fbpx

Хранилище данных и планирование ресурсов предприятия | СХД и ERP

Архив ДАННЫЕ ЦЕНТРАЛЬНЫЙ: ИСТОРИЯ ED ЭВОЛЮЦИЯ

Двумя доминирующими темами корпоративных технологий в 90-х годах были i информационное хранилище и ЭРП. Эти два мощных потока долгое время были частью корпоративной ИТ, никогда не пересекаясь. Как будто они были материей и антиматерией. Но рост обоих явлений неизбежно привел к их пересечению. Сегодня компании сталкиваются с проблемой, что делать с ERP и информационное хранилище. Эта статья объяснит, в чем заключаются проблемы и как они решаются компаниями.

В НАЧАЛЕ…

В начале была информационное хранилище. Хранилище данных он был создан для противодействия прикладной системе обработки транзакций. В первые дни запоминание дать он должен был быть просто противовесом приложениям для обработки транзакций. Но в наши дни существуют гораздо более изощренные представления о том, что информационное хранилище. В современном мире информационное хранилище он встроен в структуру, которую можно назвать Фабрикой корпоративной информации.

ФАБРИКА КОРПОРАТИВНОЙ ИНФОРМАЦИИ (СИФ)

Фабрика корпоративной информации имеет стандартные архитектурные компоненты: уровень интеграции и преобразования кода, который интегрирует i дать тогда как i дать они перемещаются из среды приложения в среду информационное хранилище компании; а информационное хранилище компании, где находится дать подробные и комплексные историки. информационное хранилище предприятия служит фундаментом, на котором могут быть построены все остальные части среды. информационное хранилище; хранилище оперативных данных (ODS). ODS представляет собой гибридную структуру, которая содержит некоторые аспекты информационное хранилище и другие аспекты среды OLTP; витрины данных, где разные отделы могут иметь свою собственную версию информационное хранилище; информационное хранилище исследование, где мыслители компании могут отправлять свои 72-часовые запросы без ущерба для информационное хранилище; и память ближней линии, в которой дать старый и дать объемные детали можно хранить по дешевке.

ГДЕ ERP СОЧЕТАЕТСЯ С ФАБРИКА КОРПОРАТИВНОЙ ИНФОРМАЦИИ

ERP объединяется с Фабрикой корпоративной информации в двух местах. В первую очередь в качестве базового приложения, которое обеспечивает i дать заявки на информационное хранилище, В этом случае i дать, созданные как побочный продукт процесса транзакции, интегрируются и загружаются в информационное хранилище компании. Вторым связующим звеном между ERP и CIF является ODS. Действительно, во многих средах ERP используется как классическая ODS.

В случае, если ERP используется в качестве базового приложения, то же самое ERP можно также использовать в CIF в качестве ODS. В любом случае, если ERP будет использоваться в обеих ролях, должно быть четкое различие между двумя объектами. Другими словами, когда ERP играет роль базового приложения и ODS, необходимо различать два архитектурных объекта. Если одна реализация ERP пытается выполнять обе роли одновременно, неизбежно возникнут проблемы при разработке и реализации этой структуры.

ОТДЕЛЬНЫЕ ODS И ОСНОВНЫЕ ПРИМЕНЕНИЯ

Существует множество причин, ведущих к разделению архитектурных компонентов. Возможно, наиболее важным моментом в разделении различных компонентов архитектуры является то, что каждый компонент архитектуры имеет свое собственное представление. Базовое приложение служит иной цели, чем ODS. Попробуйте перекрыть

базовое прикладное представление о мире ODS или наоборот — неправильный способ работы.

Следовательно, первая проблема ERP в CIF состоит в том, чтобы проверить, есть ли различие между базовыми приложениями и ODS.

МОДЕЛИ ДАННЫХ В КОРПОРАТИВНОЙ ИНФОРМАЦИОННАЯ ФАБРИКА

Для достижения согласованности между различными компонентами архитектуры CIF должна существовать модель дать. Модели дать они служат связующим звеном между различными компонентами архитектуры, такими как базовые приложения и ODS. Модели дать они становятся «интеллектуальной дорожной картой», чтобы получить правильное значение от различных архитектурных компонентов CIF.

Идя рука об руку с этим понятием, идея состоит в том, что должен быть один большой и единый шаблон. дать. Очевидно, должен быть образец дать для каждого из компонентов и, кроме того, должен быть разумный путь, соединяющий разные модели. Каждый компонент архитектуры — ODS, базовые приложения, информационное хранилище компании и т. д. – нужна своя модель дать. И поэтому должно быть точное определение того, как эти модели дать они взаимодействуют друг с другом.

ДВИГАТЬСЯ Я ДАННЫЕ ERP В ДАННЫХ СКЛАД

Если происхождение дать является базовым приложением и/или ODS, когда ERP вставляет i дать в информационное хранилище, эта вставка должна выполняться на самом низком уровне "детализации". Просто резюмируйте или агрегируйте i дать поскольку они выходят из базового приложения ERP или ERP ODS, это не то, что нужно делать. НАШИ дать подробности нужны в информационное хранилище чтобы сформировать основу процесса DSS. Такой дать они будут во многом изменены витринами данных и исследованиями информационное хранилище.

Перемещение дать из базовой среды приложения ERP в среду информационное хранилище компании осуществляется в достаточно расслабленной манере. Это перемещение происходит примерно через 24 часа после обновления или создания в ERP. Факт наличия «ленивого» движения дать в информационное хранилище компании позволяет дать поступающие из ERP для «урегулирования». Однажды я дать хранятся в базовом приложении, то вы можете безопасно перемещать дать ERP в компании. Еще одна цель, которую можно достичь благодаря «ленивому» движению дать является четким разграничением между операционными процессами и DSS. При «быстром» движении дать грань между DSS и операционной остается расплывчатой.

Движение дать из ODS ERP в информационное хранилище компании проводится периодически, обычно еженедельно или ежемесячно. В этом случае движение дать она основана на необходимости «чистить» старые дать историки. Естественно, ODS содержит i дать которые намного новее, чем дать историки нашли в информационное хранилище.

Перемещение дать в информационное хранилище это почти никогда не делается «оптом» (оптовым способом). Скопируйте таблицу из среды ERP в информационное хранилище это не имеет смысла. Гораздо более реалистичный подход состоит в том, чтобы перемещать выбранные единицы дать, Только я дать которые изменились с момента последнего обновления информационное хранилище те, которые должны быть перемещены в информационное хранилище. Один из способов узнать, какие дать изменились с момента последнего обновления, чтобы посмотреть временные метки дать находится в среде ERP. Дизайнер выбирает все изменения, произошедшие с момента последнего обновления. Другой подход заключается в использовании методов захвата изменений. дать. С помощью этих методов журналы и журнальные ленты анализируются, чтобы определить, какие из них дать должны быть перемещены из среды ERP в среду информационное хранилище. Эти методы лучше всего подходят, поскольку журналы и журнальные ленты можно считывать из файлов ERP без дальнейшего воздействия на другие ресурсы ERP.

ДРУГИЕ ОСЛОЖНЕНИЯ

Одна из проблем ERP в CIF заключается в том, что происходит с другими источниками приложений или искусственным интеллектом. дать ОРВ, которые они должны внести информационное хранилище но они не являются частью среды ERP. Учитывая закрытый характер ERP, особенно SAP, попытки интегрировать ключи из внешних источников дать с дать которые приходят из ERP во время переезда i дать в информационное хранилище, это большая проблема. И какова вероятность того, что я дать приложений или ODS за пределами среды ERP будут интегрированы в информационное хранилище? Шансы на самом деле очень высоки.

НАХОДИТЬ ДАННЫЕ ИСТОРИЯ ОТ ERP

Еще одна проблема со мной дать ERP является то, что вытекает из необходимости иметь дать историки в информационное хранилище. Обычно информационное хранилище ему нужно дать историки. И технология ERP обычно не хранит эти дать исторический, по крайней мере, не в той мере, в какой это необходимо в информационное хранилище. Когда большое количество дать журналы начинают накапливаться в среде ERP, эту среду необходимо очистить. Например, предположим, информационное хранилище должен быть загружен пятью годами дать исторический, в то время как ERP хранит максимум шесть месяцев этих дать. Пока компания удовлетворена сбором ряда дать исторический с течением времени, то нет проблем с использованием ERP в качестве источника для информационное хранилище. Но когда информационное хранилище должен вернуться в прошлое и взять богов дать история, которая ранее не собиралась и не сохранялась системой ERP, тогда среда ERP становится неэффективной.

ERP-система и метаданные

Еще одно соображение, касающееся ERP e информационное хранилище является одним из существующих метаданных в среде ERP. Подобно тому, как метаданные перемещаются из среды ERP в информационное хранилище, метаданные должны быть перемещены таким же образом. Кроме того, метаданные должны быть преобразованы в формат и структуру, требуемые инфраструктурой. информационное хранилище. Существует большая разница между операционными метаданными и метаданными DSS. Операционные метаданные в основном предназначены для разработчика и для

программист. Метаданные DSS в первую очередь предназначены для конечного пользователя. Существующие метаданные в приложениях ERP или ODS необходимо преобразовывать, и это преобразование не всегда легко и просто.

ПОЛУЧЕНИЕ ДАННЫХ ERP

Если ERP используется в качестве поставщика дать для информационное хранилище должен быть прочный интерфейс, который перемещает i дать из среды ERP в среду информационное хранилище. Интерфейс должен:

  • ▪ быть простым в использовании
  • ▪ разрешить доступ к дать ERP
  • ▪ подобрать значение дать которые перемещаются в информационное хранилище
  • ▪ знать ограничения ERP, которые могут возникнуть при доступе к дать из ERP:
  • ▪ ссылочная целостность
  • ▪ иерархические отношения
  • ▪ неявные логические отношения
  • ▪ соглашение о применении
  • ▪ все структуры дать поддерживается ERP и так далее…
  • ▪ быть эффективным в доступе дать, предоставляя:
  • ▪ прямое движение дать
  • ▪ получение сдачи дать
  • ▪ поддерживать своевременный доступ к дать
  • ▪ понимать формат дать, и так далее… ИНТЕРФЕЙС С SAP Интерфейс может быть двух типов, доморощенный или коммерческий. Некоторые из основных коммерческих интерфейсов включают в себя:
  • ▪ САС
  • ▪ Основные решения
  • ▪ D2k и так далее… НЕСКОЛЬКО ТЕХНОЛОГИЙ ERP Относиться к среде ERP как к единой технологии — большая ошибка. Существует множество технологий ERP, каждая из которых имеет свои сильные стороны. Наиболее известные производители на рынке:
  • ▪ САП
  • ▪ Оракл Финансы
  • ▪ ПиплСофт
  • Джей Ди Эдвардс
  • ▪ Баанс SAP SAP — крупнейшее и наиболее полное программное обеспечение ERP. Приложения SAP включают множество типов приложений во многих областях. SAP имеет репутацию:
  • ▪ очень большой
  • ▪ очень сложно и дорого реализовать
  • ▪ требуется много людей и консультантов для реализации
  • ▪ нужны специализированные люди для реализации
  • ▪ требует много времени для внедрения Также у SAP есть репутация запоминающего дать близко, что затрудняет доступ к ним для кого-либо за пределами области SAP. Сила SAP в том, что он способен захватывать и хранить большое количество данных. дать. SAP недавно объявила о своем намерении расширить свои приложения на информационное хранилище. Есть много плюсов и минусов использования SAP в качестве поставщика. информационное хранилище. Преимуществом является то, что SAP уже установлен, и большинство консультантов уже знакомы с SAP.
    Недостатки использования SAP в качестве поставщика информационное хранилище много: SAP не имеет опыта в мире информационное хранилище Если SAP является поставщиком информационное хранилище, необходимо «вынуть» i дать из САП в информационное хранилище. Данный послужной список SAP закрытой системы, вряд ли будет легко получить i из SAP в ней (???). В основе SAP лежит множество устаревших сред, таких как IMS, VSAM, ADABAS, ORACLE, DB2 и т. д. SAP настаивает на подходе «изобретено не здесь». SAP не хочет сотрудничать с другими поставщиками для использования или создания информационное хранилище. SAP настаивает на том, чтобы самостоятельно создавать все свое собственное программное обеспечение.

Хотя SAP — крупная и мощная компания, сам факт попытки переписать технологии ELT, OLAP, системного администрирования и даже кодовую базу СУБД это просто безумие. Вместо того, чтобы занять позицию сотрудничества с поставщиками информационное хранилище В течение долгого времени SAP следовала подходу, который они «знают лучше всего». Такое отношение сдерживает успех, который могла бы иметь SAP в области информационное хранилище.
Отказ SAP разрешить внешним поставщикам быстрый и изящный доступ к их дать. Сама суть использования информационное хранилище легкий доступ к дать. Вся история SAP основана на затруднении доступа дать.
Отсутствие у SAP опыта работы с большими объемами дать; в области информационное хранилище есть объемы дать никогда не видел от SAP и обрабатывать эти большие объемы дать у вас должна быть правильная технология. SAP, по-видимому, не знает об этом технологическом барьере, который существует для входа в область информационное хранилище.
Корпоративная культура SAP: SAP построила бизнес на получении i дать из системы. Но для этого нужно иметь другой менталитет. Традиционно компании-разработчики программного обеспечения, которые хорошо справлялись с передачей данных в среду, не могли заставить данные идти другим путем. Если SAP удастся сделать такой переход, она станет первой компанией, сделавшей это.

Короче говоря, сомнительно, должна ли компания выбирать SAP в качестве поставщика информационное хранилище. С одной стороны, очень серьезные риски, а с другой — очень мало вознаграждения. Но есть еще одна причина, которая отбивает охоту выбирать SAP в качестве поставщика. информационное хранилище. Потому что у каждой компании должно быть одинаковое информационное хранилище всех остальных компаний? информационное хранилище это сердце конкурентного преимущества. Если бы каждая компания приняла одно и то же информационное хранилище было бы трудно, хотя и не невозможно, добиться конкурентного преимущества. SAP, похоже, считает, что информационное хранилище можно рассматривать как файл cookie, и это еще один признак их менталитета «получать данные в» приложениях.

Ни один другой поставщик ERP не занимает такого доминирующего положения, как SAP. Несомненно, найдутся компании, которые пойдут по пути SAP. информационное хранилище но предположительно эти информационное хранилище SAP будут большими, дорогими и трудоемкими для создания.

Эти среды включают в себя такие действия, как обработка банковских кассиров, процессы бронирования авиабилетов, процессы рассмотрения страховых жалоб и так далее. Чем лучше работала система транзакций, тем более очевидной была необходимость разделения операционного процесса и СППР (системы поддержки принятия решений). Однако с HR и кадровыми системами вы никогда не сталкиваетесь с большими объемами транзакций. И, конечно же, когда человек принимается на работу или уходит из компании, это запись о сделке. Но по сравнению с другими системами, в HR и кадровых системах просто не так много транзакций. Поэтому в HR и кадровых системах не совсем очевидно, что есть потребность в Хранилище Данных. Во многих отношениях эти системы представляют собой объединение систем DSS.

Но есть еще один фактор, который необходимо учитывать при работе с хранилищем данных и PeopleSoft. Во многих кругах я дать Кадровые и персональные ресурсы второстепенны по отношению к основному бизнесу компании. Большинство компаний занимаются производством, продажей, предоставлением услуг и так далее. HR и кадровые системы обычно второстепенны (или поддерживают) основное направление деятельности компании. Поэтому двусмысленно и неудобно информационное хранилище отдельно для поддержки персонала и личных ресурсов.

В этом отношении PeopleSoft сильно отличается от SAP. В SAP обязательно наличие информационное хранилище. С PeopleSoft не все так однозначно. Хранилище данных является необязательным для PeopleSoft.

Лучшее, что можно сказать о дать PeopleSoft заключается в том, что информационное хранилище можно использовать для архивирования i дать связанные со старыми человеческими и личными ресурсами. Вторая причина, по которой компания хотела бы использовать информационное хранилище a

недостатком среды PeopleSoft является предоставление доступа и свободный доступ к инструментам анализа, ai дать от PeopleSoft. Но помимо этих причин могут быть случаи, когда предпочтительно не иметь хранилища данных для дать ЛюдиСофт.

В итоге

Существует множество идей, связанных с созданием информационное хранилище внутри программного обеспечения ERP.
Вот некоторые из них:

  • ▪ Имеет смысл иметь информационное хранилище кто похож на любого другого в отрасли?
  • ▪ Насколько гибкой является ERP информационное хранилище Программное обеспечение?
  • ▪ ERP информационное хранилище программное обеспечение может обрабатывать объем дать который находится винформационное хранилище арена"?
  • ▪ Какой протокол трассировки делает поставщик ERP перед лицом простых и недорогих, требующих много времени систем искусственного интеллекта? дать? (Каковы достижения поставщиков ERP в доставке недорогих, своевременных и легкодоступных данных?)
  • ▪ Как поставщик ERP понимает архитектуру DSS и фабрику корпоративной информации?
  • ▪ Поставщики ERP понимают, как получить дать внутри среды, но и понять, как их экспортировать?
  • ▪ Насколько поставщик ERP открыт для инструментов хранения данных?
    Все эти соображения необходимо учитывать при определении места размещения информационное хранилище который будет принимать меня дать ERP и др. дать. В целом, если нет веских причин поступать иначе, рекомендуется строить информационное хранилище вне среды поставщика ERP. КАПИТОЛО 1 Обзор организации BI Ключевые моменты:
    Информационные репозитории работают противоположно архитектуре бизнес-аналитики (BI):
    Корпоративная культура и ИТ могут ограничить успех построения организаций BI.

Технология больше не является ограничивающим фактором для организаций BI. Проблема для архитекторов и планировщиков проектов заключается не в том, существует ли технология, а в том, могут ли они эффективно реализовать имеющуюся технологию.

Для многих компаний информационное хранилище немного больше, чем пассивный депозит, который распределяет i дать пользователям, которым это необходимо. НАШИ дать извлекаются из исходных систем и заносятся в целевые структуры информационное хранилище. дать их также можно очистить, если повезет. Однако никакая дополнительная стоимость не добавляется и не собирается дать во время этого процесса.

По сути, пассивный dw в лучшем случае обеспечивает только i дать чистым и оперативным для пользовательских ассоциаций. Создание информации и аналитическое понимание полностью зависят от пользователей. Судя по тому, является ли DW (Хранилище данных) является ли успех субъективным. Если судить об успехе по способности эффективно собирать, интегрировать и очищать дать корпоративный на предсказуемой основе, то да, DW это успех. С другой стороны, если рассматривать сбор, консолидацию и использование информации организацией в целом, то ХД — это провал. DW предоставляет мало информации или не дает никакой информации. В результате пользователи вынуждены довольствоваться тем, что создают информационные бункеры. В этой главе представлен всеобъемлющий обзор архитектуры корпоративной BI (Business Intelligence). Мы начинаем с описания BI, а затем переходим к обсуждению дизайна и разработки информации, а не просто предоставляем дать пользователям. Затем обсуждение сосредоточится на расчете ценности ваших усилий по BI. В заключение мы определим, как IBM удовлетворяет требования вашей организации к архитектуре бизнес-аналитики.

Описание архитектуры BI-организация

Мощные транзакционно-ориентированные информационные системы сегодня стали обычным явлением на каждом крупном предприятии, эффективно уравнивая правила игры для корпораций по всему миру.

Однако для того, чтобы оставаться конкурентоспособными, в настоящее время требуются системы, ориентированные на аналитику, которые могут революционизировать способность компании заново открывать и использовать уже имеющуюся информацию. Эти аналитические системы вытекают из понимания из богатства дать доступный. BI может повысить производительность всей информации на предприятии. Предприятия могут улучшить отношения между клиентами и поставщиками, повысить рентабельность продуктов и услуг, заключать новые и более выгодные сделки, контролировать риски и, помимо многих других преимуществ, резко сокращать расходы. Благодаря BI ваша компания, наконец, начинает использовать информацию о клиентах в качестве конкурентного актива благодаря приложениям, ориентированным на рынок.

Наличие правильных средств ведения бизнеса означает наличие точных ответов на ключевые вопросы, такие как:

  • ▪ Кто из наших клиентов Заставляют ли они нас зарабатывать больше или заставляют нас терять деньги?
  • ▪ Где живут наши лучшие клиентов в отношении магазин/склад они частые?
  • ▪ Какие из наших продуктов и услуг могут быть проданы наиболее эффективно и кому?
  • ▪ Какие продукты можно продавать наиболее эффективно и кому?
  • ▪ Какая кампания по продажам более успешна и почему?
  • ▪ Какие каналы продаж для каких продуктов наиболее эффективны?
  • ▪ Как мы можем улучшить отношения с нашими лучшими клиентов? Большинство компаний имеют дать грубо ответить на эти вопросы.
    Операционные системы генерируют большое количество продуктов, клиентов и затрат. дать из точек продаж, бронирования, обслуживания клиентов и систем технической поддержки. Задача состоит в том, чтобы извлечь и использовать эту информацию. Многие компании получают прибыль только от небольшой части своей дать для стратегического анализа.
    I дать остальные, часто в сочетании с i дать получение внешних источников, таких как правительственные отчеты и другая купленная информация, представляет собой золотую жилу, которую только и ждут, чтобы ее исследовали, и дать их просто нужно уточнить в информационном контексте вашей организации.

Эти знания можно применять несколькими способами: от разработки общей корпоративной стратегии до личного общения с поставщиками, через колл-центры, выставление счетов, Интернет и другие моменты. Современная бизнес-среда диктует, что DW и связанные с ним решения BI выходят за рамки традиционных бизнес-структур. дать который я дать нормализованные на атомном уровне и «звездные/кубические фермы».

Чтобы оставаться конкурентоспособными, необходимо слияние традиционных и передовых технологий с целью поддержки широкого аналитического ландшафта.
Наконец, общая среда должна улучшать знания о компании в целом, следя за тем, чтобы действия, предпринятые в результате проведенных анализов, были полезными, чтобы все получали пользу.

Например, допустим, вы классифицируете свои клиентов в категории высокого или низкого риска.
Генерируется ли эта информация с помощью модели интеллектуального анализа данных или другими способами, она должна быть помещена в ХД и доступна для всех с помощью любого инструмента доступа, такого как статические отчеты, электронные таблицы, таблицы или онлайн-аналитическая обработка (OLAP).

Однако в настоящее время большая часть информации такого типа остается разрозненной. дать отдельных лиц или отделов, производящих анализ. Организация в целом мало или совсем не видна для понимания. Только смешивая этот тип информационного содержимого с вашим корпоративным хранилищем данных, вы можете устранить информационные хранилища и повысить уровень своей среды хранения данных.
Есть два основных препятствия на пути развития BI-организации.
Во-первых, у нас есть проблема самой организации и ее дисциплины.
Хотя мы не можем помочь с изменениями организационной политики, мы можем помочь понять компоненты бизнес-аналитики организации, ее архитектуру и то, как технологии IBM способствуют ее развитию.
Второй барьер, который необходимо преодолеть, — это отсутствие интегрированной технологии и знания метода, который вызывает все пространство бизнес-аналитики, а не только небольшой компонент.

IBM реагирует на изменения в технологии интеграции. Вы несете ответственность за обеспечение сознательного дизайна. Эта архитектура должна быть разработана с использованием технологии, выбранной для неограниченной интеграции, или, по крайней мере, с использованием технологии, соответствующей открытым стандартам. Кроме того, руководство вашей компании должно следить за тем, чтобы бизнес-би-предприятие выполнялось по графику, а не допускать развития информационных бункеров, возникающих из корыстных планов или целей.
Это не означает, что среда BI нечувствительна к различным нуждам и требованиям разных пользователей; вместо этого это означает, что реализация этих индивидуальных потребностей и требований осуществляется на благо всей организации BI.
Описание архитектуры организации BI можно найти на рисунке 9, стр. 1.1. Архитектура демонстрирует богатое сочетание технологий и методов.
С традиционной точки зрения архитектура включает в себя следующие компоненты склада

Атомный слой (Atomic Layer).

Это основа, сердце всего Dw и, следовательно, стратегической отчетности.
I дать хранящиеся здесь сохранят историческую целостность, отчеты о дать и включают производные метрики, а также очищаются, интегрируются и сохраняются с использованием моделей интеллектуального анализа данных.
Все последующее использование этих дать и соответствующая информация выводится из этой структуры. Это отличный источник для майнинга. дать и для отчетов со структурированными запросами SQL

Оперативный склад дать или сообщить на основе дать(Хранилище оперативных данных (ODS) или отчетность база данных.)

Это структура дать специально разработан для технических отчетов.

I дать хранящиеся и сообщаемые выше, эти структуры могут в конечном итоге распространяться на склад через промежуточную зону, где их можно использовать для стратегической сигнализации.

Плацдарм.

Первая остановка для большинства дать предназначенная для складской среды зона организации.
Здесь я дать интегрируются, очищаются и превращаются в дать прибыль, которая заполнит складскую структуру

Витрины свиданий.

Эта часть архитектуры представляет структуру дать используется специально для OLAP. Наличие витрин данных, если я дать они хранятся в звездных схемах, на которые они накладываются дать многомерные в реляционной среде или в файлах дать проприетарная технология, используемая конкретной технологией OLAP, такой как DB2 OLAP Server, не имеет значения.

Единственным ограничением является то, что архитектура облегчает использование дать многомерный.
Архитектура также включает в себя критически важные технологии и методы Bi, которые различаются следующим образом:

Пространственный анализ

Пространство — это информационная находка для аналитика, и оно имеет решающее значение для завершения решения. Пространство может представлять информацию о людях, которые живут в определенном месте, а также информацию о том, где это место физически находится по отношению к остальному миру.

Чтобы выполнить этот анализ, вы должны начать с привязки вашей информации к координатам широты и долготы. Это называется «геокодированием» и должно быть частью процесса извлечения, преобразования и загрузки (ETL) на атомарном уровне вашего хранилища.

Сбор данных.

Добыча дать позволяет нашим компаниям увеличивать количество клиентов, прогнозировать тенденции продаж и управлять отношениями с i клиентов (CRM), среди других инициатив BI.

Добыча дать поэтому он должен быть интегрирован со структурами дать склада и поддерживается складскими процессами для обеспечения эффективного и действенного использования технологий и связанных с ними методов.

Как указано в архитектуре бизнес-аналитики, Dwhouse атомарного уровня, а также витрины данных являются отличным источником информации. дать для добычи. Эти же свойства также должны быть получателями результатов извлечения, чтобы обеспечить доступность для самой широкой аудитории.

Агенты.

Существуют различные «агенты», которые проверяют клиента по любому вопросу, например, по операционным системам компании и самому dw. Эти агенты могут быть продвинутыми нейронными сетями, обученными узнавать о тенденциях в каждой точке, таких как будущий спрос на продукт на основе рекламных акций, основанных на правилах механизмах для реагирования на изменения. дата стечение обстоятельств или даже простые агенты, сообщающие об исключениях высшему руководству. Эти процессы обычно происходят в режиме реального времени и, следовательно, должны быть тесно связаны с движением процессов. дать. Все эти структуры из дать, технологии и приемы гарантируют, что вы не потратите ночь на организацию своей бизнес-аналитики.

Эта деятельность будет развиваться поэтапно, для небольших точек.
Каждый шаг представляет собой независимый проект и называется итерацией в вашей BI dw или инициативе. Итерации могут включать внедрение новых технологий, начиная с новых методов, добавляя новые фреймворки к дать , загрузка я дать дополнительные или с анализом расширения вашей среды. Этот параграф обсуждается более подробно в главе 3.

В дополнение к традиционным платформам DW и инструментам бизнес-аналитики существуют и другие аспекты вашей организации бизнес-аналитики, которые необходимо разработать, например:

Точки взаимодействия с клиентом (контакт с клиентом точки).

Как и в любой современной организации, существует ряд точек соприкосновения с клиентами, которые указывают, как получить положительный опыт для вас. клиентов. Существуют традиционные каналы, такие как продавцы, операторы коммутаторов, прямая почтовая рассылка, мультимедийная и печатная реклама, а также более современные каналы, такие как электронная почта и Интернет. дать продукты с некоторой точкой контакта должны быть приобретены, транспортированы, очищены, обработаны, а затем размещены на объектах дать из БИ.

Базы дать операционные и пользовательские ассоциации (Operational

базы данных и сообщества пользователей).
В конце контактных точек клиентов основы найдены дать приложения компании и сообществ пользователей. НАШИ дать существующие дать традиционные, которые должны быть сведены воедино и объединены с дать вытекающих из точек соприкосновения для удовлетворения необходимой информации.

Аналитики. (Аналитики)

Основным бенефициаром среды BI является аналитик. Именно ему выгодна текущая добыча дать оперативный, интегрированный с различными источниками дать , дополненный такими функциями, как географический анализ (геокодирование) и представленный в технологиях бизнес-аналитики, которые позволяют выполнять интеллектуальный анализ данных, OLAP, расширенные отчеты SQL и географический анализ. Основным интерфейсом для аналитика в среде отчетности является портал BI.

Однако аналитик не единственный, кто получает выгоду от архитектуры BI.
Руководители, крупные ассоциации пользователей и даже члены, поставщики и я клиентов должны найти преимущества в корпоративной BI.

Петля обратной подачи.

Архитектура бизнес-аналитики — это среда обучения. Характерным принципом развития является учет устойчивых структур дать обновляться в зависимости от используемой технологии BI и действий пользователя. Примером является скоринг клиентов.

Если отдел продаж использует модель оценки клиентов, например, использует новую услугу, то отдел продаж не должен быть единственной группой, получающей выгоду от услуги.

Вместо этого интеллектуальный анализ моделей должен выполняться как естественная часть потока данных внутри предприятия, а оценки клиентов должны стать неотъемлемой частью информационной среды хранилища, видимой для всех пользователей. Bi-bI-centric IBM Suite, включающий DB2 UDB, DB2 OLAP Server, включает наиболее важные технологические компоненты, указанные на рис. 1.1.

Мы используем архитектуру, показанную на этом рисунке из книги, чтобы обеспечить уровень преемственности и продемонстрировать, как каждый из продуктов IBM вписывается в общую схему BI.

Предоставление информационного контента (предоставление информационное наполнение)

Проектирование, разработка и внедрение среды бизнес-аналитики — непростая задача. Дизайн должен учитывать как текущие, так и будущие бизнес-требования. Чертеж архитектуры должен быть всеобъемлющим, чтобы включать все выводы, сделанные на этапе проектирования. Выполнение должно оставаться привязанным к одной цели: разработать BI-архитектуру в том виде, в каком она формально представлена ​​в проекте и основана на бизнес-требованиях.

Особенно трудно утверждать, что дисциплина обеспечит относительный успех.
Это просто, потому что вы не разрабатываете среду BI сразу, а поэтапно.

Однако определение компонентов бизнес-аналитики в вашей архитектуре важно по двум причинам: вы будете принимать все последующие решения по технической архитектуре.
Вы сможете сознательно спланировать конкретное использование технологии, даже если вам не понадобится повторное использование технологии в течение нескольких месяцев.

Достаточное понимание ваших бизнес-требований повлияет на тип продуктов, которые вы приобретете для своей архитектуры.
Дизайн и разработка вашей архитектуры гарантирует, что ваш склад

не случайное событие, а хорошо продуманная, тщательно сконструированная реклама opera искусства как мозаика смешанной техники.

Информационное содержание дизайна

Весь первоначальный проект должен фокусироваться и определять основные компоненты бизнес-аналитики, которые потребуются для всей среды сейчас и в будущем.
Важно знать бизнес-требования.

Даже до того, как началось какое-либо официальное планирование, планировщик проекта часто может сразу определить один или два компонента.
Однако баланс компонентов, которые могут потребоваться для вашей архитектуры, найти нелегко. На этапе проектирования основная часть архитектуры связывает сессию разработки приложений (JAD) с исследованием для определения бизнес-требований.

Иногда эти требования можно доверить инструментам запросов и отчетов.
Например, пользователи заявляют, что если они хотят автоматизировать текущий отчет, они должны создать его вручную, интегрировав два текущих отчета и добавив расчеты, полученные в результате комбинации дать.
Хотя это требование простое, оно определяет определенные функциональные возможности, которые вы должны включить при покупке инструментов отчетности для своей организации.

Дизайнер также должен выполнить дополнительные требования, чтобы получить полную картину. Хотят ли пользователи подписываться на этот отчет?
Создаются ли подмножества отчетов и отправляются ли они по электронной почте различным пользователям? Хотите увидеть этот отчет на портале компании? Все эти требования являются частью простой необходимости замены ручного отчета по требованию пользователей. Преимущество этих типов требований заключается в том, что все, пользователи и разработчики, знакомы с концепцией отчетов.

Однако есть и другие виды бизнеса, которые нам необходимо планировать. Когда бизнес-требования сформулированы в форме стратегических бизнес-вопросов, опытный планировщик легко различает размерные требования и требования к измерениям/фактам.

Если пользователи JAD не знают, как сформулировать свои требования в форме бизнес-задачи, дизайнер часто будет предоставлять примеры, чтобы пропустить начало сеанса сбора требований.
Эксперт по планированию может помочь пользователям понять не только стратегический бизнес, но и то, как его формировать.
Подход к сбору требований обсуждается в главе 3; сейчас мы просто хотим указать на необходимость проектирования с учетом всех видов требований BI.

Стратегическая бизнес-проблема — это не только бизнес-требование, но и проектный сигнал. Если вам предстоит ответить на многоаспектный вопрос, то вы должны запомнить, представить дать размерный, и если вам нужно запомнить дать многомерный, вам нужно решить, какой тип технологии или техники вы собираетесь использовать.

Вы реализуете зарезервированную схему куба-звезды или и то, и другое? Как видите, даже простой бизнес-вопрос может сильно повлиять на дизайн. Но эти типы бизнес-требований являются обычным явлением и, конечно, по крайней мере, для опытных проектировщиков и дизайнеров.

Было достаточно споров о технологиях OLAP и их поддержке, и доступно большое разнообразие решений. До сих пор мы говорили о необходимости объединения простых отчетов с многомерными бизнес-требованиями и о том, как эти требования влияют на решения по технической архитектуре.

Но какие требования не понятны пользователям или команде Dw? Вам когда-нибудь понадобится пространственный анализ (analysisi пространственный)?
Модели майнинга дать Станут ли они необходимой частью вашего будущего? Кто знает?

Важно отметить, что этот тип технологий малоизвестен широким сообществам пользователей и членам команды DW, отчасти это может быть связано с тем, что они обычно обрабатываются некоторыми внутренними или сторонними техническими экспертами. Это крайний случай проблем, порождаемых этими типами технологий. Если пользователи не могут описать бизнес-требования или сформулировать их в качестве руководства для дизайнеров, они могут остаться незамеченными или, что еще хуже, просто проигнорированы.

Еще более проблематичным становится, когда дизайнер и разработчик не могут распознать применение одной из этих передовых, но важных технологий.
Как мы часто слышали от Дизайнеров: «Ну, почему бы нам не убрать это, пока мы не получим другую вещь? «Действительно ли их интересуют приоритеты или они просто избегают требований, которых не понимают? Вероятнее всего последнее предположение. Допустим, ваша команда по продажам сообщила о бизнес-требовании, как показано на рис. 1.3. Как видите, требование сформулировано в форме бизнес-вопроса. Разница между этой проблемой и типичной проблемой размерности заключается в расстоянии. В этом случае отдел продаж хочет знать ежемесячно общий объем продаж продуктов, складов и клиентов которые живут в пределах 5 миль от склада, где они делают покупки.

К сожалению, дизайнеры или архитекторы могут просто игнорировать пространственный компонент, говоря: «У нас есть клиент, продукт и объект». дать депозита. Давайте отложим дистанцию ​​до следующей итерации.

"Неверный ответ. Этот тип бизнес-задач связан с BI. Он представляет собой более глубокое понимание нашего бизнеса и надежное аналитическое пространство для наших аналитиков. BI — это не только простые запросы, стандартные отчеты и даже OLAP. Это не означает, что эти технологии не важны для вашей бизнес-аналитики, но сами по себе они не представляют среду бизнес-аналитики.

Дизайн для информационного контекста (Дизайн информационного контента)

Теперь, когда мы определили бизнес-требования, которые отличают различные основные компоненты, их необходимо включить в общий архитектурный чертеж. Некоторые из компонентов BI являются частью наших первоначальных усилий, а некоторые не будут реализованы в течение нескольких месяцев.

Однако все известные требования отражены в конструкции, поэтому, когда нам нужно внедрить ту или иную технологию, мы готовы это сделать. Кое-что в проекте будет отражать традиционное мышление.

Этот набор дать используется для поддержки последующего использования дать размерность, обусловленная бизнес-проблемами, которые мы определили. По мере формирования дополнительных документов, таких как разработка проекта дать, начнем с формализации в виде i дать они распространяются в окружающей среде. Мы установили необходимость представления i дать размерным образом, разделив их (в соответствии с конкретными конкретными потребностями) на витрины данных.

Следующий вопрос, на который нужно ответить: как будут построены эти витрины данных?
Вы строите звезды для поддержки кубов, или только кубы, или только звезды? (или правильные кубики, или правильные звезды). Создайте архитектуру для зависимых витрин данных, которым требуется атомарный уровень для всех дать вы приобретаете? Разрешить независимым витринам данных получать i дать напрямую из операционных систем?

Какую технологию Cube вы попытаетесь стандартизировать?

У вас есть огромное количество богов дать требуется для размерного анализа или вам нужны кубы вашего национального торгового персонала на еженедельной основе или и то, и другое? Вы создаете мощный объект, такой как сервер OLAP DB2 для финансов или кубы Cognos PowerPlay для своей торговой организации, или и то, и другое? Это важные архитектурные проектные решения, которые повлияют на дальнейшее развитие вашей среды бизнес-аналитики. Да, вы определили потребность в OLAP. Теперь, как вы собираетесь применять такую ​​технику и технологии?

Как некоторые из более продвинутых технологий влияют на ваши проекты? Предположим, вы определили пространственную потребность в вашей организации. Теперь вам придется вспоминать редакции архитектурных чертежей, даже если вы не планируете делать пространственные компоненты в течение нескольких месяцев. Архитектор должен проектировать сегодня, исходя из того, что необходимо. Предвидеть потребность в пространственном анализе, который генерирует, хранит, поддерживает и обеспечивает доступ к дать пространственный. Это, в свою очередь, должно служить ограничением относительно типа программной технологии и спецификаций платформы, которые вы можете рассматривать в настоящее время. Например, система управления г. база данных реляционная (RDBMS), которую вы поддерживаете для своего атомарного уровня, должна иметь надежный доступный пространственный экстент. Это обеспечит максимальную производительность при использовании геометрии и пространственных объектов в аналитических приложениях. Если ваша СУБД не может справиться с дать (пространственно-ориентированном) внутри, поэтому вам придется установить база данных (пространственно-центрический) внешний. Это усложняет управление проблемами и ставит под угрозу вашу общую производительность, не говоря уже о дополнительных проблемах, которые это создает для ваших администраторов баз данных, поскольку они, вероятно, имеют минимальное понимание основ дать также пространственный. С другой стороны, если ваш механизм СУБД обрабатывает все пространственные компоненты, а его оптимизатор знает об особых потребностях (например, индексации) пространственных объектов, то ваши администраторы баз данных могут легко справиться с проблемами управления, и вы сможете максимизировать производительность.

Кроме того, вам необходимо настроить промежуточную область и слой атомарной среды, чтобы включить очистку адресов (т.

ключевой элемент пространственного анализа), а также последующее сохранение пространственных объектов. Череда дизайнерских изданий продолжается теперь, когда мы ввели понятие адресной чистоты. Во-первых, это приложение будет определять тип программного обеспечения, необходимого вам для работы с ETL.

Вам нужны такие продукты, как Trillium, чтобы предоставить вам чистый адрес, или поставщик ETL по вашему выбору, чтобы обеспечить эту функциональность?
На данный момент важно, чтобы вы оценили уровень проектирования, который необходимо выполнить, прежде чем вы начнете обслуживать свой склад. Приведенные выше примеры должны продемонстрировать множество проектных решений, которые должны следовать за идентификацией любого конкретного бизнес-требования. При правильном принятии эти проектные решения способствуют взаимозависимости между физическими структурами вашей среды, выбором используемой технологии и потоком распространения информационного контента. Без этой традиционной архитектуры BI ваша организация будет подвержена хаотичному смешению существующих технологий, в лучшем случае слабо связанных друг с другом для обеспечения кажущейся стабильности.

Поддерживать информационный контент

Обеспечение ценности информации для вашей организации — очень сложная задача. Без достаточного понимания и опыта или надлежащего проектирования и проектирования даже самые лучшие команды потерпят неудачу. С другой стороны, если у вас отличная интуиция и детальный план, но нет дисциплины для выполнения, вы только зря потратили деньги и время, потому что ваши усилия обречены на провал. Сообщение должно быть четким: если вам не хватает одного или нескольких из этих навыков, понимания/опыта, планирования/дизайна или дисциплины внедрения, это приведет к повреждению или разрушению здания организации BI.

Достаточно ли подготовлена ​​ваша команда? Кто-нибудь в вашей команде BI понимает обширный аналитический ландшафт, доступный в средах BI, а также методы и технологии, необходимые для поддержания этого ландшафта? Есть ли в вашей команде кто-нибудь, кто может отличить применение расширенных

статическая отчетность и OLAP или различия между ROLAP и OLAP? Четко ли один из членов вашей команды понимает способ майнинга и то, как он может повлиять на хранилище или как хранилище может поддерживать производительность майнинга? Член команды понимает ценность дать космическая или агентная технология? Есть ли у вас кто-то, кто ценит уникальное применение инструментов технологии ETL vs Message Broker? Если у вас его нет, получите его. BI намного больше, чем нормализованный атомарный слой, OLAP, звездообразные схемы и ODS.

Наличие понимания и опыта для распознавания требований BI и их решений имеет важное значение для вашей способности правильно формализовать потребности пользователей, а также разрабатывать и внедрять их решения. Если у вашего сообщества пользователей возникают трудности с описанием требований, команда склада должна предоставить это понимание. Но если команда склада

не распознает конкретное применение BI — например, интеллектуальный анализ данных — тогда не лучше, если среды BI часто ограничиваются пассивными репозиториями. Однако игнорирование этих технологий не умаляет их важности и влияния, которое они оказывают на появление возможностей бизнес-аналитики в вашей организации, а также на информационный актив, который вы планируете продвигать.

Дизайн должен включать в себя понятие рисунка, и оба требуют компетентного человека. Кроме того, для планирования требуется командная складская философия и соблюдение стандартов. Например, если ваша компания установила стандарт платформы или определила конкретную СУБД, которую она хочет стандартизировать для всей платформы, крайне важно, чтобы все в команде придерживались этих стандартов. Как правило, команда заявляет о необходимости стандартизации (сообществам пользователей), но сама команда не желает придерживаться стандартов, установленных в других областях компании или, возможно, даже в подобных компаниях. Это не только лицемерно, но и показывает, что компания не способна использовать существующие ресурсы и инвестиции. Это не означает, что нет ситуаций, в которых требуется нестандартизированная платформа или технология; однако усилиями склада

они должны ревностно охранять стандарты предприятия до тех пор, пока требования бизнеса не потребуют иного.

Третьим ключевым компонентом, необходимым для построения организации BI, является дисциплина.
Это зависит в целом, в равной степени от индивидуумов и от окружающей среды. Планировщики проектов, спонсоры, архитекторы и пользователи должны ценить дисциплину, необходимую для построения информационных активов компании. Дизайнеры должны направить свои дизайнерские усилия на дополнение других усилий, необходимых обществу.

Например, предположим, что ваша компания создает приложение ERP с компонентом склада.
Таким образом, разработчики ERP несут ответственность за сотрудничество с командой складской среды, чтобы не конкурировать и не дублировать уже начатую работу.

Дисциплина также является темой, которую должна решать вся организация, и обычно она устанавливается и санкционируется на руководящем уровне.
Готовы ли руководители придерживаться разработанного подхода? Подход, который обещает создать информационный контент, который в конечном итоге принесет пользу всем областям предприятия, но, возможно, поставит под угрозу планы отдельных лиц или подразделений? Помните поговорку «Думать обо всем важнее, чем думать об одном». Это высказывание верно для BI-организаций.

К сожалению, многие склады сосредотачивают свои усилия на попытках нацелить и предоставить ценность конкретному отделу или конкретным пользователям, мало заботясь об организации в целом. Предположим, менеджер просит помощи у команды склада. Команда отвечает 90-дневными усилиями, которые включают не только выполнение требований к уведомлению, определенных руководителем, но и обеспечение того, чтобы все дать основания смешиваются на атомарном уровне перед введением в предлагаемую кубическую технологию.
Это техническое дополнение гарантирует, что складское предприятие выиграет от дать нужно менеджеру.
Однако исполнительный директор обратился к внешним консалтинговым фирмам, которые предложили аналогичное приложение с доставкой менее чем за 4 недели.

Предполагая, что внутренняя команда склада компетентна, у руководителя есть выбор. Кто может поддерживать дополнительную инженерную дисциплину, необходимую для роста корпоративного информационного актива, или может выбрать быстрое создание собственного решения. Последнее, кажется, выбирается слишком часто и служит только для создания контейнеров информации, которые приносят пользу нескольким или отдельному человеку.

Краткосрочные и долгосрочные цели

Архитекторы и проектировщики должны формализовать долгосрочное видение общей архитектуры и планы развития организации BI. Это сочетание краткосрочной выгоды и долгосрочного планирования — две стороны усилий BI. Краткосрочный доход — это аспект BI, связанный с итерациями вашего склада.

Именно здесь планировщики, архитекторы и спонсоры сосредотачиваются на выполнении конкретных бизнес-требований. Именно на этом уровне строятся физические структуры, закупаются технологии и внедряются методы. Они ни в коем случае не предназначены для удовлетворения конкретных требований, определенных конкретными сообществами пользователей. Все делается с целью удовлетворения конкретных требований, определенных конкретным сообществом.
Однако долгосрочное планирование — это другой аспект BI. Именно здесь планы и проекты гарантировали, что любая физическая структура будет построена, выбраны технологии и реализованы методы, сделанные с прицелом на предприятие. Именно долгосрочное планирование обеспечивает сплоченность, необходимую для того, чтобы гарантировать, что твердые выгоды будут получены из любых обнаруженных краткосрочных выгод.

Обоснуйте свои усилия по BI

Un информационное хранилище само по себе оно не имеет внутренней ценности. Другими словами, между складскими технологиями и методами реализации нет внутренней ценности.

Ценность любых складских усилий заключается в действиях, выполняемых в результате складской среды и информационного содержания, культивируемого с течением времени. Это критический момент, который нужно понять, прежде чем пытаться оценить ценность любой инициативы по размещению.

Слишком часто архитекторы и проектировщики пытаются придать ценность физическим и техническим компонентам склада, тогда как на самом деле ценность основывается на бизнес-процессах, на которые позитивно влияет хранилище и хорошо собранная информация.

В этом заключается проблема создания BI: как вы оправдываете инвестиции? Если склад сам по себе не имеет внутренней ценности, планировщики проекта должны изучить, определить и формализовать преимущества для тех лиц, которые будут использовать склад для улучшения определенных бизнес-процессов или ценности защищенной информации, или и того, и другого.

Ситуация усложняется тем, что любой бизнес-процесс, на который влияют складские усилия, может обеспечить «существенные» или «умеренные» преимущества. Значительные преимущества обеспечивают ощутимый показатель для измерения рентабельности инвестиций (ROI) — например, оборачиваемость запасов дополнительный раз в течение определенного периода или снижение затрат на транспортировку одной отгрузки. Сложнее определить неявные выгоды, такие как улучшенный доступ к информации, с точки зрения материальной ценности.

Подключите свой проект, чтобы узнать деловые запросы

Слишком часто планировщики проектов пытаются связать ценность склада с расплывчатыми целями предприятия. Заявив, что «ценность склада зависит от нашей способности удовлетворять стратегические запросы», мы начинаем дискуссию в приятной форме. Но одного этого недостаточно, чтобы определить, имеет ли смысл инвестировать в склад. Лучше всего связывать представителей склада с конкретными бизнес-запросами и заметками.

Измерить рентабельность инвестиций

Расчет рентабельности инвестиций в условиях склада может быть особенно сложным. Особенно трудно, если ведущий

конкретного повторения является чем-то неосязаемым или легко поддающимся измерению. Одно исследование показало, что пользователи видят два основных преимущества инициатив BI:

  • ▪ Создайте способность принимать решения
  • ▪ Создать доступ к информации
    Эти льготы являются мягкими (или мягкими) льготами. Легко понять, как мы можем рассчитать рентабельность инвестиций на основе серьезной (или большей) выгоды, такой как снижение стоимости перевозки, но как мы можем измерить способность принимать лучшие решения?
    Это определенно является проблемой для планировщиков проектов, когда они пытаются заставить компанию инвестировать в конкретный склад. Увеличение продаж или снижение затрат больше не являются центральными темами, определяющими среду BI.
    Вместо этого вы ищете бизнес-запросы для лучшего доступа к информации, чтобы конкретный отдел мог быстрее принимать решения. Это стратегические движущие силы, которые одинаково важны для предприятия, но они более неоднозначны и их труднее охарактеризовать в осязаемой метрике. В этом случае расчет ROI может ввести в заблуждение, если вообще не иметь значения.
    Разработчики проекта должны быть в состоянии продемонстрировать ощутимую ценность для руководителей, чтобы решить, стоит ли вложение в конкретную итерацию. Однако мы не будем предлагать новый метод расчета ROI и не будем приводить никаких аргументов за или против него.
    Существует множество статей и книг, в которых обсуждаются основы расчета ROI. Существуют специальные ценностные предложения, такие как ценность инвестиций (VOI), предлагаемые такими группами, как Gartner, которые вы можете изучить. Вместо этого мы сосредоточимся на основных аспектах любой рентабельности инвестиций или других ценностных предложениях, которые вам необходимо учитывать. Применение ROI Помимо спора о «жестких» и «мягких» преимуществах, связанных с усилиями BI, есть и другие вопросы, которые следует учитывать при оценке рентабельности инвестиций. Например:

Приписывание слишком большой экономии усилиям DW, которые все равно будут получены
Предположим, ваша компания перешла от архитектуры мэйнфреймов к распределенной среде UNIX. Таким образом, любые сбережения, которые могут (или не могут) быть реализованы в результате этих усилий, не должны быть отнесены исключительно, если вообще (?), к складу.

Не учитывать все дорого. И есть много вещей, которые нужно учитывать. Рассмотрим следующий список:

  • ▪ Стоимость запуска, включая технико-экономическое обоснование.
  • ▪ Стоимость выделенного оборудования с соответствующим хранилищем и связью
  • ▪ Стоимость программного обеспечения, включая управление дать и клиент-серверные расширения, программное обеспечение ETL, технологии DSS, инструменты визуализации, приложения для планирования и рабочего процесса, а также программное обеспечение для мониторинга.
  • ▪ Стоимость проектирования конструкции дать, с созданием и оптимизацией
  • ▪ Затраты на разработку программного обеспечения, непосредственно связанные с работой BI.
  • ▪ Стоимость поддержки на дому, включая оптимизацию производительности, в том числе контроль версий программного обеспечения и справочные операции. Примените «большой взрыв» ROI. Построение склада как единое гигантское усилие обречено на провал, поэтому рассчитайте рентабельность инвестиций для инициативы крупного предприятия. Предложение удивительно, и планировщики продолжают предпринимать слабые попытки оценить ценность всех усилий. Почему планировщики пытаются оценить бизнес-инициативу в денежном выражении, если широко известно и общепризнано, что оценка конкретных итераций затруднена? Как это возможно? Это невозможно за редким исключением. Не делай этого. Теперь, когда мы выяснили, чего не следует делать при расчете рентабельности инвестиций, вот несколько моментов, которые помогут вам установить надежный процесс оценки ценности ваших усилий по BI.

Получение согласия на возврат инвестиций. Независимо от выбранного вами метода оценки ценности ваших усилий по BI, он должен быть согласован всеми сторонами, включая планировщиков проекта, спонсоров и руководителей компаний.

Разбейте рентабельность инвестиций на идентифицируемые части. Необходимым шагом к разумному расчету рентабельности инвестиций является сосредоточение этого расчета на конкретном проекте. Затем это позволяет вам оценить стоимость на основе конкретных бизнес-требований, которые выполняются.

Определите затраты. Как уже упоминалось, необходимо учитывать многочисленные затраты. Кроме того, затраты должны включать не только затраты, связанные с отдельной итерацией, но и затраты, связанные с обеспечением соответствия корпоративным стандартам.

Определите преимущества. Четко связывая рентабельность инвестиций с конкретными бизнес-требованиями, мы должны быть в состоянии определить преимущества, которые приведут к выполнению требований.

Сокращение затрат и выгод в неизбежных выгодах. Это лучший способ основывать свои оценки на чистой приведенной стоимости (NPV), а не пытаться предсказать будущую стоимость будущих доходов.

Сведите к минимуму время, необходимое для разделения ROI. Это хорошо задокументировано в долгосрочной перспективе, когда оно использовалось в вашем ROI.

Используйте более одной формулы ROI. Существует множество методов прогнозирования рентабельности инвестиций, и вы должны запланировать использование одного или нескольких из них, включая чистую приведенную стоимость, внутреннюю норму прибыли (IRR) и окупаемость.

Дайте определение повторяемому процессу. Это имеет решающее значение для расчета любой долгосрочной стоимости. Один повторяющийся процесс должен быть задокументирован для всех последующих подпоследовательностей проекта.

Перечисленные проблемы являются наиболее распространенными, определяемыми экспертами по окружающей среде складских помещений. Настойчивость руководства в достижении «большого взрыва» рентабельности инвестиций очень сбивает с толку. Если вы начнете все свои расчеты рентабельности инвестиций, разбив их на идентифицируемые, осязаемые части, у вас есть хорошие шансы получить точную оценку рентабельности инвестиций.

Вопросы о рентабельности инвестиций

Какими бы ни были ваши преимущества, мягкими или жесткими, вы можете использовать несколько основных вопросов, чтобы определить их ценность. Например, используя простую систему шкалы от 1 до 10, вы можете измерить влияние любых усилий, используя следующие вопросы:

  • Как бы вы оценили понимание дать следите за этим проектом вашей компании?
  • Как бы вы оценили улучшения процесса в результате этого проекта?
  • Как бы вы оценили влияние новых идей и выводов, которые стали доступны благодаря этой итерации?
  • Каково влияние новой и лучшей компьютерной среды в результате того, что было изучено? Если ответов на эти вопросы мало, возможно, предприятие не стоит вложенных средств. Вопросы с высокой оценкой указывают на значительный выигрыш в ценности и должны служить руководством для дальнейшего исследования. Например, высокий балл за улучшения процессов должен побудить разработчиков изучить, как процессы были улучшены. Вы можете обнаружить, что некоторые или все полученные выгоды осязаемы, и поэтому их можно легко оценить в денежном выражении. Получение максимальной отдачи от первой итерации склад Самая большая отдача от ваших корпоративных усилий часто приходится на первые несколько итераций. Эти ранние попытки традиционно создают наиболее полезный информационный контент для общественности и помогают создать технологическую основу для последующих приложений бизнес-аналитики. Обычно каждая последующая подпоследовательность дать складских проектов приносят все меньше и меньше дополнительной ценности предприятию в целом. Это особенно верно, если итерация не добавляет новых тем или не отвечает потребностям нового сообщества пользователей.

Эта функция хранения также применяется к растущим стопкам дать историки. Поскольку последующие усилия требуют большего дать и как еще дать заливаются на склад с течением времени, большая часть дать он становится менее релевантным для используемого анализа. Эти дать их часто называют дать бездействуют, и содержать их всегда дорого, потому что они почти никогда не используются.

Что это значит для спонсоров проекта? По сути, первые спонсоры делят больше, чем инвестиционные затраты. Это первично, потому что они являются толчком для создания широкого слоя технологической и ресурсной среды склада, в том числе органического.

Но эти первые шаги имеют наибольшую ценность, и поэтому планировщикам проектов часто приходится оправдывать инвестиции.
Проекты, выполненные после вашей BI-инициативы, могут иметь более низкие (по сравнению с первым) и прямые затраты, но приносить меньшую ценность предприятию.

И владельцам организаций следует задуматься об отказе от наращивания дать и менее актуальные технологии.

Интеллектуальный анализ данных: извлечение Давать

Многие архитектурные компоненты требуют вариаций технологий и методов интеллектуального анализа данных.
например, различные «агенты» для изучения достопримечательностей клиентов, операционные системы компании и для того же dw. Эти агенты могут быть продвинутыми нейронными сетями, обученными тенденциям в отношении марихуаны, таким как будущий спрос на продукт на основе стимулирования сбыта; основанные на правилах механизмы для реагирования на набор дата обстоятельств, например, врачебный диагноз и рекомендации по лечению; или даже простые агенты с ролью сообщения об исключениях высшему руководству. Как правило, эти процессы экстракции дать si

проверить в режиме реального времени; следовательно, они должны полностью соединиться с движением дать сами по себе.

Аналитическая онлайн-обработка

Онлайн аналитика

Возможность нарезать, нарезать кубиками, сворачивать, детализировать и выполнять анализ
что, если, находится в рамках, в рамках набора технологий IBM. Например, для DB2 существуют функции интерактивной аналитической обработки (OLAP), которые привносят многомерный анализ в механизм СУБД. база данных stesso.

Функции добавляют многомерность SQL, одновременно пользуясь всеми преимуществами того, что они являются естественной частью DB2. Другим примером интеграции OLAP является инструмент извлечения, DB2 OLAP Analyzer Server. Эта технология позволяет быстро и автоматически сканировать кубы DB2 OLAP Server, чтобы обнаруживать и сообщать о значениях дать необычное или неожиданное для любого куба торговому аналитику. И, наконец, функции DW Center предоставляют архитекторам средства для проверки, среди прочего, профиля сервера куба OLAP DB2 как естественной части процессов ETL.

Пространственный анализ Пространственный анализ

Пространство представляет собой половину аналитических якорей (проводников), необходимых для панорамы.
широкий аналитический (время представляет другую половину). Атомарный уровень склада, представленный на рис. 1.1, включает в себя основы как времени, так и пространства. Отметки времени привязывают анализы по времени, а адресные информационные привязки анализируют по пространству. Временные метки проводят анализ по времени, а адресная информация проводит анализ по пространству. На диаграмме показано геокодирование — процесс преобразования адресов в точки на карте или точки в пространстве, чтобы в анализе можно было использовать такие понятия, как расстояние и внутри/снаружи, — проводимый на атомарном уровне, а пространственный анализ доступен аналитику. IBM предоставляет пространственные расширения, разработанные совместно с Исследовательским институтом экологических систем (ESRI), и др. база данных DB2, чтобы пространственные объекты можно было поддерживать как обычную часть база данных относительный. db2

Spatial Extenders также предоставляют все расширения SQL для использования преимуществ пространственного анализа. Например, расширения SQL для запроса
расстояния между адресами или того, находится ли точка внутри или за пределами определенной многоугольной области, являются аналитическим стандартом для Spatial Extender. Дополнительную информацию см. в главе 16.

База данных-Резидентные инструменты Инструменты База данных-Резидент

В DB2 есть много резидентных функций SQL BI, которые помогают в синтаксическом анализе. К ним относятся:

  • Функции рекурсии для выполнения анализа, такие как «найти все возможные траектории полета из Сан-Франциско a New York».
  • Аналитические функции для ранжирования, суммирования, куба и сводных функций для облегчения задач, которые обычно возникают только при использовании технологии OLAP, теперь являются естественной частью механизма база данных
  • Возможность создавать таблицы, содержащие результаты
    Продавцы база данных лидеры смешивают больше функций BI в база данных то же самое.
    Основные поставщики база данных они смешивают больше функций BI в база данных то же самое.
    Это обеспечивает лучшую производительность и больше возможностей выполнения для решений бизнес-аналитики.
    Возможности и функции DB2 V8 подробно обсуждаются в следующих главах:
    Основы технической архитектуры и управления данными (глава 5)
  • Основы бизнес-аналитики DB2 (глава 6)
  • Материализованные таблицы запросов DB2 (глава 7)
  • Функции OLAP DB2 (глава 13)
  • Расширенные возможности и функции бизнес-аналитики DB2 (глава 15) Упрощенная система доставки данных Система доставки дать упрощенный

Архитектура, изображенная на рис. 1.1, включает множество структур. дать физ. Один из них - склад дать операционная. Как правило, ODS является объектно-ориентированным, интегрированным и актуальным. Вы создадите ODS для поддержки, например, офиса продаж. Продажа ОРВ дополнит дать из многих разных систем, но сохранил бы, например, только сегодняшние транзакции. ODS также может обновляться много раз в день. Одновременно процессы толкают i дать интегрируется в другие приложения. Эта структура специально разработана для интеграции дать текущим и динамичным и может быть вероятным кандидатом для поддержки аналитики в реальном времени, такой как предоставление сервисных агентов клиентов информацию о текущих продажах клиента путем извлечения информации о тенденциях продаж из самого инвентаря. Другая структура, показанная на рис. 1.1, представляет собой формальное состояние для dw. Мало того, что это место для выполнения необходимой интеграции, качества дать, и преобразования дать входного склада, но также является надежной и временной площадкой для хранения дать повторения, которые можно было бы использовать в анализе в реальном времени. Если вы решите использовать ODS или промежуточную зону, один из лучших инструментов для заполнения этих структур дать использование различных операционных источников — гетерогенный распределенный запрос DB2. Эта возможность предоставляется дополнительной функцией DB2 под названием DB2 Relational Connect (только запросы) и с помощью DB2 DataJoiner (отдельный продукт, предоставляющий возможности запроса, вставки, обновления и удаления для разнородных распределенных СУБД).

Эта технология позволяет архитекторам дать связать дать производства с аналитическими процессами. Эта технология может не только адаптироваться практически к любым требованиям репликации, которые могут возникнуть при использовании аналитики в реальном времени, но также может подключаться к широкому спектру дать самые популярные, включая DB2, Oracle, Sybase, SQL Server, Informix и другие. DB2 DataJoiner можно использовать для заполнения структуры дать формальные, такие как ODS или даже постоянная таблица, представленная на складе, предназначенная для быстрого восстановления мгновенных обновлений или для продажи. Конечно, сами эти структуры дать можно заполнить с помощью

еще одна важная технология, предназначенная для воспроизведения дать, IBM DataPropagator Relational. (DataPropagator — это отдельный продукт для центральных систем. DB2 UNIX, Linux, Windows и OS/2 включают службы репликации дать как стандартная функция).
Еще один способ перемещения дать на предприятии работает интегратор корпоративных приложений, также известный как брокер сообщений.Эта уникальная технология обеспечивает непревзойденный контроль над нацеливанием и перемещением дать вокруг компании. У IBM есть наиболее широко используемый брокер сообщений, MQSeries, или вариант продукта, который включает требования для электронная коммерция, IBM WebSphere MQ.
Для получения дополнительной информации о том, как использовать MQ для поддержки среды хранения и бизнес-аналитики, посетите сайт книги. На данный момент достаточно сказать, что эта технология является отличным средством для захвата и преобразования (с использованием MQSeries Integrator). дать целевых оперативников, набранных для решений BI. Технология MQ была интегрирована и упакована в UDB V8, что означает, что очередями сообщений теперь можно управлять, как если бы они были таблицами DB2. Концепция сообщений очереди сварки и вселенная база данных реляционная направлена ​​на мощную среду доставки дать.

Нулевая задержка

Конечной стратегической целью IBM является анализ с нулевой задержкой. Как определено
Gartner, система бизнес-аналитики должна быть способна делать выводы, принимать и предоставлять информацию аналитикам по запросу. Проблема, конечно, в том, как смешать дать текущий и в режиме реального времени с необходимой исторической информацией, такой как i дать связанная тенденция / шаблон или извлеченная информация, такая как профилирование клиентов.

Такая информация включает, например, идентификацию клиентов высокий или низкий риск или какие продукты я клиентов они, скорее всего, купят, если в их корзинах уже есть сыр.

Получение нулевой задержки на самом деле зависит от двух основных механизмов:

  • Полный союз дать которые анализируются с помощью установленных методов и инструментов, созданных BI
  • Система доставки дать эффективно, чтобы обеспечить действительно доступную аналитику в реальном времени. Эти предпосылки для нулевой задержки ничем не отличаются от двух целей, поставленных IBM и описанных выше. Тесная связь дать это часть программы бесшовной интеграции IBM. И создать систему доставки дать эффективность полностью зависит от доступной технологии, которая упрощает процесс доставки дать. Следовательно, две из трех целей IBM имеют решающее значение для достижения третьей. IBM сознательно развивает свою технологию, чтобы гарантировать, что нулевая задержка станет реальностью для складских операций. Резюме / Синтез Ваша организация BI предоставляет дорожную карту для создания вашей среды
    итеративно. Он должен быть скорректирован с учетом потребностей вашего бизнеса, как текущих, так и будущих. Без широкого архитектурного видения итерации хранилища представляют собой не более чем случайные реализации центрального хранилища, которые мало что делают для создания крупного информативного предприятия. Первым препятствием для руководителей проектов является то, как оправдать инвестиции, необходимые для развития организации BI. В то время как расчеты рентабельности инвестиций остаются основой достижений инвентаризации, становится все труднее точно предсказать. Это привело к появлению других методов определения того, оправдываете ли вы свои деньги. Например, Value on Investment2 (VOI) приобретается как решение. Это возлагается на архитекторов дать и о том, что планировщики проектов намеренно генерируют и предоставляют информацию ассоциациям пользователей, а не просто предоставляют услуги по дать. Между ними огромная разница. Информация — это то, что влияет на принятие решений и эффективность; относительно, я дать они являются строительными блоками для получения этой информации.

Даже при критическом отношении к источнику дать для удовлетворения потребностей бизнеса среда BI должна играть более важную роль в создании информационного контента. Мы должны предпринять дополнительные шаги для очистки, интеграции, преобразования или иного создания информационного контента, с которым могут действовать пользователи, а затем мы должны обеспечить, чтобы эти действия и решения, где это разумно, отражались в среде BI. Если мы передаем склад для обслуживания только на дать, будьте уверены, что ассоциации пользователей создадут информационный контент, необходимый для принятия мер. Это гарантирует, что их сообщество сможет принимать лучшие решения, но предприятие страдает от недостатка знаний, которые они использовали. Данный что архитекторы и планировщики проектов инициируют конкретные проекты в среде BI, они остаются подотчетными предприятию в целом. Простой пример этой двусторонней функции итераций BI можно найти в источнике дать, все дать полученные по конкретным коммерческим запросам, должны быть заполнены на первом атомарном уровне. Это обеспечивает развитие корпоративного информационного актива, а также управление, решение конкретных запросов пользователей, определенных в итерации.

Что такое хранилище данных?

Хранилище данных является сердцем архитектуры информационных систем с 1990 года и поддерживает информационные процессы, предлагая надежную интегрированную платформу дать История взята за основу для последующего анализа. НАШИ информационное хранилище они предлагают простоту интеграции в мир несовместимых прикладных систем. Хранилище данных это превратилось в причуду. Хранилище данных организовать и запомнить я дать необходимые для информационно-аналитических процессов на основе длительной исторической временной перспективы. Все это требует значительных и постоянных усилий по строительству и обслуживанию информационное хранилище.

Итак, что такое информационное хранилище? информационное хранилище является:

  • ▪ предметная направленность
  • ▪ интегрированная система
  • ▪ изменение времени
  • ▪ энергонезависимый (не отменяет)

коллекция дать используется для поддержки управленческих решений при реализации процессов.
I дать вставлен в информационное хранилище они происходят в большинстве случаев из операционной среды. информационное хранилище он сделан из блока хранения, физически отделенного от остальной части системы, которую он содержит дать ранее преобразованные приложениями, работающими с информацией, полученной из операционной среды.

Буквальное определение информационное хранилище он заслуживает тщательного объяснения, поскольку существуют важные мотивы и основные значения, описывающие характеристики склада.

ПРЕДМЕТНАЯ ОРИЕНТАЦИЯ ОРИЕНТАЦИЯ ТЕМАТИЧЕСКИЙ

Первая особенность информационное хранилище заключается в том, что он ориентирован на основные предметы компании. Руководство процессами через дать он контрастирует с более классическим методом, который обеспечивает ориентацию приложений на процессы и функции, метод, который в основном используется в большинстве менее современных систем управления.

Операционный мир разработан вокруг приложений и функций, таких как кредиты, сбережения, банковские карты и траст для финансового учреждения. Мир dw организован вокруг основных субъектов, таких как покупатель, продавец, продукт и деятельность. Выравнивание по темам влияет на разработку и реализацию дать нашел в дв. Самое главное, основная тема затрагивает самую важную часть ключевой структуры.

На мир приложений влияет как дизайн базы данных, так и дизайн процессов. Мир dw ориентирован исключительно на видеомоделирование дать и на дизайне база данных. Процесс проектирования (в его классическом виде) не является частью среды dw.

Различия между выбором приложения процесса/функции и выбором предмета выявляются также как различия в содержании процесса. дать на детальном уровне. НАШИ дать del dw не включает i дать которые не будут использоваться для обработки DSS, пока приложения

оперативный дать содержать я дать для немедленного удовлетворения функциональных требований/требований к обработке, которые могут иметь или не иметь никакого значения для аналитика DSS.
Еще один важный способ, с помощью которого операционно-ориентированные приложения для дать отличаться от дать dw находится в отчетах дать. дать операторы поддерживают постоянную связь между двумя или более таблицами на основе активного бизнес-правила. НАШИ дать dw охватывают спектр времени, и отчеты, найденные в dw, многочисленны. Многие торговые правила (и, соответственно, многие отчеты о дать ) представлены на складе дать между двумя и более столами.

(Для подробного объяснения того, как отношения между дать управляются в DW, обратитесь к технической теме по этому вопросу.)
Ни с какой другой точки зрения, кроме как с точки зрения фундаментальной разницы между выбором функционального/процессного приложения и выбором предмета, нет ли существенной разницы между операционными системами и дать и ДВ.

ИНТЕГРАЦИЯ ИНТЕГРАЦИЯ

Наиболее важным аспектом среды dw является то, что я дать найденные в dw легко интегрируются. ВСЕГДА. БЕЗ ИСКЛЮЧЕНИЙ. Сама суть среды dw заключается в том, что я дать содержащиеся в пределах склада интегрированы.

Интеграция проявляется по-разному: в согласованных идентифицированных соглашениях, в согласованных измерениях переменных, в согласованных закодированных структурах, в физических атрибутах объектов. дать последовательный и так далее.

За прошедшие годы разработчики различных приложений приняли множество решений о том, как следует разрабатывать приложение. Стиль и индивидуальные дизайнерские решения дизайнерских приложений проявляются сотней способов: в различиях в кодировании, ключевой структуре, физических характеристиках, условностях идентификации и так далее. О коллективной способности многих дизайнеров приложений создавать противоречивые приложения ходят легенды. На рис. 3 показаны некоторые из наиболее важных отличий в разработке приложений.

Кодировка: Кодировать:

Разработчики приложений выбрали кодирование поля — пол — несколькими способами. Дизайнер представляет гендер как «м» и «ж». Другой дизайнер представляет пол как «1» и «0». Другой дизайнер представляет гендер как «х» и «у». Другой дизайнер представляет пол как «мужской» и «женский». На самом деле не имеет значения, как секс попадает в DW. «М» и «Ж», вероятно, так же хороши, как и любое другое представление.

Важно то, что из какого бы источника ни исходило половое поле, это поле поступает в ДГ в непротиворечивом интегрированном состоянии. Следовательно, когда поле загружается в ХД из приложения, где оно было представлено снаружи в формате «M» и «F», дать необходимо преобразовать в формат DW.

Измерение атрибутов: измерение Атрибуты:

Разработчики приложений на протяжении многих лет выбирали различные способы измерения конвейера. Дизайнерские магазины я дать трубопровода в сантиметрах. Другой дизайнер приложений хранит дать трубопровода в дюймах. Другой дизайнер приложений хранит дать трубопровода в миллионах кубических футов в секунду. А другой дизайнер хранит информацию о трубопроводе в ярдах. Каким бы ни был источник, когда конвейерная информация поступает в ХД, она должна измеряться одинаковым образом.

Как показано на рис. 3, вопросы интеграции затрагивают почти каждый аспект проекта — физические характеристики дать, дилемма наличия более чем одного источника дать, проблема несоответствия идентифицированных образцов, форматов дать непоследовательный и так далее.

Каким бы ни был аргумент дизайна, результат один и тот же – i дать должны храниться в DW уникальным и глобально приемлемым способом, даже если базовые операционные системы хранят i дать.

Когда аналитик DSS смотрит на DW, его внимание должно быть сосредоточено на использовании дать которые находятся на складе,

вместо того, чтобы задаваться вопросом о достоверности или последовательности дать.

ОТКЛОНЕНИЕ ПО ВРЕМЕНИ

Все дать в ДГ они точны до некоторого момента времени. Эта основная черта дать в DW сильно отличается от дать обнаружены в операционной среде. НАШИ дать операционной среды так же точны, как и на момент доступа. Другими словами, в операционной среде при доступе к устройству дать, ожидается, что он будет отражать значения так же точно, как и на момент доступа. Почему я дать в DW точны как в какой-то момент времени (т. е. не «прямо сейчас»), т.е. дать найденные в DW, являются «временной дисперсией».
Разница во времени дать DW упоминается по-разному.
Самый простой способ - я дать ХД представляют дать в долгосрочной перспективе – от пяти до десяти лет. Временной горизонт, изображенный для операционной среды, намного короче сегодняшних текущих значений на величину до шестидесяти девяноста.
Приложения, которые должны хорошо работать и должны быть доступны для обработки транзакций, должны иметь минимальный объем дать если они допускают какую-либо степень гибкости. Таким образом, операционные приложения имеют короткий временной горизонт, например тема дизайна аудиоприложений.
Второй способ появления «временной дисперсии» в DW — в ключевой структуре. Каждая ключевая структура в DW явно или неявно содержит элемент времени, такой как день, неделя, месяц и т. д. Элемент времени почти всегда находится внизу составного ключа, найденного в DW. В этих случаях элемент времени будет существовать неявно, например, в случае, когда весь файл дублируется в конце месяца или квартала.
Третий способ отображения временной дисперсии заключается в том, что i дать ХД, только что корректно прописанные, не могут быть обновлены. НАШИ дать Хранилища данных для всех практических целей представляют собой длинную серию снимков. Конечно, если снимок был сделан неправильно, то снимки можно изменить. Но при условии, что снимки сделаны правильно, они не изменяются сразу после того, как сделаны. В некоторых

случаях изменение моментальных снимков в DW может быть неэтичным или даже недействительным. НАШИ дать действующая, будучи такой же точной, как и на момент доступа, может обновляться по мере необходимости.

НЕ ЭЛЕМЕНТАРНЫЙ

Четвертой важной характеристикой DW является его энергонезависимость.
Обновления, вставки, удаления и изменения в операционных средах выполняются регулярно, по записи. Но основные манипуляции с дать нужно в DW намного проще. В ХД происходят только два вида операций – первоначальная загрузка дать и доступ к дать. Нет обновления дать (в общем смысле обновления) в ХД как обычную операцию обработки. Есть несколько очень важных последствий этого основного различия между оперативной обработкой и обработкой DW. На уровне проектирования необходимость быть осторожным при аварийном обновлении не является фактором для DW, поскольку обновление дать это не выполняется. Это означает, что на физическом уровне проектирования могут быть допущены вольности для оптимизации доступа к дать, особенно при работе с темами нормализации и физической денормализации. Еще одним следствием простоты работы DW является базовая технология, используемая для запуска среды DW. Необходимость поддержки онлайновых обновлений «запись за записью» (как это часто бывает при оперативной обработке) требует, чтобы технология имела очень сложную основу, скрытую за кажущейся простотой.
Технология, поддерживающая резервное копирование и восстановление, транзакции и целостность данных дать а обнаружение и устранение взаимоблокировок довольно сложно и не нужно для обработки DW. Характеристики ХД, ориентация дизайна, интеграция дать внутри DW, разница во времени и простота управления дать, все это приводит к среде, которая очень и очень отличается от классической операционной среды. Источник почти всех дать DW является операционной средой. Заманчиво думать, что существует массовая избыточность дать между двумя средами.
Действительно, первое впечатление, которое возникает у многих людей, — это большая избыточность. дать между операционной средой и окружающей средой

Расширение ДВ. Такая интерпретация поверхностна и свидетельствует о непонимании того, что происходит в ДГ.
Действительно есть минимум избыточности дать между операционной средой и i дать из ДВ. Рассмотрим следующее: я дать они фильтруются дата что вы переключаетесь из операционной среды в среду DW. Много дать они никогда не выходят за пределы операционной среды. Только то, что я дать которые необходимы для обработки DSS, находят свое направление в среде

▪ временной горизонт дать это очень отличается от одной среды к другой. НАШИ дать в операционной среде они очень свежие. НАШИ дать в DW они намного старше. Только с точки зрения временного горизонта между операционной средой и ХД очень мало совпадений.

▪ ХД содержит дать резюме, которых никогда не бывает в среде

▪ я дать претерпевают фундаментальные преобразования по мере перехода к рис. 3, иллюстрирует, что большинство дать существенно модифицируются при условии, что они выбраны и перемещены в ХД. Иными словами, большинство дать он физически и радикально изменяется по мере перемещения в ХД. С точки зрения интеграции они не одинаковы дать проживающих в операционной среде. Учитывая эти факторы, избыточность дать между двумя средами — редкое событие, приводящее к избыточности менее 1 % между двумя средами. СТРУКТУРА СКЛАДА ДС имеют четкую структуру. Существуют различные уровни сводки и детализации, которые разграничивают ХД.
Различные компоненты DW:

Безусловно, главная проблема для меня дать текущие детали. Это основная проблема, потому что:

  • I дать Текущие детали отражают самые последние события, которые всегда представляют большой интерес и
  • i дать текущие подробные данные объемны, потому что они хранятся на самом низком уровне детализации и
  • i дать текущих деталей почти всегда хранятся в дисковой памяти, доступ к которой быстрый, но дорогой и сложный из-за дать детали старше дать которые хранятся в некоторой памяти масса. К нему обращаются спорадически, и он хранится на уровне детализации, совместимом с дать текущие детали. Хотя хранение на альтернативном носителе не обязательно из-за большого объема дать в сочетании со спорадическим доступом дать, носитель информации для дать более старые детали обычно не сохраняются на диске. НАШИ дать легко резюмировать они дать которые перегоняются из найденного низкого уровня детализации в текущий уровень детализации. Этот уровень ХД почти всегда хранится в памяти диска. Проблемы дизайна, которые встают перед архитектором дать в построении этого уровня ХД являются:
  • В какую единицу времени выполнено обобщение, сделанное выше
  • Какое содержание, атрибуты будут немного резюмировать содержание дать Следующий уровень дать найденный в DW, это то, что дать очень кратко. НАШИ дать очень кратко, компактны и легко доступны. НАШИ дать очень обобщенные иногда встречаются в среде DW и других случаях i дать высоко абстрактные находятся за пределами непосредственных стен технологии, на которой размещается ХД. (во всяком случае я дать высоко обобщенные являются частью DW независимо от того, где я дать находятся физически). Последним компонентом DW является компонент метаданных. Во многих отношениях метаданные находятся в другом измерении, чем другие. дать ХД, потому что метаданные не содержат никаких дата непосредственно из операционной среды. Метаданные играют особую и очень важную роль в DW. Метаданные используются как:
  • каталог, чтобы помочь аналитику DSS найти содержимое DW,
  • руководство по составлению карт дать как я дать были преобразованы из операционной среды в среду DW,
  • руководство по алгоритмам, используемым для суммирования между i дать текущие детали дать немного подытожил, я дать Подводя итог, метаданные играют гораздо большую роль в среде DW, чем когда-либо в операционной среде. СРЕДСТВО ДЛЯ ХРАНЕНИЯ СТАРЫХ ДЕТАЛЕЙ Магнитную ленту можно использовать для хранения такого рода дать. Действительно, существует большое разнообразие носителей, которые следует учитывать для хранения старых. дать деталей. В зависимости от объема дать, частота доступа, стоимость инструментов и тип доступа, вполне вероятно, что другим инструментам потребуется старый уровень детализации в ХД. ПОТОК ДАННЫХ Существует нормальный и предсказуемый поток дать внутри ДВ.
    I дать они попадают в ХД из операционной среды. (ПРИМЕЧАНИЕ. Из этого правила есть несколько очень интересных исключений. Однако почти все дать войти в ХД из операционной среды). Данный че я дать они попадают в ХД из операционной среды, она трансформируется, как описано выше. Если вы войдете в DW, я дать введите текущий уровень детализации, как показано. Он находится там и используется до тех пор, пока не произойдет одно из трех событий:
  • очищается,
  • суммируется, и/или ▪является Устаревший процесс внутри ХД перемещает i дать текущие детали а дать детали старые, по возрасту дать. Процесс

обобщение использует детали дать рассчитать дать малообобщенные и высокообобщенные уровни дать. Есть некоторые исключения из показанного потока (будут обсуждаться позже). Однако, как правило, для подавляющего большинства дать находится в DW, поток дать это так, как представлено.

ИСПОЛЬЗОВАНИЕ ХРАНИЛИЩА ДАННЫХ

Неудивительно, что различные уровни дать внутри ХД они не получают разных уровней использования. Как правило, чем выше уровень обобщения, тем больше i дать Они используются.
Многие виды использования встречаются в дать очень кратко, в то время как старый дать деталей практически не используются. Есть веская причина для перехода организации на парадигму использования ресурсов. Более подытожил я дать, тем быстрее и эффективнее будет достигнуть дать. Если магазин обнаруживает, что он выполняет большую обработку DW на уровне детализации, тогда потребляется соответственно большое количество машинных ресурсов. В интересах всех как можно скорее обработать резюме такого высокого уровня.

Для многих магазинов аналитик DSS в среде до DW использовал дать на уровне детализации. Во многом приход в дать детализированное выглядит как одеяло безопасности, даже когда доступны другие уровни обобщения. Одно из направлений деятельности архитектора дать заключается в том, чтобы отучить пользователя DSS от постоянного использования дать на самом низком уровне детализации. У архитектора есть два мотива. дать:

  • установка системы возвратных платежей, где конечный пользователь платит за потребляемые ресурсы e
  • которые показывают, что очень хорошее время отклика может быть получено, когда поведение с i дать находится на высоком уровне обобщения, в то время как плохое время отклика связано с поведением дать на низком уровне ДРУГИЕ СООБРАЖЕНИЯ Есть несколько других соображений по созданию и управлению DW.
    Первое соображение касается индексов. НАШИ дать на более высоких уровнях обобщения их можно свободно индексировать, в то время как i дать

на более низких уровнях детализации они настолько объемны, что их можно экономно индексировать. Из того же токена я дать на высоких уровнях детализации можно относительно легко реструктурировать, в то время как объем дать на нижних уровнях она настолько велика, что я дать они не могут быть легко восстановлены. Следовательно, модель дать и формальная работа, проделанная при проектировании, закладывает основу для DW, применяемого почти исключительно к текущему уровню детализации. Другими словами, деятельность по моделированию дать они не применяются к уровням суммирования почти во всех случаях. Еще одним структурным соображением является подразделение дать по ДВ.

Раздел можно сделать на двух уровнях – на уровне СУБД и на уровне приложения. В дивизии на уровне СУБД, то СУБД информируется о подразделениях и соответствующим образом контролирует их. В случае с подразделением прикладного уровня только программист знает о подразделениях, и ответственность за их администрирование остается на нем.

Ниже уровня СУБД, большая часть работы выполняется автоматически. Существует много негибкости, связанной с самоуправлением подразделений. В случае применения на уровне подразделения дать из информационное хранилище, большая часть работы ложится на программиста, но конечным результатом является гибкость в администрировании дать в информационное хранилище

ДРУГИЕ АНОМАЛИИ

В то время как компоненты информационное хранилище работают, как описано почти для всех дать, есть несколько полезных исключений, которые необходимо обсудить. Исключение составляет тот, дать публичные сводки (общедоступные сводные данные). Это дать сводки, рассчитанные на основе информационное хранилище но они используются обществом. НАШИ дать общедоступные сводки хранятся и управляются в информационное хранилище, хотя как было сказано выше они вычисляются. Бухгалтеры работают над созданием таких ежеквартальных дать такие как доход, квартальные расходы, квартальная прибыль и так далее. Работа, выполняемая бухгалтерами, является внешней по отношению к информационное хранилище. Однако я дать используются «внутри» внутри компании – от маркетинга, продажи и т. д. Другая аномалия, о которой мы не будем говорить, — это дать внешний.

Еще один выдающийся тип дать который можно найти в информационное хранилище это постоянные подробные данные. Это вызывает необходимость постоянного хранения дать на детальном уровне по этическим или юридическим причинам. Если компания подвергает своих работников воздействию вредных веществ, в этом есть необходимость. дать подробно и постоянно. Если компания производит продукт, связанный с общественной безопасностью, например детали для самолета, необходимо дать постоянные реквизиты, а также если компания заключает опасные контракты.

Компания не может позволить себе упускать из виду детали, потому что в течение следующих нескольких лет, в случае судебного иска, отзыва, спорного строительного дефекта и т. подверженность компании может быть большой. В результате возникает уникальный тип дать известные как постоянные подробные данные.

РЕЗЮМЕ

Un информационное хранилище это предметно-ориентированный, интегрированный, временный вариант, совокупность дать энергонезависимой в поддержку принятия решений потребностей администрации. Каждая из важнейших функций информационное хранилище имеет свои последствия. Кроме того, существует четыре уровня дать из информационное хранилище:

  • Старые детали
  • Текущая деталь
  • Давать слегка резюмированный
  • Давать обобщенные метаданные также являются важной частью информационное хранилище. АННОТАЦИЯ Концепция хранения дать в последнее время ему уделяется много внимания и он стал тенденцией 90-х.Это связано со способностью информационное хранилище преодолеть ограничения систем поддержки управления, таких как системы поддержки принятия решений (DSS) и исполнительные информационные системы (EIS). Несмотря на то, что концепция информационное хранилище выглядит многообещающе, реализую информационное хранилище может быть проблематичным из-за крупномасштабных складских процессов. Несмотря на сложность складских проектов дать, многие поставщики и консультанты, которые дать утверждают, что хранение дать представить не проблема. Однако в начале этого исследовательского проекта едва ли проводились какие-либо независимые, строгие и систематические исследования. Следовательно, трудно сказать, что на самом деле происходит в промышленности, когда они строятся. информационное хранилище. В этом исследовании изучалась складская практика дать современников, целью которого является более глубокое понимание австралийской практики. Обзор литературы предоставил контекст и основу для эмпирического исследования. Есть ряд результатов этого исследования. Во-первых, это исследование выявило деятельность, которая происходила во время разработки информационное хранилище. Во многих областях я дать Собрание подтвердило практику, описанную в литературе. Во-вторых, вопросы и проблемы, которые могут повлиять на развитие информационное хранилище были выявлены этим исследованием. Наконец, преимущества, полученные австралийскими организациями в связи с использованием информационное хранилище были раскрыты.

Глава 1

Контекст поиска

Концепция хранилищ данных получила широкое распространение и стала новой тенденцией в 90-х годах (McFadden 1996, TDWI 1996, Shah and Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman and Oates 2000). Это видно из растущего числа статей о хранении данных в отраслевых изданиях (Little and Gibson, 1999). Многие статьи (см., например, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett and King 1996, Graham et al. 1996, Sakaguchi and Frolick 1996, Alvarez 1997, Brousell 1997, Clarke 1997, McCarthy 1997, O'Donnell 1997, Эдвардс, 1998 г., TDWI, 1999 г.) сообщают о значительных преимуществах для организаций, внедряющих информационное хранилище. Они подкрепили свою теорию неподтвержденными данными об успешных внедрениях, высокой рентабельности инвестиций (ROI), а также предоставили рекомендации или методологии для разработки информационное хранилище

(Шенкс и др., 1997; Седдон и Бенджамин, 1998; Литтл и Гибсон, 1999). В крайнем случае Graham et al. (1996) сообщают о средней доходности трехлетних инвестиций в размере 401%.

Однако большая часть современной литературы упускает из виду сложности, связанные с осуществлением таких проектов. Проекты информационное хранилище они обычно сложны и крупномасштабны и, следовательно, несут в себе высокую вероятность неудачи, если их тщательно не контролировать (Shah and Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs and Clymer 1998, Rao 1998). Они требуют огромного количества как человеческих, так и финансовых ресурсов, времени и усилий для их создания (Hill 1998, Crofts 1998). Типичные требуемые время и финансовые средства составляют около двух лет и от двух до трех миллионов долларов соответственно (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). На этот раз требуются время и финансовые средства для контроля и консолидации многих различных аспектов хранения данных (Cafasso 1995, Hill 1998). Помимо аппаратных и программных соображений, другие функции, которые отличаются от извлечения дать к процессам загрузки дать, объем памяти для управления обновлениями и мета дать необходимо учитывать для обучения пользователей.

В то время, когда начинался этот исследовательский проект, в области хранилищ данных проводилось очень мало академических исследований, особенно в Австралии. Это было очевидно из-за нехватки статей, опубликованных о хранилищах данных в журналах или других научных трудах того времени. Опыт США описан во многих доступных академических трудах. Отсутствие академических исследований в области хранилищ данных вызвало спрос на тщательные исследования и эмпирические исследования (McFadden 1996, Shanks et al. 1997, Little and Gibson 1999). В частности, исследования процесса реализации информационное хранилище необходимо сделать, чтобы расширить общие знания о реализации информационное хранилище и послужит основой для будущих исследований (Шенкс и др., 1997; Литтл и Гибсон, 1999).

Таким образом, целью данного исследования является изучение того, что на самом деле происходит, когда организации внедряют и используют i информационное хранилище в Австралии. В частности, это исследование будет включать анализ всего процесса разработки информационное хранилище, начиная с инициирования и проектирования, заканчивая проектированием и внедрением и последующим использованием в австралийских организациях. Кроме того, исследование также внесет вклад в текущую практику, выявив области, в которых практику можно улучшить и свести к минимуму или избежать неэффективности и рисков. Кроме того, он послужит основой для других исследований по информационное хранилище в Австралии и заполнит пробел, существующий в настоящее время в литературе.

Вопросы исследования

Целью данного исследования является изучение деятельности, связанной с осуществлением информационное хранилище и их использование австралийскими организациями. В частности, изучаются элементы, касающиеся планирования проекта, разработки, эксплуатации, использования и сопутствующих рисков. Итак, вопрос исследования:

«Как обстоят дела с нынешней практикой информационное хранилище в Австралии?"

Чтобы эффективно ответить на этот вопрос, требуется ряд вспомогательных исследовательских вопросов. В частности, из литературы, представленной в главе 2, были определены три подвопроса, которыми можно руководствоваться в этом исследовательском проекте: информационное хранилище австралийскими организациями? Какие проблемы возникают?

Каковы преимущества?
Для ответа на эти вопросы был использован исследовательский дизайн с использованием опроса. Как предварительное исследование, ответы на приведенные выше вопросы не являются полными (Шэнкс и др., 1993, Денскомб, 1998). В этом случае требуется некоторая триангуляция, чтобы улучшить ответы на эти вопросы. Тем не менее, исследование заложит прочную основу для будущей работы по изучению этих вопросов. Подробное обсуждение обоснования и дизайна метода исследования представлено в главе 3.

Структура исследовательского проекта

Этот исследовательский проект разделен на две части: контекстуальное изучение концепции хранилища данных и эмпирическое исследование (см. рис. 1.1), каждая из которых обсуждается ниже.

Часть I: Контекстное исследование

Первая часть исследования состояла из обзора современной литературы по различным типам хранилищ данных, включая системы поддержки принятия решений (DSS), исполнительные информационные системы (EIS), тематические исследования информационное хранилище и концепции информационное хранилище. Кроме того, результаты форумов на информационное хранилище а группы экспертов и практиков, возглавляемые исследовательской группой Monash DSS, внесли свой вклад в этот этап исследования, целью которого было получить представление о практике информационное хранилище и выявить риски, связанные с их принятием. В течение этого периода контекстуального исследования было установлено понимание проблемной области, чтобы обеспечить базу знаний для последующих эмпирических исследований. Тем не менее, это был непрерывный процесс, поскольку исследование проводилось.

Часть II: Эмпирическое исследование

Относительно новая концепция хранилищ данных, особенно в Австралии, привела к необходимости опроса, чтобы получить общую картину опыта использования. Эта часть была выполнена после того, как проблемная область была установлена ​​посредством обширного обзора литературы. Концепция хранилища данных, сформированная на этапе контекстуального исследования, использовалась в качестве исходных данных для начальной анкеты этого исследования. После этого анкета была рассмотрена. Вы эксперт по информационное хранилище участвовал в испытании. Цель тестирования исходной анкеты заключалась в проверке полноты и точности вопросов. По результатам тестирования анкета была изменена, и измененная версия была отправлена ​​участникам опроса по почте. Затем возвращенные анкеты были проанализированы на i дать в таблицах, диаграммах и других форматах. НАШИ

результаты анализа дать сформируйте снимок практики хранения данных в Австралии.

ОБЗОР ХРАНИЛИЩА ДАННЫХ

Концепция хранилищ данных развивалась с развитием компьютерных технологий.
Он направлен на преодоление проблем, с которыми сталкиваются группы поддержки приложений, такие как система поддержки принятия решений (DSS) и исполнительная информационная система (EIS).

В прошлом самым большим препятствием для этих приложений была неспособность этих приложений обеспечить база данных необходимые для анализа.
В основном это обусловлено характером работы руководства. Интересы руководства компании постоянно меняются в зависимости от сферы деятельности. Поэтому я дать фундаментальные для этих приложений должны иметь возможность быстро меняться в зависимости от обрабатываемой детали.
Это означает, что я дать должны быть доступны в соответствующей форме для необходимых анализов. На самом деле группам поддержки приложений в прошлом было очень трудно собирать и интегрировать дать из сложных и разнообразных источников.

В оставшейся части этого раздела представлен обзор концепции хранилища данных и обсуждается, как информационное хранилище может преодолеть проблемы групп поддержки приложений.
Термин "Хранилище данныхбыл популяризирован Уильямом Инмоном в 1990 году. Его часто цитируемое определение Хранилище данных как собрание дать предметно-ориентированные, интегрированные, энергонезависимые и изменяющиеся во времени для поддержки управленческих решений.

Используя это определение, Инмон указывает, что я дать проживающий в информационное хранилище должен обладать следующими 4 характеристиками:

  • ▪ Предметно-ориентированный
  • ▪ Интегрированный
  • ▪ Энергонезависимый
  • ▪ Переменная во времени Под предметно-ориентированным Inmon подразумевается, что i дать в информационное хранилище в крупнейших организационных областях, которые были

определено в модели дать. например все дать относительно i клиентов содержатся в предметной области КЛИЕНТЫ. Аналогично все дать относящиеся к продуктам, содержатся в предметной области ПРОДУКТЫ.

Под Integrated Inmon подразумевается, что я дать с разных платформ, систем и мест объединяются и хранятся в одном месте. Следовательно дать похожие должны быть преобразованы в согласованные форматы, чтобы их можно было легко добавлять и сравнивать.
Например, мужской и женский род представлены буквами M и F в одной системе и 1 и 0 в другой. Чтобы правильно их интегрировать, один или оба формата должны быть преобразованы так, чтобы они были равны. В этом случае мы могли бы изменить M на 1 и F на 0 или наоборот. Предметно-ориентированный и Интегрированный указывают на то, что информационное хранилище предназначен для обеспечения функционального и поперечного видения дать компанией.

Под энергонезависимой он подразумевает, что я дать в информационное хранилище оставаться последовательным и обновлять дать это не обязательно. Вместо этого любое изменение в дать оригиналы добавлены в база данных из информационное хранилище. Это означает, что историк дать содержится в информационное хранилище.

Для переменных со временем Inmon указывает, что i дать в информационное хранилище всегда содержат индикаторы темпа ei дать они обычно пересекают определенный временной горизонт. Например
информационное хранилище может содержать 5 лет исторических значений клиентов с 1993 по 1997 год. Наличие исторических и временных рядов дать позволяет анализировать тенденции.

Un информационное хранилище он может сам собрать дать из систем OLTP; из источников дать внешние по отношению к организации и / или из других проектов специальной системы отлова дать.
I дать экстракты могут пройти процесс очистки, в этом случае я дать преобразуются и интегрируются перед сохранением в база данных из информационное хранилище. Затем я дать

проживающие в пределах база данных из информационное хранилище становятся доступными для входа конечных пользователей и средств восстановления. С помощью этих инструментов конечный пользователь может получить доступ к интегрированному представлению об организации дать.

I дать проживающие в пределах база данных из информационное хранилище они хранятся как в подробном, так и в сводном форматах.
Уровень обобщения может зависеть от характера дать. дать подробное может состоять из дать текущий и дать исторический
I дать реальные не входят в информационное хранилище пока я дать в информационное хранилище повторно обновляются.
В дополнение к хранению дать сами, а информационное хранилище он также может хранить различные виды дата называется МЕТАДАННЫЕ, описывающие i дать проживающий в его база данных.
Существует два типа метаданных: метаданные разработки и метаданные анализа.
Метаданные разработки используются для управления и автоматизации процессов извлечения, очистки, сопоставления и загрузки. дать в информационное хранилище.
Информация, содержащаяся в метаданных разработки, может содержать сведения об операционных системах, сведения об извлекаемых элементах, модели дать из информационное хранилище и бизнес-правила преобразования данных дать.

Второй тип метаданных, известный как метаданные аналитики, позволяет конечному пользователю исследовать содержимое информационное хранилище найти дать доступны и их значение в четких, нетехнических терминах.

Таким образом, метаданные аналитики работают как мост между информационное хранилище и приложения для конечных пользователей. Эти метаданные могут содержать бизнес-модель, описания дать соответствующие бизнес-модели, предопределенные запросы и отчеты, информация для доступа пользователей и индекс.

Метаданные анализа и разработки должны быть объединены в единые интегрированные метаданные сдерживания для правильной работы.

К сожалению, многие из существующих инструментов имеют свои собственные метаданные, и в настоящее время не существует стандартов, которые

разрешить инструментам хранилища данных интегрировать эти метаданные. Чтобы исправить эту ситуацию, многие поставщики ведущих инструментов для хранения данных сформировали Совет по метаданным, который позже стал Коалицией по метаданным.

Цель этой коалиции — создать стандартный набор метаданных, который позволит различным инструментам хранения данных преобразовывать метаданные.
Их усилия привели к рождению спецификации обмена метаданными (MDIS), которая позволит обмениваться информацией между архивами Microsoft и соответствующими файлами MDIS.

Существование дать как в суммированном/индексированном, так и в подробном виде, он дает пользователю возможность выполнить DRILL DROWN (сверление) из дать индексируются в подробные и наоборот. Наличие дать подробная история позволяет создавать анализ тенденций с течением времени. Кроме того, метаданные анализа можно использовать в качестве каталога del. база данных из информационное хранилище чтобы помочь конечным пользователям найти меня дать нужно.

По сравнению с системами OLTP, с их способностью поддерживать анализ дать и отчетности, информационное хранилище она рассматривается как более подходящая система для информационных процессов, таких как составление запросов и ответов на них, а также подготовка отчетов. В следующем разделе будут подробно освещены различия этих двух систем.

ХРАНИЛИЩЕ ДАННЫХ ПРОТИВ OLTP-СИСТЕМ

Многие информационные системы в организациях предназначены для поддержки повседневных операций. Эти системы, известные как OLTP SYSTEMS, фиксируют ежедневные транзакции, которые постоянно обновляются.

I дать в этих системах они часто модифицируются, добавляются или удаляются. Например, адрес клиента меняется, когда он перемещается с места на место. В этом случае новый адрес будет зарегистрирован путем изменения поля адреса база данных. Основная цель этих систем — снизить транзакционные издержки и в то же время сократить время обработки. Примеры OLTP-систем включают критические действия, такие как ведение журнала заказов, начисление заработной платы, выставление счетов, производство, обслуживание клиентов. клиентов.

В отличие от OLTP-систем, которые были созданы для процессов, основанных на транзакциях и событиях, i информационное хранилище были созданы для обеспечения поддержки процессов на основе аналитики дать и о процессах принятия решений.

Обычно это достигается путем интегрирования i дать из различных OLTP и внешних систем в единый «контейнер» дать, как обсуждалось в предыдущем разделе.

Модель процесса хранилища данных Monash

Модель процесса для информационное хранилище Monash был разработан исследователями исследовательской группы Monash DSS и основан на литературе информационное хранилище, опыт работы в области систем поддержки разработки, обсуждения с поставщиками приложений для использования на информационное хранилище, о группе экспертов по использованию информационное хранилище.

Фазы: Инициация, Планирование, Разработка, Операции и Объяснение. Диаграмма объясняет итеративный или эволюционный характер разработки информационное хранилище процесс с помощью двусторонних стрелок, расположенных между различными этапами. В этом контексте «итеративный» и «эволюционный» означают, что на каждом этапе процесса деятельность по внедрению всегда может распространяться назад к предыдущему этапу. Это связано с характером проекта. информационное хранилище в котором дополнительные запросы конечного пользователя происходят в любое время. Например, на этапе разработки процесса информационное хранилищеЕсли конечный пользователь запрашивает новый размер предмета или площадь, которые не были частью исходного плана, он должен быть добавлен в систему. Это приводит к изменению проекта. В результате группа разработчиков должна изменить требования к документам, созданным на этапе проектирования. Во многих случаях текущее состояние проекта должно полностью вернуться к этапу проектирования, где необходимо добавить и задокументировать новое требование. Конечный пользователь должен иметь возможность просматривать конкретную проверенную документацию и изменения, внесенные на этапе разработки. В конце этого цикла разработки проект должен получить хорошие отзывы как от разработчиков, так и от пользователей. Затем отзывы повторно используются для улучшения будущего проекта.

Планирование мощности
dw имеют тенденцию быть очень большими по размеру и расти очень быстро (Best 1995, Rudin 1997a) из-за количества дать исторические, которые они сохраняют от своей длительности. Рост также может быть вызван дать надстройки, запрошенные пользователями, чтобы увеличить ценность дать что они уже есть. Следовательно, требования к хранению дать может быть значительно усилен (Eckerson 1997). Таким образом, посредством планирования мощностей необходимо обеспечить, чтобы создаваемая система могла расти по мере роста потребностей (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
При планировании масштабируемости хранилища данных необходимо знать ожидаемый рост размера хранилища, типы вопросов, которые могут возникнуть, и количество поддерживаемых конечных пользователей (Best 1995, Rudin 1997b, Foley 1997a). Создание масштабируемых приложений требует сочетания масштабируемых серверных технологий и методов проектирования масштабируемых приложений (Best 1995, Rudin 1997b). И то, и другое необходимо для создания высокомасштабируемого приложения. снижение производительности (Lang 1997, Telephony 1997).

Существуют две основные масштабируемые серверные технологии: симметричная множественная обработка (SMP) и массово-параллельная обработка (MPP)) (IDC 1997, Humphries et al. 1999). Сервер SMP обычно имеет несколько процессоров, которые совместно используют память, системные шины и другие ресурсы (IDC 1997, Humphries et al. 1999). Дополнительные процессоры могут быть добавлены, чтобы увеличить его власть вычислительный. Еще один способ увеличить власть вычисления SMP-сервера, заключается в объединении многочисленных SMP-машин. Этот метод известен как кластеризация (Хамфрис и др., 1999). Сервер MPP, с другой стороны, имеет несколько процессоров, каждый со своей собственной памятью, системой шин и другими ресурсами (IDC 1997, Humphries et al. 1999). Каждый процессор называется узлом. Увеличение власть вычисление может быть получено

добавление дополнительных узлов к серверам MPP (Хамфрис и др., 1999).

Слабость серверов SMP заключается в том, что слишком большое количество операций ввода-вывода (I/O) может привести к перегрузке системы шин (IDC 1997). Эта проблема не возникает на серверах MPP, поскольку каждый процессор имеет собственную систему шин. Однако взаимосвязи между каждым узлом обычно намного медленнее, чем в шинной системе SMP. Более того, MPP-серверы могут усложнить работу разработчиков приложений (IDC 1997). Таким образом, выбор между серверами SMP и MPP может зависеть от многих факторов, включая сложность приложений, соотношение цены и производительности, требуемую пропускную способность, предотвращение приложений dw и увеличение размера сервера. база данных dw и по количеству конечных пользователей.

При планировании емкости можно использовать ряд методов проектирования масштабируемых приложений. Один использует различные отчетные периоды, такие как дни, недели, месяцы и годы. Имея различные периоды уведомления, база данных можно разделить на управляемо сгруппированные части (Inmon et al. 1997). Другой метод заключается в использовании сводных таблиц, которые строятся путем суммирования дать da дать подробный. Таким образом, я дать рефераты более компактны, чем подробные, что требует меньше места в памяти. Итак дать детали могут быть заархивированы в менее дорогом хранилище, что позволяет сэкономить еще больше места. Хотя использование сводных таблиц может сэкономить место для хранения, они требуют больших усилий, чтобы поддерживать их в актуальном состоянии и в соответствии с потребностями бизнеса. Однако этот метод широко используется и часто используется в сочетании с предыдущим методом (Best 1995, Inmon 1996a, Chauduri and Dayal).
1997).

Определяющий Хранилище данных Технические архитектуры Определение методов архитектуры dw

Первые сторонники хранилищ данных в первую очередь предполагали реализацию централизованного хранилища данных, в котором все дать, в том числе я дать внешние, были объединены в единую,
физическое хранилище (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Основное преимущество этого подхода заключается в том, что конечные пользователи могут получить доступ к общекорпоративному представлению о дать организационные (Овум, 1998). Еще одним плюсом является то, что он предлагает стандартизацию дать во всей организации, что означает наличие только одной версии или определения для каждой терминологии, используемой в метаданных репозитория (Flanagan and Safdie 1997, Ovum 1998). Недостатком этого подхода, с другой стороны, является то, что он дорог и сложен в реализации (Flanagan and Safdie 1997, Ovum 1998, Inmon et al. 1998). Вскоре после архитектуры хранения дать стала популярной централизованная, концепция добычи мельчайших подмножеств богов эволюционировала. дать для поддержки потребностей конкретных приложений (Варни, 1996 г., IDC, 1997 г., Берсон и Смит, 1997 г., Пикок, 1998 г.). Эти маленькие системы являются производными от более крупной. информационное хранилище централизованный. Они названы информационное хранилище отделы сотрудников или витрины данных сотрудников. Архитектура зависимой витрины данных известна как трехуровневая архитектура, в которой первый уровень состоит из информационное хранилище централизованная, вторая состоит из месторождений дать ведомственный, а третий состоит из доступа к дать и инструментами анализа (Demarest 1994, Inmon et al. 1997).

Витрины данных обычно строятся после информационное хранилище централизованная была построена для удовлетворения потребностей конкретных подразделений (White 1995, Varney 1996).
Витрины данных i дать относящиеся к конкретным единицам (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

Преимущество этого метода в том, что не будет дата не интегрировано и что я дать будет менее избыточным в витринах данных, поскольку все дать происходят из депозита дать интегрированный. Еще одно преимущество заключается в том, что будет меньше связей между каждой витриной данных и ее источниками. дать потому что каждая витрина данных имеет только один источник дать. Кроме того, с этой архитектурой конечные пользователи по-прежнему могут получить доступ к дать

корпоративные организации. Этот метод известен как метод «сверху вниз», при котором витрины данных строятся после информационное хранилище (Павлин 1998, Гофф 1998).
В связи с возрастающей необходимостью своевременного представления результатов некоторые организации начали создавать независимые витрины данных (Flanagan and Safdie, 1997, White, 2000). В этом случае витрины данных получают свои дать прямо из основ дать OLTP и не-OLTP из централизованного и интегрированного репозитория, что устраняет необходимость в центральном репозитории.

Для каждой витрины данных требуется хотя бы одна ссылка на ее источники. дать. Одним из недостатков наличия нескольких ссылок на каждую витрину данных является то, что по сравнению с двумя предыдущими архитектурами избыток дать значительно увеличивается.

Каждая витрина данных должна хранить все дать требуется локально, чтобы не влиять на системы OLTP. Это заставляет меня дать они хранятся в разных витринах данных (Инмон и др., 1997). Еще одним недостатком этой архитектуры является то, что она приводит к созданию сложных взаимосвязей между витринами данных и их источниками данных. дать которые трудно внедрить и контролировать (Inmon et al. 1997).

Другим недостатком является то, что конечные пользователи могут не иметь доступа к обзору информации о компании, потому что я дать различные витрины данных не интегрированы (Ovum 1998).
Еще одним недостатком является то, что для каждой терминологии, используемой в витринах данных, может быть более одного определения, что приводит к несогласованности данных. дать в организации (Овум 1998).
Несмотря на рассмотренные выше недостатки, автономные витрины данных по-прежнему вызывают интерес у многих организаций (IDC 1997). Одним из факторов, делающих их привлекательными, является то, что они быстрее развиваются и требуют меньше времени и ресурсов (Бреснахан, 1996; Берсон и Смит, 1997; Овум, 1998). Следовательно, они служат главным образом в качестве тестовых планов, которые можно использовать для быстрого выявления преимуществ и/или недостатков плана (Parsaye 1995, Braly 1995, Newing 1996). В этом случае часть, которая должна быть реализована в пилотном проекте, должна быть небольшой, но важной для организации (Newing, 1996; Mansell-Lewis, 1996).

Изучив прототип, конечные пользователи и руководство могут принять решение о продолжении или остановке проекта (Фланаган и Сафди, 1997).
Если принято решение о продолжении, витрины данных для других отраслей должны создаваться по одной за раз. Существует два варианта для конечных пользователей, основанных на их потребностях в построении независимых матриц данных: интегрированный/федеративный и неинтегрированный (Ovum 1998).

В первом методе каждая новая витрина данных должна строиться на основе текущих витрин данных и модели. дать используется фирмой (Варни, 1996 г., Берсон и Смит, 1997 г., Пикок, 1998 г.). Необходимость использования модели дать предприятия означает, что необходимо обеспечить наличие только одного определения для каждой терминологии, используемой в витринах данных, а также гарантировать, что различные витрины данных могут быть объединены для получения обзора корпоративной информации (Bresnahan 1996). Этот метод называется методом «снизу вверх», и его лучше всего использовать при ограниченности финансовых средств и времени (Flanagan and Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). Во втором способе построенные витрины данных могут удовлетворить потребности только конкретного подразделения. Вариантом федеративной витрины данных является информационное хранилище распределяется, в котором база данных ПО промежуточного слоя хаб-сервера используется для объединения множества витрин данных в один репозиторий. дать распространены (Уайт, 1995). В этом случае я дать бизнес распределены по нескольким витринам данных. Запросы конечных пользователей перенаправляются на база данных ПО промежуточного слоя хаб-сервера, которое извлекает все дать запрашиваются витринами данных и передают результаты обратно в приложения конечного пользователя. Этот метод предоставляет бизнес-информацию конечным пользователям. Однако проблемы независимых витрин данных до сих пор не устранены. Можно использовать другую архитектуру, которая называется информационное хранилище виртуальный (Уайт, 1995). Однако эта архитектура, изображенная на рис. 2.9, не является архитектурой хранения данных. дать реальным, поскольку не переносит нагрузку с OLTP-систем на информационное хранилище (Демарест, 1994).

На самом деле запросы на дать конечными пользователями они передаются в системы OLTP, которые возвращают результаты после обработки пользовательских запросов. Хотя эта архитектура позволяет конечным пользователям создавать отчеты и делать запросы, она не может предоставить

дать история и обзор информации о компании с тех пор, как я дать поскольку различные системы OLTP не интегрированы. Следовательно, эта архитектура не может удовлетворить анализ дать например предсказания.

Подбор приложений для доступа и восстановления данных дать

Цель создания информационное хранилище заключается в передаче информации конечным пользователям (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); одно или несколько приложений для доступа и восстановления дать должно быть предоставлено. На сегодняшний день существует множество таких приложений, из которых пользователь может выбирать (Hammergren 1998, Humphries et al. 1999). Выбранные приложения определяют успех складских операций. дать в организации, потому что приложения являются наиболее заметной частью информационное хранилище конечному пользователю (Инмон и др., 1997; По, 1996). Чтобы быть успешным информационное хранилище, должен быть в состоянии поддерживать деятельность по анализу данных дать конечного пользователя (По, 1996; Седдон и Бенджамин, 1998; Экерсон, 1999). Таким образом, необходимо определить «уровень» того, что хочет конечный пользователь (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

В общем, конечных пользователей можно разделить на три категории: руководители, бизнес-аналитики и опытные пользователи (Poe 1996, Humphries et al. 1999). Руководящим пользователям необходим легкий доступ к предустановленным наборам отчетов (Хамфрис и др., 1999). Доступ к этим отчетам можно легко получить с помощью навигации по меню (Poe 1996). Кроме того, отчеты должны представлять информацию с использованием графического представления, такого как таблицы и шаблоны, для быстрой передачи информации (Хамфрис и др., 1999). Бизнес-аналитики, у которых может не быть технических возможностей для самостоятельной разработки отчетов с нуля, должны иметь возможность модифицировать текущие отчеты для удовлетворения своих конкретных потребностей (Poe 1996, Humphries et al. 1999). С другой стороны, опытные пользователи — это тип конечных пользователей, которые могут генерировать и писать запросы и отчеты с нуля (Poe 1996, Humphries et al. 1999). Это те, кто

они строят отношения для других типов пользователей (Poe, 1996; Humphries et al., 1999).

После определения требований конечного пользователя необходимо выбрать приложения для доступа и восстановления. дать среди всех доступных (Poe 1996, Inmon et al. 1997).
Доступ к дать а инструменты поиска можно разделить на 4 типа: инструмент OLAP, инструмент EIS/DSS, инструмент запросов и отчетов и инструмент интеллектуального анализа данных.

Инструменты OLAP позволяют пользователям создавать специальные запросы, а также запросы, сделанные на база данных из информационное хранилище. Кроме того, эти продукты позволяют пользователям детализировать дать общего к подробному.

Инструменты EIS/DSS предоставляют исполнительную отчетность, такую ​​как анализ «что, если» и доступ к отчетам на основе меню. Отчеты должны быть предопределены и объединены с меню для облегчения навигации.
Инструменты запросов и отчетов позволяют пользователям создавать предопределенные и конкретные отчеты.

Инструменты интеллектуального анализа данных используются для выявления взаимосвязей, которые могут пролить новый свет на забытые операции. дать хранилища данных.

Наряду с оптимизацией требований каждого типа пользователей выбранные инструменты должны быть интуитивно понятными, эффективными и простыми в использовании. Они также должны быть совместимы с другими частями архитектуры и работать с существующими системами. Также предлагается выбирать инструменты доступа и извлечения данных с разумной ценой и производительностью. Другие критерии, которые следует учитывать, включают обязательство поставщика инструмента поддерживать свой продукт и разработки, которые он будет иметь в будущих версиях. Чтобы обеспечить участие пользователей в использовании хранилища данных, команда разработчиков вовлекает пользователей в процесс выбора инструмента. В этом случае следует провести практическую оценку пользователя.

Чтобы повысить ценность хранилища данных, команда разработчиков также может предоставить веб-доступ к своим хранилищам данных. Хранилище данных с поддержкой Интернета позволяет пользователям получать доступ к дать из отдаленных мест или во время путешествия. Также информация может

предоставляться по более низкой цене за счет снижения затрат на обучение.

2.4.3 Хранилище данных Этап эксплуатации

Этот этап состоит из трех действий: определение стратегий обновления данных, контроль действий хранилища данных и управление безопасностью хранилища данных.

Определение стратегий обновления данных

После первоначальной загрузки я дать в база данных хранилища данных необходимо периодически обновлять, чтобы воспроизвести изменения, сделанные на дать оригиналы. Таким образом, вы должны решить, когда обновлять, как часто следует планировать обновление и как обновлять дать. Предлагается обновить дать когда система может быть переведена в автономный режим. Частота обновления определяется командой разработчиков на основе требований пользователя. Существует два подхода к обновлению хранилища данных: полное обновление и непрерывная загрузка изменений.

Первый подход, полное обновление, требует перезагрузки всех дать с нуля. Это означает, что все дать необходимо извлечь, очистить, преобразовать и интегрировать в каждое обновление. По возможности следует избегать этого подхода, поскольку он отнимает много времени и ресурсов.

Альтернативный подход — постоянно загружать изменения. Это добавляет я дать которые изменились с момента последнего цикла обновления хранилища данных. Идентификация новых или измененных записей значительно снижает количество дать которые должны распространяться в хранилище данных при каждом обновлении, поскольку только эти дать будет добавлено к база данных хранилища данных.

Существует как минимум 5 подходов, которые можно использовать для вывода i. дать новый или модифицированный. Для достижения эффективной стратегии обновления видео дать сочетание этих подходов, которые извлекают все изменения в системе, может оказаться полезным.

Первый подход, использующий временные метки, предполагает, что всем назначены дать отредактировал и обновил метку времени, чтобы вы могли легко идентифицировать все дать модифицированные и новые. Однако сегодня этот подход не получил широкого распространения в большинстве операционных систем.
Второй подход заключается в использовании дельта-файла, созданного приложением, который содержит только изменения, внесенные в дать. Использование этого файла также увеличивает цикл обновления. Однако даже этот метод не использовался во многих приложениях.
Третий подход заключается в сканировании файла журнала, который в основном содержит информацию, аналогичную дельта-файлу. Единственное отличие состоит в том, что файл журнала создается для процесса восстановления, и его может быть трудно понять.
Четвертый подход заключается в изменении кода приложения. Однако код большинства приложений устарел и ненадежен; поэтому этого метода следует избегать.
Последний подход заключается в сравнении i дать исходники с основным файлом dei дать.

Мониторинг деятельности хранилища данных

После того, как хранилище данных было предоставлено пользователям, его необходимо отслеживать с течением времени. В этом случае администратор хранилища данных может использовать один или несколько инструментов управления и контроля для мониторинга использования хранилища данных. В частности, можно собирать информацию о людях и о времени их доступа к хранилищу данных. Ну давай же дать собранных данных, может быть создан профиль выполненной работы, который может быть использован в качестве входных данных для реализации пользователем возвратного платежа. Возвратный платеж позволяет пользователям получать информацию о стоимости обработки хранилища данных.

Кроме того, аудит хранилища данных также можно использовать для определения типов запросов, их размера, количества запросов в день, времени реакции на запросы, достигнутых секторов и количества дать обработанный. Еще одна цель аудита хранилища данных — выявить дать которые не используются. Эти дать их можно удалить из хранилища данных, чтобы улучшить время

ответа на запрос и контролировать рост дать которые находятся внутри база данных хранилища данных.

Управление безопасностью хранилища данных

Хранилище данных содержит дать комплексный, критический, чувствительный, до которого можно легко добраться. По этой причине он должен быть защищен от неавторизованных пользователей. Один из способов реализовать безопасность — использовать функцию del. СУБД назначать разные привилегии разным типам пользователей. Таким образом, профиль доступа должен поддерживаться для каждого типа пользователей. Другой способ обезопасить хранилище данных — зашифровать его, как написано в база данных хранилища данных. Доступ к дать и поисковые инструменты должны расшифровать дать перед представлением результатов пользователям.

2.4.4 Хранилище данных Этап развертывания

Это последний этап цикла внедрения хранилища данных. Действия, которые необходимо выполнить на этом этапе, включают обучение пользователей использованию хранилища данных и проведение обзоров хранилища данных.

Обучение пользователей

Перед доступом к дать хранилища данных и использование поисковых инструментов. Как правило, занятия следует начинать с ознакомления с концепцией хранения. дать, содержимое хранилища данных, мета дать и основные характеристики инструментов. Затем более продвинутые пользователи могут также изучить физические таблицы и функции пользователей инструментов доступа к данным и поиска.

Существует множество подходов к обучению пользователей. Один из них включает в себя выбор многих пользователей или аналитиков, выбранных из пула пользователей на основе их лидерских и коммуникативных навыков. Они лично обучены всему, что им нужно знать, чтобы ознакомиться с системой. После обучения они возвращаются к своей работе и начинают обучать других пользователей работе с системой. На

Основываясь на том, что они узнали, другие пользователи могут начать изучение хранилища данных.
Другой подход заключается в одновременном обучении многих пользователей, как если бы вы занимались в классе. Этот метод подходит, когда есть много пользователей, которых нужно обучать одновременно. Еще один метод заключается в обучении каждого пользователя индивидуально, одного за другим. Этот способ подходит, когда пользователей немного.

Целью обучения пользователей является ознакомление с доступом к дать и поисковые инструменты, а также содержимое хранилища данных. Однако некоторые пользователи могут быть ошеломлены объемом информации, предоставленной во время сеанса обучения. Затем необходимо провести ряд повторных сессий для постоянной поддержки и ответов на конкретные вопросы. В некоторых случаях для предоставления такого рода поддержки создается группа пользователей.

Сбор отзывов

После развертывания хранилища данных пользователи могут использовать i дать находящихся в хранилище данных для различных целей. В основном аналитики или пользователи используют i дать в хранилище данных для:

  1. 1 Определите тенденции компании
  2. 2 Проанализируйте профили закупок клиентов
  3. 3 Сплит я клиентов и
  4. 4 Предоставлять лучшие услуги клиентов - настроить услуги
  5. 5 Сформулируйте стратегии маркетинга
  6. 6 Сделайте конкурентоспособные предложения для анализа затрат и помогите контролировать
  7. 7 Поддержка принятия стратегических решений
  8. 8 Определите возможности для появления
  9. 9 Улучшить качество текущих бизнес-процессов
  10. 10 Проверьте прибыль

Следуя направлению развития хранилища данных, можно провести серию обзоров системы для получения обратной связи.

как командой разработчиков, так и сообществом конечных пользователей.
Полученные результаты могут быть учтены для следующего цикла разработки.

Поскольку хранилище данных имеет инкрементальный подход, важно учиться на успехах и ошибках предыдущих разработок.

2.5 Резюме

В этой главе обсуждались подходы, представленные в литературе. В разделе 1 обсуждалась концепция хранилища данных и его роль в науке принятия решений. В разделе 2 описаны основные различия между хранилищами данных и системами OLTP. В разделе 3 обсуждалась модель хранилища данных Монаша, которая использовалась в разделе 4 для описания действий, связанных с процессом разработки хранилища данных, эти утверждения не были основаны на тщательном исследовании. То, что происходит в действительности, может сильно отличаться от того, что сообщается в литературе, однако эти результаты можно использовать для создания базового багажа, который подчеркивает концепцию хранилища данных для этого исследования.

Глава 3

Методы исследования и проектирования

В этой главе рассматриваются методы исследования и проектирования для этого исследования. В первой части представлен общий обзор методов исследования, доступных для поиска информации, кроме того обсуждаются критерии выбора наилучшего метода для конкретного исследования. В разделе 2 затем обсуждаются два метода, выбранные с учетом вышеуказанных критериев; один из них будет выбран и принят по причинам, изложенным в разделе 3, где также изложены причины исключения другого критерия. В разделе 4 представлен исследовательский проект, а в разделе 5 - выводы.

3.1 Исследования в области информационных систем

Исследования информационных систем не ограничиваются только технологической сферой, но также должны быть расширены, чтобы включить поведенческие и организационные цели.
Этим мы обязаны тезисам различных дисциплин, от социальных до естественных; это приводит к необходимости использования определенного спектра методов исследования, включающих количественные и качественные методы, для использования в информационных системах.
Важны все доступные методы исследования, на самом деле несколько исследователей, таких как Jenkins (1985), Nunamaker et al. (1991) и Galliers (1992) утверждают, что не существует конкретного универсального метода проведения исследований в различных областях информационных систем; на самом деле метод может быть подходящим для конкретного исследования, но не для других. Это приводит нас к необходимости выбора метода, подходящего для нашего конкретного исследовательского проекта: для этого выбора Benbasat et al. (1987) утверждают, что следует учитывать характер и цель исследования.

3.1.1 Характер исследования

Различные методы исследования природы можно разделить на три широко известные традиции в информатике: позитивистские, интерпретативные и критические исследования.

3.1.1.1 Позитивистское исследование

Позитивистское исследование также известно как научное или эмпирическое исследование. Он стремится: «объяснить и предсказать, что произойдет в социальном мире, рассматривая закономерности и причинно-следственные связи между составляющими его элементами» (Шенкс и др., 1993).

Позитивистские исследования также характеризуются повторяемостью, упрощениями и опровержениями. Кроме того, позитивистское исследование допускает наличие априорных отношений между изучаемыми явлениями.
Согласно Galliers (1992) таксономия - это исследовательский метод, включенный в позитивистскую парадигму, которая, однако, этим не ограничивается, на самом деле существуют лабораторные эксперименты, полевые эксперименты, тематические исследования, демонстрации теорем, предсказания и симуляции. Используя эти методы, исследователи признают, что изучаемые явления можно наблюдать объективно и строго.

3.1.1.2 Интерпретативное исследование

Интерпретативное исследование, которое часто называют феноменологией или антипозитивизмом, описывается Нейманом (1994) как «систематический анализ социального значения действия посредством прямого и подробного наблюдения за людьми в естественных ситуациях с целью прийти к пониманию и интерпретация того, как люди создают и поддерживают свой социальный мир». Интерпретационные исследования отвергают предположение, что наблюдаемые явления можно наблюдать объективно. На самом деле они основаны на субъективных интерпретациях. Более того, интерпретирующие исследователи не навязывают априорные значения изучаемым ими явлениям.

Этот метод включает в себя субъективные/аргументативные исследования, практические исследования, описательные/интерпретационные исследования, исследования будущего и ролевые игры. Помимо этих опросов, в этот подход могут быть включены тематические исследования, поскольку они касаются изучения отдельных лиц или организаций в сложных реальных ситуациях.

3.1.1.3 Критическое исследование

Критический поиск — наименее известный подход в социальных науках, но недавно он привлек внимание исследователей в области информационных систем. Философское предположение о том, что социальная реальность исторически производится и воспроизводится людьми, а также социальными системами с их действиями и взаимодействиями. Однако их способность определяется рядом социальных, культурных и политических соображений.

Как и интерпретационное исследование, критическое исследование утверждает, что позитивистское исследование не имеет ничего общего с социальным контекстом и игнорирует его влияние на действия человека.
Критическое исследование, с другой стороны, критикует интерпретационное исследование за то, что оно слишком субъективно и не ставит целью помочь людям улучшить свою жизнь. Самая большая разница между критическим исследованием и двумя другими подходами заключается в его оценочном измерении. В то время как объективность позитивистских и интерпретационных традиций заключается в предсказании или объяснении статус-кво или социальной реальности, критическое исследование направлено на критическую оценку и преобразование изучаемой социальной реальности.

Критически настроенные исследователи обычно выступают против статус-кво, чтобы устранить социальные различия и улучшить социальные условия. Критическое исследование имеет приверженность процессуальному взгляду на интересующие явления и, следовательно, обычно лонгитюдно. Примерами методов исследования являются многолетние исторические исследования и этнографические исследования. Однако критический поиск не нашел широкого применения в исследованиях информационных систем.

3.1.2 Цель исследования

Вместе с характером исследования его цель может быть использована для руководства исследователем в выборе конкретного метода исследования. Объем исследовательского проекта тесно связан с положением исследования по отношению к исследовательскому циклу, который состоит из трех фаз: построение теории, проверка теории и уточнение теории. Таким образом, в зависимости от импульса исследовательского цикла исследовательский проект может иметь объяснительную, описательную, исследовательскую или прогнозную цель.

3.1.2.1 Поисковое исследование

Поисковое исследование направлено на изучение совершенно новой темы и формулирование вопросов и гипотез для будущих исследований. Этот тип исследования используется при построении теории для получения первоначальных рекомендаций в новой области. Обычно используются качественные методы исследования, такие как тематические исследования или феноменологические исследования.

Однако также возможно использовать количественные методы, такие как поисковые опросы или эксперименты.

3.1.3.3 Описательный поиск

Описательное исследование предназначено для анализа и подробного описания конкретной ситуации или организационной практики. Это подходит для построения теорий, а также может использоваться для подтверждения или оспаривания гипотез. Описательные исследования обычно включают использование измерений и выборок. Подходящие методы исследования включают опросы и фоновый анализ.

3.1.2.3 Объяснительные исследования

Объяснительное исследование пытается объяснить, почему что-то происходит. Он основывается на фактах, которые уже были изучены, и пытается найти причины этих фактов.
Таким образом, объяснительное исследование обычно строится на основе поискового или описательного исследования и является вспомогательным для проверки и уточнения теорий. Объяснительные исследования обычно используют тематические исследования или методы исследования, основанные на опросах.

3.1.2.4 Упреждающее исследование

Упреждающее исследование направлено на предсказание наблюдаемых событий и изучаемых моделей поведения (Маршалл и Россман, 1995). Предсказание — это стандартная научная проверка истины. Этот тип исследования обычно использует опросы или анализ данных. дать историки. (Инь 1989 г.)

Приведенное выше обсуждение демонстрирует, что существует ряд возможных методов исследования, которые можно использовать в конкретном исследовании. Однако должен существовать конкретный метод, более подходящий, чем другие, для конкретного типа исследовательского проекта. (Галье, 1987, Инь, 1989, Де Ваус, 1991). Поэтому каждому исследователю необходимо тщательно оценить сильные и слабые стороны различных методов, чтобы принять наиболее подходящий метод исследования, совместимый с исследовательским проектом. (Дженкинс, 1985 г., Перван и Класс, 1992 г., Бономия, 1985 г., Инь, 1989 г., Химилтон и Айвз, 1992 г.).

3.2. Возможные методы поиска

Целью данного проекта было изучение опыта австралийских организаций с i дать сохраняется с развитием информационное хранилище. Данный что в настоящее время в Австралии недостаточно исследований в области хранилищ данных, этот исследовательский проект все еще находится в теоретической фазе исследовательского цикла и имеет исследовательскую цель. Изучение опыта австралийских организаций по внедрению хранилищ данных требует интерпретации реального общества. Следовательно, философское предположение, лежащее в основе исследовательского проекта, следует традиционной интерпретации.

После тщательного изучения доступных методов были определены два возможных метода исследования: опросы и тематические исследования, которые можно использовать для поисковых исследований (Shanks et al., 1993). Galliers (1992) доказывает пригодность этих двух методов для данного конкретного исследования в своей пересмотренной таксономии, говоря, что они подходят для теоретического построения. В следующих двух подразделах подробно рассматривается каждый метод.

3.2.1 Опросный метод исследования

Опросный метод исследования восходит к древнему методу переписи населения. Перепись заключается в сборе информации от всего населения. Этот метод дорог и непрактичен, особенно если популяция велика. Таким образом, по сравнению с переписью, опрос обычно направлен на сбор информации для небольшого числа или выборки представителей населения (Fowler, 1988, Neuman, 1994). Выборка отражает совокупность, из которой она составлена, с разной степенью точности в зависимости от структуры выборки, размера и используемого метода отбора (Фаулер, 1988, Бабби, 1982, Нейман, 1994).

Метод опроса определяется как «моментальные снимки практик, ситуаций или взглядов в определенный момент времени, сделанные с использованием вопросников или интервью, из которых могут быть сделаны выводы».
сделано» (Galliers 1992:153) [моментальная фотография практик, ситуаций или взглядов в определенный момент времени, сделанная с использованием анкет или интервью, на основании которых можно сделать выводы]. Опросы связаны со сбором информации об определенных аспектах исследования от ряда участников путем задавания вопросов (Fowler, 1988). Эти анкеты и интервью, которые включают личные телефонные интервью и структурированные интервью, также являются методами сбора информации. дать используются в исследованиях (Blalock 1970, Nachmias and Nachmias 1976, Fowler 1988), могут использоваться наблюдения и анализы (Gable 1994). Из всех этих методов сбора богов дать, использование анкеты является наиболее популярным методом, так как он гарантирует, что i дать

собранные данные структурированы и отформатированы, что облегчает классификацию информации (Hwang 1987, de Vaus 1991).

Анализируя я датьСтратегия опроса часто использует количественные методы, такие как статистический анализ, но также могут использоваться и качественные методы (Galliers 1992, Pervan

и Класс 1992, Гейбл 1994). Обычно я дать собранные данные используются для анализа распределения и закономерностей ассоциаций (Fowler, 1988).

Хотя опросы обычно подходят для поиска, связанного с вопросом «что?» (что) или производные от него, такие как «Quanto» (сколько) и «Quante» (сколько), их можно задать с помощью вопроса «почему» (Sonquist and Dunkelberg 1977, Yin 1989). Согласно Сонквисту и Дункельбергу (1977), целью исследовательского исследования являются твердые гипотезы, программы оценки, описание популяции и разработка моделей человеческого поведения. Более того, опросы можно использовать для изучения мнения, условий, убеждений, характеристик, ожиданий и даже прошлого или настоящего поведения определенного населения (Neuman, 1994).

Опросы позволяют исследователю выявить взаимосвязь населения, и результаты обычно более общие, чем другие методы (Sonquist and Dunkelberg, 1977, Gable, 1994). Опросы позволяют исследователям охватить более широкую географическую область и охватить большое количество респондентов (Блалок, 1970, Сонквист и Дункельберг, 1977, Хван и Лин, 1987, Гейбл, 1994, Нойман, 1994). Наконец, опросы могут предоставить информацию, которая недоступна где-либо еще или в форме, необходимой для анализа (Fowler, 1988).

Однако существуют некоторые ограничения на проведение опроса. Недостатком является то, что исследователь не может получить много информации об изучаемом объекте. Это связано с тем, что опросы проводятся только в определенное время и, следовательно, имеется ограниченное количество переменных и людей, которых может исследовать исследователь.

исследования (Инь, 1989 г., де Ваус, 1991 г., Гейбл, 1994 г., Денскомб, 1998 г.). Другим недостатком является то, что проведение опроса может быть очень дорогостоящим с точки зрения времени и ресурсов, особенно если оно включает личные интервью (Fowler, 1988).

3.2.2. Метод исследования запросов

Исследовательский метод запроса предполагает углубленное изучение конкретной ситуации в ее реальном контексте в течение определенного периода времени без какого-либо вмешательства со стороны исследователя (Шэнкс и К., 1993; Эйзенхардт, 1989; Дженкинс, 1985). В основном этот метод используется для описания отношений между изучаемыми переменными в конкретной ситуации (Galliers 1992). Исследования могут включать один или несколько случаев, в зависимости от анализируемого явления (Franz and Robey 1987, Eisenhardt 1989, Yin 1989).

Метод исследования-запроса определяется как «эмпирическое исследование, которое исследует современное явление в его реальном контексте с использованием нескольких источников, отобранных из одного или нескольких объектов, таких как люди, группы или организации» (Инь, 1989). Не существует четкого разделения между явлением и его контекстом, а также нет контроля или экспериментального манипулирования переменными (Инь, 1989 г., Бенбасат и др., 1987 г.).

Существует множество техник сбора богов. дать которые могут быть использованы в методе опроса, который включает в себя прямое наблюдение, просмотр архивных записей, вопросники, просмотр документации и структурированные интервью. Разнообразие техники сбора урожая дать, опросы позволяют исследователям иметь дело как с дать качественные и количественные одновременно (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Как и в случае с методом опроса, исследователь-опросник выступает в роли наблюдателя или исследователя, а не активного участника изучаемой организации.

Бенбасат и др. (1987) утверждают, что метод исследования особенно подходит для построения теории исследования, которое начинается с исследовательского вопроса и продолжается обучением.

теории в процессе сбора дать. Быть также подходящим для сцены

При построении теории Франц и Роби (1987) предполагают, что метод исследования можно также использовать на этапе комплексной теории. В этом случае на основе собранных доказательств осуществляется проверка или опровержение данной теории или гипотезы. Кроме того, запрос также подходит для исследований, связанных с вопросами «как» или «почему» (Yin 1989).

По сравнению с другими методами опросы позволяют исследователю более подробно собирать необходимую информацию (Galliers, 1992; Shanks et al., 1993). Кроме того, исследования позволяют исследователю понять природу и сложность изучаемых процессов (Бенбасат и др., 1987).

Есть четыре основных недостатка, связанных с методом опроса. Во-первых, это отсутствие контролируемых отчислений. Субъективность исследователя может изменить результаты и выводы исследования (Инь, 1989). Вторым недостатком является отсутствие контролируемого наблюдения. В отличие от экспериментальных методов исследователь-исследователь не может контролировать изучаемые явления, поскольку они исследуются в их естественном контексте (Gable, 1994). Третий недостаток — отсутствие тиражируемости. Это связано с тем, что исследователь вряд ли наблюдает одни и те же события и не может проверить результаты конкретного исследования (Lee 1989). Наконец, вследствие невоспроизводимости трудно обобщить результаты, полученные в результате одного или нескольких обследований (Galliers 1992, Shanks et al. 1993). Все эти проблемы, однако, не являются непреодолимыми и фактически могут быть сведены к минимуму исследователем путем принятия соответствующих мер (Lee, 1989).

3.3. Обоснуйте методологию исследования Adottata

Из двух возможных методов исследования для данного исследования наиболее подходящим считается метод опроса. Следственный был отклонен после тщательного рассмотрения связанных

достоинства и недостатки. Удобство или непригодность каждого метода для данного исследования обсуждается ниже.

3.3.1. Неподходящий метод исследования расследования

Метод исследования требует углубленного изучения конкретной ситуации в одной или нескольких организациях в течение определенного периода времени (Eisenhardt, 1989). При этом срок может превышать сроки, отведенные для данного исследования. Еще одна причина не применять метод исследования заключается в том, что результаты могут страдать от недостатка строгости (Yin 1989). Субъективность исследователя может повлиять на результаты и выводы. Другая причина заключается в том, что этот метод больше подходит для исследования вопросов типа «как» или «почему» (Инь, 1989), тогда как исследовательский вопрос для этого исследования относится к типу «что». И последнее, но не менее важное: трудно обобщать результаты только одного или нескольких исследований (Galliers, 1992; Shanks et al., 1993). Исходя из этого, метод исследования методом опроса не был выбран, так как он не подходил для данного исследования.

3.3.2. Удобство метода поиска обзор

Когда проводилось это исследование, практика хранения данных не была широко распространена в австралийских организациях. Следовательно, было мало информации об их реализации в австралийских организациях. Доступная информация поступила от организаций, внедривших или использовавших информационное хранилище. В данном случае наиболее подходящим является опросный метод исследования, поскольку он позволяет получить информацию, недоступную где-либо еще или в той форме, которая требуется для анализа (Фаулер, 1988). Кроме того, исследовательский метод исследования позволяет исследователю получить хорошее представление о практиках, ситуациях или взглядах в данный момент времени (Galliers 1992, Denscombe 1998). Обзор был запрошен для повышения осведомленности об опыте использования хранилищ данных в Австралии.

Кроме того, Sonquist и Dunkelberg (1977) заявляют, что результаты опросных исследований носят более общий характер, чем другие методы.

3.4. Дизайн исследования исследования

Опрос практики хранилищ данных был проведен в 1999 году. Целевая группа состояла из австралийских организаций, заинтересованных в исследованиях хранилищ данных, поскольку они, вероятно, уже знали об дать которые они хранят и, следовательно, могут предоставить полезную информацию для этого исследования. Целевая группа была определена в ходе первоначального опроса всех австралийских членов «Института хранилищ данных» (Tdwi-aap). В этом разделе обсуждается дизайн этапа эмпирического исследования данного исследования.

3.4.1. Техника сбора дать

Из трех методов, обычно используемых в опросных исследованиях (т. е. вопросник по почте, интервью по телефону и личное интервью) (Nachmias, 1976, Fowler, 1988, de Vaus, 1991), для данного исследования был выбран почтовый вопросник. Первая причина принятия последнего заключается в том, что он может охватить географически рассредоточенное население (Blalock 1970, Nachmias and Nachmias 1976, Hwang and Lin 1987, de Vaus 1991, Gable 1994). Во-вторых, почтовая анкета подходит для высокообразованных участников (Fowler, 1988). Почтовая анкета для этого исследования была адресована спонсорам проекта хранилища данных, директорам и/или менеджерам проекта. В-третьих, почтовые анкеты уместны, когда доступен безопасный список адресов (Салант и Дилман, 1994). TDWI, в данном случае, доверенная ассоциация хранилищ данных, предоставила список рассылки своих австралийских членов. Еще одно преимущество почтового опроса по сравнению с опросами по телефону или личным опросом состоит в том, что он позволяет респондентам давать более точные ответы, особенно когда респондентам необходимо свериться с записями или обсудить вопросы с другими людьми (Fowler, 1988).

Потенциальным недостатком может быть время, необходимое для проведения анкет по почте. Обычно анкетирование по почте проводится в такой последовательности: отправка писем, ожидание ответов и отправка подтверждения (Фаулер, 1988, Бейнбридж, 1989). Таким образом, общее время может быть больше, чем время, необходимое для личных интервью или интервью по телефону. Однако общее время может быть известно заранее (Фаулер, 1988, Денскомб, 1998). Время, затраченное на проведение личных интервью, не может быть известно заранее, поскольку оно варьируется от интервью к интервью (Fowler, 1988). Интервью по телефону могут быть более быстрыми, чем анкеты по почте и личные интервью, но могут иметь высокий процент оставшихся без ответа из-за недоступности некоторых людей (Fowler, 1988). Кроме того, телефонные интервью обычно ограничиваются относительно коротким списком вопросов (Bainbridge 1989).

Еще одним недостатком рассылаемых по почте вопросников является высокий процент неответов (Fowler, 1988, Bainbridge, 1989, Neuman, 1994). Тем не менее, были приняты контрмеры путем связывания этого исследования с доверенным учреждением по хранению данных (т. цель исследования (Neuman 1989).

3.4.2. Блок анализа

Целью данного исследования является получение информации о внедрении хранилищ данных и их использовании в австралийских организациях. Целевой группой являются все австралийские организации, внедрившие или внедряющие i информационное хранилище. Затем регистрируются отдельные организации. Анкета была разослана организациям, заинтересованным в принятии информационное хранилище. Этот метод гарантирует, что собранная информация поступает из наиболее подходящих ресурсов каждой участвующей организации.

3.4.3. Образец опроса

Список рассылки участников опроса был получен от TDWI. Из этого списка в качестве основы для выборки были выбраны 3000 австралийских организаций. Последующее письмо с объяснением проекта и цели опроса вместе с формой ответа и предварительно оплаченным конвертом для возврата заполненной анкеты было отправлено выборке. Из 3000 организаций 198 согласились принять участие в исследовании. Ожидалось такое небольшое количество ответов дата большое количество австралийских организаций, которые в то время приняли или применяли стратегию хранения данных в своих организациях. Таким образом, целевая группа для этого исследования состоит только из 198 организаций.

3.4.4. Содержание анкеты

Дизайн анкеты был основан на модели хранилища данных Монаша (обсуждавшейся ранее в части 2.3). Содержание анкеты было основано на обзоре литературы, представленном в главе 2. Копия анкеты, разосланная участникам опроса, находится в Приложении B. Анкета состоит из шести разделов, которые следуют шагам рассматриваемой модели. Следующие шесть параграфов кратко суммируют содержание каждого раздела.

Раздел A: Основная информация об организации
Этот раздел содержит вопросы, касающиеся профиля участвующих организаций. Кроме того, некоторые вопросы относятся к состоянию проекта хранилища данных участника. Конфиденциальная информация, такая как название организации, не раскрывалась при анализе опроса.

Раздел Б: Начало
Вопросы в этом разделе связаны с началом работы с хранилищем данных. Были заданы вопросы об инициаторах проекта, спонсорах, необходимых навыках и знаниях, целях разработки хранилищ данных и ожиданиях конечных пользователей.

Раздел C: Дизайн
Этот раздел содержит вопросы, связанные с планированием деятельности информационное хранилище. В частности, вопросы касались объема реализации, продолжительности проекта, стоимости проекта и анализа затрат/выгод.

Раздел D: Развитие
В разделе разработки есть вопросы, связанные с деятельностью разработчиков информационное хранилище: сбор требований конечного пользователя, источники дать, логическая модель дать, прототипы, планирование емкости, технические архитектуры и выбор средств разработки хранилищ данных.

Раздел E: Эксплуатация
Эксплуатационные вопросы, связанные с работой и расширяемостью информационное хранилище, поскольку он развивается на следующем этапе развития. Там Качество данных, стратегии обновления дать, степень детализации дать, масштабируемость информационное хранилище и вопросы безопасности информационное хранилище были среди типов задаваемых вопросов.

Раздел F: Развитие
Этот раздел содержит вопросы, связанные с использованием информационное хранилище конечными пользователями. Исследователя интересовало назначение и полезность информационное хранилище, принятые стратегии обзора и обучения, а также стратегия контроля информационное хранилище принят.

3.4.5. Скорость отклика

Несмотря на то, что почтовые опросы критикуют за низкий уровень ответов, были предприняты шаги для увеличения уровня возврата (как обсуждалось выше в разделе 3.4.1). Термин «коэффициент ответов» относится к проценту людей в конкретной выборке обследования, которые ответили на вопросник (Denscombe 1998). Следующая формула использовалась для расчета частоты ответов в этом исследовании:

Количество людей, которые ответили
Коэффициент ответов = —————————————————————————— X 100 Общее количество отправленных анкет

3.4.6. Летчик-испытатель

Прежде чем анкета была отправлена ​​в выборку, вопросы были проверены путем проведения экспериментальных испытаний, как это было предложено Лаком и Рубином (1987), Джексоном (1988) и де Ваусом (1991). Цель пилотных испытаний — выявить любые неуклюжие, двусмысленные выражения и трудные для интерпретации вопросы, уточнить любые используемые определения и термины, а также определить приблизительное время, необходимое для заполнения анкеты (Warwick and Lininger, 1975, Jackson, 1988, Salant). и Дилман, 1994). Пилотные испытания проводились путем отбора субъектов с характеристиками, аналогичными характеристикам финальных субъектов, как это было предложено Davis e. Козенца (1993). В этом исследовании в качестве экспериментальных субъектов были выбраны шесть специалистов по хранению данных. После каждого пилотного испытания вносились необходимые коррективы. Благодаря проведенным пилотным испытаниям участники внесли свой вклад в ремоделирование и сброс окончательной версии вопросника.

3.4.7. Методы анализа Давать

I дать Данные опроса, собранные из закрытых вопросников, были проанализированы с использованием пакета статистического программного обеспечения под названием SPSS. Многие ответы были проанализированы с использованием описательной статистики. Ряд анкет вернулся неполным. Они были обработаны более тщательно, чтобы убедиться, что я дать отсутствуют не из-за ошибок при вводе данных, а из-за того, что вопросы не подходят владельцу регистрации или владелец регистрации решил не отвечать на один или несколько конкретных вопросов. Эти отсутствующие ответы игнорировались при анализе данных. дать и были закодированы как «-9», чтобы гарантировать их исключение из процесса анализа.

При подготовке анкеты закрытые вопросы были предварительно закодированы путем присвоения каждому варианту номера. Затем число использовалось для обучения i дать во время анализа (Denscombe 1998, Sapsford and Jupp 1996). Например, в вопросе 1 раздела B было перечислено шесть вариантов: совет директоров, высшее руководство, ИТ-отдел, бизнес-подразделение, консультанты и другие. В файле дать SPSS была сгенерирована переменная для «инициатора проекта» с шестью метками значений: «1» для «совета», «2» для «старшего руководителя» и т. д. Street. Использование шкалы Лайкертина в некоторых закрытых вопросах также позволило без усилий провести идентификацию с использованием соответствующих числовых значений, введенных в SPSS. Для вопросов с неполными ответами, которые не были взаимоисключающими, каждый вариант рассматривался как одна переменная с двумя метками значений: «1» для «проверено» и «2» для «непроверено».

Открытые вопросы рассматривались иначе, чем закрытые вопросы. Ответы на эти вопросы не были введены в SPSS. Вместо этого они были проанализированы вручную. Использование этого типа вопросов позволяет получить информацию о свободно выраженных идеях и личном опыте респондентов (Bainbridge 1989, Denscombe 1998). По возможности была проведена классификация ответов.

Для анализа датьиспользуются методы простого статистического анализа, такие как частота ответов, среднее значение, стандартное отклонение и медиана (Argyrous 1996, Denscombe 1998).
Гамма-тест был эффективен для получения количественных показателей связи между дать порядковые номера (Норусис, 1983; Аргироус, 1996). Эти тесты были уместны, потому что используемые порядковые шкалы не имели многих категорий и могли быть показаны в таблице (Norusis 1983).

3.5 Соммарио

В этой главе обсуждались методология исследования и дизайн, принятые для этого исследования.

Выбор наиболее подходящего метода исследования для конкретного исследования требует
рассмотрение ряда правил, включая характер и тип исследования, а также достоинства и недостатки каждого возможного метода (Jenkins, 1985, Benbasat et al., 1097, Galliers and Land, 1987, yin, 1989, Hamilton and ives, 1992, Galliers). 1992, Нейман 1994). Учитывая отсутствие существующих знаний и теории о внедрении хранилищ данных в Австралии, это исследование требует интерпретативного метода исследования с исследовательской способностью изучать опыт австралийских организаций. Выбранный метод исследования был выбран для сбора информации о принятии концепции хранилища данных австралийскими организациями. В качестве метода сбора была выбрана почтовая анкета. дать. Обоснование метода исследования и методики сбора дать выбор будет предоставлен в этой главе. Кроме того, обсуждались единицы анализа, использованная выборка, процент ответов, содержание вопросника, предварительное тестирование вопросника и метод анализа результатов. дать.

Проектирование Хранилище данных:

Объединение отношений сущностей и пространственного моделирования

АБСТРАКТ НАЯ
Магазин я дать является актуальной проблемой для многих организаций. Ключевая проблема в развитии складского хозяйства дать это его дизайн.
Рисунок должен поддерживать обнаружение понятий в информационное хранилище к устаревшей системе и другим источникам дать а также легкость понимания и оперативность в реализации информационное хранилище.
Большая часть литературы по складскому хозяйству дать рекомендует использовать моделирование отношений сущностей или многомерное моделирование для представления дизайна информационное хранилище.
В этой статье мы показываем, как оба представления могут быть объединены в подходе к проектированию информационное хранилище. Используемый подход систематически

рассмотрены в тематическом исследовании и определены в ряде важных последствий с профессионалами.

ХРАНИЛИЩЕ ДАННЫХ

Un информационное хранилище его обычно определяют как «предметно-ориентированный, комплексный, изменяющийся во времени и энергонезависимый набор данных в поддержку решений руководства» (Inmon and Hackathorn, 1994). Предметно-ориентированный и интегрированный свидетельствует о том, что информационное хранилище разработан, чтобы выйти за функциональные границы устаревших систем, чтобы предложить интегрированную перспективу дать.
Временной вариант связан с историческим или временным характером видео. дать в информационное хранилище, что позволяет анализировать тенденции. Энергонезависимый указывает, что информационное хранилище он не обновляется постоянно, как база данных OLTP. Скорее, он периодически обновляется, с дать из внутренних и внешних источников. информационное хранилище он специально разработан для исследований, а не для обновления целостности и производительности.
Идея хранения я дать не ново, это было одной из целей управления дать с шестидесятых годов (Il Martin, 1982).
I информационное хранилище они предлагают инфраструктуру дать для систем поддержки управления. К системам поддержки управления относятся системы поддержки принятия решений (СППР) и исполнительные информационные системы (ИИС). DSS — это компьютерная информационная система, предназначенная для улучшения процесса и, следовательно, принятия решений человеком. EIS обычно представляет собой систему доставки дать который позволяет бизнес-руководителям легко получить доступ к представлению о дать.
Общая архитектура информационное хранилище подчеркивает роль информационное хранилище в поддержке управления. Помимо предоставления инфраструктуры дать для EIS и DSS, al информационное хранилище к нему можно получить доступ напрямую через запросы. НАШИ дать включены в информационное хранилище основаны на анализе требований к управленческой информации и получены из трех источников: внутренних унаследованных систем, систем сбора данных специального назначения и внешних источников данных. НАШИ дать во внутренних устаревших системах часто избыточны, непоследовательны, низкого качества и хранятся в разных форматах, поэтому их необходимо согласовать и очистить, прежде чем их можно будет загрузить в систему.

информационное хранилище (Инмон, 1992; Макфадден, 1996). НАШИ дать из систем хранения дать ad hoc и из источников дать внешние часто используются для дополнения (обновления, замены) i дать из устаревших систем.

Существует множество веских причин для разработки информационное хранилище, которые включают в себя улучшение принятия решений за счет эффективного использования большего количества информации (Айвс, 1995 г.), поддержку сосредоточения внимания на делах в целом (Грэм, 1996 г.) и снижение затрат на принятие решений. дать для EIS и DSS (Graham 1996, McFadden 1996).

Недавнее эмпирическое исследование показало, что в среднем окупаемость инвестиций для i информационное хранилище на 401% через три года (Graham, 1996). Однако другие эмпирические исследования информационное хранилище обнаружил серьезные проблемы, включая трудности в измерении и распределении выгод, отсутствие четкой цели, недооценку объема и сложности процесса хранения дать, особенно в отношении источников и чистоты дать. Магазин я дать можно рассматривать как решение проблемы управления дать между организациями. Манипуляции дать как социальный ресурс он остается одной из ключевых проблем управления информационными системами во всем мире на протяжении многих лет (Браншо и др., 1996; Гальер и др., 1994; Нидерман и др., 1990; Перван, 1993).

Популярный подход к управлению активами дать в восьмидесятых годах была разработка модели дать Социальное. Модель дать social был разработан, чтобы предложить стабильную основу для разработки новых систем приложений e база данных и реконструкция и интеграция унаследованных систем (Brancheau et al.

1989, Гудхью и др. 1988:1992, Ким и Эверест, 1994). Однако у этого подхода есть несколько проблем, в частности, сложность и стоимость каждой задачи, а также длительное время, необходимое для достижения ощутимых результатов (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997). ).

Il информационное хранилище это отдельная база данных, которая сосуществует с устаревшими базами данных, а не заменяет их. Таким образом, это позволяет вам направлять управление дать и избежать дорогостоящего восстановления устаревших систем.

СУЩЕСТВУЮЩИЕ ПОДХОДЫ К ПРОЕКТИРОВАНИЮ ДАННЫХ

СКЛАД

Процесс создания и совершенствования информационное хранилище следует понимать скорее как эволюционный процесс, а не как традиционный жизненный цикл разработки систем (Дезио, 1995, Шанкс, О'Доннелл и Арнотт, 1997а). В проекте задействовано много процессов информационное хранилище такие как инициализация, планирование; информация, полученная из требований, запрашиваемых у менеджеров компании; источники, преобразования, очистка дать и синхронизировать с устаревшими системами и другими источниками дать; разрабатываемые системы доставки; мониторинг информационное хранилище; и бессмысленность эволюционного процесса и построения информационное хранилище (Стинчи, О'Доннелл и Арнотт, 1997b). В этом журнале мы сосредоточимся на том, как рисовать i дать хранится в контексте этих других процессов. Существует ряд предлагаемых подходов к архитектуре видео. информационное хранилище в литературе (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Каждая из этих методологий имеет краткий обзор с анализом их сильных и слабых сторон.

Подход Инмона (1994) к Хранилище данных Проект

Инмон (1994) предложил четыре итерационных шага для разработки информационное хранилище (см. рис. 2). Первым шагом является разработка шаблона дать социальные, чтобы понять, как я дать могут быть интегрированы между функциональными областями внутри организации путем разделения i дать хранить в районах. Модель дать это сделано для хранения дать связанных с принятием решений, в том числе дать исторический, в том числе дать вычитается и суммируется. Второй шаг заключается в определении предметных областей для реализации. Они основаны на приоритетах, определенных конкретной организацией. Третий этап включает в себя нанесение база данных для предметной области уделите особое внимание включению соответствующих уровней детализации. Inmon рекомендует использовать модель сущностей и отношений. Четвертый шаг – определение исходных систем. дать необходимо и разработать процессы преобразования для захвата, очистки и форматирования i дать.

Сильные стороны подхода Инмона заключаются в том, что модель дать социальные предлагает основу для интеграции дать в рамках организации и планирования поддерживает итеративную разработку информационное хранилище. Его недостатками являются сложность и стоимость проектирования модели. дать социальная, трудность в понимании моделей сущностей и отношений, используемых в обеих моделях, что дать социальный и тот из дать хранится по предметной области, и уместность дать рисунка информационное хранилище для реализации база данных относительно, но не для база данных многомерный.

Айвз (1995) Подход к Хранилище данных Проект

Айвс (1995) предлагает четырехэтапный подход к проектированию информационной системы, который, по его мнению, применим к проектированию информационное хранилище (см. рис. 3). Подход во многом основан на информационной инженерии для разработки информационных систем (Мартин, 1990). Первым шагом является определение ваших целей, успеха и критических факторов, а также ключевых показателей эффективности. Ключевые бизнес-процессы и необходимая информация моделируются, чтобы привести нас к модели дать Социальное. Второй шаг включает в себя разработку определяющей архитектуры дать хранится по площади, база данных di информационное хранилище, необходимые технологические компоненты, набор организационной поддержки, необходимой для внедрения и работы с информационное хранилище. Третий шаг включает в себя выбор необходимых программных пакетов и инструментов. Четвертый этап – детальное проектирование и строительство объекта. информационное хранилище. Айвз отмечает, что магазин дать это ограниченный итерационный процесс.

Сильные стороны подхода Айвса — использование технических спецификаций для определения требований к информации, использование структурированного процесса для поддержки интеграции информационное хранилище, соответствующий выбор аппаратного и программного обеспечения, а также использование нескольких методов представления для информационное хранилище. Его недостатки присущи сложности. Другие включают в себя трудности развития многих уровней база данных в пределах информационное хранилище в разумные сроки и стоимость.

Подход Кимбалла (1994) к Хранилище данных Проект

Кимбалл (1994) предложил пять итерационных шагов для разработки информационное хранилище (см. рис. 4). Его подход особенно посвящен рисованию соло. информационное хранилище и об использовании многомерных моделей вместо моделей сущностей и отношений. Кимбалл анализирует эти многомерные модели, потому что бизнес-лидерам легче понять бизнес, они более эффективны при проведении сложных консультаций, а разработка база данных физические более эффективны (Kimball 1994). Кимбалл признает, что разработка информационное хранилище является итеративным, и это информационное хранилище разделенные могут быть объединены путем разделения на таблицы общих измерений.

Первым шагом является определение конкретной предметной области, которую необходимо усовершенствовать. Второй и третий этапы связаны с формированием размеров. На втором этапе меры определяют интересующие предметы в предметной области и группируют их в таблицу фактов. Например, в предметной области продаж интересующие меры могут включать количество проданных товаров и доллар в качестве валюты продаж. Третий шаг включает в себя определение измерений, которые представляют собой способы группировки фактов. В предметной области продаж соответствующие измерения могут включать товар, местоположение и период времени. Таблица фактов имеет составной ключ для связи с каждой из таблиц измерений и обычно содержит очень большое количество фактов. Напротив, таблицы измерений содержат описательную информацию об измерениях и других атрибутах, которые можно использовать для группировки фактов. Предлагаемая связанная таблица фактов и измерений образует так называемую звездную схему из-за своей формы. Четвертый этап предполагает построение база данных многомерный, чтобы усовершенствовать рисунок звезды. Последним шагом является определение исходных систем. дать необходимо и разработать процессы преобразования для захвата, очистки и форматирования i дать.

Сильные стороны подхода Кимбалла включают использование многомерных моделей для представления i. дать хранится, что облегчает понимание и приводит к эффективному физическому дизайну. Размерная модель, которая также легко использует обе системы база данных реляционные могут быть усовершенствованы или системы база данных многомерный. Его недостатки включают отсутствие некоторых методов, облегчающих планирование или интеграцию многих звездных схем в рамках одной системы. информационное хранилище и трудность проектирования из экстремально денормализованной структуры в многомерной модели дать в устаревших системах.

Подход Макфаддена (1996) к данным Проектирование складов

Макфадден (1996) предлагает пятиэтапный подход к рисованию информационное хранилище (см. рис. 5).
Его подход основан на синтезе идей из литературы и ориентирован на разработку единого информационное хранилище. На первом этапе проводится анализ требований. Хотя технические спецификации не предписаны, в примечаниях Макфаддена указаны сущности. дать спецификации и их атрибуты, а также отсылает к читателям Watson and Frolick (1993) для сбора требований.
На втором этапе строится модель отношений сущностей для информационное хранилище а затем утверждается руководителями компании. Третий шаг включает в себя определение сопоставления с унаследованными системами и внешними источниками данных. информационное хранилище. Четвертый шаг включает в себя процессы разработки, развертывания и синхронизации. дать в информационное хранилище. На последнем этапе разрабатывается поставка системы с упором на пользовательский интерфейс. Макфадден отмечает, что процесс рисования обычно повторяется.

Сильные стороны подхода Макфаддена — вовлечение бизнес-лидеров в определение требований, а также важность ресурсов. датьих очистка и сбор. Его недостатки — отсутствие процесса разделения большого проекта. информационное хранилище во многих интегрированных стадиях, и там

трудности с пониманием моделей сущностей и отношений, используемых при разработке информационное хранилище.

Нас выбирают не только те, кто нам близок.

    0/5 (0 отзывов)
    0/5 (0 отзывов)
    0/5 (0 отзывов)

    Узнайте больше в Интернет-агентстве

    Подпишитесь, чтобы получать последние статьи по электронной почте.

    автор аватар
    Администратор Генеральный директор
    👍Интернет-агентство | Эксперт веб-агентства в области цифрового маркетинга и SEO. Веб-агентство Online — это веб-агентство. Успех Agenzia Web Online в цифровой трансформации основан на основах Iron SEO версии 3. Специализации: системная интеграция, интеграция корпоративных приложений, сервис-ориентированная архитектура, облачные вычисления, хранилище данных, бизнес-аналитика, большие данные, порталы, интранет, веб-приложения. Проектирование и управление реляционными и многомерными базами данных. Проектирование интерфейсов для цифровых медиа: удобство использования и графика. Интернет-агентства предлагают компаниям следующие услуги: -SEO в Google, Amazon, Bing, Яндекс; -Веб-аналитика: Google Analytics, Google Tag Manager, Яндекс Метрика; -Конверсии пользователей: Google Analytics, Microsoft Clarity, Яндекс Метрика; -SEM в Google, Bing, Amazon Ads; -Маркетинг в социальных сетях (Facebook, Linkedin, Youtube, Instagram).
    Моя Agile-конфиденциальность
    Этот сайт использует технические и профилирующие файлы cookie. Нажимая «Принять», вы разрешаете использование всех профилирующих файлов cookie. При нажатии на кнопку «Отклонить» или «X» все профилирующие файлы cookie будут отклонены. Нажав «Настроить», вы можете выбрать, какие профилирующие файлы cookie активировать.
    Этот сайт соответствует Закону о защите данных (LPD), Федеральному закону Швейцарии от 25 сентября 2020 года, а также GDPR, Регламенту ЕС 2016/679, касающемуся защиты персональных данных, а также свободного перемещения таких данных.