fbpx

Data warehouse e planejamento de recursos empresariais | DWH e ERP

ARQUIVO DADOS CENTRAL: ED HISTÓRIA EVOLUÇÕES

Os dois temas dominantes da tecnologia corporativa na década de 90 foram: data warehouse e o ERP. Há muito tempo essas duas poderosas correntes fazem parte da TI corporativa sem nunca terem interseções. Era quase como se fossem matéria e antimatéria. Mas o crescimento de ambos os fenômenos inevitavelmente levou à sua interseção. As empresas hoje estão enfrentando o problema do que fazer com o ERP e data warehouse. Este artigo irá delinear quais são os problemas e como eles são abordados pelas empresas.

NO INICIO…

No começo havia o data warehouse. Armazém de dados foi criado para combater o sistema aplicativo de processamento de transações. Nos primórdios, a memorização do dar pretendia ser apenas um contraponto aos aplicativos de processamento de transações. Mas hoje em dia existem visões muito mais sofisticadas do que se pode fazer data warehouse. No mundo de hoje, o data warehouse faz parte de uma estrutura que pode ser chamada de Fábrica de Informações Corporativas.

A FÁBRICA DE INFORMAÇÕES CORPORATIVAS (CIF)

A Fábrica de Informações Corporativas possui componentes arquiteturais padrão: uma camada de transformação e integração de código que integra i dar enquanto eu dar passar do ambiente de aplicação para o data warehouse da empresa; uma data warehouse da empresa onde eu dar histórias detalhadas e integradas. o data warehouse empresa serve como a base sobre a qual todas as outras partes do ambiente podem ser construídas data warehouse; um armazenamento de dados operacionais (ODS). Uma ODS é uma estrutura híbrida que contém alguns aspectos da data warehouse e outros aspectos de um ambiente OLTP; data marts, onde diferentes departamentos podem ter sua própria versão do data warehouse; uma data warehouse de exploração onde os "pensadores" da empresa podem apresentar suas consultas de 72 horas sem nenhum efeito prejudicial sobre o data warehouse; e uma memória de linha próxima, na qual dar velho e dar detalhes em massa podem ser armazenados de forma barata.

ONDE O ERP COMBINA COM O FÁBRICA DE INFORMAÇÕES CORPORATIVAS

O ERP se funde com a Fábrica de Informações Corporativas em dois lugares. Primeiro como um aplicativo básico (linha de base) que fornece a dar da aplicação para data warehouse. Neste caso eu dar, gerados como subproduto de um processo de transação, são integrados e carregados no data warehouse da empresa. O segundo ponto de união entre ERP e CIF é o ODS. De fato, em muitos ambientes o ERP é usado como um ODS clássico.

Caso o ERP seja utilizado como aplicação básica, o mesmo ERP também pode ser utilizado no CIF como ODS. De qualquer forma, se o ERP for usado em ambas as funções, deve haver uma distinção clara entre as duas entidades. Em outras palavras, quando o ERP desempenha o papel de aplicativo principal e ODS, as duas entidades arquitetônicas devem ser distintas. Se uma única implementação de um ERP tentar desempenhar as duas funções ao mesmo tempo, inevitavelmente haverá problemas no projeto e na implementação dessa estrutura.

SEPARAR ODS E APLICAÇÕES BÁSICAS

Muitos são os motivos que levam à divisão dos componentes arquitetônicos. Talvez a questão mais reveladora na separação dos diferentes componentes de uma arquitetura seja que cada componente da arquitetura tem sua própria visão. O aplicativo de linha de base serve a um propósito diferente do ODS. Tente sobrepor

uma visão de aplicativo de linha de base no mundo de um ODS ou vice-versa não é a maneira correta de trabalhar.

Consequentemente, o primeiro problema de um ERP em CIF é verificar se há distinção entre as aplicações de linha de base e o ODS.

MODELOS DE DADOS NA CORPORATIVA FÁBRICA DE INFORMAÇÕES

Para alcançar a coesão entre os diferentes componentes da arquitetura CIF, deve haver um modelo de dar. Os modelos de dar eles servem como um link entre os vários componentes da arquitetura, como os aplicativos de linha de base e o ODS. Os modelos de dar eles se tornam o "roteiro intelectual" para obter o significado correto dos diferentes componentes arquitetônicos do CIF.

De mãos dadas com essa noção, a ideia é que deve haver um grande e único modelo de dar. Obviamente, deve haver um padrão de dar para cada um dos componentes e, além disso, deve haver um caminho sensato conectando os diferentes modelos. Cada componente da arquitetura - ODS, aplicativos de linha de base, data warehouse empresa, e assim por diante .. - precisa de seu próprio modelo de dar. E assim deve haver uma definição precisa de como esses modelos de dar eles interagem entre si.

MOVE I DADOS DA DATA ERP ARMAZÉM

Se a origem do dar é uma aplicação de linha de base e/ou um ODS, quando o ERP entra dar em data warehouse, essa inserção deve ocorrer no nível mais baixo de "granularidade". Simplesmente resumir ou agregar i dar assim como eles saem do aplicativo de linha de base do ERP ou o ERP ODS não é a coisa certa a fazer. A dar detalhes são necessários no data warehouse para formar a base do processo DSS. Tal dar será reformulado de muitas maneiras pelos data marts e explorações do data warehouse.

O deslocamento de dar do ambiente de aplicação de linha de base do ERP para o data warehouse da empresa é feito de forma razoavelmente relaxada. Tal mudança ocorre aproximadamente 24 horas após a atualização ou criação no ERP. O fato de ter um movimento "preguiçoso" dos deuses dar em data warehouse da empresa permite o dar vindo do ERP para "resolver". Uma vez eu dar são depositados no aplicativo de linha de base, então você pode mover com segurança i dar de ERP na empresa. Outro objetivo alcançável graças ao movimento “preguiçoso” dos deuses dar é a demarcação clara entre processos operacionais e SAD. Com um movimento "rápido" do dar a linha entre DSS e operacional permanece vaga.

O movimento de dar do ODS do ERP para data warehouse da empresa é feito periodicamente, geralmente semanal ou mensalmente. Neste caso, o movimento de dar é baseado na necessidade de "limpar" o antigo dar historiadores. Claro, o ODS contém i dar que são muito mais recentes do que o dar historiadores encontrados em data warehouse.

O deslocamento de dar em data warehouse quase nunca é feito "atacado" (de maneira atacadista). Copie uma tabela do ambiente ERP para o data warehouse Não faz sentido. Uma abordagem muito mais realista é mover unidades selecionadas do dar. Só eu dar que mudaram desde a última atualização do data warehouse são os que devem ser movidos para o data warehouse. Uma maneira de saber quais dar foram alterados desde a última atualização é olhar para os timestamps dar encontrados no ambiente ERP. O designer seleciona todas as alterações que ocorreram desde a última atualização. Outra abordagem é usar técnicas de aquisição de mudanças dar. Com essas técnicas, os logs e as fitas de diário são analisados ​​para determinar quais dar deve ser movido do ambiente de ERP para o de data warehouse. Essas técnicas são melhores, pois os logs e as fitas de diário podem ser lidos dos arquivos do ERP sem causar mais impacto nos outros recursos do ERP.

OUTRAS COMPLICAÇÕES

Um dos problemas do ERP em CIF é o que acontece com outras fontes da aplicação ou com dar do ODS, que deve contribuir para data warehouse mas não fazem parte do ambiente ERP. Dada a natureza fechada do ERP, especialmente SAP, a tentativa de integrar chaves de fontes externas de dar com dar que vêm do ERP no momento da mudança i dar em data warehouse, é um grande desafio. E quantas exatamente são as probabilidades de que eu dar de aplicativos ou ODS fora do ambiente ERP serão integrados ao data warehouse? As chances são realmente muito altas.

ACHAR DADOS HISTÓRICOS DO ERP

Outro problema com o dar ERP é aquele decorrente da necessidade de se ter dar histórico dentro do data warehouse. Normalmente o data warehouse ele precisa dar historiadores. E normalmente a tecnologia ERP não armazena esses dar histórico, pelo menos não a ponto de ser necessário no data warehouse. Quando uma grande quantidade de dar histórico começa a ser adicionado no ambiente ERP, esse ambiente precisa ser limpo. Por exemplo, suponha um data warehouse deve ser carregado com cinco anos de dar histórico enquanto o ERP detém no máximo seis meses desses dar. Desde que a empresa esteja satisfeita em coletar uma variedade de dar histórico com o passar do tempo, então não há problema em usar o ERP como fonte para o data warehouse. Mas quando o data warehouse ele tem que voltar no tempo e levar deuses dar históricos que não foram previamente coletados e salvos pelo ERP, então o ambiente ERP se torna ineficiente.

ERP E METADATA

Outra consideração a fazer sobre ERP e data warehouse é o dos metadados existentes no ambiente ERP. Assim como os metadados passam do ambiente ERP para o data warehouse, os metadados devem ser movidos da mesma maneira. Além disso, os metadados devem ser transformados no formato e estrutura exigidos pela infraestrutura do data warehouse. Há uma grande diferença entre metadados operacionais e metadados DSS. Metadados operacionais são principalmente para o desenvolvedor e o

programador. Os metadados DSS são principalmente para o usuário final. Metadados existentes em aplicativos ERP ou ODS precisam ser convertidos e essa conversão nem sempre é fácil e direta.

FAZENDO OS DADOS DO ERP

Se o ERP for usado como provedor de dar para o data warehouse deve haver uma interface sólida que move i dar do ambiente ERP para o ambiente data warehouse. A interface deve:

  • ▪ ser fácil de usar
  • ▪ permitir o acesso a dar do ERP
  • ▪ tomar o significado de dar que estão prestes a serem transferidos para o data warehouse
  • ▪ conhecer as limitações do ERP que podem surgir quando o acesso é feito dar do ERP:
  • ▪ integridade referencial
  • ▪ relacionamentos hierárquicos
  • ▪ relações lógicas implícitas
  • ▪ convenção de aplicação
  • ▪ todas as estruturas do dar suportado pelo ERP, e assim por diante ...
  • ▪ ser eficiente no acesso dar, providenciando:
  • ▪ movimento direto de dar
  • ▪ aquisição de troco dar
  • ▪ apoiar o acesso oportuno a dar
  • ▪ entender o formato do dar, e assim por diante… INTERFACE COM SAP A interface pode ser de dois tipos, doméstica ou comercial. Algumas das principais interfaces comerciais incluem:
  • ▪ SAS
  • ▪ Soluções Prims
  • ▪ D2k, e assim por diante... MÚLTIPLAS TECNOLOGIAS ERP Tratar o ambiente ERP como se fosse uma única tecnologia é um grande erro. Existem muitas tecnologias de ERP, cada uma com seus pontos fortes. Os fornecedores mais conhecidos do mercado são:
  • ▪ SAP
  • ▪ Oracle Financials
  • ▪ PeopleSoft
  • ▪ JD Edwards
  • ▪ Baan SAP SAP é o maior e mais completo software ERP. Os aplicativos SAP abrangem muitos tipos de aplicativos em muitas áreas. A SAP tem a reputação de ser:
  • ▪ muito grande
  • ▪ muito difícil e caro de implementar
  • ▪ precisa de muita gente e consultores para ser implementado
  • ▪ precisa de pessoas especializadas para implementação
  • ▪ leva muito tempo para implementar. A SAP também tem a reputação de armazenar seus próprios dar com muito cuidado, dificultando o acesso de alguém de fora da área SAP. A força do SAP é ser capaz de capturar e armazenar uma grande quantidade de dar. A SAP anunciou recentemente sua intenção de estender seus aplicativos para data warehouse. Há muitos prós e contras em usar a SAP como fornecedora de data warehouse. Uma vantagem é que o SAP já está instalado e que a maioria dos consultores já conhece o SAP.
    As desvantagens de ter SAP como fornecedor de data warehouse são muitos: a SAP não tem experiência no mundo da data warehouse Se SAP é o fornecedor de data warehouse, é necessário "tirar" i dar do SAP al data warehouse. Dato um histórico de sistema fechado da SAP, é improvável que seja fácil obter i da SAP para ele (???). Existem muitos ambientes legados que alimentam o SAP, como IMS, VSAM, ADABAS, ORACLE, DB2 e assim por diante. A SAP insiste em uma abordagem "não inventada aqui". A SAP não quer trabalhar com outros fornecedores para usar ou criar o data warehouse. A SAP insiste em gerar todo o seu software sozinha.

Embora a SAP seja uma empresa grande e poderosa, tentando reescrever a tecnologia de ELT, OLAP, administração de sistemas e até mesmo o código central do banco de dados é simplesmente louco. Em vez de adotar uma atitude cooperativa com fornecedores de data warehouse de longa data, a SAP seguiu a abordagem que "conhece melhor". Esta atitude está a travar o sucesso que a SAP poderia ter na área de data warehouse.
A recusa da SAP em permitir que fornecedores externos acessem os seus de forma rápida e graciosa dar. A própria essência de usar um data warehouse é de fácil acesso a dar. Toda a história da SAP se baseia em dificultar o acesso dar.
A falta de experiência da SAP em lidar com grandes volumes de dar; no campo de data warehouse existem volumes de dar nunca visto pela SAP e para lidar com essas grandes quantidades de dar você precisa ter uma tecnologia adequada. A SAP aparentemente desconhece essa barreira tecnológica que existe para entrar no campo da data warehouse.
A cultura corporativa da SAP: A SAP criou um negócio na obtenção de dar do sistema. Mas para fazer isso você precisa ter uma mentalidade diferente. Tradicionalmente, as empresas de software que eram boas em obter dados em um ambiente não eram boas em fazer com que os dados fossem para o outro lado. Se a SAP puder fazer esse tipo de troca, será a primeira empresa a fazê-lo.

Em suma, é questionável se uma empresa deve selecionar a SAP como seu fornecedor de data warehouse. Há riscos muito sérios, por um lado, e muito poucas recompensas, por outro. Mas há outra razão que desencoraja a escolha da SAP como fornecedora de data warehouse. Porque toda empresa deve ter o mesmo data warehouse de todas as outras empresas? o data warehouse é o coração da vantagem competitiva. Se todas as empresas adotassem o mesmo data warehouse seria difícil, se não impossível, obter uma vantagem competitiva. A SAP parece pensar que um data warehouse ele pode ser visto como um cookie e isso é mais um sinal de sua mentalidade de aplicativo "obter os dados".

Nenhum outro fornecedor de ERP é tão dominante quanto o SAP. Sem dúvida, haverá empresas que seguirão o caminho do SAP para as suas data warehouse mas provavelmente esses data warehouse Os SAPs serão grandes, caros e demorados para serem criados.

Esses ambientes incluem atividades como processamento de caixa de banco, processos de reserva de companhias aéreas, processos de reclamação de seguro e assim por diante. Quanto mais poderoso o sistema de transações, mais óbvia era a necessidade de separação entre o processo operacional e o DSS (Decision Support System). No entanto, com sistemas de recursos humanos e pessoais, você nunca se depara com grandes volumes de transações. E, claro, quando uma pessoa é contratada ou sai da empresa isso é um registro de uma transação. Mas em relação a outros sistemas, os sistemas de recursos humanos e pessoais simplesmente não têm muitas transações. Portanto, em sistemas de recursos humanos e pessoais não é totalmente óbvio que um DataWarehouse seja necessário. De muitas maneiras, esses sistemas representam o pacote de sistemas DSS.

Mas há outro fator que precisa ser considerado ao lidar com datawarehouse e PeopleSoft. Em muitos ambientes, eu dar dos recursos humanos e pessoais são secundários ao negócio principal da empresa. A maioria das empresas fabrica, vende, presta serviços e assim por diante. Os sistemas de recursos humanos e pessoais são geralmente secundários (ou de apoio) à principal linha de negócios da empresa. Portanto, é equívoco e inconveniente um data warehouse separados para suporte de recursos humanos e pessoais.

A PeopleSoft é muito diferente da SAP nesse aspecto. Com o SAP, é obrigatório que haja um data warehouse. Com PeopleSoft, não é tão claro. Um data warehouse é opcional com PeopleSoft.

A melhor coisa que pode ser dita sobre o dar PeopleSoft é que o data warehouse pode ser usado para arquivar i dar relacionados com antigos recursos humanos e pessoais. Uma segunda razão pela qual uma empresa gostaria de usar um data warehouse a

em detrimento do ambiente PeopleSoft é permitir o acesso e acesso livre às ferramentas de análise, dar pela PeopleSoft. Mas além dessas razões, pode haver casos em que é preferível não ter um data warehouse para dar PeopleSoft.

Em resumo

Há muitos insights sobre a construção de um data warehouse dentro de um software ERP.
Alguns deles são:

  • ▪ Faz sentido ter um data warehouse quem se parece com qualquer outro na indústria?
  • ▪ Quão flexível é um ERP data warehouse Programas?
  • ▪ Um ERP data warehouse software pode lidar com um volume de dar que está localizado em um "data warehouse arena"?
  • ▪ Qual é o registro da trilha que o fornecedor de ERP faz frente ao fácil e barato, em termos de tempo, dar? (qual é o histórico dos fornecedores de ERP na entrega de dados baratos, pontuais e fáceis de acessar?)
  • ▪ Qual é o entendimento do fornecedor de ERP sobre a arquitetura DSS e a fábrica de informações corporativas?
  • ▪ Os fornecedores de ERP entendem como obter dar dentro do ambiente, mas também entender como exportá-los?
  • ▪ Quão aberto é o fornecedor de ERP para ferramentas de armazenamento de dados?
    Todas essas considerações devem ser feitas para determinar onde colocar o data warehouse que vai hospedar eu dar ERP e outros dar. Em geral, a menos que haja uma razão convincente para fazer o contrário, a construção é recomendada data warehouse fora do ambiente do fornecedor de ERP. CAPÍTULO 1 Visão geral dos principais pontos da organização de BI:
    Os repositórios de informações funcionam de forma contrária à arquitetura de business intelligence (BI):
    A cultura corporativa e a TI podem limitar o sucesso na construção de organizações de BI.

A tecnologia não é mais o fator limitante para as organizações de BI. O problema para arquitetos e planejadores de projetos não é se a tecnologia existe, mas se eles podem efetivamente implementar a tecnologia disponível.

Para muitas empresas um data warehouse é pouco mais que um depósito passivo que distribui i dar para usuários que precisam. A dar eles são extraídos dos sistemas de origem e são preenchidos em estruturas de destino de data warehouse. o dar eles também podem ser limpos com alguma sorte. No entanto, nenhum valor adicional é adicionado ou colhido por dar durante este processo.

Essencialmente, o DW passivo, na melhor das hipóteses, fornece apenas i dar limpo e operacional para associações de usuários. A criação de informações e o entendimento analítico são inteiramente de responsabilidade dos usuários. Julgue se o DW (Armazém de dados) é um sucesso e subjetivo. Se julgarmos o sucesso na capacidade de coletar, integrar e limpar com eficiência o dar corporativo de forma previsível, então sim, o DW é um sucesso. Por outro lado, se olharmos para a coleta de informações, consolidação e exploração da organização como um todo, então o DW é um fracasso. Um DW fornece pouco ou nenhum valor de informação. Como resultado, os usuários são forçados a se conformar, criando assim silos de informações. Este capítulo apresenta uma visão geral abrangente para recapitular a arquitetura de business intelligence (BI) da organização. Vamos começar com uma descrição de BI e, em seguida, passar para as discussões de design e desenvolvimento de informações, em vez de simplesmente fornecer o dar aos usuários. As discussões são então focadas no cálculo do valor de seus esforços de BI. Concluímos definindo como a IBM aborda os requisitos de arquitetura de BI de sua organização.

Descrição da arquitetura de organização de BI

Poderosos sistemas de informação orientados para transações são agora comuns em todas as grandes empresas, efetivamente nivelando o campo de atuação para corporações em todo o mundo.

Permanecer competitivo, no entanto, agora requer sistemas de orientação analítica que possam revolucionar a capacidade da empresa redescobrindo e usando as informações que já possuem. Esses sistemas analíticos derivam da compreensão da riqueza dos deuses dar acessível. O BI pode melhorar o desempenho de todas as informações corporativas. As empresas podem melhorar o relacionamento entre clientes e fornecedores, melhorar a rentabilidade de produtos e serviços, gerar novas e melhores ofertas, controlar riscos e, entre muitos outros ganhos, cortar gastos drasticamente. Com o BI sua empresa finalmente começa a utilizar as informações do cliente como um ativo competitivo graças a aplicativos que possuem objetivos de mercado.

Ter o negócio certo significa ter respostas definitivas para questões-chave como:

  • ▪ Qual dos nossos clientes eles nos fazem ganhar mais ou nos mandam com prejuízo?
  • ▪ Onde moram nossos melhores clientes em relação a loja/ armazém que frequentam?
  • ▪ Quais de nossos produtos e serviços podem ser vendidos de forma mais eficaz e para quem?
  • ▪ Quais produtos podem ser vendidos de forma mais eficaz e para quem?
  • ▪ Qual campanha de vendas teve mais sucesso e por quê?
  • ▪ Quais canais de vendas são mais eficazes para quais produtos?
  • ▪ Como podemos melhorar o relacionamento com nossos melhores clientes? A maioria das empresas tem dar difícil responder a essas perguntas.
    Os sistemas operacionais geram grandes quantidades de produtos, clientes e dar mercado de pontos de venda, reservas, atendimento ao cliente e sistemas de suporte técnico. O desafio é extrair e explorar essas informações. Muitas empresas aproveitam apenas pequenas frações de suas próprias dar para análises estratégicas.
    I dar restante, muitas vezes junto com i dar derivar fontes externas, como "relatórios do governo" e outras informações adquiridas, são uma mina de ouro apenas esperando para ser explorada, e dar eles só devem ser refinados no contexto informativo de sua organização.

Este conhecimento pode ser aplicado de diversas maneiras, desde a concepção de uma estratégia corporativa global até a comunicação pessoal com fornecedores, através de call centers, faturamento, Internet e outros pontos. O ambiente de negócios atual determina que as soluções de DW e BI relacionadas evoluam além da execução de estruturas de negócios tradicionais. dar qual eu dar normalizado no nível atômico e "fazendas de estrelas / cubos".

O que é necessário para permanecer competitivo é uma fusão de tecnologias tradicionais e avançadas em um esforço para suportar um amplo cenário analítico.
Concluindo, o ambiente geral deve melhorar o conhecimento da empresa como um todo, garantindo que as ações tomadas como consequência das análises realizadas sejam úteis para o benefício de todos.

Por exemplo, digamos que você classifique o seu clientes nas categorias de alto ou baixo risco.
Caso essas informações sejam geradas por um modelo de extração ou outro meio, elas devem ser colocadas no DW e disponibilizadas a qualquer pessoa, por meio de qualquer ferramenta de acesso, como relatórios estáticos, planilhas, tabelas ou processamento analítico online (OLAP). .

No entanto, atualmente, grande parte desse tipo de informação permanece nos silos de dar dos indivíduos ou departamentos que geram a análise. A organização como um todo tem pouca ou nenhuma visibilidade para compreensão. Somente misturando esse tipo de conteúdo de informações em seu DW corporativo você pode eliminar silos de informações e elevar seu ambiente de DW.
Existem dois grandes obstáculos para o desenvolvimento de uma organização de BI.
Primeiro, temos o problema da própria organização e sua disciplina.
Embora não possamos ajudar com mudanças nas políticas organizacionais, podemos ajudar a entender os componentes de BI de uma organização, sua arquitetura e como a tecnologia IBM facilita seu desenvolvimento.
A segunda barreira a ser superada é a falta de tecnologia integrada e o conhecimento de um método que relembre todo o espaço de BI ao invés de apenas um pequeno componente.

A IBM está respondendo às mudanças na tecnologia de integração. É sua responsabilidade fornecer um planejamento consciente. Essa arquitetura deve ser desenvolvida com tecnologia escolhida para integração irrestrita ou, no mínimo, com tecnologia que adere a padrões abertos. Além disso, sua gestão de negócios deve garantir que os negócios de BI sejam realizados dentro do cronograma e não permitir o desenvolvimento de silos de informações que surgem de agendas ou objetivos de autoatendimento.
Isso não quer dizer que o ambiente de BI não seja sensível para reagir às diferentes necessidades e exigências de diferentes usuários; em vez disso, significa que a implementação dessas necessidades e requisitos individuais é feita para o benefício de toda a organização de BI.
Uma descrição da arquitetura da organização de BI pode ser encontrada na página 9 da Figura 1.1 A arquitetura demonstra uma rica combinação de tecnologias e técnicas.
Do ponto de vista tradicional, a arquitetura inclui os seguintes componentes de armazém

Camada atômica.

Esta é a base, o coração de todo o DW e, portanto, do relatório estratégico.
I dar armazenado aqui manterá a integridade histórica, relatórios de dar e incluem métricas derivadas, além de serem limpas, integradas e armazenadas usando os modelos de extração.
Todo o uso subsequente destes dar e informações relacionadas são derivadas desta facilidade. Esta é uma excelente fonte para extração de dar e para relatórios com consultas SQL estruturadas

Depósito operacional de dar ou base de relatório de dar(Armazenamento de dados operacionais (ODS) ou relatórios banco de dados.)

Esta é uma estrutura de dar projetado especificamente para sinalização técnica.

I dar armazenadas e relatadas acima, essas estruturas podem eventualmente se propagar para o armazém através da área de preparação, onde podem ser usadas para relatórios estratégicos.

Área de preparação.

A primeira parada para a maioria dar destinado ao ambiente de warehouse é a zona da organização.
Aqui eu dar eles são integrados, limpos e transformados em dar lucros que vão povoar a estrutura do armazém

Data martes.

Esta parte da arquitetura representa a estrutura de dar usado especificamente para OLAP. A presença dos datamarts, se eu dar eles são armazenados nos diagramas de estrelas sobrepostos dar multidimensional em um ambiente relacional, ou nos arquivos de dar reservado usado por tecnologia OLAP específica, como servidor DB2 OLAP, não é relevante.

A única restrição é que a arquitetura facilita o uso de dar multidimensional.
A arquitetura também inclui tecnologias e técnicas críticas de Bi que se destacam como:

Análise espacial

O espaço é um ganho inesperado de informações para o analista e é fundamental para a resolução completa. O espaço pode representar informações sobre pessoas que vivem em um determinado local, bem como informações sobre onde esse local está fisicamente em relação ao resto do mundo.

Para realizar essa análise, você deve começar vinculando suas informações às coordenadas de latitude e longitude. Isso é chamado de "geocodificação" e deve fazer parte do processo de extração, transformação e carregamento (ETL) no nível atômico de seu warehouse.

Mineração de dados.

A extração de dar permite que nossas empresas aumentem o número de clientes, para prever tendências de vendas e permitir a gestão do relacionamento com o clientes (CRM), entre outras iniciativas de BI.

A extração de dar deve, portanto, ser integrado com as estruturas de dar da DWHouse e apoiado por processos de armazém para verificar o uso eficaz e eficiente da tecnologia e técnicas relacionadas.

Conforme indicado na arquitetura de BI, o nível atômico do DWHouse, assim como os datamarts, é uma excelente fonte de dar para extração. Essas mesmas instalações também devem receber os resultados da extração para garantir a disponibilidade para o público mais amplo.

Agentes.

Existem vários agentes para examinar o cliente para cada ponto como, por exemplo, os sistemas operacionais da empresa e o próprio dw. Esses agentes podem ser redes neurais avançadas treinadas para aprender sobre as tendências de cada ponto, como demanda futura de produtos com base em promoções de vendas, mecanismos baseados em regras para reagir a um data conjunto de circunstâncias, ou mesmo simples agentes que relatam exceções aos "altos executivos". Esses processos geralmente ocorrem em tempo real e, portanto, devem estar intimamente ligados ao movimento do mesmo. dar. Todas essas estruturas de dar, tecnologias e técnicas garantem que você não passará a noite gerando uma organização do seu BI.

Esta atividade será desenvolvida em etapas incrementais, por pequenos pontos.
Cada etapa é um esforço de projeto independente e é referido como uma iteração em sua iniciativa de dw ou BI. As iterações podem incluir a implementação de novas tecnologias, começando com novas técnicas, adicionando novas estruturas de dar , carregando eu dar adicionais ou expandindo a análise do seu ambiente. Este parágrafo é discutido com mais detalhes no Capítulo 3.

Além das estruturas tradicionais de DW e ferramentas de BI, existem outras funções da sua organização de BI para as quais você precisa projetar, como:

Pontos de contato do cliente (contato do cliente pontos).

Como em qualquer organização moderna, existem vários pontos de contato com o cliente que indicam como ter uma experiência positiva para a sua clientes. Existem canais tradicionais como lojistas, telefonistas, mala direta, multimídia e imprensa publicitária, além dos canais mais atuais como e-mail e web, dar produtos com algum ponto de contato devem ser adquiridos, transportados, limpos, transformados e então povoados em instalações de dar do BI.

Bases de dar operacionais e associações de usuários (operacional

bancos de dados e comunidades de usuários).
No final dos pontos de contato do clientes você encontrará o básico de dar aplicação da empresa e comunidades de usuários. A dar existentes são dar tradicional que deve ser reunido e fundido com o dar fluindo dos pontos de contato para fornecer as informações necessárias.

Analistas. (Analistas)

O principal beneficiário do ambiente de BI é o analista. É ele quem se beneficia da atual extração de dar operacional, integrado com diferentes fontes de dar , ampliado com recursos como análise geográfica (geocodificação) e apresentado em tecnologias de BI que permitem extrair, OLAP, relatórios avançados de SQL e análise geográfica. A interface principal do analista com o ambiente de relatórios é o portal de BI.

No entanto, o analista não é o único que se beneficia da arquitetura de BI.
Executivos, grandes associações de usuários e até mesmo parceiros, fornecedores e eu clientes eles devem encontrar benefícios no BI empresarial.

Loop de retroalimentação.

A arquitetura de BI é um ambiente de aprendizagem. Um princípio característico do desenvolvimento é permitir que estruturas persistentes de dar ser atualizado usando a tecnologia de BI utilizada e por meio de ações do usuário. Um exemplo é a avaliação do cliente (pontuação do cliente).

Se o departamento de vendas faz um modelo de mineração das pontuações do cliente quanto ao uso de um novo serviço, então o departamento de vendas não deve ser o único grupo a se beneficiar do serviço.

Em vez disso, o modelo de mineração deve ser realizado como parte natural do fluxo de dados dentro da empresa e as pontuações dos clientes devem se tornar parte integrante do contexto de informações do armazém, visível a todos os usuários. O conjunto de bicêntricos da IBM, incluindo DB2 UDB, DB2 OLAP Server inclui a maioria dos principais componentes de tecnologia, definidos na Figura 1.1.

Usamos a arquitetura como aparece nesta figura do livro para nos dar um nível de continuidade e demonstrar como cada produto IBM se encaixa na estrutura geral de BI.

Fornecendo o Conteúdo da Informação (Fornecendo Conteúdo de informação)

Projetar, desenvolver e implementar seu ambiente de BI é uma tarefa assustadora. O design deve abranger os requisitos de negócios atuais e futuros. O projeto arquitetônico deve ser completo para incluir todas as conclusões encontradas durante a fase de projeto. A execução deve permanecer comprometida com um único propósito: desenvolver a arquitetura de BI conforme formalmente apresentada no projeto e fundamentada nos requisitos de negócios.

É particularmente difícil argumentar que a disciplina garantirá o sucesso relativo.
Isso é simples porque você não desenvolve um ambiente de BI de repente, mas faz isso em pequenos passos ao longo do tempo.

No entanto, identificar os componentes de BI de sua arquitetura é importante por dois motivos: Você orientará todas as decisões técnicas de arquitetura subsequentes.
Você será capaz de projetar conscientemente um uso específico da tecnologia, mesmo que não consiga uma repetição que precise da tecnologia por vários meses.

Compreender suficientemente seus requisitos de negócios afetará o tipo de produtos que você adquire para sua arquitetura.
O desenho e desenvolvimento de sua arquitetura garantem que seu armazém seja

não um evento aleatório, mas sim um anúncio "bem pensado", cuidadosamente construído operar da arte como um mosaico de tecnologia mista.

Projete o conteúdo da informação

Todo o projeto inicial deve focar e identificar os principais componentes de BI que serão necessários para o ambiente geral agora e no futuro.
Conhecer os requisitos de negócios é importante.

Mesmo antes do início de todo o planejamento formal, o planejador do projeto pode identificar um ou dois componentes imediatamente.
O equilíbrio de componentes que podem ser necessários para sua arquitetura, no entanto, não pode ser encontrado facilmente. Durante a fase de design, a parte principal da arquitetura vincula a sessão de desenvolvimento de aplicativos (JAD) a uma pesquisa para identificar os requisitos de negócios.

Às vezes, esses requisitos podem ser confiados a ferramentas de consulta e relatório.
Por exemplo, os usuários afirmam que, se quiserem automatizar atualmente um relatório, devem gerar manualmente integrando dois relatórios atuais e adicionando os cálculos derivados da combinação dos dar.
Embora esse requisito seja simples, ele define algumas funcionalidades do recurso que você deve incluir ao adquirir ferramentas de relatórios para sua organização.

O designer também deve buscar os requisitos adicionais para obter uma imagem completa. Os usuários querem assinar este relatório?
Os subconjuntos do relatório são gerados e enviados por e-mail para os diversos usuários? Quer ver este relatório no portal da empresa? Todos esses requisitos fazem parte da simples necessidade de substituir um relatório manual conforme exigido pelos usuários. O benefício desses tipos de requisitos é que todos, usuários e designers, entendem o conceito de relatórios.

Existem outros tipos de negócios, no entanto, que precisamos planejar. Quando os requisitos de negócios são declarados na forma de questões estratégicas de negócios, é fácil para o designer experiente discernir medidas/fatos e requisitos dimensionais.

Se os usuários JAD não souberem como declarar seus requisitos na forma de um problema de negócios, o designer geralmente fornecerá exemplos para iniciar a sessão de coleta de requisitos.
O designer especialista pode ajudar os usuários a entender não apenas o comércio estratégico, mas também como treiná-lo.
A abordagem de coleta de requisitos é discutida no capítulo 3; por enquanto, queremos apenas apontar a necessidade de projetar para todos os tipos de requisitos de BI.

Um problema estratégico de negócios não é apenas um requisito de negócios, mas também uma pista de design. Se você tem que responder a uma pergunta multidimensional, então você tem que memorizar, apresentar o dar dimensões, e se você precisar armazenar i dar multidimensional, você tem que decidir que tipo de tecnologia ou técnica vai empregar.

Você implementa um esquema de estrela de cubo reservado ou ambos? Como você pode ver, mesmo um simples problema de negócios pode afetar significativamente o design. Mas esses tipos de requisitos de negócios são comuns e, claro, pelo menos por planejadores e designers de projetos experientes.

Houve debate suficiente sobre as tecnologias e suporte do OLAP, e uma ampla gama de soluções está disponível. Até agora, mencionamos a necessidade de combinar relatórios simples com requisitos de negócios dimensionais e como esses requisitos influenciam as decisões técnicas de arquitetura.

Mas quais são os requisitos que não são prontamente compreendidos pelos usuários ou pela equipe de DW? Você vai precisar de análise espacial?
Os modelos de mineração de dar eles serão uma parte necessária do seu futuro? Quem sabe?

É importante observar que esses tipos de tecnologias não são bem conhecidos pelas comunidades de usuários em geral e membros da equipe de DW, em parte isso pode ser porque eles normalmente são tratados por alguns especialistas técnicos internos ou de terceiros. É um caso extremo dos problemas que esses tipos de tecnologias geram. Se os usuários não puderem descrever os requisitos de negócios ou enquadrá-los de uma maneira que forneça diretrizes aos designers, eles podem passar despercebidos ou, pior, simplesmente ignorados.

Torna-se mais problemático quando o designer e o desenvolvedor não conseguem reconhecer a aplicação de uma dessas tecnologias avançadas, mas críticas.
Como muitas vezes ouvimos os Designers dizerem: “bem, por que não deixamos isso de lado até conseguirmos isso? “Eles estão realmente interessados ​​em prioridades ou apenas evitam requisitos que não entendem? É provavelmente a última hipótese. Digamos que sua equipe de vendas comunicou um requisito de negócios, conforme indicado na Figura 1.3, como você pode ver, o requisito está enquadrado na forma de um problema de negócios. A diferença entre este problema e o problema dimensional típico é a distância. Neste caso, o grupo de vendas quer saber mensalmente as vendas totais de produtos, armazéns e clientes que moram a menos de 5 km do armazém onde fazem compras.

Infelizmente, designers ou arquitetos podem simplesmente ignorar o componente espacial dizendo: "Nós temos o cliente, o produto e o dar do depósito. Vamos manter a distância até outra iteração.

"Resposta errada. Esse tipo de problema de negócios é inteiramente sobre BI. Representa uma compreensão mais profunda do nosso negócio e um espaço analítico robusto para nossos analistas. O BI está além da simples consulta ou relatório padrão, ou mesmo OLAP. Isso não quer dizer que essas tecnologias não sejam importantes para seu BI, mas sozinhas elas não representam o ambiente de BI.

Design para o contexto da informação (Projetando para Conteúdo de Informação)

Agora que identificamos os requisitos de negócios que distinguem vários componentes fundamentais, eles devem ser incluídos em um projeto de arquitetura geral. Alguns dos componentes do BI fazem parte de nossos esforços iniciais, enquanto alguns não serão implementados por vários meses.

No entanto, todos os requisitos conhecidos são refletidos no design para que quando precisarmos implementar uma determinada tecnologia, estejamos preparados para fazê-lo. Algo sobre o design refletirá o pensamento tradicional.

Este conjunto de dar é usado para apoiar usos posteriores de dar dimensões guiadas pelas questões de Negócios que identificamos. À medida que documentos adicionais são gerados, como o desenvolvimento do projeto do dar, vamos começar a formalizar como eu dar eles se espalham no ambiente. Verificamos a necessidade de representar o dar dimensionalmente, dividindo-os (de acordo com necessidades específicas específicas) em data marts.

A próxima pergunta a ser respondida é: como esses data marts serão construídos?
Você constrói as estrelas para apoiar os cubos, ou apenas cubos, ou apenas as estrelas? (ou cubos certos, ou estrelas certas). Gere arquitetura para data marts dependentes que exigem uma camada atômica para todos dar adquirido? Permitir a aquisição de data marts independentes dar diretamente dos sistemas operacionais?

Que tecnologia de cubo você tentará padronizar?

Você tem grandes quantidades de deuses dar necessário para análise dimensional ou você precisa de cubos de sua força de vendas nacional semanalmente ou ambos? Você constrói um objeto poderoso como o DB2 OLAP Server para finanças ou cubos Cognos PowerPlay para sua organização de vendas ou ambos? Essas são as grandes decisões de projeto de arquitetura que afetarão seu ambiente de BI daqui em diante. Sim, você identificou a necessidade de OLAP. Agora, como você vai fazer esse tipo de técnica e tecnologia?

Como algumas das tecnologias mais avançadas afetam seus projetos? Vamos supor que você tenha verificado uma necessidade espacial em sua organização. Agora você precisa recuperar as edições de desenhos arquitetônicos, mesmo que não planeje fazer componentes espaciais por vários meses. O arquiteto deve projetar hoje com base no que é necessário. Prever a necessidade de análise espacial que gere, armazene, faça e forneça acesso a dar espacial. Isso, por sua vez, deve servir como uma restrição em relação ao tipo de tecnologia de software e às especificações de plataforma que você pode considerar atualmente. Por exemplo, o sistema de administração de base de dados Relacional Relacional (RDBMS) que você faz para sua camada atômica deve ter uma extensão espacial robusta disponível. Isso garantiria o máximo desempenho ao usar objetos geométricos e espaciais em seus aplicativos analíticos. Se o seu RDBMS não puder lidar com o dar (centrado no espaço) internamente, então você terá que estabelecer um base de dados (centrado no espaço) externo. Isso complica o gerenciamento de edições e compromete seu desempenho geral, sem falar nos problemas adicionais gerados para seus DBAs, pois eles provavelmente têm um conhecimento mínimo dos fundamentos de dar espaço também. Por outro lado, se seu mecanismo RDMBS lida com todos os componentes espaciais e seu otimizador está ciente das necessidades especiais (por exemplo, indexação) dos objetos espaciais, seus DBAs podem lidar com o gerenciamento dos problemas prontamente e você pode maximizar o desempenho .

Além disso, você precisa ajustar a área de teste (área de cena) e a camada de ambiente atômico para incluir a limpeza de endereço (uma

elemento chave para a análise espacial), bem como o salvamento posterior de objetos espaciais. A sucessão de edições de design continua agora que introduzimos a noção de limpeza de endereço. Por um lado, este aplicativo ditará o tipo de software necessário para seu esforço de ETL.

Você precisa de produtos como o Trillium para fornecer um endereço limpo ou um provedor de ETL de sua escolha para fornecer essa funcionalidade?
Por enquanto é importante que você aprecie o nível do projeto que deve ser concluído antes de começar a construir seu ambiente (armazém). Os exemplos acima devem demonstrar a multiplicidade de decisões de design que devem seguir a identificação de qualquer requisito de negócios específico. Quando feitas corretamente, essas decisões de projeto promovem a interdependência entre as estruturas físicas do seu ambiente, a seleção da tecnologia utilizada e o fluxo de propagação do conteúdo da informação. Sem essa arquitetura de BI convencional, sua organização estará sujeita a uma mistura caótica de tecnologias existentes, na melhor das hipóteses, combinadas de maneira flexível para fornecer estabilidade aparente.

Manter conteúdo de informação

Trazer o valor da informação para sua organização é uma tarefa muito difícil. Sem compreensão e experiência suficientes, ou planejamento e desenho adequados, até mesmo as melhores equipes falhariam. Por outro lado, se você tem grande intuição e planejamento detalhado, mas não tem disciplina para executar, acaba de desperdiçar seu dinheiro e tempo porque seu empreendimento está fadado ao fracasso. A mensagem deve ser clara: se você não tiver uma ou mais dessas habilidades, compreensão/experiência ou design/design ou disciplina de implementação, isso prejudicará ou destruirá a construção da organização de BI.

Sua equipe está preparada o suficiente? Existe alguém em sua equipe de BI que entenda o vasto cenário analítico disponível em ambientes de BI, as técnicas e tecnologias necessárias para implementar esse cenário? Existe alguém em sua equipe que possa reconhecer a diferença de aplicação entre

relatórios estáticos e OLAP, ou as diferenças entre ROLAP e OLAP? Um dos membros de sua equipe reconhece claramente como a mineração e como isso pode afetar o armazém ou como o armazém pode apoiar o desempenho da mineração? Um membro da equipe entende o valor de dar tecnologia espacial ou baseada em agentes? Você tem alguém que aprecia a aplicação exclusiva das ferramentas ETL versus a tecnologia de corretor de mensagens? Se você não tem, pegue um. O BI é muito maior do que uma camada atômica normalizada, OLAP, padrões de estrelas e um ODS.

Ter a compreensão e a experiência para reconhecer os requisitos de BI e suas soluções é essencial para sua capacidade de formalizar adequadamente as necessidades do usuário e projetar e implementar suas soluções. Se sua comunidade de usuários tiver dificuldade em descrever os requisitos, cabe à equipe do warehouse fornecer esse entendimento. Mas se a equipe do armazém

não reconhece a aplicação específica de BI - por exemplo, mineração de dados - então não é a melhor coisa que os ambientes de BI são frequentemente limitados a serem repositórios passivos. No entanto, ignorar essas tecnologias não diminui sua importância e o efeito que elas têm no surgimento dos recursos de inteligência de negócios da sua organização, bem como nos ativos de informação que você planeja promover.

O design deve incluir a noção de design, e ambos requerem um indivíduo competente. Além disso, o design requer uma filosofia de trabalho em equipe e observância de padrões. Por exemplo, se sua empresa estabeleceu uma plataforma padrão ou identificou um RDBMS específico que deseja padronizar em toda a plataforma, cabe a todos na equipe aderir a esses padrões. Geralmente uma equipe expõe a necessidade de normalização (às comunidades de usuários), mas a própria equipe não está disposta a aderir aos padrões estabelecidos em outras áreas da empresa ou talvez até mesmo em empresas semelhantes. Isso não é apenas hipocrisia, mas também verifica que a empresa é incapaz de explorar os recursos e investimentos existentes. Não significa que não existam situações que garantam uma plataforma ou tecnologia não padronizada; no entanto, os esforços do armazém

eles devem proteger zelosamente os padrões da empresa até que os requisitos de negócios determinem o contrário.

O terceiro componente chave necessário para construir uma organização de BI é a disciplina.
Depende no total, igualmente dos indivíduos e do meio ambiente. Planejadores de projetos, patrocinadores, arquitetos e usuários devem apreciar a disciplina necessária para construir a estrutura de informações da empresa. Os designers devem direcionar seus esforços de projeto de forma a complementar outros esforços necessários na sociedade.

Por exemplo, suponha que sua empresa construa um aplicativo ERP que tenha um componente de depósito.
Portanto, é responsabilidade dos projetistas de ERP colaborar com a equipe do ambiente de armazém para não competir ou duplicar o trabalho já iniciado.

A disciplina também é um assunto que deve ser ocupado por toda a organização e geralmente é estabelecido e confiado a um nível executivo.
Os executivos estão dispostos a aderir a uma abordagem projetada? Uma abordagem que promete criar conteúdo de informação que acabará por agregar valor a todas as áreas do negócio, mas talvez comprometa indivíduos ou agendas departamentais? Lembre-se do ditado “pensar em tudo é mais importante do que pensar em uma coisa”. Esse ditado é verdadeiro para organizações de BI.

Infelizmente, muitos armazéns concentram seus esforços tentando direcionar e agregar valor a um determinado departamento ou usuários específicos, com pouca consideração pela organização em geral. Suponha que o executivo solicite assistência da equipe da loja. A equipe responde com um trabalho de 90 dias que inclui não apenas a entrega de requisitos de notificação definidos pelos executivos, mas também a garantia de que todos dar base são misturados no nível atômico antes de serem introduzidos na tecnologia de cubo proposta.
Esta adição de engenharia garante que a empresa do armazém se beneficie da dar necessário para o gerente.
No entanto, o executivo conversou com consultorias externas que propuseram uma aplicação semelhante com entrega em menos de 4 semanas.

Supondo que a equipe interna do armazém seja competente, o executivo tem uma escolha. Aqueles que podem oferecer suporte à disciplina de engenharia adicional necessária para nutrir o ativo de informações corporativas ou podem optar por implementar sua própria solução rapidamente. Este último parece ser escolhido com muita frequência e é usado apenas para criar contêineres de informações que apenas alguns ou um único se beneficiam.

Metas de curto e longo prazo

Arquitetos e designers de projeto devem formalizar uma visão de longo prazo da arquitetura geral e planos para crescer em uma organização de BI. Essa combinação de ganhos de curto prazo e planejamento de longo prazo representam as duas faces dos empreendimentos de BI. O ganho de curto prazo é a faceta de BI associada às iterações do seu warehouse.

É aqui que designers, arquitetos e patrocinadores se concentram em atender a requisitos comerciais específicos. É neste nível que as estruturas físicas são construídas, a tecnologia é adquirida e as técnicas são implementadas. Eles não são feitos para atender a requisitos específicos definidos por comunidades de usuários específicas. Tudo é feito para atender a requisitos específicos definidos por uma determinada comunidade.
O planejamento de longo prazo, no entanto, é a outra faceta do BI. É onde os planos e projetos garantiram que qualquer estrutura física fosse construída, as tecnologias selecionadas e as técnicas implementadas feitas com o olhar voltado para o empreendimento. É o planejamento de longo prazo que fornece a coesão necessária para garantir que os benefícios do negócio derivam de quaisquer ganhos de curto prazo encontrados.

Justifique seu esforço de BI

Un data warehouse por si só não tem valor inerente. Em outras palavras, não há valor inerente entre as tecnologias de armazenamento e as técnicas de implementação.

O valor de qualquer esforço do warehouse é encontrado nas ações executadas como resultado do ambiente do warehouse e do conteúdo da informação que cresceu ao longo do tempo. Este é um ponto crítico a ser entendido antes de tentar estimar o valor de qualquer iniciativa local.

Com muita frequência, arquitetos e designers tentam aplicar valor aos componentes físicos e técnicos do armazém quando o valor é baseado em processos de negócios que são impactados positivamente pelo armazém e pelas informações bem adquiridas.

Aqui está o desafio de fundar o BI: Como justificar o investimento? Se o local em si não tiver valor intrínseco, os projetistas devem investigar, definir e formalizar os benefícios alcançados por aqueles indivíduos que usarão o armazém para melhorar processos de negócios específicos ou o valor das informações protegidas ou ambos.

Para complicar as coisas, qualquer processo comercial afetado pela tensão do armazém pode fornecer benefícios "consideráveis" ou "leves". Benefícios consideráveis ​​fornecem uma métrica tangível para medir o retorno sobre o investimento (ROI) - por exemplo, girar o estoque mais um tempo durante um período específico ou para um custo menor de transporte por remessa. Pequenos benefícios, como melhor acesso à informação, são mais difíceis de definir em termos de valor tangível.

Vincule seu projeto para saber mais sobre o Pedidos de negócios

Com muita frequência, os projetistas de projetos tentam vincular o valor do depósito aos objetivos amorfos da empresa. Ao declarar que "o valor de um armazém é baseado na nossa capacidade de satisfazer os pedidos estratégicos" abrimos a discussão de forma agradável. Mas isso por si só não é suficiente para determinar se investir em estoque faz sentido. É melhor vincular as repetições do warehouse com solicitações de negócios específicas e conhecidas.

Meça o ROI

Calcular o ROI em uma configuração de armazém pode ser particularmente difícil. É especialmente difícil se a vantagem

principal de uma repetição particular é algo intangível ou fácil de medir. Um estudo descobriu que os usuários percebem os dois principais benefícios das iniciativas de BI:

  • ▪ Criar a capacidade de tomar decisões
  • ▪ Criar acesso à informação
    Essas vantagens são vantagens suaves (ou leves). É fácil ver como podemos calcular um ROI com base em uma vantagem mais difícil (ou maior) como reduzir o custo de transporte, mas como medimos a capacidade de tomar melhores decisões?
    Este é certamente um desafio para os projetistas quando eles estão tentando fazer com que a empresa invista em um esforço de depósito específico. O aumento das vendas ou a queda dos custos não são mais os temas centrais que impulsionam o ambiente de BI.
    Em vez disso, você está procurando um melhor acesso às informações em consultas de negócios para que um determinado departamento possa tomar decisões mais rápidas. Esses são direcionadores estratégicos que são igualmente importantes para o negócio, mas são mais ambíguos e mais difíceis de caracterizar em uma métrica tangível. Nesse caso, o cálculo do ROI pode ser enganador, se não irrelevante.
    Os designers de projeto devem ser capazes de demonstrar valor tangível para os executivos decidirem se o investimento em uma repetição específica vale a pena. No entanto, não vamos propor um novo método de cálculo do ROI, nem apresentar argumentos a favor ou contra ele.
    Existem muitos artigos e livros disponíveis que discutem os fundamentos do cálculo do ROI. Existem propostas de valor especiais, como valor no investimento (YOU), oferecidas por grupos como o Gartner, que você pode pesquisar. Em vez disso, vamos nos concentrar nos principais aspectos de qualquer ROI ou outras propostas de valor que você precise considerar. Aplicando ROI Além do argumento sobre os benefícios “difíceis” versus os benefícios “leves” associados aos esforços de BI, há outras questões a serem consideradas ao aplicar o ROI. Por exemplo:

Atribua muitas economias aos esforços do DW que viriam de qualquer maneira
Digamos que sua empresa mudou de uma arquitetura de mainframe para um ambiente UNIX distribuído. Portanto, qualquer economia que possa (ou não) ser feita por esse esforço não deve ser atribuída exclusivamente, se for o caso (?), ao armazém.

Não contabilizando todos os custos. E há muitas coisas a ter em conta. Considere a seguinte lista:

  • ▪ Custo de start-up, incluindo viabilidade.
  • ▪ Custo de hardware dedicado com armazenamento e comunicações relacionados
  • ▪ Custo de software, incluindo gerenciamento de dar e extensões cliente/servidor, software ETL, tecnologias DSS, ferramentas de visualização, aplicativos de programação e fluxo de trabalho e software de monitoramento.
  • ▪ Custo do projeto da estrutura dar, com a realização e otimização de
  • ▪ Custo de desenvolvimento de software diretamente associado ao esforço de BI
  • ▪ Custo do suporte doméstico, incluindo otimização de desempenho, incluindo controle de versão de software e operações de ajuda Aplicar ROI “Big-Bang”. Construir o warehouse como um único esforço gigantesco está fadado ao fracasso, assim como calcula o ROI para uma grande iniciativa empresarial. A oferta é surpreendente, e os projetistas continuam fazendo tentativas fracas de estimar o valor de todo o esforço. Por que os planejadores tentam atribuir um valor monetário à iniciativa empresarial se é amplamente conhecido e aceito que é difícil estimar repetições específicas? Como isso é possível? Não é possível com algumas exceções. Não faça isso. Agora que estabelecemos o que não fazer ao calcular o ROI, aqui estão alguns pontos que nos ajudarão a definir um processo confiável para estimar o valor de seus esforços de BI.

Obtenção de consentimento de ROI. Independentemente de sua escolha de técnica para estimar o valor de seus esforços de BI, ela deve ser acordada por todas as partes, incluindo planejadores de projetos, patrocinadores e executivos de negócios.

Reduza o ROI para peças identificáveis. Um passo necessário para um cálculo de ROI razoável é focar esse cálculo em um projeto específico. Isso permite que você estime um valor com base em requisitos de negócios específicos que estão sendo atendidos

Defina os custos. Como mencionado, vários custos devem ser considerados. Além disso, os custos devem incluir não apenas aqueles associados à iteração única, mas também os custos associados à garantia da conformidade com os padrões da empresa.

Defina benefícios. Ao vincular claramente o ROI aos requisitos de negócios específicos, devemos ser capazes de identificar os benefícios que levarão ao atendimento dos requisitos.

Reduza custos e benefícios em ganhos futuros. É a melhor maneira de basear suas avaliações no valor presente líquido (VPL), em vez de tentar prever o valor futuro em ganhos futuros.

Mantenha seu tempo fracionado de ROI no mínimo. Está bem documentado, a longo prazo, tem sido usado em seu ROI.

Use mais de uma fórmula de ROI. Existem vários métodos para prever o ROI e você deve planejar se deve usar um ou mais, incluindo valor presente líquido, taxa interna de retorno (IRR) e retorno.

Defina o processo repetível. Isso é crucial para calcular qualquer valor de longo prazo. Um único processo repetível deve ser documentado para todas as sequências subsequentes do projeto.

Os problemas listados são os mais comuns definidos por especialistas em oficinas. A insistência da administração em entregar um ROI “Big-Bang” é muito confusa. Se você iniciar todos os seus cálculos de ROI dividindo-os em partes identificáveis ​​e tangíveis, você terá uma boa chance de estimar uma avaliação de ROI precisa.

Perguntas sobre os benefícios do ROI

Quaisquer que sejam seus benefícios, leves ou duros, você pode usar algumas perguntas fundamentais para determinar seu valor. Por exemplo, usando um sistema de escala simples, de 1 a 10, você pode medir o impacto de qualquer esforço usando as seguintes perguntas:

  • Como você avalia a compreensão de dar como resultado deste projeto da sua empresa?
  • Como você estimaria as melhorias de processo após este projeto?
  • Como você mediria o impacto de novos insights e inferências agora disponibilizados por esta iteração
  • Qual foi o impacto de novos ambientes de computador de alto desempenho como resultado do que foi aprendido? Se as respostas para essas perguntas forem poucas, é possível que a empresa não valha o investimento. Questões com pontuação alta apontam para ganhos significativos de valor e devem servir como guias para investigações posteriores. Por exemplo, uma alta pontuação de melhoria de processo deve levar os designers a examinar como os processos foram melhorados. Você pode descobrir que alguns ou todos os ganhos obtidos são tangíveis e, portanto, um valor monetário pode ser prontamente aplicado. Tirando o máximo proveito da primeira iteração do armazém O maior resultado do esforço da sua empresa geralmente está nas primeiras iterações. Esses esforços iniciais tradicionalmente estabelecem o conteúdo de informação mais útil para o público e auxiliam na base da tecnologia para aplicativos de BI subsequentes. Normalmente, cada subsequência subsequente de dar Os projetos de armazém trazem cada vez menos valor adicional ao negócio como um todo. Isso é especialmente verdadeiro se a iteração não adicionar novos tópicos ou não atender às necessidades de uma nova comunidade de usuários.

Esse recurso de armazenamento também se aplica a pilhas crescentes de dar historiadores. Como os esforços subsequentes exigem mais dar e como mais dar são despejados no armazém ao longo do tempo, a maior parte dar torna-se menos relevante para a análise utilizada. Esses dar são frequentemente chamados dar dormentes e é sempre caro mantê-los porque quase nunca são usados.

O que isso significa para os patrocinadores do projeto? Essencialmente, os primeiros patrocinadores compartilham mais do que os custos de investimento. Isso é primordial porque eles são o impulso para fundar o amplo ambiente tecnológico e a camada de recursos do armazém, incluindo orgânicos.

Mas esses primeiros passos têm o maior valor e, portanto, os projetistas geralmente precisam justificar o investimento.
Projetos feitos após sua iniciativa de BI podem ter custos menores (comparados ao primeiro) e diretos, mas trazem menos valor ao negócio.

E os proprietários da organização devem começar a considerar jogar o acúmulo dar e tecnologias menos relevantes.

Data Mining: Mining Dar

Inúmeros componentes de arquitetura exigem variações nas tecnologias e técnicas de mineração de dados—
por exemplo, os diferentes "agentes" para o exame dos pontos de interesse do clientes, os sistemas operacionais da empresa e para o mesmo dw. Esses agentes podem ser redes neurais avançadas treinadas em tendências POT, como demanda futura de produtos com base em promoções de vendas; mecanismos baseados em regras para reagir a um conjunto data circunstâncias, por exemplo, diagnóstico médico e recomendações de tratamento; ou mesmo simples agentes com a função de reportar exceções aos altos executivos. Geralmente esses processos de extração dar si

verificar em tempo real; portanto, eles devem estar totalmente unidos com o movimento de dar -se.

Processamento de processamento analítico online

Analítica Online

A capacidade de fatiar, cortar, rolar, detalhar e analisar
what-if, está dentro do escopo, do objetivo do conjunto de tecnologia IBM. Por exemplo, existem funções de processamento analítico online (OLAP) para DB2 que trazem a análise dimensional para o mecanismo do banco de dados stesso.

As funções adicionam utilidade dimensional ao SQL enquanto aproveitam ao máximo o fato de serem uma parte natural do DB2. Outro exemplo de integração OLAP é a ferramenta de extração, DB2 OLAP Server Analyzer. Essa tecnologia permite que os cubos do DB2 OLAP Server sejam analisados ​​rápida e automaticamente para localizar e relatar valores de dados dar incomum ou inesperado em todo o cubo para o analista de negociação. E, finalmente, os recursos do DW Center fornecem um meio para os arquitetos controlarem, entre outras coisas, o perfil de um cubo do servidor DB2 OLAP como uma parte natural dos processos ETL.

Análise Espacial Análise Espacial

O espaço representa metade das âncoras analíticas (condução) necessárias para um panorama
ampla analítica (o tempo representa a outra metade). O nível atômico do armazém, representado na Figura 1.1, inclui os fundamentos de tempo e espaço. O tempo registra a análise de âncora por tempo e a análise de âncora de informações de endereço por espaço. Os carimbos de data/hora conduzem a análise por tempo e as informações de endereço conduzem a análise por espaço. O diagrama mostra a geocodificação - processo de conversão de endereços em pontos em um mapa ou pontos no espaço para que conceitos como distância e interior/exterior possam ser utilizados na análise - realizada em nível atômico e a análise espacial que é disponibilizada ao analista. A IBM fornece extensões espaciais, desenvolvidas com o Environmental System Research Institute (ESRI), al banco de dados DB2 para que os objetos espaciais possam ser armazenados como uma parte normal do banco de dados relacional. DB2

Spatial Extenders, eles também fornecem todas as extensões SQL para aproveitar a análise espacial. Por exemplo, as extensões SQL para consultar no
distância entre endereços ou se um ponto está dentro ou fora de uma área poligonal definida, são um padrão analítico com o Spatial Extender. Consulte o capítulo 16 para obter mais informações.

banco de dados-Ferramentas de ferramentas residentes banco de dados-Residente

O DB2 possui muitos recursos residentes em SQL BI que auxiliam na ação de análise. Esses incluem:

  • Funções de recursão para realizar análises, como “encontrar todas as rotas de voo possíveis de San Francisco a New York".
  • As funções analíticas para classificação, funções cumulativas, cubo e rollup para facilitar as tarefas que normalmente ocorrem apenas com a tecnologia OLAP, são agora uma parte natural do motor do banco de dados
  • A capacidade de criar tabelas que contêm resultados
    Vendedores de banco de dados líderes misturam mais recursos de BI no banco de dados mesmo.
    Os principais fornecedores de base de dados estão combinando mais recursos de BI no banco de dados mesmo.
    Isso fornece o melhor desempenho e a maioria das opções de execução para soluções de BI.
    Os recursos e funções do DB2 V8 são discutidos em detalhes nos capítulos a seguir:
    Arquitetura Técnica e Fundamentos de Gerenciamento de Dados (Capítulo 5)
  • Fundamentos do DB2 BI (Capítulo 6)
  • Tabelas de Consulta Materializadas do DB2 (Capítulo 7)
  • Funções OLAP do DB2 (Capítulo 13)
  • Recursos e funções de BI aprimorado do DB2 (Capítulo 15) Sistema simplificado de entrega de dados Sistema de entrega de dar simplificada

A arquitetura representada na Figura 1.1 inclui várias estruturas dar fisica. Um é o armazém de dar operativo. Geralmente, um ODS é um assunto orientado, integrado e atual. Você construiria um ODS para dar suporte, por exemplo, ao escritório de vendas. As vendas de ODS integrariam dar vindo de vários sistemas diferentes, mas manteria apenas, por exemplo, as transações de hoje. O ODS também pode ser atualizado várias vezes ao dia. Ao mesmo tempo, os processos empurram o dar integrado em outras aplicações. Essa estrutura foi projetada especificamente para integrar dar atual e dinâmico e seria um candidato provável para passar por análises em tempo real, como fornecer agentes de serviço clientes informações de vendas atuais de um cliente, extraindo informações de tendências de vendas do próprio estoque. Outra estrutura mostrada na Figura 1.1 é um estado formal para o dw. Não só é aqui que se faz a necessária integração, da qualidade de dar, e a transformação de dar do armazém de entrada, mas também é uma área de armazenamento confiável e temporária para dar réplicas que podem ser usadas em análises em tempo real. Se você decidir usar um ODS ou área de preparo, uma das melhores ferramentas para preencher essas estruturas dar usando diferentes fontes operacionais é a consulta distribuída heterogênea do DB2. Esse recurso é fornecido pelo recurso opcional do DB2 chamado DB2 Relational Connect (somente consulta) e por meio do DB2 DataJoiner (um produto separado que fornece recursos de aplicativo, inserção, atualização e exclusão para RDBMSs distribuídos heterogêneos).

Esta tecnologia permite que os arquitetos dar di legare dar de produção com processos analíticos. A tecnologia não apenas pode se adaptar a praticamente qualquer demanda de replicação que possa surgir com análises em tempo real, mas também pode se conectar a uma ampla variedade de bases de dar mais populares, incluindo DB2, Oracle, Sybase, SQL Server, Informix e outros. O DB2 DataJoiner pode ser usado para preencher uma estrutura dar formal como um ODS ou mesmo uma mesa permanente representada no armazém projetada para recuperação rápida de atualizações instantâneas ou para venda. Claro que essas mesmas estruturas dar pode ser preenchido usando

outra grande tecnologia projetada para replicação de dar, IBM DataPropagator Relacional. (DataPropagator é um produto separado para sistemas centrais. DB2 UNIX, Linux, Windows e OS / 2 incluem serviços de replicação dar como um recurso padrão).
Outro método para mover o dar operando em toda a empresa é um integrador de aplicativos corporativos também conhecido como mediador de mensagens. Essa tecnologia exclusiva permite um controle inigualável para direcionar e mover dar ao redor da empresa. A IBM possui o intermediário de mensagens mais utilizado, o MQSeries, ou uma variação do produto que inclui os requisitos de e-commerce,, IBM WebSphere MQ.
Para obter mais discussões sobre como aproveitar o MQ para dar suporte a um ambiente de warehouse e BI, visite website do livro. Por enquanto, basta dizer que esta tecnologia é um excelente meio de capturar e transformar (usando o MQSeries Integrator) dar operadores direcionados recrutados para soluções de BI. A tecnologia MQ foi integrada e empacotada no UDB V8, o que significa que as filas de mensagens agora podem ser gerenciadas como se fossem tabelas do DB2. O conceito de mensagens em fila de soldagem e o universo de banco de dados relacional leva a um ambiente de entrega poderoso dar.

Latência zero Latência zero

O objetivo estratégico final da IBM é a análise de latência zero. Conforme definido por
Gartner, um sistema de BI deve ser capaz de inferir, assimilar e fornecer informações para analistas sob demanda. O desafio, é claro, está em como misturar dar atual e em tempo real com as informações históricas necessárias, como dar padrão/tendência relacionado ou entendimento extraído, como perfil do cliente.

Essas informações incluem, por exemplo, a identificação de clientes alto ou baixo risco ou quais produtos eu clientes eles provavelmente comprarão se já tiverem queijo em seus carrinhos de compras.

A obtenção de latência zero depende efetivamente de dois mecanismos fundamentais:

  • União completa de dar que são analisados ​​com as técnicas estabelecidas e com as ferramentas criadas pelo BI
  • Um sistema de entrega de dar eficiente para garantir que as análises em tempo real estejam realmente disponíveis Esses pré-requisitos de latência zero não são diferentes das duas metas definidas pela IBM e descritas acima. O acoplamento estreito do dar ele faz parte do programa de integração contínua da IBM. E criar um sistema de entrega de dar eficiente é totalmente dependente da tecnologia disponível que simplifica o processo de entrega dar. Conseqüentemente, dois dos três objetivos da IBM são críticos para alcançar o terceiro. A IBM está desenvolvendo conscientemente sua tecnologia para garantir que a latência zero seja uma realidade para os esforços de armazenamento. Resumo / Síntese A organização de BI fornece um roteiro para realizar seu ambiente
    iterativamente. Ele deve ser ajustado para refletir as necessidades do seu negócio, tanto agora quanto no futuro. Sem uma visão arquitetônica ampla, as repetições do warehouse são pouco mais do que implementações aleatórias do warehouse central que fazem pouco para criar uma empresa grande e informativa. O primeiro obstáculo para os gerentes de projeto é como justificar os investimentos necessários para desenvolver a organização de BI. Embora o cálculo do ROI tenha permanecido como principal suporte para as realizações de estoque, está se tornando mais difícil prever exatamente. Isso levou a outros métodos para determinar se você está recebendo o valor do seu dinheiro. O valor do investimento2 (YOU), por exemplo, é proclamado como uma solução. Está pairando sobre os arquitetos de dar e em planejadores de projeto deliberadamente geram e fornecem informações para associações de usuários e não simplesmente prestam um serviço em dar. Há uma enorme diferença entre os dois. A informação é algo que faz a diferença na tomada de decisão e na eficácia; relativamente, eu dar eles são blocos de construção para derivar essas informações.

Apesar de criticar a fonte dar para direcionar consultas de negócios, o ambiente de BI deve desempenhar um papel maior na criação de conteúdo de informações. Precisamos tomar medidas extras para limpar, integrar, transformar ou de outra forma criar conteúdo de informação que os usuários possam agir e, então, precisamos garantir que essas ações e decisões, quando razoáveis, sejam refletidas no ambiente de BI. Se relegamos o armazém para servir apenas em dar, é garantido que as associações de usuários criarão o conteúdo das informações necessárias para agir. Isso garante que sua comunidade possa tomar melhores decisões, mas a empresa sofre com a falta de conhecimento que eles usaram. Dato que arquitetos e planejadores de projeto iniciem projetos específicos no ambiente de BI, eles permanecem responsáveis ​​perante a empresa como um todo. Um exemplo simples desse recurso bilateral de iterações de BI é encontrado na fonte dar. Todos dar recebidos para solicitações comerciais específicas devem ser preenchidos na primeira camada atômica. Isso garante o desenvolvimento do ativo de informações corporativas, bem como o gerenciamento, atendendo às solicitações específicas do usuário definidas na iteração.

O que éDataWarehouse?

Armazém de dados tem sido o coração da arquitetura de sistemas de informação desde 1990 e suporta os processos de informação oferecendo uma plataforma integrada sólida dar historiadores tomados como base para análises posteriores. A data warehouse eles oferecem facilidade de integração em um mundo de sistemas de aplicativos incompatíveis. Armazém de dados evoluiu para se tornar uma moda. Armazém de dados organiza e armazena eu dar necessários para a informação e os processos analíticos com base em uma longa perspectiva de tempo histórico. Tudo isso envolve um empenho considerável e constante na construção e manutenção do data warehouse.

Então, o que é um data warehouse? um data warehouse é:

  • ▪ orientado a assuntos
  • ▪ sistema integrado
  • ▪ tempo de variante
  • ▪ não volátil (não cancela)

uma coleção de dar usado para apoiar as decisões gerenciais na implementação de processos.
I dar inserido em data warehouse na maioria dos casos, eles derivam de ambientes operacionais. o data warehouse é realizado por uma unidade de armazenamento, fisicamente separada do resto do sistema, que contém dar anteriormente transformados por aplicativos que operam com informações provenientes do ambiente operacional.

A definição literal de um data warehouse merece uma explicação detalhada, pois existem importantes razões e significados subjacentes que descrevem as características de um armazém.

ORIENTAÇÃO DO ASSUNTO ORIENTAÇÃO TEMÁTICO

A primeira característica de um data warehouse é que é voltado para os principais players de uma empresa. O julgamento dos julgamentos através de i dar está em contraste com o método mais clássico que prevê a orientação das aplicações para processos e funções, um método em grande parte compartilhado pela maioria dos sistemas de gestão mais antigos.

O mundo operacional é projetado em torno de aplicativos e funções como empréstimos, poupança, cartões bancários e confiança para uma instituição financeira. O mundo do dw está organizado em torno de temas principais como o cliente, o vendedor, o produto e o negócio. O alinhamento em torno de tópicos afeta o design e a implementação de dar encontrado no dw. Mais importante, o argumento principal afeta a parte mais importante da estrutura de chave.

O mundo do aplicativo é influenciado tanto pelo design do banco de dados quanto pelo design do processo. O mundo do dw está focado exclusivamente na modelagem dar e no desenho de banco de dados. O desenho do processo (em sua forma clássica) não faz parte do ambiente dw.

As diferenças entre a escolha da aplicação do processo/função e a escolha por assunto também se revelam como diferenças no conteúdo das dar em um nível detalhado. A dar del dw não inclui eu dar que não será usado para o processo DSS enquanto os aplicativos

operacional orientado para dar contém eu dar para atender imediatamente aos requisitos funcionais / de processamento que podem ou não ter qualquer utilidade para o analista de DSS.
Outra forma importante de dar difere da dar de dw está nos relatórios de dar. o dar Os operadores mantêm um relacionamento contínuo entre duas ou mais tabelas com base em uma regra de negócios ativa. A dar de dw abrangem um espectro de tempo e as razões encontradas em dw são muitas. Muitas regras de negociação (e, consequentemente, muitas dar ) são representados no armazém de dar entre duas ou mais tabelas.

(Para uma explicação detalhada de como as relações entre os dar são gerenciados no DW, nos referimos ao Tópico Técnico sobre esse assunto.)
De nenhuma outra perspectiva além da diferença fundamental entre uma escolha de aplicativo funcional/processo e uma escolha de assunto, existe uma diferença maior entre sistemas operacionais e dar e o DW.

INTEGRAÇÃO INTEGRAÇÃO

O aspecto mais importante do ambiente de dw é que eu dar encontrados no dw são facilmente integrados. SEMPRE. SEM EXCEÇÕES. A própria essência do ambiente dw é que eu dar contidos dentro dos limites do armazém são integrados.

A integração se revela de muitas maneiras diferentes - nas convenções identificadas consistentes, na extensão de variáveis ​​consistentes, nas estruturas codificadas consistentes, nos atributos físicos de dar consistente e assim por diante.

Ao longo dos anos, designers de diferentes aplicativos tomaram muitas decisões sobre como um aplicativo deve ser desenvolvido. O estilo e as decisões de design individualizadas dos aplicativos dos designers se revelam de centenas de maneiras: nas diferenças de codificação, estrutura de chave, características físicas, convenções de identificação e assim por diante. A capacidade coletiva de muitos designers de aplicativos de criar aplicativos inconsistentes é lendária. A Figura 3 expõe algumas das diferenças mais importantes nas formas como os aplicativos são projetados.

Codificação: Codificar:

Os designers de aplicativos escolheram a codificação de campo - gênero - de várias maneiras. Um designer representa o sexo como um "m" e "f". Outro designer representa o sexo como um "1" e um "0". Outro designer representa o sexo como um "x" e "y". Outro designer representa o sexo como "masculino" e "feminino". Realmente não importa como o sexo vem no DW. O "M" e o "F" são provavelmente tão bons quanto toda a representação.

O que importa é que qualquer que seja a origem do campo sexual, esse campo chega ao DW em um estado integrado consistente. Conseqüentemente, quando o campo é carregado no DW a partir de uma aplicação onde foi representado no formato "M" e "F", o dar deve ser convertido para o formato DW.

Medição de Atributos: Medição de Atributos:

Os designers de aplicativos optaram por medir o pipeline de várias maneiras ao longo dos anos. Um designer armazena i dar da tubulação em centímetros. Outro designer de aplicativos armazena i dar da tubulação em termos de polegadas. Outro designer de aplicativos armazena i dar do gasoduto em milhões de pés cúbicos por segundo. E outro designer armazena informações de pipeline em termos de jardas. Qualquer que seja a fonte, quando as informações do pipeline chegam ao DW, elas devem ser medidas da mesma forma.

De acordo com as indicações da Figura 3, os problemas de integração afetam quase todos os aspectos do projeto - as características físicas do dar, o dilema de ter mais de uma fonte de dar, a questão de amostras identificadas inconsistentes, formatos de dar inconsistente e assim por diante.

Qualquer que seja o argumento de design, o resultado é o mesmo - i dar eles devem ser armazenados no DW de maneira singular e globalmente aceitável, mesmo quando os sistemas operacionais subjacentes armazenam i de maneira diferente dar.

Quando o analista DSS olha para o DW, o objetivo do analista deve ser a exploração de dar quem está no armazém,

em vez de se perguntar sobre a credibilidade ou consistência do dar.

VARIÂNCIA DE TEMPO

tudo dar no DW eles são precisos em algum momento. Essa característica básica do dar em DW é muito diferente de dar encontrados no ambiente operacional. A dar do ambiente operacional são tão precisos quanto no momento do acesso. Em outras palavras, no ambiente operacional quando uma unidade é acessada dar, espera-se que reflita valores tão precisos quanto no momento do login. Por que eu dar no DW são precisos como em algum momento (ou seja, não “agora”), i dar encontrados no DW são "variações de tempo".
A variação de tempo de dar O DW é referido de várias maneiras.
A maneira mais simples é que eu dar de um DW representa dar longo prazo - cinco a dez anos. O horizonte de tempo representado para o ambiente operacional é muito menor que os valores atuais de até sessenta e noventa
Os aplicativos que devem funcionar bem e estar disponíveis para processamento de transações devem conter a quantidade mínima de dar se admitirem algum grau de flexibilidade. Portanto, os aplicativos operacionais têm um horizonte de tempo curto, como um tópico de design de aplicativo de áudio.
A segunda maneira que a 'variância de tempo' aparece no DW é na estrutura de chaves. Cada estrutura de chave no DW contém, implícita ou explicitamente, um elemento de tempo, como dia, semana, mês, etc. O elemento de tempo está quase sempre na parte inferior da chave concatenada encontrada no DW. Nessas ocasiões, o elemento tempo existirá implicitamente, como no caso em que um arquivo inteiro é duplicado no final do mês ou trimestre.
A terceira maneira pela qual a variação de tempo é exibida é que eu dar do DW, assim que estiverem corretamente registrados, não poderão ser atualizados. A dar do DW são, para todos os efeitos práticos, uma longa série de instantâneos (snapshots). Claro, se os instantâneos foram tirados incorretamente, os instantâneos podem ser editados. Mas supondo que os instantâneos sejam feitos corretamente, eles não são alterados assim que são feitos. Em alguns

casos, pode ser antiético ou mesmo inválido que os snapshots no DW sejam modificados. A dar operacionais, sendo precisos como no momento do acesso, podem ser atualizados conforme a necessidade.

NÃO VOLÁTIL

A quarta característica importante do DW é que ele não é volátil.
Atualizações, inserções, exclusões e alterações são feitas regularmente para ambientes operacionais, registro por registro. Mas a manipulação básica do dar ocorrendo no DW é muito mais simples. Existem apenas dois tipos de operações que ocorrem no DW - o carregamento inicial do dar e acesso a dar. Não há atualização do dar (no sentido geral de atualização) no DW como uma operação normal de processamento. Existem algumas consequências muito poderosas dessa diferença básica entre processamento operacional e processamento DW. No nível de design, a necessidade de ser cauteloso com atualizações anormais não é um fator no DW, pois atualizar o dar não é realizado. Isso significa que no nível físico do design, liberdades podem ser tomadas para otimizar o acesso a dar, em particular ao lidar com as questões de normalização e desnormalização física. Outra consequência da simplicidade das operações de DW está na tecnologia subjacente usada para executar o ambiente de DW. Ter que suportar atualizações de registro por registro online (como é frequentemente o caso do processamento operacional) exige que a tecnologia tenha uma base muito complexa sob uma aparente simplicidade.
A tecnologia que suporta cópias de backup e recuperação, transações e integridade de dar e a detecção e correção da condição de deadlock é bastante complexa e não é necessária para o processamento de DW. As características de um DW, orientação de design, integração de dar dentro do DW, variação de tempo e a simplicidade de gerenciamento dar, tudo isso leva a um ambiente muito, muito diferente do ambiente operacional clássico. A fonte de quase todos dar de DW são o ambiente operacional. É tentador pensar que há uma redundância maciça de dar entre os dois ambientes.
De fato, a primeira impressão que muitas pessoas têm é a de grande redundância de dar entre o ambiente operacional e o

DW. Tal interpretação é superficial e demonstra uma falta de compreensão do que acontece no DW.
Na verdade, há um mínimo de redundância de dar entre o ambiente operacional e eu dar do DW. Consideremos o seguinte: dar são filtrados data que você passa do ambiente operacional para o ambiente DW. Muito dar eles nunca saem do ambiente operacional. Exceto que eu dar que são necessários para o processamento DSS encontram sua direção no ambiente

▪ o horizonte de tempo do dar é muito diferente de um ambiente para outro. A dar no ambiente operacional, eles são muito novos. A dar em DW eles são muito mais velhos. Apenas da perspectiva do horizonte de tempo, há muito pouca sobreposição entre o ambiente operacional e o DW.

▪ O DW contém dar resumo que nunca são encontrados no ambiente

▪ Eu dar sofrem uma transformação fundamental à medida que avançam para a Figura 3 ilustra que a maioria dos dar eles são significativamente modificados desde que sejam selecionados e movidos para o DW. Dito de outra forma, a maioria dos dar é alterado física e radicalmente à medida que é movido no DW. Do ponto de vista da integração eles não são os mesmos dar residentes no ambiente operacional. Diante desses fatores, a redundância de dar entre os dois ambientes é um evento raro, que leva a menos de 1% de redundância entre os dois ambientes. A ESTRUTURA DO ARMAZÉM DWs têm uma estrutura distinta. Existem vários níveis de resumo e detalhes que demarcam os DWs.
Os vários componentes de um DW são:

  • metadados
  • Dar detalhes atuais
  • Dar de detalhes antigos
  • Dar ligeiramente resumido
  • Dar altamente resumido

De longe, a principal preocupação é para mim dar detalhes atuais. É a principal preocupação porque:

  • I dar detalhes atuais refletem os eventos mais recentes, que são sempre de grande interesse e
  • i dar os detalhes atuais são volumosos porque são armazenados no nível mais baixo de granularidade e
  • i dar os detalhes atuais são quase sempre armazenados na memória do disco, que é de acesso rápido, mas caro e complexo por I. dar detalhes mais antigos são dar que são armazenados em alguma memória de Massa. Ele é acessado esporadicamente e é armazenado em um nível de detalhe compatível com dar detalhes atuais. Embora não seja obrigatório armazenar em um meio de armazenamento alternativo, devido ao grande volume de dar unidos com o acesso esporádico do dar, o meio de memória para dar detalhes mais antigos geralmente não são armazenados em disco. A dar resumido levemente são dar que são destilados do baixo nível de detalhe encontrado para o nível de detalhe atual. Este nível do DW é quase sempre armazenado na memória do disco. Os problemas de projeto que se apresentam ao arquiteto do dar na construção deste nível do DW são:
  • Qual unidade de tempo é a sumarização feita acima
  • Qual conteúdo, atributos irão resumir ligeiramente o conteúdo de dar O próximo nível de dar encontrado no DW é o de dar altamente resumido. A dar altamente resumidas são compactas e de fácil acesso. A dar altamente resumidas são algumas vezes encontradas no ambiente DW e em outros casos eu dar altamente resumidas são encontradas fora das paredes imediatas da tecnologia que hospeda o DW. (de qualquer forma, eu dar altamente resumidas fazem parte do DW, independentemente de onde eu dar estão fisicamente alojados). O componente final do DW é o de metadados. Em muitos aspectos, os metadados ficam em uma dimensão diferente dos outros dar do DW, porque os metadados não contêm nenhum data diretamente do ambiente operacional. Os metadados desempenham um papel especial e muito importante no DW. Os metadados são usados ​​como:
  • um diretório para ajudar o analista de DSS a localizar o conteúdo do DW,
  • um guia para mapear dar de como eu dar foram transformados do ambiente operacional para o ambiente DW,
  • um guia para os algoritmos usados ​​para sumarização entre dar detalhes atuais e eu dar ligeiramente resumido, eu dar altamente resumidos, os metadados desempenham um papel muito mais importante no ambiente DW do que jamais tiveram no ambiente operacional ANTIGO MEIO DE ARMAZENAMENTO DE DETALHE A fita magnética pode ser usada para armazenar esse tipo de dar. De fato, existe uma grande variedade de mídias de armazenamento que devem ser consideradas para a preservação de antigas dar de detalhe. Dependendo do volume do dar, a frequência de acesso, o custo das ferramentas e o tipo de acesso, é bem provável que outras ferramentas precisem do antigo nível de detalhamento do DW. FLUXO DE DADOS Existe um fluxo normal e previsível de deuses dar dentro do DW.
    I dar insira o DW a partir do ambiente operacional. (NOTA: Existem algumas exceções muito interessantes a esta regra. No entanto, quase todos dar entrar no DW a partir do ambiente operacional). Dato que dar entrar no DW a partir do ambiente operacional, ele é transformado conforme descrito acima. Desde que você insira o DW, eu dar insira o nível de detalhe atual, conforme mostrado. Ele reside lá e é usado até que um dos três eventos ocorra:
  • é purificado,
  • é resumido, e/ou ▪ é um processo obsoleto dentro de um movimento DW i dar detalhes atuais a dar de detalhes antigos, de acordo com a idade de dar. O processo

resumo usa o detalhe de dar para calcular eu dar níveis ligeiramente resumidos e altamente resumidos de dar. Existem algumas exceções ao fluxo mostrado (a ser discutido posteriormente). No entanto, geralmente, para a grande maioria dos dar encontrado dentro de um DW, o fluxo de dar é como retratado.

USANDO O DATAWAREHOUSE

Não surpreendentemente, os vários níveis de dar dentro do DW eles não recebem diferentes níveis de uso. Como regra, quanto maior o nível de sumarização, mais dar eles são usados.
Muitos usos ocorrem em dar altamente resumido, enquanto o antigo dar detalhes quase nunca são usados. Há boas razões para mover a organização para o paradigma de uso de recursos. Mais resumido eu dar, mais rápido e mais eficiente é chegar ao dar. Se um loja descobre que ele faz muitos processos no nível de detalhe do DW, então uma grande quantidade correspondente de recursos da máquina é consumida. É do interesse de todos processar o mais rápido possível em um alto nível de sumarização.

Para muitas lojas, o analista DSS em um DW pré-ambiente usado dar no nível de detalhe. Em muitos aspectos, a chegada de um dar detalhado parece um cobertor de segurança, mesmo quando outros níveis de resumo estão disponíveis. Uma das atividades do arquiteto de dar é desacostumar o usuário DSS do uso constante de dar no nível mais baixo de detalhes. Há duas razões disponíveis para o arquiteto de dar:

  • instalando um sistema de estorno, onde o usuário final paga pelos recursos consumidos e
  • que indicam que um tempo de resposta muito bom pode ser obtido quando o comportamento com i dar está em um alto nível de sumarização, enquanto o tempo de resposta ruim vem do comportamento do dar em um nível baixo de OUTRAS CONSIDERAÇÕES Existem algumas outras considerações de construção e gerenciamento de DW.
    A primeira consideração é a dos índices. A dar em níveis mais altos de sumarização, eles podem ser indexados livremente, enquanto i dar

nos níveis mais baixos de detalhe, eles são tão volumosos que podem ser indexados frugalmente. Da mesma ficha, eu dar em altos níveis de detalhes, eles podem ser reestruturados com relativa facilidade, enquanto o volume de dar nos níveis mais baixos é tão grande que eu dar eles não podem ser facilmente reestruturados. Assim, o modelo de dar e o trabalho formal feito pelo projeto lançou as bases para o DW aplicado quase que exclusivamente ao atual nível de detalhamento. Em outras palavras, as atividades de modelagem de dar eles não se aplicam aos níveis de sumarização em quase todos os casos. Outra consideração estrutural é a da subdivisão de dar por DW.

O particionamento pode ser feito em dois níveis - no nível de banco de dados e ao nível da aplicação. Na divisão do nível banco de dados, o banco de dados ele é informado das divisões e as monitora de acordo. No caso de uma divisão em nível de aplicação, apenas o programador é informado das divisões e a responsabilidade de sua administração é dele.

Abaixo do nível banco de dados, muito trabalho é feito automaticamente. Há muita inflexibilidade associada à administração automática de divisões. No caso da divisão ao nível da aplicação do dar De data warehouse, muito trabalho pesa sobre o programador, mas o resultado final é a flexibilidade na administração do dar em data warehouse

OUTRAS ANOMALIAS

Enquanto os componentes do data warehouse funcionam como descrito para quase todos dar, há algumas exceções úteis que precisam ser discutidas. Uma exceção é a de dar dados sumários públicos. Estes são dar resumos que foram calculados data warehouse mas eles são usados ​​pela sociedade. A dar resumos públicos são armazenados e gerenciados no data warehouse, embora, como mencionado acima, eles sejam descobertos. Os contadores trabalham para produzir tais dar como receitas, despesas trimestrais, lucro trimestral e assim por diante. O trabalho dos contadores é externo ao data warehouse. No entanto, eu dar são usados ​​“internamente” dentro da empresa – desde especialistas em Marketing, vendas, etc Outra anomalia, que não será discutida, é a dar externo.

Outro ótimo tipo de dar que pode ser encontrado em um data warehouse é o dos dados de detalhe permanentes. Isso resulta na necessidade de armazenar permanentemente i dar em um nível detalhado por razões éticas ou legais. Se uma empresa está expondo seus trabalhadores a substâncias perigosas, é necessário dar detalhado e permanente. Se uma empresa fabrica um produto que envolve segurança pública, como peças de um avião, há necessidade de dar detalhes permanentes, bem como se uma empresa celebra contratos perigosos.

A empresa não pode se dar ao luxo de ignorar os detalhes, porque nos próximos anos, no caso de uma ação judicial, um recall, um defeito de construção contestado etc. a exposição da empresa pode ser grande. Consequentemente, existe um tipo único de dar conhecidos como dados de detalhes permanentes.

RESUMO

Un data warehouse é uma variante de tempo orientada a objetos, integrada, uma coleção de dar não volátil para apoiar as necessidades de tomada de decisão da administração. Cada uma das funções importantes de um data warehouse tem suas implicações. Além disso, existem quatro níveis de dar De data warehouse:

  • Detalhe antigo
  • Detalhe atual
  • Dar ligeiramente resumido
  • Dar Metadados altamente resumidos também são uma parte importante do data warehouse. ABSTRATO O conceito de armazenamento de dar recentemente recebeu muita atenção e se tornou uma tendência dos anos 90. Isso se deve à capacidade de um data warehouse superar as limitações dos sistemas de apoio à gestão como os sistemas de apoio à decisão (DSS) e os sistemas de informação executiva (EIS). Embora o conceito de data warehouse parece promissor, implementando i data warehouse pode ser problemático devido a processos de armazenamento em grande escala. Apesar da complexidade do dar, muitos fornecedores e consultores que estocam dar afirmam que o armazenamento de dar atual não envolve problemas. No entanto, no início deste projeto de pesquisa, quase nenhuma pesquisa independente, rigorosa e sistemática havia sido realizada. Consequentemente, é difícil dizer o que realmente acontece na indústria quando eles são construídos data warehouse. Este estudo explorou a prática de armazenamento de dar contemporâneos com o objetivo de desenvolver uma compreensão mais rica da prática australiana. A análise da literatura forneceu o contexto e fundamento para o estudo empírico. Há uma série de resultados desta pesquisa. Em primeiro lugar, este estudo revelou as atividades que ocorreram durante o desenvolvimento do data warehouse. Em muitas áreas, eu dar reunidos confirmaram a prática relatada na literatura. Em segundo lugar, as questões e problemas que podem impactar o desenvolvimento da data warehouse foram identificados a partir deste estudo. Finalmente, os benefícios derivados de organizações australianas associadas ao uso de data warehouse foram revelados.

Capítulo 1

Contexto de pesquisa

O conceito de armazenamento de dados recebeu ampla exposição e se desenvolveu em uma tendência emergente na década de 90 (McFadden 1996, TDWI 1996, Shah e Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman e Oates 2000). Isso pode ser visto no crescente número de artigos sobre data warehousing em publicações comerciais (Little e Gibson 1999). Muitos artigos (ver, por exemplo, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett e re 1996, Graham et al. 1996, Sakaguchi e Frolick 1996, Alvarez 1997, Brousell 1997, Clarke 1997, McCarthy 1997, O'Donnell 1997, Edwards 1998, TDWI 1999) relataram benefícios significativos para as organizações que implementam i data warehouse. Eles apoiaram sua teoria com evidências anedóticas de implementações bem-sucedidas, altos números de retorno sobre o investimento (ROI) e, também, fornecendo as diretrizes ou metodologias para desenvolver o data warehouse

(Shanks et al. 1997, Seddon e Benjamin 1998, little e Gibson 1999). Em um caso extremo, Graham et al. (1996) relataram um retorno médio de um investimento de três anos de 401%.

Grande parte da literatura atual, no entanto, tem negligenciado as complexidades envolvidas na realização de tais projetos. Os projetos de data warehouse eles são normalmente complexos e de grande escala e, portanto, implicam uma alta probabilidade de falha se não forem cuidadosamente controlados (Shah e Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs e Clymer 1998, Rao 1998). Eles exigem grandes quantidades de recursos humanos e financeiros e tempo e esforço para construí-los (Hill 1998, Crofts 1998). O tempo típico e os meios financeiros necessários são de aproximadamente dois anos e dois ou três milhões de dólares, respectivamente (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Este tempo e meios financeiros são necessários para controlar e consolidar muitos aspectos diferentes do armazenamento de dados (Cafasso 1995, Hill 1998). Além das considerações de hardware e software, outras funções, que variam desde a extração de dar para os processos de carregamento de dar, da capacidade de memória para gerenciar atualizações e de meta dar para o treinamento do usuário, eles devem ser considerados.

Na época deste projeto de pesquisa, havia muito pouca pesquisa acadêmica realizada na área de armazenamento de dados, especialmente na Austrália. Isso ficou evidente pela escassez de artigos publicados sobre armazenamento de dados em jornais ou outros escritos acadêmicos da época. Muitos dos escritos acadêmicos disponíveis descreveram a experiência dos Estados Unidos. A falta de pesquisas acadêmicas na área de armazenamento de dados tem causado a demanda por pesquisas rigorosas e estudos empíricos (McFadden 1996, Shanks et al. 1997, Little e Gibson 1999). Em particular, estudos de pesquisa sobre o processo de implementação de data warehouse precisa ser feito para ampliar o conhecimento geral sobre a implementação de data warehouse e servirá como base para um futuro estudo de pesquisa (Shanks et al. 1997, Little e Gibson 1999).

O objetivo deste estudo, portanto, é investigar o que realmente acontece quando as organizações implementam e usam i data warehouse na Austrália. Especificamente, este estudo envolverá uma análise de todo um processo de desenvolvimento de um data warehouse, começando com a iniciação e planejamento até o design e implementação e uso subsequente em organizações australianas. Além disso, o estudo também contribuirá para a prática atual, identificando áreas onde a prática pode ser melhorada e as ineficiências e riscos podem ser minimizados ou evitados. Além disso, servirá de base para outros estudos sobre data warehouse na Austrália e preencherá a lacuna que existe atualmente na literatura.

Questões de pesquisa

O objetivo desta pesquisa é estudar as atividades envolvidas na implementação de data warehouse e seu uso por organizações australianas. Em particular, são estudados os elementos relativos ao planejamento do projeto, desenvolvimento, operação, uso e os riscos envolvidos. Assim, a pergunta desta pesquisa é:

“Como é a prática atual de data warehouse na Austrália?"

Para responder eficazmente a esta questão, são necessárias várias questões de pesquisa subsidiárias. Em particular, três subquestões foram identificadas na literatura, que é apresentada no capítulo 2, para orientar este projeto de pesquisa: Como são as data warehouse de organizações australianas? Quais são os problemas encontrados?

Quais são os benefícios experimentados?
Para responder a essas perguntas, foi utilizado um desenho de pesquisa exploratória empregando inquérito. Como um estudo exploratório, as respostas às perguntas acima não são completas (Shanks et al. 1993, Denscombe 1998). Nesse caso, a triangulação é necessária para melhorar as respostas a essas perguntas. No entanto, a investigação fornecerá uma base sólida para trabalhos futuros examinando essas questões. Uma discussão detalhada sobre a justificativa do método e desenho da pesquisa é apresentada no capítulo 3.

Estrutura do projeto de pesquisa

Este projeto de pesquisa está dividido em duas partes: o estudo contextual do conceito de datawarehousing e a pesquisa empírica (ver figura 1.1), cada uma delas discutida a seguir.

Parte I: estudo contextual

A primeira parte da pesquisa consistiu em revisar a literatura atual sobre vários tipos de armazenamento de dados, incluindo sistemas de auxílio à decisão (DSS), sistemas de informação executiva (EIS), estudos de caso de data warehouse e os conceitos de data warehouse. Além disso, os resultados do foum sui data warehouse e grupos de reuniões para especialistas e profissionais liderados pelo grupo de pesquisa Monash DSS, contribuíram para esta fase do estudo que pretendia obter informações sobre a prática de data warehouse e identificar os riscos envolvidos na sua adoção. Durante este período de estudo contextual, a compreensão da área do problema foi estabelecida para fornecer o conhecimento de fundo para investigações empíricas subsequentes. No entanto, este foi um processo contínuo durante a realização do estudo de pesquisa.

Parte II: Pesquisa Empírica

O conceito relativamente novo de data warehousing, especialmente na Austrália, criou a necessidade de uma investigação para obter uma visão ampla da experiência do usuário. Esta parte foi feita uma vez que o domínio do problema foi estabelecido através de extensa revisão de literatura. O conceito de armazenamento de dados formado durante a fase de estudo contextual foi usado como entrada para o questionário inicial deste estudo. Após isso, o questionário foi revisado. Você é especialista em data warehouse participou da prova. O objetivo do teste do questionário inicial foi verificar a completude e a precisão das perguntas. Com base nos resultados do teste, o questionário foi modificado e a versão modificada foi enviada aos participantes da pesquisa. Os questionários devolvidos foram então analisados ​​para dar em tabelas, diagramas e outros formatos. A

resultados da análise de dar formar um instantâneo da prática de armazenamento de dados na Austrália.

VISÃO GERAL DO ARMAZENAMENTO DE DADOS

O conceito de data warehousing evoluiu com as melhorias na tecnologia de computadores.
Destina-se a superar os problemas enfrentados por grupos de apoio a aplicações como Sistema de Apoio à Decisão (DSS) e Sistema de Informação Executiva (EIS).

No passado, o maior obstáculo destas aplicações foi a incapacidade destas aplicações de fornecerem uma base de dados necessário para a análise.
Isto é causado principalmente pela natureza do trabalho da administração. Os interesses da administração de uma empresa variam constantemente de acordo com a área de atuação. Portanto, eu dar fundamental para essas aplicações deve poder mudar rapidamente dependendo da peça a ser tratada.
Isso significa que eu dar devem estar disponíveis no formulário apropriado para as análises requeridas. De fato, os grupos de suporte a aplicativos encontraram muitas dificuldades no passado para coletar e integrar dar de fontes complexas e diversas.

O restante desta seção apresenta uma visão geral do conceito de data warehousing e discute como o data warehouse pode superar os problemas dos grupos de suporte de aplicativos.
O termo "Armazém de dadosFoi lançado por William Inmon em 1990. Sua definição frequentemente citada é a Armazém de dados como uma coleção de dar orientado por assunto, integrado, não volátil e variável ao longo do tempo, para apoiar as decisões de gestão.

Usando esta definição, Inmon aponta que eu dar residindo em um data warehouse devem ter as 4 características seguintes:

  • ▪ Orientado ao assunto
  • ▪ Integrado
  • ▪ Não volátil
  • ▪ Variável ao longo do tempo Por Assunto Orientado Inmon significa que i dar em data warehouse nas maiores áreas organizacionais que

definido no modelo dar. Por exemplo todos dar sobre i clientes estão contidos na área de assunto CLIENTES. Da mesma forma todos dar relacionados aos produtos estão contidos na área de assunto PRODUTOS.

Por Integrati Inmon significa que eu dar de diferentes plataformas, sistemas e locais são combinados e armazenados em um só lugar. Conseqüentemente dar formatos semelhantes devem ser transformados em formatos consistentes para serem facilmente adicionados e comparados.
Por exemplo, os gêneros masculino e feminino são representados pelas letras M e F em um sistema e com 1 e 0 em outro. Para integrá-los adequadamente, um ou ambos os formatos devem ser transformados para que os dois formatos sejam iguais. Neste caso poderíamos mudar M para 1 e F para 0 ou vice-versa. Orientado para o assunto e Integrado indicam que o data warehouse é projetado para fornecer uma visão funcional e transversal de dar pela empresa.

Não volátil significa que eu dar em data warehouse manter a consistência e atualizar o dar não é necessário. Em vez disso, qualquer alteração na dar originais são adicionados ao banco de dados De data warehouse. Isso significa que o historiador da dar está contido no data warehouse.

Para variáveis ​​ao longo do tempo, Inmon indica que i dar em data warehouse sempre contém marcadores de tempo e eu dar eles normalmente cruzam um determinado horizonte de tempo. Por exemplo um
data warehouse pode conter 5 anos de valores históricos do clientes de 1993 a 1997. A disponibilidade do historiador e uma série temporal de dar permite que você analise tendências.

Un data warehouse ele pode coletar o seu dar de sistemas OLTP; de origens dar externos à organização e/ou outros projetos especiais de sistemas de captura dar.
I dar extratos podem passar por um processo de limpeza, neste caso eu dar eles são transformados e integrados antes de serem armazenados no banco de dados De data warehouse. Então eu dar

residindo dentro do banco de dados De data warehouse são disponibilizados para acesso do usuário final e ferramentas de recuperação. Utilizando essas ferramentas, o usuário final pode acessar a visão integrada da organização do dar.

I dar residindo dentro do banco de dados De data warehouse eles são armazenados em detalhes e em formatos de resumo.
O nível de resumo pode depender da natureza do dar. o dar detalhado pode consistir em dar corrente e dar histórico
I dar reais não estão incluídos no data warehouse até eu dar em data warehouse são atualizados.
Além de armazenar i dar eles próprios, um data warehouse também pode armazenar um tipo diferente de data chamado METADATA descrevendo i dar residindo em seu banco de dados.
Existem dois tipos de metadados: metadados de desenvolvimento e metadados de análise.
Os metadados de desenvolvimento são usados ​​para gerenciar e automatizar os processos de extração, limpeza, mapeamento e carregamento de dar em data warehouse.
As informações contidas nos metadados de desenvolvimento podem conter detalhes de sistemas operacionais, detalhes dos elementos a serem extraídos, o modelo dar De data warehouse e regras de negócio para a conversão de dar.

O segundo tipo de metadados, conhecido como metadados de análise, permite que o usuário final explore o conteúdo do data warehouse para encontrar o dar disponíveis e seu significado em termos claros e não técnicos.

Portanto, os metadados analíticos funcionam como uma ponte entre o data warehouse e aplicativos de usuário final. Esses metadados podem conter o modelo de negócios, descrições de dar correspondente ao modelo de negócio, consultas e relatórios pré-definidos, informação de acessos de utilizadores e índice.

Os metadados de análise e desenvolvimento devem ser combinados em um único metadados de contenção integrado para funcionar corretamente.

Infelizmente, muitas das ferramentas existentes têm seus próprios metadados e atualmente não existem padrões existentes que

permitem que ferramentas de armazenamento de dados integrem esses metadados. Para remediar esta situação, muitos comerciantes das principais ferramentas de armazenamento de dados formaram o Meta Data Council que mais tarde se tornou a Meta Data Coalition.

O objetivo desta coalizão é construir um conjunto de metadados padrão que permita que diferentes ferramentas de armazenamento de dados convertam os metadados.
Seus esforços resultaram no nascimento da Meta Data Interchange Specification (MDIS), que permitirá a troca de informações entre os arquivos da Microsoft e os arquivos MDIS relacionados.

A existência de dar tanto resumido/indexado quanto detalhado dá ao usuário a possibilidade de realizar um DRILL DROWN a partir de dar indexados aos detalhados e vice-versa. A existência de dar históricos detalhados permitem a realização de análises de tendências ao longo do tempo. Além disso, os metadados de análise podem ser usados ​​como o diretório do banco de dados De data warehouse para ajudar os usuários finais a localizar i dar necessário.

Em comparação com os sistemas OLTP, com sua capacidade de suportar análises de dar e relatórios, o data warehouse é visto como um sistema mais adequado para processos de informação, como fazer e responder a consultas e produzir relatórios. A próxima seção destacará as diferenças dos dois sistemas em detalhes.

ARMAZÉM DE DADOS CONTRA SISTEMAS OLTP

Muitos dos sistemas de informação dentro das organizações destinam-se a apoiar as operações do dia-a-dia. Esses sistemas, conhecidos como OLTP SYSTEMS, capturam transações diárias continuamente atualizadas.

I dar dentro desses sistemas, eles são frequentemente modificados, adicionados ou excluídos. Por exemplo, o endereço de um cliente muda à medida que ele se desloca de um lugar para outro. Neste caso o novo endereço será registrado modificando o campo de endereço do banco de dados. O principal objetivo desses sistemas é reduzir os custos de transação e, ao mesmo tempo, reduzir os tempos de processamento. Exemplos de sistemas OLTP incluem ações críticas, como livros de pedidos, folhas de pagamento, faturas, fabricação, serviços de IA clientes.

Ao contrário dos sistemas OLTP, que foram construídos para processos baseados em transações e eventos, data warehouse foram criados para apoiar os processos baseados em análise de dar e nos processos de tomada de decisão.

Isso normalmente é conseguido integrando i dar de vários OLTP e sistemas externos em um único "contêiner" de dar, como discutido na seção anterior.

Modelo de processo de armazenamento de dados da Monash

O modelo de processo para data warehouse Monash foi desenvolvido por pesquisadores do Monash DSS Research Group, é baseado na literatura de data warehouse, na experiência no apoio ao desenvolvimento de campos de sistemas, em discussões com fornecedores de aplicativos para uso em data warehouse, em um grupo de especialistas no uso de data warehouse.

As fases são: Iniciação, Planejamento, Desenvolvimento, Operações e Explicações. O diagrama explica a natureza iterativa ou evolutiva do desenvolvimento de um data warehouse processo usando setas bidirecionais colocadas entre as diferentes fases. Neste contexto “iterativo” e “evolutivo” significam que, a cada passo do processo, as atividades de implementação podem sempre se propagar para trás em direção à fase anterior. Isso se deve à natureza de um projeto data warehouse em que solicitações adicionais do usuário final assumem a qualquer momento. Por exemplo, durante a fase de desenvolvimento de um data warehouse, uma nova dimensão ou área de assunto é solicitada pelo usuário final, que não fazia parte do plano original, esta deve ser adicionada ao sistema. Isso causa uma alteração no design. O resultado é que a equipe de design precisa alterar os requisitos dos documentos criados até agora durante a fase de design. Em muitos casos, o estado atual do projeto deve retornar ao estágio de design onde a nova solicitação deve ser adicionada e documentada. O usuário final deve poder ver a documentação específica revisada e as alterações que foram feitas na fase de desenvolvimento. No final deste ciclo de desenvolvimento, o projeto deve obter um excelente feedback tanto das equipes de desenvolvimento quanto dos usuários. O feedback é então reutilizado para melhorar um projeto futuro.

Planejamento de capacidade
DWs tendem a ser muito grandes em tamanho e crescem muito rápido (Best 1995, Rudin 1997a) devido à quantidade de dar historiadores que guardam de sua vida. O crescimento também pode ser causado por dar add-ons solicitados pelos usuários para aumentar o valor de dar que eles já têm. Consequentemente, os requisitos de armazenamento para dar pode ser significativamente melhorada (Eckerson 1997). Assim, é essencial garantir, através da realização do planejamento de capacidade, que o sistema a ser construído possa crescer com o crescimento das necessidades (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
Ao planejar a escalabilidade do dw, deve-se conhecer o crescimento esperado no tamanho do depósito, os tipos de perguntas que provavelmente serão feitas e o número de usuários finais suportados (Best 1995, Rudin 1997b, Foley 1997a). A construção de aplicativos escaláveis ​​requer uma combinação de tecnologias de servidor escaláveis ​​e técnicas de design de aplicativos escaláveis ​​(Best 1995, Rudin 1997b. Ambos são necessários na construção de um aplicativo altamente escalável. As tecnologias de servidor escaláveis ​​podem tornar fácil e econômico adicionar armazenamento, memória e CPU sem desempenho degradante (Lang 1997, Telephony 1997).

Existem duas tecnologias principais de servidor escalável: processamento múltiplo simétrico (SMP) e processamento paralelo massivo (MPP) (IDC 1997, Humphries et al. 1999). Um servidor SMP normalmente tem vários processadores que compartilham uma memória, barramento de sistema e outros recursos (IDC 1997, Humphries et al. 1999). Processadores adicionais podem ser adicionados para aumentar sua poder computacional. Outro método de aumentar o poder computacional do servidor SMP, é combinar várias máquinas SMP. Esta técnica é conhecida como agrupamento (Humphries et al. 1999). Um servidor MPP, por outro lado, possui vários processadores, cada um com sua própria memória, sistema de barramento e outros recursos (IDC 1997, Humphries et al. 1999). Cada processador é chamado de nó. Um aumento na poder computacional pode ser alcançado

adicionar nós adicionais aos servidores MPP (Humphries et al. 1999).

Um ponto fraco dos servidores SMP é que muitas operações de entrada-saída (E/S) podem congestionar o sistema de barramento (IDC 1997). Esse problema não ocorre em servidores MPP, pois cada processador possui seu próprio sistema de barramento. No entanto, as interconexões entre cada nó são geralmente muito mais lentas do que o sistema de barramento SMP. Além disso, os servidores MPP podem adicionar um nível extra de complexidade aos desenvolvedores de aplicativos (IDC 1997). Assim, a escolha entre servidores SMP e MPP pode ser influenciada por diversos fatores, incluindo a complexidade das aplicações, a relação preço/desempenho, a capacidade de processamento necessária, as aplicações dw impedidas e o aumento do tamanho do banco de dados de dw e no número de usuários finais.

Numerosas técnicas de projeto de aplicativos escaláveis ​​podem ser empregadas no planejamento de capacidade. Um usa vários períodos de notificação, como dias, semanas, meses e anos. Tendo vários períodos de notificação, o banco de dados pode ser dividido em peças agrupadas com facilidade (Inmon et al. 1997). Outra técnica é usar tabelas de resumo que são construídas resumindo dar da dar detalhado. Assim, eu dar os resumos são mais compactos do que detalhados, o que requer menos espaço de memória. Então o dar os detalhes podem ser armazenados em uma unidade de armazenamento mais barata, o que economiza ainda mais armazenamento. Embora o uso de tabelas de resumo possa economizar espaço de memória, elas exigem muito esforço para mantê-las atualizadas e alinhadas às necessidades comerciais. No entanto, esta técnica é amplamente utilizada e frequentemente usada em conjunto com a técnica anterior (Best 1995, Inmon 1996a, Chauduri e Dayal

Definindo Armazém de dados Arquiteturas Técnicas Definição de técnicas de arquitetura dw

Os adotantes iniciais de data warehousing conceberam principalmente uma implementação centralizada de dw em que todos dar, incluindo eu dar externo, foram integrados em um único,
repositório físico (Inmon 1996a, Bresnahan 1996, Peacock 1998).

A principal vantagem dessa abordagem é que os usuários finais podem acessar a visão de toda a empresa dar organizacional (Ovum 1998). Outra vantagem é que oferece padronização de dar através da organização, o que significa que há apenas uma versão ou definição para cada terminologia usada nos metadados do repositório dw (Flanagan e Safdie 1997, Ovum 1998). A desvantagem dessa abordagem, por outro lado, é que ela é cara e difícil de construir (Flanagan e Safdie 1997, Ovum 1998, Inmon et al. 1998). Não muito depois da arquitetura de armazenamento dar centralizado tornou-se popular, o conceito de extrair os menores subconjuntos de deuses evoluiu dar para atender às necessidades de aplicações específicas (Varney 1996, IDC 1997, Berson e Smith 1997, peacock 1998). Esses pequenos sistemas são derivados dos maiores data warehouse centralizado. Eles são nomeados data warehouse funcionários do departamento ou data marts dependentes. A arquitetura de data mart dependente é conhecida como arquitetura de três camadas na qual a primeira linha consiste no data warehouse centralizado, o segundo consiste nos depósitos de dar departamental e o terceiro consiste no acesso a dar e ferramentas de análise (Demarest 1994, Inmon et al. 1997).

Os data marts são normalmente construídos após o data warehouse centralizado foi construído para atender às necessidades de unidades específicas (White 1995, Varney 1996).
Data marts - loja i dar relevantes para unidades particulares (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

A vantagem deste método é que não haverá data não integrado e que eu dar será menos redundante nos data marts, já que todos dar vem de um depósito de dar integrado. Outra vantagem é que haverá poucos links entre cada data mart e suas fontes dar porque cada data mart tem apenas uma fonte de dar. Além disso, com essa arquitetura em vigor, os usuários finais ainda podem acessar a visão geral de dar

organização corporativa. Esse método é conhecido como método top-down, no qual os data marts são construídos após a data warehouse (pavão 1998, Goff 1998).
Aumentando a necessidade de mostrar resultados cedo, algumas organizações começaram a construir data marts independentes (Flanagan e Safdie 1997, White 2000). Nesse caso, os data marts pegam seus dar diretamente do básico de dar OLTP e repositório não centralizado e integrado, eliminando assim a necessidade de repositório central no local.

Cada data mart requer pelo menos um link para suas fontes de dar. Uma desvantagem de ter várias conexões para cada data mart é que, em comparação com as duas arquiteturas anteriores, a superabundância de dar aumenta significativamente.

Cada data mart deve armazenar todos dar exigido localmente para não ter efeito nos sistemas OLTP. Isso faz com que o dar eles são armazenados em diferentes data marts (Inmon et al. 1997). Outra desvantagem dessa arquitetura é que ela leva à criação de interconexões complexas entre data marts e suas fontes de dados. dar que são difíceis de realizar e controlar (Inmon et al. 1997).

Outra desvantagem é que os usuários finais não podem acessar a visão geral das informações corporativas, pois dar dos diferentes data marts não são integrados (Ovum 1998).
Ainda outra desvantagem é que pode haver mais de uma definição para cada terminologia usada nos data marts que gera inconsistências de dar na organização (Ovum 1998).
Apesar das desvantagens discutidas acima, data marts independentes ainda atraem o interesse de muitas organizações (IDC 1997). Um fator que os torna atraentes é que eles são mais rápidos de desenvolver e requerem menos tempo e recursos (Bresnahan 1996, Berson e Smith 1997, Ovum 1998). Consequentemente, eles servem principalmente como projetos de prova de conceito que podem ser usados ​​para identificar rapidamente benefícios e/ou deficiências no projeto (Parsaye 1995, Braly 1995, Newing 1996). Neste caso, a parte a ser implementada no projeto piloto deve ser pequena, mas importante para a organização (Newing 1996, Mansell-Lewis 1996).

Ao examinar o protótipo, os usuários finais e a administração podem decidir se continuam ou interrompem o projeto (Flanagan e Safdie 1997).
Se a decisão for continuar, os data marts para outros setores devem ser construídos um de cada vez. Existem duas opções para usuários finais com base em suas necessidades na construção de matrizes de dados independentes: integrado/federado e não integrado (Ovum 1998)

No primeiro método, quaisquer novos data marts devem ser construídos com base nos data marts atuais e no modelo dar usado pela empresa (Varney 1996, Berson e Smith 1997, Peacock 1998). A necessidade de usar o modelo dar da empresa garante que haja apenas uma definição para cada terminologia usada por meio de data marts, também para garantir que diferentes data marts possam ser mesclados para fornecer uma visão geral das informações corporativas (Bresnahan 1996). Esse método é chamado de bottom-up e é melhor quando há restrição de meios financeiros e tempo (Flanagan e Safdie 1997, Ovum 1998, peacock 1998, Goff 1998). No segundo método, os data marts construídos só podem satisfazer as necessidades de uma unidade específica. Uma variante do data mart federado é o data warehouse distribuído em que o banco de dados O middleware do servidor hub é usado para mesclar muitos data marts em um único repositório de dar distribuído (White 1995). Neste caso, eu dar empresas estão distribuídas em vários data marts. As solicitações do usuário final são encaminhadas para banco de dados middleware de hub de servidor, que extrai todos dar exigido pelos data marts e retorna os resultados para os aplicativos do usuário final. Esse método fornece informações comerciais aos usuários finais. No entanto, os problemas dos data marts independentes ainda não foram eliminados. Existe outra arquitetura que pode ser usada, chamada de data warehouse virtual (White 1995). No entanto, esta arquitetura, que é descrita na Figura 2.9, não é uma arquitetura de armazenamento de dar real, pois não transfere a carga dos sistemas OLTP para data warehouse (Demarest 1994).

Na verdade, os pedidos de dar os usuários finais são repassados ​​aos sistemas OLTP que retornam resultados após o processamento das solicitações do usuário. Embora essa arquitetura permita que os usuários finais gerem relatórios e formulem solicitações, ela não pode fornecer a

dar visão geral das informações históricas e da empresa desde que eu dar dos diferentes sistemas OLTP não estão integrados. Portanto, essa arquitetura não pode satisfazer a análise de dar complexos como as previsões.

Seleção dos aplicativos de acesso e recuperação dar

O propósito de construir um data warehouse é transmitir informações aos usuários finais (Inmon et al 1997, Poe 1996, McFadden 1996, Shanks et al 1997, Hammergren 1998); um ou mais aplicativos de acesso e recuperação dar Deve ser providenciado. Até o momento, existe uma grande variedade dessas aplicações que o usuário pode escolher (Hammergren 1998, Humphries et al 1999). Os aplicativos selecionados determinam o sucesso do esforço de armazenamento dar em uma organização porque os aplicativos são a parte mais visível do data warehouse para o usuário final (Inmon et al 1997, Poe 1996). Para ter sucesso um data warehouse, deve ser capaz de apoiar as atividades de análise de dar usuário final (Poe 1996, Seddon e Benjamin 1998, Eckerson 1999). Assim, o "nível" do que o usuário final deseja deve ser identificado (Poe 1996, Mattison 1996, Inmon et al 1997, Humphries et al 1999).

Em geral, os usuários finais podem ser agrupados em três categorias: usuários executivos, analistas de negócios e usuários avançados (Poe 1996, Humphries et al. 1999). Os usuários executivos precisam de acesso fácil a conjuntos predefinidos de relatórios (Humphries et al 1999). Esses relatórios podem ser facilmente acessados ​​navegando pelos menus (Poe 1996). Além disso, os relatórios devem apresentar informações usando representações gráficas como tabelas e padrões para transmitir informações rapidamente (Humphries et al 1999). Os analistas de negócios, que podem não ter as capacidades técnicas para desenvolver relacionamentos do zero por conta própria, precisam ser capazes de modificar os relacionamentos existentes para atender às suas necessidades específicas (Poe 1996, Humphries et al. 1999). Os usuários avançados, por outro lado, são o tipo de usuário final que tem a capacidade de gerar e escrever solicitações e relatórios do zero (Poe 1996, Humphries et al. 1999). São eles que

desenvolver relatórios para outros tipos de usuários (Poe 1996, Humphries et al 1999).

Uma vez determinados os requisitos do usuário final, deve ser feita uma seleção dos aplicativos de acesso e recuperação dar entre todos os disponíveis (Poe 1996, Inmon et al 1997).
Acesso a dar e ferramentas de recuperação podem ser classificadas em 4 tipos: ferramenta OLAP, ferramenta EIS/DSS, ferramenta de consulta e relatório e ferramenta de mineração de dados.

As ferramentas OLAP permitem que os usuários criem consultas ad hoc, bem como aquelas feitas no banco de dados De data warehouse. Além disso, esses produtos permitem que os usuários façam uma busca detalhada de dar gerais para os detalhados.

As ferramentas EIS/DSS fornecem relatórios executivos, como análise “what if” e acesso a relatórios baseados em menus. Os relatórios devem ser predefinidos e mesclados com menus para facilitar a navegação.
As ferramentas de consulta e relatório permitem que os usuários produzam relatórios predefinidos e específicos.

Ferramentas de mineração de dados são usadas para identificar relacionamentos que podem lançar uma nova luz sobre operações esquecidas em dar do datawarehouse.

A par da otimização dos requisitos de cada tipo de utilizador, as ferramentas selecionadas devem ser intuitivas, eficientes e fáceis de utilizar. Eles também precisam ser compatíveis com outras partes da arquitetura e capazes de trabalhar com sistemas existentes. Sugere-se também a escolha de ferramentas de acesso e recuperação de dados com preços e desempenhos razoáveis. Outros critérios a serem considerados incluem o compromisso do fornecedor da ferramenta em oferecer suporte ao produto e os desenvolvimentos que ele terá em versões futuras. Para garantir o engajamento do usuário no uso do data warehouse, a equipe de desenvolvimento envolve os usuários no processo de seleção de ferramentas. Neste caso, uma avaliação prática do usuário deve ser realizada.

Para aumentar o valor do data warehouse, a equipe de desenvolvimento também pode fornecer acesso web ao seu data warehouse. Um data warehouse habilitado para web permite que os usuários acessem dar de lugares remotos ou durante uma viagem. Além disso, a informação pode

ser fornecidos a custos mais baixos, reduzindo os custos de treinamento.

2.4.3 Armazém de dados Fase de Operação

Esta fase consiste em três atividades: definição de estratégias de atualização de dados, controle das atividades do data warehouse e gerenciamento da segurança do data warehouse.

Definição de estratégias de atualização de dados

Após o upload inicial, eu dar em banco de dados do datawarehouse deve ser atualizado periodicamente para reproduzir as alterações feitas dar originais. Portanto, é necessário decidir quando atualizar, com que frequência a atualização deve ser agendada e como atualizar o dar. Sugere-se atualizar o dar quando o sistema pode ser colocado offline. A taxa de atualização é determinada pela equipe de desenvolvimento com base nos requisitos do usuário. Existem duas abordagens para atualizar o data warehouse: a atualização completa e o carregamento contínuo de alterações.

A primeira abordagem, a atualização completa, requer o recarregamento de todos os dar do princípio. Isso significa que todos dar necessários devem ser extraídos, limpos, transformados e integrados em cada atualização. Esta abordagem deve ser evitada tanto quanto possível, pois requer muito tempo e recursos.

Uma abordagem alternativa é carregar continuamente as alterações. Isso me adiciona dar que foram alterados desde o último ciclo de atualização do data warehouse. A identificação de registros novos ou alterados reduz significativamente a quantidade de dar que deve ser propagado para o data warehouse em cada atualização, pois somente esses dar será adicionado ao banco de dados do datawarehouse.

Existem pelo menos 5 abordagens que podem ser usadas para retirar i dar novo ou modificado. Para obter uma estratégia de atualização eficiente do dar uma mistura dessas abordagens que capta todas as mudanças no sistema pode ser útil.

A primeira abordagem, que usa timestamps, assume que ela é atribuída a todos os dar modificou e atualizou um carimbo de data/hora para que você possa identificar facilmente todos dar modificado e novo. Essa abordagem, no entanto, não tem sido amplamente utilizada na maioria dos sistemas operacionais hoje.
A segunda abordagem é usar um arquivo delta gerado por um aplicativo que contém apenas as alterações feitas no dar. O uso desse arquivo também amplifica o ciclo de atualização. No entanto, mesmo este método não tem sido usado em muitas aplicações.
A terceira abordagem é verificar um arquivo de log, que basicamente contém informações semelhantes ao arquivo delta. A única diferença é que um arquivo de log é criado para o processo de recuperação e pode ser difícil de entender.
A quarta abordagem é modificar o código do aplicativo. No entanto, a maior parte do código do aplicativo é antiga e frágil; portanto, esta técnica deve ser evitada.
A última abordagem é comparar o dar fontes com o arquivo principal de dar.

Controle das atividades de data warehouse

Uma vez que o data warehouse tenha sido liberado para os usuários, ele precisa ser monitorado ao longo do tempo. Nesse caso, o administrador do data warehouse pode empregar uma ou mais ferramentas de gerenciamento e controle para monitorar o uso do data warehouse. Em particular, podem ser coletadas informações sobre as pessoas e a hora em que elas acessam o data warehouse. Vamos dar coletado, pode ser criado um perfil do trabalho realizado que pode ser utilizado como entrada na implementação do estorno do usuário. O Chargeback permite que os usuários sejam informados sobre o custo de processamento do data warehouse.

Além disso, o controle do data warehouse também pode ser usado para identificar os tipos de consultas, seu tamanho, número de consultas por dia, tempos de reação das consultas, setores atingidos e quantidade de dar processado. Outro propósito de verificar o data warehouse é identificar o dar que não estão em uso. Esses dar eles podem ser removidos do data warehouse para melhorar o tempo

resposta de execução de consulta e controle do crescimento de dar que residem dentro do base de dados do datawarehouse.

Gerenciamento de segurança do data warehouse

Um data warehouse contém dar integrado, crítico, sensível que pode ser alcançado facilmente. Por esta razão, deve ser protegido de usuários não autorizados. Uma maneira de implementar a segurança é usar a função del DBMS para atribuir diferentes privilégios a diferentes tipos de usuários. Desta forma, deve ser mantido um perfil de acesso para cada tipo de usuário. Outra maneira de proteger o data warehouse é criptografá-lo conforme escrito no base de dados do datawarehouse. Acesso a dar e as ferramentas de recuperação devem descriptografar o dar antes de apresentar os resultados aos usuários.

2.4.4 Armazém de dados Fase de Implantação

É a última fase do ciclo de implementação do data warehouse. As atividades a serem realizadas nesta fase incluem o treinamento dos usuários para o uso do data warehouse e a realização de revisões do data warehouse.

Treinamento de usuário

O treinamento do usuário deve ser feito antes de acessar o dar do datawarehouse e o uso de ferramentas de recuperação. Geralmente, as sessões devem começar com uma introdução ao conceito de armazenamento de dar, ao conteúdo do data warehouse, ao meta dar e as características básicas das ferramentas. Então, usuários mais avançados também poderiam estudar as tabelas físicas e os recursos dos usuários de ferramentas de acesso e recuperação de dados.

Existem muitas abordagens para treinar usuários. Uma delas envolve uma seleção de muitos usuários ou analistas escolhidos por um conjunto de usuários, com base em suas habilidades de liderança e comunicação. Eles são treinados a título pessoal em tudo o que precisam saber para se familiarizar com o sistema. Terminado o treinamento, eles retornam ao seu trabalho e começam a ensinar outros usuários a usar o sistema. No

com base no que aprenderam, outros usuários podem começar a explorar o data warehouse.
Outra abordagem é treinar muitos usuários ao mesmo tempo, como se estivesse fazendo um curso em sala de aula. Este método é adequado quando há muitos usuários que precisam ser treinados ao mesmo tempo. Ainda outro método é treinar cada usuário individualmente, um por um. Este método é adequado quando há poucos usuários.

O objetivo do treinamento do usuário é familiarizar-se com o acesso dar e as ferramentas de recuperação, bem como o conteúdo do data warehouse. No entanto, alguns usuários podem ficar sobrecarregados com a quantidade de informações fornecidas durante a sessão de treinamento. Em seguida, várias sessões de atualização devem ser feitas sobre o suporte contínuo e para responder a perguntas específicas. Em alguns casos, é formado um grupo de usuários para prestar esse tipo de suporte.

Coletando feedback

Uma vez que o data warehouse tenha sido implementado, os usuários podem usar i dar que residem no data warehouse para diversos fins. Principalmente, analistas ou usuários usam o dar no data warehouse para:

  1. 1 Identifique as tendências da empresa
  2. 2 Analisar os perfis de compra de clientes
  3. 3 Divida eu clientes e
  4. 4 Fornecer os melhores serviços para clientes - personalizar serviços
  5. 5 Formule estratégias especialistas em Marketing
  6. 6 Faça estimativas competitivas para análises de custos e ajude a controlar
  7. 7 Apoiar a tomada de decisões estratégicas
  8. 8 Identificar oportunidades para surgir
  9. 9 Melhorar a qualidade dos processos de negócios atuais
  10. 10 Verifique o lucro

Seguindo a direção de desenvolvimento do data warehouse, uma série de revisões no sistema pode ser realizada para obter feedback

tanto da equipe de desenvolvimento quanto da comunidade de usuários finais.
Os resultados obtidos podem ser levados em consideração para o próximo ciclo de desenvolvimento.

Como o data warehouse adota uma abordagem incremental, é essencial aprender com os acertos e erros de desenvolvimentos anteriores.

2.5 Resumo

Abordagens encontradas na literatura foram discutidas neste capítulo. A seção 1 discutiu o conceito de data warehouse e seu papel na ciência da decisão. A Seção 2 descreve as principais diferenças entre os sistemas de data warehouse e OLTP. Na seção 3 discutimos o modelo de data warehouse da Monash que foi usado na seção 4 para descrever as atividades envolvidas no processo de desenvolvimento de um data warehouse, essas teses não foram baseadas em pesquisas rigorosas. O que acontece na realidade pode ser muito diferente do que a literatura relata, porém esses resultados podem ser usados ​​para criar um pano de fundo que sublinhe o conceito de data warehouse para esta pesquisa.

Capítulo 3

Métodos de pesquisa e design

Este capítulo trata dos métodos de pesquisa e design para este estudo. A primeira parte apresenta uma visão genérica dos métodos de busca disponíveis para recuperação da informação, e são discutidos os critérios de seleção do melhor método para um determinado estudo. Na seção 2, dois métodos selecionados com os critérios estabelecidos acima são discutidos; um deles será escolhido e adotado com as razões expostas na seção 3 onde também são apresentadas as razões para a exclusão do outro critério. A seção 4 apresenta o projeto de pesquisa e a seção 5 as conclusões.

3.1 Pesquisa em sistemas de informação

A pesquisa em sistemas de informação não se limita apenas à tecnologia, mas também deve ser estendida para incluir propósitos comportamentais e organizacionais.
Devemos isso às teses de várias disciplinas que vão das ciências sociais às naturais; isso leva à necessidade de um certo espectro de métodos de pesquisa envolvendo métodos quantitativos e qualitativos a serem usados ​​para sistemas de informação.
Todos os métodos de pesquisa disponíveis são importantes, de fato vários pesquisadores como Jenkins (1985), Nunamaker et al. (1991) e Galliers (1992) argumentam que não existe um método universal específico para a realização de pesquisas nas diversas áreas de sistemas de informação; na verdade, um método pode ser adequado para uma pesquisa específica, mas não para outras. Isso nos leva à necessidade de selecionar um método adequado ao nosso projeto de pesquisa específico: para essa escolha, Benbasat et al. (1987) afirmam que a natureza e o propósito da pesquisa devem ser considerados.

3.1.1 Natureza da pesquisa

Os vários métodos de pesquisa baseados na natureza podem ser classificados em três tradições amplamente conhecidas na ciência da informação: pesquisa positivista, interpretativa e crítica.

3.1.1.1 Pesquisa positivista

A pesquisa positivista também é conhecida como estudo científico ou empírico. Procura: “explicar e prever o que vai acontecer no mundo social olhando para as regularidades e relações de causa e efeito entre os elementos que o constituem” (Shanks et al 1993).

A pesquisa positivista também se caracteriza pela repetibilidade, simplificações e refutações. Além disso, a pesquisa positivista admite a existência de relações a priori entre os fenômenos estudados.
Segundo Galliers (1992) a taxonomia é um método de pesquisa inserido no paradigma positivista, mas que não se limita a ele, na verdade existem experimentos de laboratório, experimentos de campo, estudos de caso, provas de teoremas, previsões e simulações. Usando esses métodos, os pesquisadores admitem que os fenômenos estudados podem ser observados de forma objetiva e rigorosa.

3.1.1.2 Pesquisa interpretativa

A pesquisa interpretativa, muitas vezes chamada de fenomenologia ou antipositivismo, é descrita por Neuman (1994) como "a análise sistemática do significado social da ação por meio da observação direta e detalhada de pessoas em situações naturais, a fim de chegar à compreensão e a interpretação de como as pessoas criam e mantêm seu mundo social”. Estudos interpretativos rejeitam a suposição de que fenômenos observados podem ser observados objetivamente. Na verdade, eles são baseados em interpretações subjetivas. Além disso, os pesquisadores interpretativos não impõem significados a priori aos fenômenos que estudam.

Este método inclui estudos subjetivos/argumentativos, ações de pesquisa, estudos descritivos/interpretativos, pesquisas futuras e role playing. Além dessas investigações e estudos de caso, eles podem ser incluídos nesta abordagem, pois dizem respeito aos estudos de indivíduos ou organizações em situações complexas do mundo real.

3.1.1.3 Pesquisa crítica

A pesquisa crítica é a abordagem menos conhecida nas ciências sociais, mas tem recebido recentemente a atenção de pesquisadores da área de sistemas de informação. O pressuposto filosófico de que a realidade social é historicamente produzida e reproduzida pelas pessoas, assim como os sistemas sociais com suas ações e interações. Sua capacidade, no entanto, é mediada por uma série de considerações sociais, culturais e políticas.

Assim como a pesquisa interpretativa, a pesquisa crítica argumenta que a pesquisa positivista não tem nada a ver com o contexto social e ignora sua influência nas ações humanas.
A pesquisa crítica, por outro lado, critica a pesquisa interpretativa por ser muito subjetiva e porque não se propõe a ajudar as pessoas a melhorar suas vidas. A maior diferença entre a pesquisa crítica e as outras duas abordagens é sua dimensão avaliativa. Enquanto a objetividade das tradições positivista e interpretativa é prever ou explicar o status quo ou a realidade social, a pesquisa crítica visa avaliar criticamente e transformar a realidade social em estudo.

Pesquisadores críticos geralmente se opõem ao status quo para remover as diferenças sociais e melhorar as condições sociais. A pesquisa crítica tem um compromisso com uma visão processual dos fenômenos de interesse e, portanto, normalmente é longitudinal. Exemplos de métodos de pesquisa são estudos históricos de longo prazo e estudos etnográficos. A pesquisa crítica, no entanto, não tem sido amplamente utilizada na pesquisa de sistemas de informação.

3.1.2 Objetivo da pesquisa

Juntamente com a natureza da pesquisa, seu propósito pode ser usado para orientar o pesquisador na seleção de um método de pesquisa específico. A finalidade de um projeto de pesquisa está intimamente relacionada à posição da pesquisa em relação ao ciclo de pesquisa que consiste em três fases: construção da teoria, teste da teoria e refinamento da teoria. Assim, com base no momento em relação ao ciclo de pesquisa, um projeto de pesquisa pode ter finalidade explicativa, descritiva, exploratória ou preditiva.

3.1.2.1 Pesquisa exploratória

A pesquisa exploratória visa investigar um tema totalmente novo e formular perguntas e hipóteses para pesquisas futuras. Esse tipo de pesquisa é utilizado na construção da teoria para obter referências iniciais em uma nova área. Normalmente, são utilizados métodos de pesquisa qualitativa, como estudos de caso ou estudos fenomenológicos.

No entanto, também é possível empregar técnicas quantitativas, como investigações exploratórias ou experimentos.

3.1.3.3 Pesquisa descritiva

A pesquisa descritiva visa analisar e descrever em grande detalhe uma situação particular ou prática organizacional. Isso é apropriado para construir teorias e também pode ser usado para confirmar ou contestar hipóteses. A pesquisa descritiva geralmente envolve o uso de medições e amostras. Os métodos de pesquisa mais adequados incluem investigação e análise de antecedentes.

3.1.2.3 Pesquisa explicativa

A pesquisa explicativa tenta explicar por que as coisas acontecem. Baseia-se em fatos já estudados e tenta encontrar as razões para esses fatos.
Portanto, a pesquisa explicativa é normalmente construída em pesquisa exploratória ou descritiva e é auxiliar para testar e refinar as teorias. A pesquisa explicativa normalmente emprega estudos de caso ou métodos de pesquisa baseados em inquérito.

3.1.2.4 Pesquisa preventiva

A pesquisa preventiva visa prever os eventos e comportamentos sob observação que estão sendo estudados (Marshall e Rossman 1995). A previsão é o teste científico padrão da verdade. Esse tipo de pesquisa geralmente emprega investigação ou análise de dar historiadores. (Yin 1989)

A discussão acima demonstra que existem vários métodos de pesquisa possíveis que podem ser usados ​​em um estudo específico. No entanto, deve haver um método específico mais adequado que os outros para um determinado tipo de projeto de pesquisa. (Galliers 1987, Yin 1989, De Vaus 1991). Portanto, todo pesquisador precisa avaliar cuidadosamente os pontos fortes e fracos dos diversos métodos, a fim de adotar o método de pesquisa mais adequado e compatível com o projeto de pesquisa. (Jenkins 1985, Pervan e Klass 1992, Bonomia 1985, Yin 1989, Himilton e Ives 1992).

3.2. Possíveis métodos de pesquisa

O objetivo deste projeto foi estudar a experiência em organizações australianas com dar armazenado com um desenvolvimento de data warehouse. Dato que, atualmente, há carência de pesquisas na área de data warehousing na Austrália, este projeto de pesquisa ainda está na fase teórica do ciclo de pesquisa e tem um propósito exploratório. Explorar a experiência em organizações australianas que adotam data warehousing requer uma interpretação da sociedade real. Consequentemente, o pressuposto filosófico subjacente ao projeto de pesquisa segue a interpretação tradicional.

Após um exame rigoroso dos métodos disponíveis, foram identificados dois métodos de pesquisa possíveis: levantamentos e estudos de caso, que podem ser usados ​​para pesquisas exploratórias (Shanks et al. 1993). Galliers (1992) defende a adequação desses dois métodos para este estudo específico em sua taxonomia revisada dizendo que eles são adequados para construção teórica. As duas subseções a seguir discutem cada método em detalhes.

3.2.1 Método de investigação de investigação

O método de pesquisa de levantamento vem do antigo método de censo. Um censo consiste em coletar informações de uma população inteira. Este método é caro e impraticável, principalmente se a população for grande. Assim, em comparação com o censo, uma pesquisa geralmente se concentra na coleta de informações para um pequeno número, ou amostra, de representantes da população (Fowler 1988, Neuman 1994). Uma amostra reflete a população da qual é extraída, com diferentes níveis de precisão, de acordo com a estrutura da amostra, o tamanho e o método de seleção utilizado (Fowler 1988, Babbie 1982, Neuman 1994).

O método de pesquisa é definido como "instantâneos de práticas, situações ou pontos de vista em um determinado momento, realizados por meio de questionários ou entrevistas, dos quais podem ser inferidas
feito” (Galliers 1992: 153) [instantâneo de práticas, situações ou pontos de vista em um determinado momento, realizado por meio de questionários ou entrevistas, a partir dos quais podem ser feitas inferências]. As pesquisas estão preocupadas com a coleta de informações sobre certos aspectos do estudo de vários participantes por meio de perguntas (Fowler 1988). Esses questionários e entrevistas, que incluem entrevistas presenciais por telefone e entrevistas estruturadas, também são as técnicas de coleta de dar mais comumente usado em investigações (Blalock 1970, Nachmias e Nachmias 1976, Fowler 1988), observações e análises podem ser usadas (Gable 1994). De todos esses métodos de coleta do dar, o uso do questionário é a técnica mais popular, pois garante que eu dar

coletadas são estruturadas e formatadas, o que facilita a classificação das informações (Hwang 1987, de Vaus 1991).

Ao analisar o dar, uma estratégia de pesquisa geralmente emprega técnicas quantitativas, como análise estatística, mas técnicas qualitativas também podem ser empregadas (Galliers 1992, Pervan

e Klass 1992, Gable 1994). Normalmente, eu dar coletadas são usadas para analisar as distribuições e padrões das associações (Fowler 1988).

Embora as pesquisas sejam geralmente apropriadas para pesquisas que lidam com a questão 'o quê?' (o quê) ou derivando dele, como 'quanto' (quanto) e 'quantum' (quantos), eles podem ser perguntados por meio da pergunta 'por que' (Sonquist e Dunkelberg 1977, Yin 1989). Segundo Sonquist e Dunkelberg (1977), a investigação da investigação aponta para hipóteses difíceis, programas de avaliação, descrição da população e desenvolvimento de modelos de comportamento humano. Além disso, pesquisas podem ser usadas para estudar uma determinada opinião da população, condições, opiniões, características, expectativas e até mesmo comportamentos passados ​​ou presentes (Neuman 1994).

As investigações permitem ao pesquisador descobrir as relações entre a população e os resultados são geralmente mais genéricos do que outros métodos (Sonquist e Dunkelberg 1977, Gable 1994). As pesquisas permitem aos pesquisadores cobrir uma área geográfica mais ampla e alcançar um grande número de respondentes (Blalock 1970, Sonquist e Dunkelberg 1977, Hwang e Lin 1987, Gable 1994, Neuman 1994). Finalmente, as pesquisas podem fornecer informações que não estão disponíveis em nenhum outro lugar ou na forma exigida para análise (Fowler 1988).

Existem, no entanto, algumas limitações na realização de uma investigação. Uma desvantagem é que o pesquisador não pode obter muitas informações sobre o objeto que está sendo estudado. Isso se deve ao fato de que as pesquisas são realizadas apenas em um determinado momento e, portanto, há um número limitado de variáveis ​​e pessoas que o pesquisador pode

estudar (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Outra desvantagem é que a realização de uma investigação pode ser muito dispendiosa em termos de tempo e recursos, principalmente se envolver entrevistas pessoais (Fowler 1988).

3.2.2. Método de pesquisa de investigação

O método de investigação por inquérito envolve o estudo aprofundado de uma situação particular dentro do seu contexto real durante um período de tempo definido, sem qualquer intervenção do investigador (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Principalmente este método é usado para descrever as relações entre as variáveis ​​que estão sendo estudadas em uma situação particular (Galliers 1992). As investigações podem envolver casos únicos ou múltiplos, dependendo do fenômeno analisado (Franz e Robey 1987, Eisenhardt 1989, Yin 1989).

O método de pesquisa de investigação é definido como "uma investigação empírica que estuda um fenômeno contemporâneo dentro de seu contexto real, usando múltiplas fontes reunidas de uma ou mais entidades, como pessoas, grupos ou organizações" (Yin 1989). Não há separação clara entre o fenômeno e seu contexto e não há controle experimental ou manipulação das variáveis ​​(Yin 1989, Benbasat et al 1987).

Existe uma variedade de técnicas para a coleta de dar que podem ser utilizados no método de investigação, que incluem observações diretas, revisão de fichas, questionários, revisão de documentação e entrevistas estruturadas. Ter uma gama diversificada de técnicas de coleta dar, as investigações permitem aos pesquisadores lidar tanto com dar qualitativa e quantitativa ao mesmo tempo (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Assim como no método survey, o pesquisador investigativo atua como observador ou pesquisador e não como participante ativo na organização que está sendo estudada.

Benbasat et al.(1987) afirmam que o método de investigação é particularmente adequado para a construção da teoria de pesquisa, que começa com uma pergunta de pesquisa e continua com o treinamento.

de uma teoria durante o processo de coleta dar. Sendo também adequado para o palco

de construção de teoria, Franz e Robey (1987) sugerem que o método de investigação também pode ser usado para o estágio de teoria complexa. Nesse caso, com base nas evidências reunidas, uma determinada teoria ou hipótese é verificada ou refutada. Além disso, a investigação também é adequada para pesquisas que lidam com as questões 'como' ou 'por que' (Yin 1989).

Comparadas a outros métodos, as pesquisas permitem que o pesquisador capture informações essenciais com mais detalhes (Galliers 1992, Shanks et al. 1993). Além disso, as investigações permitem ao pesquisador compreender a natureza e complexidade dos processos estudados (Benbasat et al 1987).

Existem quatro desvantagens principais associadas ao método de investigação. A primeira é a falta de deduções controladas. A subjetividade do pesquisador pode alterar os resultados e conclusões do estudo (Yin 1989). A segunda desvantagem é a falta de observação controlada. Ao contrário dos métodos experimentais, o pesquisador investigativo não pode controlar os fenômenos estudados, uma vez que são examinados em seu contexto natural (Gable 1994). A terceira desvantagem é a falta de replicabilidade. Isso se deve ao fato de que é improvável que o pesquisador observe os mesmos eventos e não possa verificar os resultados de um determinado estudo (Lee 1989). Finalmente, como consequência da não replicabilidade, é difícil generalizar os resultados obtidos de uma ou mais pesquisas (Galliers 1992, Shanks et al. 1993). Todos esses problemas, no entanto, não são intransponíveis e podem, de fato, ser minimizados pelo pesquisador aplicando ações apropriadas (Lee 1989).

3.3. Justifique a metodologia de pesquisa adotado

Dos dois métodos de pesquisa possíveis para este estudo, o método survey é considerado o mais adequado. O de investigação foi descartado após uma cuidadosa consideração dos relativos

méritos e fraquezas. A conveniência ou inadequação de cada método para este estudo é discutida abaixo.

3.3.1. Método de pesquisa impróprio de inquérito

O método de investigação requer um estudo aprofundado de uma situação particular dentro de uma ou mais organizações durante um período de tempo (Eisenhardt 1989). Nesse caso, o período pode exceder o prazo dado para este estudo. Outra razão para não adotar o método de investigação é que os resultados podem sofrer com a falta de rigor (Yin 1989). A subjetividade do pesquisador pode influenciar os resultados e conclusões. Outra razão é que este método é mais adequado para pesquisas sobre questões do tipo 'como' ou 'por que' (Yin 1989), enquanto a questão de pesquisa para este estudo é do tipo 'o quê'. Por último, mas não menos importante, é difícil generalizar os resultados de apenas uma ou algumas pesquisas (Galliers 1992, Shanks et al 1993). Com base nesse raciocínio, o método de pesquisa de inquérito não foi escolhido por ser inadequado para este estudo.

3.3.2. Conveniência do método de pesquisa vistoria

Na época em que esta pesquisa foi realizada, a prática de data warehousing não havia sido amplamente adotada pelas organizações australianas. Assim, não havia muitas informações sobre sua implementação dentro das organizações australianas. As informações disponíveis vieram de organizações que implementaram ou utilizaram um data warehouse. Neste caso, o método de pesquisa de investigação é o mais adequado, pois permite obter informações que não estão disponíveis em outro lugar ou na forma necessária para análise (Fowler 1988). Além disso, o método de pesquisa por inquérito permite ao pesquisador obter uma boa visão das práticas, situações ou visões em um determinado momento (Galliers 1992, Denscombe 1998). Uma visão geral foi necessária para aumentar o conhecimento sobre a experiência australiana de armazenamento de dados.

Além disso, Sonquist e Dunkelberg (1977) afirmam que os resultados da pesquisa de levantamento são mais gerais do que outros métodos.

3.4. Survey Research Design

A pesquisa sobre a prática de armazenamento de dados foi realizada em 1999. A população-alvo consistiu em organizações australianas interessadas em estudos de armazenamento de dados, pois provavelmente já estavam informadas sobre a dar que armazenam e, portanto, podem fornecer informações úteis para este estudo. A população-alvo foi identificada com uma pesquisa inicial de todos os membros australianos do 'The Data Warehousing Institute' (Tdwiaap). Esta seção discute o desenho da fase de pesquisa empírica deste estudo.

3.4.1. Técnica de coleta de dar

Das três técnicas comumente usadas em pesquisas de levantamento (ou seja, questionário por correio, entrevista por telefone e entrevista pessoal) (Nachmias 1976, Fowler 1988, de Vaus 1991), o questionário por correio foi adotado para este estudo. A primeira razão para adotar este último é que ele pode atingir uma população geograficamente dispersa (Blalock 1970, Nachmias e Nachmias 1976, Hwang e Lin 1987, de Vaus 1991, Gable 1994). Em segundo lugar, o questionário por correio é adequado para participantes altamente qualificados (Fowler 1988). O questionário enviado para este estudo foi dirigido aos patrocinadores, diretores e/ou gerentes de projeto de data warehouse. Terceiro, questionários por correio são adequados quando uma lista segura de endereços está disponível (Salant e Dilman 1994). A TDWI, neste caso, uma associação de armazenamento de dados confiável forneceu a lista de discussão de seus membros australianos. Outra vantagem do questionário por correio sobre o questionário por telefone ou entrevistas pessoais é que ele permite que os registrantes respondam com mais precisão, principalmente quando os registrantes precisam consultar registros ou discutir questões com outras pessoas (Fowler, 1988).

Uma desvantagem potencial pode ser o tempo necessário para conduzir os questionários pelo correio. Normalmente, um questionário por correio é conduzido nesta sequência: envio de cartas, espera por respostas e envio de confirmação (Fowler 1988, Bainbridge 1989). Assim, o tempo total pode ser maior do que o tempo necessário para entrevistas pessoais ou entrevistas por telefone. No entanto, o tempo total pode ser conhecido com antecedência (Fowler 1988, Denscombe 1998). O tempo gasto na realização de entrevistas pessoais não pode ser conhecido antecipadamente, pois varia de entrevista para entrevista (Fowler 1988). As entrevistas por telefone podem ser mais rápidas do que enviar questionários e entrevistas pessoais, mas podem ter uma alta taxa de não resposta devido à indisponibilidade de algumas pessoas (Fowler 1988). Além disso, as entrevistas por telefone são geralmente limitadas a listas relativamente curtas de perguntas (Bainbridge 1989).

Outra fraqueza de um questionário por correio é a alta taxa de não resposta (Fowler 1988, Bainbridge 1989, Neuman 1994). No entanto, contramedidas foram tomadas associando este estudo a uma instituição confiável no campo de armazenamento de dados (ou seja, TDWI) (Bainbridge 1989, Neuman 1994), que envia duas cartas de lembrete para não respondentes (Fowler 1988, Neuman 1994) e também inclui uma carta adicional explicando o propósito do estudo (Neuman 1994).

3.4.2. Unidade de análise

O objetivo deste estudo é obter informações sobre a implementação de data warehousing e seu uso dentro das organizações australianas. A população-alvo consiste em todas as organizações australianas que implementaram, ou estão implementando, data warehouse. Posteriormente, as organizações individuais são registradas. O questionário foi enviado para organizações interessadas em adotar data warehouse. Esse método garante que as informações coletadas sejam provenientes dos recursos mais adequados de cada organização participante.

3.4.3. Amostra de pesquisa

A lista de discussão dos respondentes da pesquisa foi obtida da TDWI. Dessa lista, 3000 organizações australianas foram selecionadas como base para a amostragem. Uma carta adicional explicando o desenho e o objetivo da pesquisa, juntamente com uma folha de respostas e um envelope pré-pago para devolver o questionário preenchido foram enviados à amostra. Das 3000 organizações, 198 concordaram em participar do estudo. Esperava-se um número tão pequeno de respostas data o grande número de organizações australianas que adotaram ou estavam adotando a estratégia de data warehouse em suas organizações. Assim, a população alvo deste estudo é composta por apenas 198 organizações.

3.4.4. Conteúdo do questionário

A estrutura do questionário foi baseada no modelo de armazenamento de dados da Monash (discutido anteriormente na parte 2.3). O conteúdo do questionário foi baseado na revisão de literatura apresentada no Capítulo 2. Uma cópia do questionário enviado aos participantes da pesquisa encontra-se no Anexo B. O questionário é composto por seis seções, que seguem os passos do modelo em tratamento. Os seis parágrafos a seguir resumem brevemente o conteúdo de cada seção.

Seção A: informações básicas sobre a organização
Esta seção contém questões relacionadas ao perfil das organizações participantes. Além disso, algumas das perguntas estão relacionadas à condição do projeto de armazenamento de dados do participante. Informações confidenciais, como o nome da organização, não foram divulgadas na análise da pesquisa.

Seção B: Iniciar
As perguntas nesta seção estão relacionadas ao negócio inicial de data warehousing. Foram feitas perguntas sobre os iniciadores do projeto, patrocinadores, habilidades e conhecimentos necessários, os objetivos do desenvolvimento de data warehouse e as expectativas do usuário final.

Seção C: Design
Esta seção contém perguntas relacionadas às atividades de planejamento do data warehouse. Em particular, as perguntas foram sobre o escopo de execução, a duração do projeto, o custo do projeto e a análise custo/benefício.

Seção D: Desenvolvimento
Na seção de desenvolvimento há questões relacionadas às atividades de desenvolvimento do data warehouse: coleção de requisitos do usuário final, fontes de dar, o modelo lógico de dar, protótipos, planejamento de capacidade, arquiteturas técnicas e seleção de ferramentas de desenvolvimento de data warehousing.

Seção E: Operação
Questões operacionais relacionadas à operação e extensibilidade do data warehouse, à medida que evolui no próximo estágio de desenvolvimento. Lá qualidade de dados, as estratégias de atualização do dar, a granularidade do dar, escalabilidade do data warehouse e as questões de segurança do data warehouse estavam entre os tipos de perguntas feitas.

Seção F: Desenvolvimento
Esta seção contém perguntas relacionadas ao uso do data warehouse pelos usuários finais. O pesquisador estava interessado no propósito e na utilidade do data warehouse, as estratégias de revisão e treinamento adotadas e a estratégia de controle do data warehouse adotado.

3.4.5. Taxa de resposta

Embora as consultas postais sejam criticadas por terem uma baixa taxa de resposta, foram tomadas medidas para aumentar a taxa de retorno (conforme discutido anteriormente na seção 3.4.1). O termo 'taxa de resposta' refere-se à porcentagem de pessoas em uma determinada amostra de pesquisa que respondem ao questionário (Denscombe 1998). A seguinte fórmula foi usada para calcular a taxa de resposta para este estudo:

Número de pessoas que responderam
Taxa de resposta = ——————————————————————————– X 100 Número total de questionários enviados

3.4.6. Teste de piloto

Antes do envio do questionário para a amostra, as questões foram examinadas por meio de testes piloto, como sugerido por Luck e Rubin (1987), Jackson (1988) e de Vaus (1991). O objetivo dos testes piloto é revelar todas as expressões desconfortáveis, ambíguas e difíceis de interpretar, esclarecer quaisquer definições e termos usados ​​e identificar o tempo aproximado necessário para preencher o questionário (Warwick e Lininger 1975, Jackson 1988, Salant and Dilman 1994). Os testes pilotos foram realizados selecionando sujeitos com características semelhantes às dos sujeitos finais, como sugerido por Davis e Cosenza (1993). Neste estudo, seis profissionais de data warehouse foram selecionados como sujeitos piloto. Após cada teste piloto, eram feitas as correções necessárias. A partir dos testes piloto realizados, os participantes contribuíram para remodelar e redefinir a versão final do questionário.

3.4.7. Métodos de Análise Di Dar

I dar Pesquisas coletadas de questionários de perguntas fechadas foram analisadas usando um pacote de programa estatístico chamado SPSS. Muitas das respostas foram analisadas por meio de estatística descritiva. Vários questionários retornaram incompletos. Estes foram tratados com mais cuidado para garantir que eu dar faltando não eram consequência de erros de entrada de dados, mas porque as perguntas não eram adequadas para o registrante, ou o registrante decidiu não responder a uma ou mais perguntas específicas. Essas respostas faltantes foram ignoradas durante a análise de dar e foram codificados como '- 9' para verificar sua exclusão do processo de análise.

Na elaboração do questionário, as questões fechadas foram pré-codificadas, atribuindo-se um número a cada opção. O número foi então usado para preparar o dar durante a análise (Denscombe 1998, Sapsford e Jupp 1996). Por exemplo, havia seis opções listadas na pergunta 1 da seção B: conselho de administração, executivo sênior, departamento de TI, unidade de negócios, consultores e muito mais. No arquivo de dar do SPSS, foi gerada uma variável para indicar 'iniciador do projeto', com seis rótulos de valor: '1' para 'conselho de administração', '2' para 'executivo de alto nível' e assim por diante. A utilização da escala Likertin em algumas das questões fechadas também permitiu uma identificação sem esforço dado o uso dos valores numéricos correspondentes inseridos no SPSS. Para questões com respostas não exaustivas, que não eram mutuamente exclusivas, cada opção foi tratada como uma única variável com dois rótulos de valor: '1' para 'marcado' e '2' para 'não marcado'.

As questões abertas foram tratadas de forma diferente das questões fechadas. As respostas a estas perguntas não foram inseridas no SPSS. Pelo contrário, eles foram analisados ​​à mão. O uso desse tipo de pergunta permite obter informações sobre as ideias livremente expressas e as experiências pessoais dos registrantes (Bainbridge 1989, Denscombe 1998). Sempre que possível, foi feita uma categorização das respostas.

Para a análise de dar, são utilizados métodos de análise estatística simples, como a frequência de respostas, a média, o desvio padrão e a mediana (Argyrous 1996, Denscombe 1998).
O teste Gamma foi eficaz na obtenção de medidas quantitativas das associações entre dar ordinais (Norusis 1983, Argyrous 1996). Esses testes eram apropriados porque as escalas ordinais utilizadas não tinham muitas categorias e podiam ser apresentadas em uma tabela (Norusis 1983).

3.5 Resumo

Neste capítulo, discutimos a metodologia de pesquisa e o desenho adotado para este estudo.

A seleção do método de pesquisa mais apropriado para um estudo particular leva em
consideração de uma série de regras, incluindo a natureza e o tipo de pesquisa, bem como os méritos e fraquezas de cada método possível (Jenkins 1985, Benbasat et al. 1097, Galliers e Land 1987, yin 1989, Hamilton e ives 1992, Galliers 1992, Neuman 1994). Dada a falta de conhecimento e teoria existentes sobre a adoção de data warehouse na Austrália, este estudo de pesquisa requer um método de pesquisa interpretativa com capacidade exploratória para explorar as experiências das organizações australianas. O método de pesquisa escolhido foi selecionado para reunir informações sobre a adoção do conceito de data ware-housing por organizações australianas. Um questionário postal foi escolhido como técnica de coleta dar. As justificativas para o método de pesquisa e a técnica de coleta dar selecionados serão fornecidos neste capítulo. Além disso, foi apresentada uma discussão sobre a unidade de análise, a amostra utilizada, os percentuais de respostas, o conteúdo do questionário, o pré-teste do questionário e o método de análise do questionário. dar.

Criando um Armazém de dados:

Combinando relacionamento de entidade e modelagem dimensional

RESUMO
Loja i dar é um grande problema atual para muitas organizações. Um problema-chave no desenvolvimento do armazenamento de dar é o seu desígnio.
O design deve apoiar a detecção de conceitos no data warehouse um sistema legado e outras fontes de dar e também uma fácil compreensão e eficiência na implementação de data warehouse.
Grande parte da literatura de armazenamento dar recomenda o uso de modelagem de relacionamento de entidade ou modelagem dimensional para representar o design de data warehouse.
Nesta revista mostramos como ambas as representações podem ser combinadas em uma abordagem de design data warehouse. A abordagem usada é sistematicamente

examinado em um estudo de caso e é identificado em uma série de implicações importantes com os profissionais.

ARMAZENAMENTO DE DADOS

Un data warehouse geralmente é definido como uma "coleção de dados orientada por assunto, integrada, variável no tempo e não volátil para apoiar as decisões da administração" (Inmon e Hackathorn, 1994). Orientado para o assunto e integrado significa que o data warehouse é projetado para cruzar os limites funcionais dos sistemas legados para oferecer uma perspectiva integrada de dar.
A variante temporal afeta a natureza histórica ou de série temporal de dar num data warehouse, o que permite analisar tendências. Não volátil indica que o data warehouse não é continuamente atualizado como um banco de dados de OLTP. Em vez disso, é atualizado periodicamente, com dar de fontes internas e externas. O data warehouse ele é projetado especificamente para pesquisa em vez de atualizar a integridade e o desempenho da operação.
A ideia de armazenar i dar não é novo, tem sido um dos propósitos de gestão da dar desde 1982 (Il Martin, XNUMX).
I data warehouse eles oferecem a infraestrutura dar para sistemas de apoio à gestão. Os sistemas de apoio à gestão incluem sistemas de apoio à decisão (DSS) e sistemas de informação executiva (EIS). Um SAD é um sistema de informação baseado em computador que é projetado para melhorar a tomada de decisão e o processo humano. Um EIS é tipicamente um sistema de entrega de dar que permite aos executivos de negócios acessar facilmente a visão de dar.
A arquitetura geral de um data warehouse destaca o papel de data warehouse no apoio à gestão. Além de oferecer a infraestrutura dar para EIS e DSS, al data warehouse ele pode ser acessado diretamente por meio de consultas. A dar incluído em um data warehouse baseiam-se na análise dos requisitos de informação de gestão e são obtidos a partir de três fontes: sistemas legados internos, sistemas de captura de dados para fins especiais e fontes de dados externas. O dar em sistemas legados internos são frequentemente redundantes, inconsistentes, de baixa qualidade e armazenados em formatos diferentes, portanto devem ser reconciliados e limpos antes de serem carregados no

data warehouse (Inmon, 1992; McFadden, 1996). A dar de sistemas de armazenamento dar ad hoc e de fontes dar externos são gastos usados ​​para aumentar (atualizar, substituir) i dar de sistemas legados.

Existem muitas razões convincentes para desenvolver um data warehouse, que incluem uma melhor tomada de decisão por meio do uso eficaz de mais informações (Ives 1995), suporte para um foco em assuntos inteiros (Graham 1996) e redução nos custos de tomada de decisão dar para EIS e DSS (Graham 1996, McFadden 1996).

Um estudo empírico recente encontrou, em média, um retorno sobre o investimento para i data warehouse em 401% após três anos (Graham, 1996). No entanto, os outros estudos empíricos de data warehouse encontrou problemas significativos, incluindo dificuldade em medir e alocar benefícios, falta de propósito claro, subestimar o escopo e a complexidade do processo de armazenamento dar, principalmente no que diz respeito às fontes e à limpeza do dar. Armazenar eu dar pode ser considerada como uma solução para o problema de gestão dar entre organizações. A manipulação de dar como um recurso social, permaneceu como um dos principais problemas no gerenciamento de sistemas de informação em todo o mundo por muitos anos (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

Uma abordagem popular para gerenciar dar nos anos oitenta foi o desenvolvimento de um modelo dar social. Modelo dar social foi projetado para oferecer uma base estável para o desenvolvimento de novos sistemas de aplicativos e banco de dados e a reconstrução e integração de sistemas legados (Brancheau et al.

1989, Goodhue e outros. 1988:1992, Kim e Everest 1994). No entanto, existem vários problemas com esta abordagem, em particular, a complexidade e o custo de cada tarefa, e o longo tempo necessário para alcançar resultados tangíveis (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997 ).

Il data warehouse é um banco de dados separado que coexiste com os bancos de dados legados em vez de substituí-los. Assim, permite-lhe dirigir a gestão de dar e evitar a reconstrução dispendiosa de sistemas legados.

ABORDAGENS EXISTENTES PARA O DESENHO DE DATA

ARMAZÉM

O processo de construção e aperfeiçoamento de um data warehouse deve ser entendido mais como um processo evolutivo do que como um ciclo de vida de desenvolvimento de sistemas tradicional (Desio, 1995, Shanks, O'Donnell e Arnott 1997a). Existem muitos processos envolvidos em um projeto data warehouse como inicialização, programação; informações adquiridas a partir dos requisitos solicitados aos gestores da empresa; fontes, transformações, limpeza de dar e sincronizar de sistemas legados e outras fontes dar; sistemas de entrega em desenvolvimento; monitoramento de data warehouse; e insensatez do processo evolutivo e da construção de uma data warehouse (Stinchi, O'Donnell e Arnott 1997b). Neste diário, nos concentramos em como desenhar i dar armazenados no contexto desses outros processos. Há uma série de abordagens propostas para a arquitetura de vídeo data warehouse na literatura (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Cada uma dessas metodologias tem uma breve revisão com uma análise de seus pontos fortes e fracos.

Abordagem de Inmon (1994) para Armazém de dados Design

Inmon (1994) propôs quatro etapas iterativas para projetar um data warehouse (ver Figura 2). O primeiro passo é criar um modelo dar social para entender como eu dar podem ser integrados em áreas funcionais dentro de uma organização, subdividindo i dar armazenar em áreas. Modelo dar é feito para armazenamento dar relacionadas à tomada de decisão, incluindo dar histórico, e incluído dar deduzido e agregado. O segundo passo é identificar áreas temáticas para implementação. Estes são baseados em prioridades determinadas por uma determinada organização. A terceira etapa consiste em desenhar um banco de dados para a área de assunto, preste atenção especial para incluir níveis apropriados de granularidade. Inmon recomenda usar o modelo de entidade e relacionamento. A quarta etapa é identificar os sistemas de origem dar necessários e desenvolver processos de transformação para capturar, limpar e formatar i dar.

Os pontos fortes da abordagem do Inmon são que o modelo dar social oferece a base para a integração de dar dentro da organização e suporte de planejamento para o desenvolvimento iterativo de data warehouse. Suas desvantagens são a dificuldade e o custo de projetar o modelo dar social, a dificuldade em entender modelos de entidades e relacionamentos usados ​​em ambos os modelos, que dar social e de dar armazenados por área de assunto, e a adequação de dar do desenho de data warehouse para a realização de banco de dados relacional, mas não para banco de dados multidimensional.

Abordagem de Ives (1995) para Armazém de dados Design

Ives (1995) propõe uma abordagem de quatro etapas para projetar um sistema de informação que ele acredita ser aplicável ao projeto de um data warehouse (ver Figura 3). A abordagem é muito baseada na Engenharia da Informação para o desenvolvimento de sistemas de informação (Martin 1990). O primeiro passo é determinar seus objetivos, sucesso e fatores críticos e indicadores-chave de desempenho. Os principais processos de negócios e as informações necessárias são modelados para nos levar a um modelo dar social. A segunda etapa envolve o desenvolvimento de uma arquitetura de definição dar armazenado por áreas, banco de dados di data warehouse, os componentes de tecnologia necessários, o conjunto de suporte organizacional necessário para implementar e operar com data warehouse. A terceira etapa inclui a seleção de pacotes de software e ferramentas necessárias. A quarta etapa é o projeto detalhado e a construção do data warehouse. Ives observa que para armazenar dar é um processo iterativo restrito.

Os pontos fortes da abordagem Ives são o uso de especificações técnicas para determinar os requisitos de informação, o uso de um processo estruturado para apoiar a integração de data warehouse, a seleção apropriada de hardware e software e o uso de técnicas de representação múltipla para o data warehouse. Suas falhas são inerentes à complexidade. Outros incluem dificuldade em desenvolver muitos níveis de banco de dados dentro do data warehouse em tempo e custo razoáveis.

A abordagem de Kimball (1994) para Armazém de dados Design

Kimball (1994) propôs cinco etapas iterativas para projetar um data warehouse (ver Figuras 4). A sua abordagem é particularmente dedicada ao desenho de um solo data warehouse e sobre o uso de modelos dimensionais em preferência a modelos de entidade e relacionamento. Kimball analisa esses modelos dimensionais porque é mais fácil para os líderes empresariais entenderem os negócios, é mais eficiente ao lidar com consultas complexas e o design de banco de dados físico é mais eficiente (Kimball 1994). Kimball reconhece que o desenvolvimento de um data warehouse é iterativo, e isso data warehouse separados podem ser integrados através da divisão em tabelas de dimensões comuns.

O primeiro passo é identificar a área específica a ser aperfeiçoada. A segunda e terceira etapas envolvem modelagem dimensional. Na segunda etapa, as medidas identificam coisas de interesse na área de assunto e as agrupam em uma tabela de fatos. Por exemplo, em uma área de vendas, as medidas de interesse podem incluir a quantidade de itens vendidos e o dólar como moeda de vendas. A terceira etapa envolve a identificação de dimensões que são as formas pelas quais os fatos podem ser agrupados. Em uma área de assunto de vendas, as dimensões relevantes podem incluir item, local e período de tempo. A tabela de fatos tem uma chave de várias partes para vinculá-la a cada uma das tabelas de dimensão e geralmente contém um número muito grande de fatos. Por outro lado, as tabelas de dimensão contêm informações descritivas sobre dimensões e outros atributos que podem ser usados ​​para agrupar fatos. A tabela de fatos e dimensões associada proposta forma o que é chamado de esquema em estrela devido à sua forma. A quarta etapa envolve a construção de um banco de dados multidimensional para aperfeiçoar o padrão da estrela. A etapa final é identificar os sistemas de origem dar necessários e desenvolver processos de transformação para capturar, limpar e formatar i dar.

Os pontos fortes da abordagem de Kimball incluem o uso de modelos dimensionais para representar i dar armazenados, o que facilita a compreensão e leva a um design físico eficiente. Um modelo dimensional que também usa prontamente ambos os sistemas banco de dados sistemas relacionais podem ser aperfeiçoados ou sistemas banco de dados multidimensional. Suas falhas incluem a falta de algumas técnicas para facilitar o planejamento ou integração de muitos esquemas estelares dentro de um data warehouse e a dificuldade de projetar a partir da estrutura desnormalizada extrema em um modelo dimensional um dar no sistema legado.

Abordagem de dados de McFadden (1996) Design de Armazém

McFadden (1996) propõe uma abordagem de cinco etapas para desenhar um data warehouse (veja a Figura 5).
Sua abordagem é baseada em uma síntese de ideias da literatura e é focada no design de um único data warehouse. A primeira etapa envolve uma análise de requisitos. Embora as especificações técnicas não sejam prescritas, as notas de McFadden identificam entidades dar especificações e seus atributos, e refere-se aos leitores Watson e Frolick (1993) para capturar os requisitos.
Na segunda etapa, um modelo de entidade de relacionamento é desenhado para data warehouse e depois validado pelos executivos da empresa. A terceira etapa envolve determinar o mapeamento de sistemas legados e fontes externas de data warehouse. A quarta etapa envolve processos de desenvolvimento, implantação e sincronização dar em data warehouse. Na etapa final, a entrega do sistema é desenvolvida com ênfase em uma interface com o usuário. McFadden observa que o processo de desenho é geralmente iterativo.

Os pontos fortes da abordagem de McFadden são o envolvimento dos líderes empresariais na determinação dos requisitos, bem como a importância dos recursos darsua limpeza e coleta. Suas falhas são a falta de um processo para dividir um grande projeto data warehouse em muitos estágios integrados, e o

dificuldade em compreender os modelos de entidade e relacionamento usados ​​na concepção de data warehouse.

Não são apenas aqueles que estão próximos de nós que nos escolhem.

    0/5 (0 Avaliações)
    0/5 (0 Avaliações)
    0/5 (0 Avaliações)

    Saiba mais na Agência Web Online

    Inscreva-se para receber os artigos mais recentes por e-mail.

    avatar do autor
    admin CEO
    👍Agência Web Online | Agência Web especialista em Marketing Digital e SEO. Agência Web Online é uma agência web. Para a Agenzia Web Online, o sucesso na transformação digital é baseado nos fundamentos do Iron SEO versão 3. Especialidades: Integração de Sistemas, Integração de Aplicações Corporativas, Arquitetura Orientada a Serviços, Computação em Nuvem, Data Warehouse, Business Intelligence, Big Data, portais, intranets, Aplicações Web Desenho e gestão de bases de dados relacionais e multidimensionais. Desenho de interfaces para meios digitais: usabilidade e gráficos. A Agência Web Online oferece às empresas os seguintes serviços: -SEO no Google, Amazon, Bing, Yandex; -Web Analytics: Google Analytics, Google Tag Manager, Yandex Metrica; -Conversões de usuários: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM no Google, Bing, Amazon Ads; -Marketing em mídias sociais (Facebook, Linkedin, Youtube, Instagram).
    Minha privacidade ágil
    Este site usa cookies técnicos e de perfil. Ao clicar em aceitar, você autoriza todos os cookies de perfil. Ao clicar em rejeitar ou no X, todos os cookies de perfil são rejeitados. Ao clicar em personalizar é possível selecionar quais cookies de perfil ativar.
    Este site está em conformidade com a Lei de Proteção de Dados (LPD), Lei Federal Suíça de 25 de setembro de 2020, e com o GDPR, Regulamento da UE 2016/679, relativo à proteção de dados pessoais, bem como à livre circulação de tais dados.