fbpx

Almacén de datos y ERP | ARCHIVO CENTRAL DE DATOS: HISTORIA Y EVOLUCIONES

ARCHIVO DATOS CENTRAL: HISTORIA Y EVOLUCIONES


Los dos temas dominantes de la tecnología corporativa en los noventa son
afirma yo almacenamiento de datos y el ERP. Durante mucho tiempo estos dos poderosos
corrientes han sido parte de la TI corporativa sin haber tenido
intersecciones. Era casi como si fueran materia y antimateria. Pero
el crecimiento de ambos fenómenos condujo inevitablemente a una
su intersección. Hoy, las empresas se enfrentan al problema de
que hacer con ERP e almacenamiento de datos. Este artículo ilustrará
cuáles son los problemas y cómo los abordan las empresas.
AL PRINCIPIO…
Al principio estaba el almacenamiento de datos. Almacén de datos nació para
contrarrestar el sistema de solicitud de procesamiento de transacciones.
En los primeros días, la memorización de la adquirir que estaba destinado a ser
solo un contrapunto a las aplicaciones de procesamiento de
actas. Pero hoy en día existen visiones mucho más sofisticadas
que que almacenamiento de datos. En el mundo de hoy el
almacenamiento de datos se inserta dentro de una estructura que puede ser
llamada Fábrica de Información Corporativa.
LA FÁBRICA DE INFORMACIÓN CORPORATIVA
(CIF)
La Fábrica de Información Corporativa tiene componentes arquitectónicos
estándar: un nivel de transformación e integración de código
que integra i adquirir mientras yo adquirir se mueven del entorno de
aplicación ambiental de la almacenamiento de datos de la compañia; a
almacenamiento de datos de la empresa donde yo adquirir
Historias detalladas e integradas. La almacenamiento de datos de la empresa sirve como
base sobre la cual se pueden construir todas las demás partes
del entorno de almacenamiento de datos; un almacén de datos operativos (ODS).
Un ODS es una estructura híbrida que contiene algunos aspectos de los datos.
almacén y otros aspectos de un entorno OLTP; mercados de datos, en los que yo
diferentes departamentos pueden tener su propia versión de los datos
depósito; a almacenamiento de datos de exploración en la que yo
Los "pensadores" de la empresa pueden presentar sus consultas
72 horas sin efectos nocivos sobre almacenamiento de datos; y un recuerdo
cerca de la línea, en la que adquirir viejo y adquirir el detalle a granel puede ser
almacenado barato.
DONDE ERP SE COMBINA CON EL
FÁBRICA DE INFORMACIÓN CORPORATIVA
El ERP se fusiona con la Fábrica de Información Corporativa en dos lugares.
Primero como una aplicación básica (línea de base) que proporciona la
adquirir de la aplicación a almacenamiento de datos. En este caso yo adquirir,
generado como subproducto de un proceso de transacción,
están integrados y cargados en el almacenamiento de datos de la compañia. La
segundo punto de unión entre ERP y CIF y el ODS. De hecho, muchos
entornos el ERP se utiliza como un clásico ODS.
En caso de que ERP se utilice como aplicación principal,
El mismo ERP también se puede utilizar en CIF como ODS. En
sin embargo, si el ERP se va a utilizar en ambos roles, hay
debe haber una distinción clara entre las dos entidades. En otras palabras,
cuando ERP juega el papel de aplicación central y ODS, el
dos entidades arquitectónicas deben ser distintas. Si un solo
implementar un ERP intenta jugar ambos roles
al mismo tiempo, inevitablemente habrá problemas en el
diseño e implementación de esta estructura.
SAO SEPARADO Y APLICACIONES BÁSICAS
Hay muchas razones que conducen a la división de componentes.
arquitectónico. Quizás la pregunta más reveladora para separar
diferentes componentes de una arquitectura es que cada componente
de la arquitectura tiene su propia visión. Se necesita la aplicación de referencia
para un propósito diferente al ODS. Intenta superponer
una vista de la aplicación de referencia en el mundo de un ODS o viceversa
no es una forma correcta de trabajar.
En consecuencia, el primer problema de un ERP en el CIF es el de
comprobar si existe una distinción entre las aplicaciones de referencia y las
Ods.
MODELOS DE DATOS EN LA CORPORATIVA
FABRICA DE INFORMACION
Para lograr la cohesión entre los diferentes componentes
de la arquitectura del CIF, debe existir un modelo de adquirir.
modelos de adquirir servir como enlace entre los diversos componentes
arquitectura como aplicaciones de línea de base y ODS. LA
modelos de adquirir convertirse en la "hoja de ruta intelectual" para tener la
sentido correcto por los diferentes componentes arquitectónicos del CIF.
De la mano de esta noción, la idea es que debería haber
ser un gran y único modelo de adquirir. Obviamente tiene que
ser un modelo de adquirir para cada uno de los componentes y además hay
debe ser un camino sensato que conecte los diferentes modelos.
Cada componente de la arquitectura: ODS, aplicaciones básicas,
almacenamiento de datos empresa, etc. - necesita su propia
modelo de adquirir. Y entonces debe haber una definición precisa de
como estos modelos de adquirir interactúan entre sí.
MOVE I DATOS DE LA FECHA DEL ERP
ALMACÉN
Si el origen de la adquirir es una aplicación de referencia y / o un ODS, cuando
Insertos ERP i adquirir en almacenamiento de datos, tal inserción debe
ocurren en el nivel más bajo de "granularidad". Resumen o
simplemente agregue i adquirir como salen
de la aplicación de línea de base del ERP o el ODS del ERP no es el
Es lo correcto. LA adquirir se necesitan detalles en la fecha
almacén para formar la base del proceso DSS. Semejante adquirir
serán remodelados de muchas maneras por los mercados de datos y las exploraciones
de los almacenamiento de datos.
El desplazamiento de adquirir desde el entorno de la aplicación de línea de base
del ERP al entorno de la almacenamiento de datos de la empresa se realiza en una
razonablemente relajado. Ese cambio ocurre después de eso
unas 24 horas desde la actualización o creación en el ERP. El hecho de
tener un movimiento "perezoso" de los dioses adquirir en almacenamiento de datos
de la empresa permite adquirir procedentes del ERP para "asentarse".
Una vez yo adquirir están depositados en la aplicación de referencia,
entonces puedes moverte con seguridad adquirir del ERP
en la compañia. Otro objetivo alcanzable gracias al movimiento
Dioses "perezosos" adquirir es la clara delimitación entre procesos operativos y
DSS. Con un movimiento "rápido" del adquirir la linea divisoria
entre DSS y operacional sigue siendo vago.
El movimiento de adquirir del ODS del ERP a almacenamiento de datos
de la empresa se realiza periódicamente, normalmente
semanal o mensual. En este caso el movimiento de
adquirir se basa en la necesidad de "limpiar" el viejo adquirir historiadores.
Por supuesto, el ODS contiene i adquirir que son mucho mas recientes
en comparación con adquirir historiadores encontrados en almacenamiento de datos.
El desplazamiento de adquirir en almacenamiento de datos casi nunca se hace
"Mayorista" (en forma de mayorista). Copiar una tabla
desde el entorno ERP a almacenamiento de datos No tiene sentido. Una aproximación
mucho más realista es el desplazamiento de unidades seleccionadas de la adquirir.
Sólo adquirir que han cambiado desde la última actualización de la fecha
almacén son los que deben moverse en los datos
depósito. Una forma de saber cuales adquirir han sido modificados
ya que la última actualización es mirar las marcas de tiempo del adquirir
que se encuentran en el entorno ERP. El diseñador selecciona todos los cambios
que han ocurrido desde la última actualización. Otro enfoque
es utilizar técnicas de adquisición de cambios adquirir. con
estas técnicas se analizan en cintas de registro y diario con el fin de
determinar cuales adquirir debe trasladarse del entorno ERP a
La de la almacenamiento de datos. Estas técnicas son mejores en
cuántos registros y cintas de diario se pueden leer de los archivos ERP
sin mayores efectos sobre los demás recursos del ERP.
OTRAS COMPLICACIONES
Uno de los problemas con ERP en CIF es lo que les pasa a los demás
fuentes de aplicación o ia adquirir de las SAO que deben contribuir a
almacenamiento de datos pero no forman parte del entorno ERP. Dado que
naturaleza cerrada de ERP, especialmente SAP, el intento de integrar
claves de fuentes externas de adquirir con el adquirir que vienen del ERP al
hora de moverme adquirir en almacenamiento de datos, es un gran desafío.
¿Y cuántas son exactamente las probabilidades de que yo adquirir de aplicaciones o
Las ODS fuera del entorno ERP se integrarán en los datos.
¿almacén? Las probabilidades son realmente muy altas.
ENCONTRAR DATOS HISTÓRICOS DE ERP
Otro problema con el adquirir del ERP es el resultante
de la necesidad de tener adquirir historiadores dentro del almacenamiento de datos.
Por lo general, la almacenamiento de datos él necesita adquirir historiadores. ES
por lo general, la tecnología ERP no almacena estos adquirir
histórico, al menos no hasta el punto en el que se necesita en la fecha
depósito. Cuando una gran cantidad de adquirir los historiadores comienzan a
agregarse al entorno ERP, dicho entorno debe ser
limpiado. Por ejemplo, supongamos que almacenamiento de datos debería
estar cargado con cinco años de adquirir histórico mientras que el ERP mantiene el
máximo seis meses de estos adquirir. Siempre que la empresa esté satisfecha con
recoger una variedad de adquirir histórico a medida que pasa el tiempo,
entonces no hay problemas al usar el ERP como fuente para el
almacenamiento de datos. Pero cuando el almacenamiento de datos Deve andare
retroceder en el tiempo y tomar dioses adquirir historiadores que no han sido
previamente recopilado y guardado por el ERP, luego el entorno ERP
se vuelve ineficiente.
ERP Y METADATOS
Otra consideración a tener en cuenta sobre ERP y almacenamiento de datos es eso
sobre los metadatos existentes en el entorno ERP. Además de los metadatos
pasan del entorno ERP al almacenamiento de datos, y
los metadatos deben moverse de la misma manera. Además, yo
los metadatos deben transformarse en formato y estructura
requerido por la infraestructura del almacenamiento de datos. Hay uno grande
diferencia entre metadatos operacionales y metadatos DSS. Los metadatos
operativos son principalmente para el desarrollador y para el
programador. Los metadatos de DSS son principalmente para el usuario
el final. Metadatos existentes en aplicaciones ERP o ODS
necesitan convertirse y esta conversión no siempre es fácil
y directo.
OBTENER LOS DATOS DEL ERP
Si el ERP se utiliza como proveedor de adquirir para la almacenamiento de datos ci
debe ser una interfaz sólida que se mueva adquirir del medio ambiente
ERP al medio ambiente almacenamiento de datos. La interfaz debe:
▪ ser fácil de usar
▪ permitir el acceso a adquirir del ERP
▪ tomar el significado de adquirir que están a punto de ser movidos
en almacenamiento de datos
▪ conocer las limitaciones de ERP que podrían surgir en
hora en la que inicias sesión en adquirir del ERP:
▪ integridad referencial
▪ relaciones jerárquicas
▪ relaciones lógicas implícitas
▪ convenio de aplicación
▪ todas las estructuras del adquirir soportado por el ERP, y así sucesivamente ...
▪ ser eficiente en el acceso adquirir, proporcionando:
▪ movimiento directo de adquirir
▪ adquisición de cambio adquirir
▪ apoyar el acceso oportuno a adquirir
▪ comprender el formato de la adquirir, y así…
INTERFAZ CON SAP
La interfaz puede ser de dos tipos, propia o comercial.
Algunas de las principales interfaces comerciales incluyen:
▪ S.A.S.
▪ Soluciones Prims
▪ D2k, y así sucesivamente ...
MÚLTIPLES TECNOLOGÍAS ERP
Tratar el entorno ERP como si fuera una sola tecnología es una
gran error. Hay muchas tecnologías ERP, cada una con su propia
fortalezas. Los proveedores más conocidos del mercado son:
▪SAP
▪ Finanzas de Oracle
▪ PersonasSoft
JD Edwards
▪ Ba'an
SAP
SAP es el software ERP más grande y completo. Aplicaciones
de SAP abarcan muchos tipos de aplicaciones en muchas áreas. SAP tiene
la reputación de ser:
▪ muy grande
▪ muy difícil y costoso de implementar
▪ necesita muchas personas y consultores para
implementado
▪ necesita personas especializadas para la implementación
▪ lleva mucho tiempo implementar
Además, SAP tiene la reputación de memorizar sus propios adquirir muy
con cuidado, lo que dificulta el acceso a ellos
persona fuera del área SAP. La fuerza de SAP es ser
capaz de capturar y almacenar una gran cantidad de adquirir.
SAP anunció recientemente su intención de ampliar
sus aplicaciones ai almacenamiento de datos. Hay muchos pros y contras.
en el uso de SAP como proveedor de almacenamiento de datos.
Una ventaja es que SAP ya está instalado y que la mayoría de los
los consultores ya conocen SAP.
Las desventajas de tener a SAP como proveedor de almacenamiento de datos son
muchos: SAP no tiene experiencia en el mundo de almacenamiento de datos
Si SAP es el proveedor de almacenamiento de datos, es necesario "sacar"
i adquirir de SAP al almacenamiento de datos. Fecha un historial de SAP de
sistema cerrado, es poco probable que sea fácil pasar i de SAP a
eso (???). Hay muchos entornos heredados que impulsan a SAP,
como IMS, VSAM, ADABAS, ORACLE, DB2, etc.
SAP insiste en un enfoque "no inventado aquí". SAP no quiere
colaborar con otros proveedores para utilizar o crear el almacenamiento de datos.
SAP insiste en generar todo su software por su cuenta.
Aunque SAP es una empresa grande y poderosa, el hecho de
intentar reescribir la tecnología de ELT, OLAP, administración de la
sistema e incluso el código base del dbms es una locura.
En lugar de adoptar una actitud cooperativa con los proveedores
di almacenamiento de datos desde hace mucho tiempo, SAP ha seguido el enfoque que
ellos "saben más". Esta actitud frena el éxito que
SAP puede tener en el área de almacenamiento de datos.
La negativa de SAP a permitir el acceso de proveedores externos
con prontitud y gracia para ellos adquirir. La esencia misma de usar
un almacenamiento de datos es de fácil acceso a adquirir. Toda la historia de SAP es
basado en dificultar el acceso adquirir.
La falta de experiencia de SAP en el manejo de grandes volúmenes de adquirir;
en el campo de almacenamiento de datos hay volúmenes de adquirir nunca visto desde
SAP y para manejar estas grandes cantidades de adquirir debes tener uno
tecnología adecuada. SAP aparentemente no es consciente de esto
barrera tecnológica que existe para ingresar al campo de datos
almacén.
La cultura corporativa de SAP: SAP ha creado un negocio
en la obtención de i adquirir del sistema. Pero para hacer esto necesitas tener
una mentalidad diferente. Tradicionalmente, las empresas de software que
buenos para introducir datos en un entorno no han sido buenos en
conseguir que los datos vayan al revés. Si SAP puede hacer este tipo de
Switch será la primera empresa en hacerlo.
En resumen, es cuestionable si una empresa debe seleccionar
SAP como proveedor de almacenamiento de datos. Hay riesgos muy graves
por un lado y muy pocas recompensas por el otro. Pero hay otro
razón que desalienta la elección de SAP como proveedor de dátiles
almacén. Porque todas las empresas deberían tener la misma fecha
almacén de todas las demás empresas? La almacenamiento de datos es el corazon
ventaja competitiva. Si todas las empresas adoptaran el mismo
almacenamiento de datos sería difícil, aunque no imposible,
lograr una ventaja competitiva. SAP parece pensar que un
almacenamiento de datos puede verse como una cookie y es una
otra señal de su "obtenga los datos
en".
Ningún otro proveedor de ERP es tan dominante como SAP.
Sin duda habrá empresas que seguirán el camino de SAP
para ellos almacenamiento de datos pero presumiblemente estas fechas
Los almacenes de SAP serán grandes, costosos y muy exigentes
tiempo para su creación.
Estos entornos incluyen actividades como "procesamiento de cajeros bancarios",
procesos para reservas de aerolíneas, procesos para quejas
seguros, etc. Más eficaz fue el sistema de transacciones,
más obvia era la necesidad de separación entre proceso operativo y
DSS (Sistema de apoyo a la toma de decisiones). Sin embargo, con los sistemas de recursos
humano y personal, nunca se enfrenta a grandes volúmenes de
actas. Y, por supuesto, cuando se contrata a una persona
o dejar la empresa esto es un registro de una transacción.
Pero en relación con otros sistemas, los sistemas de recursos humanos y
personal simplemente no tiene muchas transacciones. Por lo tanto, en el
sistemas de recursos humanos y personales no es del todo obvio que exista
necesita un DataWarehouse. En muchos sentidos, estos sistemas
representan la fusión de los sistemas DSS.
Pero hay otro factor que debe considerarse si uno tiene que
hacer con datawarehouse y PeopleSoft. En muchos entornos, yo adquirir
Los recursos humanos y personales son secundarios al negocio.
empresa principal. La mayoría de las empresas realizan
fabricación, venta, prestación de servicios, etc. LA
Los sistemas de recursos humanos y personales suelen ser secundarios (o di
apoyo) a la línea de negocio principal de la empresa. Por tanto, es
equívoco e inconveniente almacenamiento de datos separado para el
apoyo a los recursos humanos y personales.
PeopleSoft es muy diferente de SAP a este respecto. Con SAP, es
obligatorio que hay un almacenamiento de datos. Con PeopleSoft, no es
entonces tan claro. Un almacén de datos es opcional con PeopleSoft.
Lo mejor que se puede decir del adquirir PeopleSoft es que los datos
El almacén se puede utilizar para almacenar i adquirir relacionado a
viejos recursos humanos y personales. Una segunda razón para la
que a una empresa le gustaría utilizar almacenamiento de datos a
en detrimento del entorno PeopleSoft es permitir el acceso y
acceso gratuito a herramientas de análisis, ia adquirir por PeopleSoft. Pero
Además de estas razones, puede haber casos en los que sea preferible no
tener un almacén de datos para adquirir GenteSoft.
En fin
Hay muchas ideas sobre la construcción de una fecha.
almacén dentro de un software ERP.
Algunos de estos son:
▪ Tiene sentido tener un almacenamiento de datos que se parece a cualquiera
más en la industria?
▪ Qué tan flexible es un ERP almacenamiento de datos software?
▪ Un ERP almacenamiento de datos el software puede manejar un volumen de
adquirir que se encuentra en un "almacenamiento de datos arena"?
▪ ¿Cuál es el historial que hace el proveedor de ERP?
frente fácil y económico, en términos de tiempo, ai adquirir? (qué
es el historial de los proveedores de ERP en la entrega de productos económicos
tiempo, datos de fácil acceso?)
▪ ¿Cuál es la comprensión de la arquitectura DSS y la
¿“Fábrica de información corporativa” por parte del proveedor de ERP?
▪ Los proveedores de ERP entienden cómo obtener adquirir dentro de
medio ambiente, pero también entiendes cómo exportarlos?
▪ ¿Qué tan abierto está el proveedor de ERP a la fecha de los instrumentos?
almacenamiento?
Todas estas consideraciones deben tenerse en cuenta para determinar
donde poner el almacenamiento de datos que me alojará adquirir ERP y otros
adquirir. En general, a menos que exista una razón de peso para ello
para hacer lo contrario, se recomienda construir almacenamiento de datos fuera
del entorno del proveedor de ERP.
CAPÍTULO 1
Descripción general de la organización de BI
Puntos clave:
Los repositorios de información funcionan al revés
a la arquitectura de inteligencia empresarial (BI):
La cultura corporativa y la TI pueden limitar el éxito en
construir organizaciones de BI.
La tecnología ya no es el factor limitante para las organizaciones de BI. los
El problema para los arquitectos y planificadores de proyectos no es si el
la tecnología existe, pero si pueden implementar eficazmente la
tecnología disponible.
Para muchas empresas un almacenamiento de datos es poco mas que un deposito
distribución pasiva i adquirir a los usuarios que lo necesiten. LA adquirir
se extraen de los sistemas de origen y se rellenan en estructuras de destino
di almacenamiento de datos. adquirir también se pueden limpiar con todo
suerte. Sin embargo, tampoco se agrega ningún valor adicional
recogido por adquirir Durante este proceso.
Esencialmente, la DW pasiva, en el mejor de los casos, ofrece
solo yo adquirir limpio y operativo para las asociaciones de usuarios. Allí
la creación de información y la comprensión analítica dependen
íntegramente por los usuarios. Juzgue si el DW (Almacén de datos) cualquiera
el éxito es subjetivo. Si juzgamos el éxito en el
capacidad para recolectar, integrar y limpiar de manera eficiente i adquirir
corporativo sobre una base predecible, entonces sí, el DW es un éxito.
Por otro lado, si miramos la colección, la consolidación y
explotación de la información la organización en su conjunto, entonces
el DW es un fracaso. Un DW proporciona poco o ningún valor de la
información. Como resultado, los usuarios se ven obligados a arreglárselas,
creando así silos de información. Este capítulo presenta
una visión completa para resumir la arquitectura de BI (Business
Inteligencia) de las empresas. Comencemos con una descripción de BI y
luego pasaremos a las discusiones de diseño y
desarrollo de información, en lugar de simplemente proporcionar i adquirir
a los usuarios. Luego, las discusiones se centran en el cálculo de
valor de sus esfuerzos de BI. Concluimos definiendo cómo IBM
aborda los requisitos arquitectónicos de BI de su organización.
Descripción de la arquitectura de
organización de BI
Los potentes sistemas de información orientados a las transacciones
en la agenda de todas las grandes empresas, ya que nivelan
efectivamente, el patio de recreo de empresas de todo el mundo.
Sin embargo, mantenerse competitivo ahora requiere sistemas analíticamente
orientado a lo que puede revolucionar la capacidad de la empresa redescubriendo y
utilizando la información que ya tienen. Estos sistemas
La analítica se deriva de la comprensión de la riqueza de adquirir
disponible. BI puede mejorar el rendimiento en toda la información
de la compañia. Las empresas pueden mejorar las relaciones con los clientes y
proveedores, mejorar la rentabilidad de productos y servicios, generar
nuevas y mejores ofertas, control de riesgos y entre muchas otras
las ganancias reducen drásticamente el gasto. Con BI el tuyo
la empresa finalmente comienza a utilizar la información del cliente
como un activo competitivo gracias a aplicaciones que tienen objetivos de
mercado.
Tener los medios comerciales adecuados significa tener respuestas definitivas a
preguntas clave como:
▪ Cuál de los nuestros clientes nos hacen ganar mas, o hay
¿Mandan perdidos?
▪ Donde vivimos nuestros mejores clientes en relación con tienda/
almacén que frecuentan?
▪ Cuáles de nuestros productos y servicios se pueden vender más
efectivamente y para quién?
▪ ¿Qué productos se pueden vender con mayor eficacia ya quién?
▪ ¿Qué campaña de ventas fue la más exitosa y por qué?
▪ ¿Qué canales de venta son más eficaces para qué productos?
▪ Cómo podemos mejorar las relaciones con nuestros mejores clientes?
La mayoría de las empresas tienen adquirir difícil de responder
estas preguntas.
Los sistemas operativos generan grandes cantidades de producto, de
cliente y adquirir mercado desde puntos de venta, reservas,
de los sistemas de atención al cliente y soporte técnico. El desafío es
extraer y explotar esta información.
Muchas empresas aprovechan solo pequeñas fracciones de las suyas adquirir
para análisis estratégicos.
I adquirir restante, a menudo unido con i adquirir resultante de fuentes externas como i
Los "informes gubernamentales" y otra información comprada son una
mina de oro esperando ser explorada, ei adquirir necesario
solo se refinará en el contexto informativo suyo
organización.
Este conocimiento se puede aplicar de varias formas, variaciones
desde el diseño de una estrategia corporativa general hasta
comunicación personal con proveedores, a través de call center,
facturación, Internet y otros puntos. El entorno empresarial actual dicta
que DW y las soluciones de BI relacionadas evolucionan aún más
la ejecución de estructuras tradicionales de adquirir cual yo adquirir normalizado a
nivel atómico y "granjas de estrellas / cubos".
Lo que se necesita para seguir siendo competitivo es una fusión de
tecnología tradicional y avanzada en un esfuerzo por apoyar un
vasto paisaje analítico.
Finalmente, el entorno general debe mejorar el conocimiento
de la empresa en su conjunto, asegurándose de que las acciones tomadas
como consecuencia de los análisis realizados son útiles para que todos
beneficio.
Por ejemplo, digamos que clasifica el suyo clientes en las categorias
riesgo alto o bajo.
Si esta información es generada por un modelo de minería o
otros medios, se debe poner en DW y hacer accesible a
cualquier persona, por cualquier medio de acceso, como yo
informes estáticos, hojas de cálculo, tablas o procesamiento analítico en
línea (OLAP).
Sin embargo, actualmente, gran parte de este tipo de información
permanecer en los silos de adquirir de las personas o departamentos que generan
el analisis. La organización en su conjunto tiene poca o ninguna visibilidad
para la comprensión. Solo mezclando este tipo de contenido
información en su empresa DW puede eliminar los silos de la
información y elevar su entorno Dw.
Hay dos obstáculos principales para el desarrollo de una organización.
de BI.
Primero, tenemos el problema de la propia organización
de las regulaciones relacionadas.
Aunque no podemos ayudar con los cambios de política
organización, podemos ayudarlo a comprender los componentes de
una organización de BI, su arquitectura y cómo
La tecnología de IBM facilita su desarrollo.
La segunda barrera a superar es la falta de tecnología
integrado y el conocimiento de un método que recuerda todo el espacio
de BI en lugar de solo un componente pequeño.
IBM está respondiendo a los cambios en la tecnología
de integración. Es su responsabilidad proporcionar un diseño
consciente de sí mismo. Esta arquitectura debe desarrollarse con
tecnología elegida para la integración sin restricciones, o al menos con
tecnología que se adhiere a estándares abiertos. Además, el tuyo
La dirección de la empresa debe asegurarse de que la empresa de Bi
llevado a cabo de acuerdo al horario y no permitirlo
desarrollo de silos de información derivados del interés propio
agendas u objetivos.
Esto no quiere decir que el entorno de BI no sea sensible a
reaccionar a las diferentes necesidades y requisitos de diferentes usuarios; en cambio, significa
que la implementación de esas necesidades y requisitos individuales es
hecho en beneficio de toda la organización de BI.
Una descripción de la arquitectura de la organización de BI puede
se puede encontrar en la página 9 de la Figura 1.1. La arquitectura demuestra
una rica combinación de tecnologías y técnicas.
Desde la vista tradicional, la arquitectura incluye los siguientes componentes
de almacén
Capa atómica.
Este es el fundamento, el corazón de todo el DW y, por tanto, del
informes estratégicos.
I adquirir almacenados aquí conservarán la integridad histórica, los informes de
adquirir e incluir la métrica derivada, además de estar limpio,
integrado y almacenado utilizando plantillas de extracción.
Todo uso posterior de estos adquirir y la información relacionada es
derivado de esta estructura. Esta es una excelente fuente de
extracción de adquirir y para informes con consultas SQL estructuradas
Depósito operativo de adquirir o informe base de
adquirir(Almacén de datos operativos (ODS) o informes
base de datos.)
Esta es una estructura de adquirir diseñado específicamente para
informes técnicos.
I adquirir almacenados y transportados estas estructuras finalmente pueden
propagarse en el almacén a través de la zona de organización (puesta en escena
área), donde podría utilizarse para informes estratégicos.
Área de ensayo.
La primera parada para la mayoría adquirir destinado al entorno de
El almacén es la zona de organización.
Aquí yo adquirir se integran, limpian y transforman en adquirir útil que
poblará la estructura del almacén
Mercados de citas.
Esta parte de la arquitectura representa la estructura de adquirir usado
específicamente para OLAP. La presencia de los datamarts, si yo adquirir son
almacenados en el esquema de estrella que se superponen adquirir
multidimensional en un entorno relacional, o en archivadores
di adquirir propietario utilizado por tecnología OLAP específica, como el
Servidor DB2 OLAP, no es relevante.
La única limitación es que la arquitectura facilita el uso de adquirir
multidimensional.
La arquitectura también abarca las tecnologías y técnicas críticas de Bi.
que se distinguen como:
Análisis espacial
El espacio es una ganancia inesperada de información para el analista y
es fundamental para completar la resolución. El espacio puede
representar la información de las personas que viven en un determinado
ubicación, así como información sobre dónde está esa ubicación
comparado físicamente con el resto del mundo.
Para realizar este análisis, debe comenzar por vincular el suyo
información en coordenadas de latitud y longitud. Eso es todo
denominada "codificación geográfica" y debe formar parte de la extracción,
transformación, y el proceso de carga (ETL) a nivel
atómico de su almacén.
Procesamiento de datos.
La extracción de adquirir permite a nuestras empresas hacer crecer
numero de clientes, para predecir tendencias de ventas y permitir
la gestión de las relaciones con i clientes (CRM), entre otras iniciativas de la
BI.
La extracción de adquirir por lo tanto, debe integrarse con las estructuras de
adquirir del DWHouse y respaldado por procesos de almacén para
Determinar el uso eficaz y eficiente de la tecnología y
técnicas relacionadas.
Como se indica en la arquitectura de BI, el nivel atómico del
Dwhouse, al igual que los datamarts, es una excelente fuente de adquirir
para extracción. Esas mismas estructuras también deben ser
destinatarios de los resultados de la extracción para determinar la disponibilidad de
audiencias más amplias.
Agentes
Hay varios agentes para examinar al cliente para cada punto como, por ejemplo, i
sistemas operativos de la empresa y los mismos dw. Estos agentes pueden
Ser redes neuronales avanzadas capacitadas para aprender
tendencias de cada punto, como el producto basado en la demanda futura
sobre promociones de ventas, motores basados ​​en reglas para reaccionar
un fecha conjunto de circunstancias, o incluso simples agentes que
informan de las excepciones a los "altos ejecutivos". Estos procesos hacen
generalmente presente en tiempo real y por lo tanto debe
estar estrechamente acoplado con el movimiento de la misma adquirir.
Todas estas estructuras de adquirir, tecnologías y técnicas garantizan
que no pasarás la noche generando una organización del
su BI.
Esta actividad se desarrollará en pasos incrementales, para los más pequeños.
puntos.
Cada paso es un esfuerzo de proyecto independiente y se informa
como una iteración en su iniciativa de dw o BI. Las iteraciones
puede incluir la implementación de nuevas tecnologías, para
comenzar con nuevas técnicas agregando nuevas estructuras adquirir ,
cargando yo adquirir adicional, o con la ampliación del análisis de la
tu entorno. Este párrafo se discute más
en profundidad en el capítulo 3.
Además de las estructuras tradicionales de Dw y herramientas de Bi existen otras
funciones de su organización de BI que debe
diseño, como:
Puntos de contacto con el cliente (contacto con el cliente
Puntos).
Como ocurre con cualquier organización moderna, hay una serie de
puntos de contacto con el cliente que indican cómo tener una experiencia
positivo para el tuyo clientes. Hay canales tradicionales como i
comerciantes, operadoras de centralita, correo directo, multimedia e impresión
publicidad, así como los canales más actuales como correo electrónico y web, i adquirir
se deben adquirir productos con algún punto de contacto,
transportado, limpiado, transformado y luego poblado en estructuras de adquirir de la
BI.
Bases de adquirir asociaciones operativas y de usuarios (operativa
bases de datos y comunidades de usuarios).
Al final de los puntos de contacto del clientes encontrarás los conceptos básicos de adquirir
aplicación de la empresa y comunidades de usuarios. LA adquirir existente
son adquirir tradicional que debe reunirse y fusionarse con el adquirir que
fluyen desde los puntos de contacto para satisfacer las necesidades
información.
Analistas. (Analistas)
El principal beneficiario del entorno de BI es el analista. Es el quien
se beneficia de la extracción actual de adquirir operativo, integrado con
diferentes fuentes de adquirir , aumentado con características como análisis
geográficas (geocodificación) y presentadas en tecnologías de BI que
le permiten extraer, OLAP, informes y análisis avanzados de SQL
geográfico. La interfaz principal del analista con el entorno de
la presentación de informes es el portal de BI.
Sin embargo, el analista no es el único que se beneficia de la arquitectura del
BI.
Ejecutivos, grandes asociaciones de usuarios, e incluso socios, proveedores y yo
clientes deberían encontrar beneficios en la BI empresarial.
Bucle de retroalimentación.
La arquitectura de BI es un entorno de aprendizaje. Un principio
característica del desarrollo es permitir estructuras persistentes de adquirir
actualizarse a través de la tecnología de BI usada y a través de acciones
usuario intrapese. Un ejemplo es la evaluación de la
cliente (puntuación del cliente).
Si el departamento de ventas hace un modelo de minería
de las puntuaciones del cliente en cuanto a utilizar un nuevo servicio,
El departamento de ventas no debería ser el único grupo beneficiario.
de servicio.
En cambio, el modelo de minería debe hacerse como parte
flujo de datos natural dentro de la empresa y las puntuaciones del cliente
debe convertirse en una parte integrada del entorno de información del
almacén, visible para todos los usuarios. La suite de IBM de bi-bi-céntrica
incluyendo DB2 UDB, DB2 OLAP Server incluye la mayoría
parte de los componentes importantes de la tecnología, definidos en la figura
1.1.
Usamos la arquitectura como aparece en esta figura de libro para
danos un nivel de continuidad y muestra cómo cada producto
de IBM se ajustan al esquema general de BI.
Proporcionar el contenido de la información (proporcionar
Contenido de informacion)
Diseñar, desarrollar e implementar su entorno de BI es
una ardua operación. El diseño debe abarcar tanto
requisitos comerciales actuales y futuros. El diseño de la arquitectura
debe estar completo para incluir todas las conclusiones encontradas
durante la fase de diseño. La ejecución debe permanecer
comprometidos con un único propósito: desarrollar la arquitectura de BI
como se presenta formalmente en el dibujo y basado en los requisitos de
negocio.
Es particularmente difícil argumentar que la disciplina garantizará la
éxito relativo.
Esto es simple porque no desarrolla un entorno de BI completo
de repente, pero se hace en pequeños pasos a lo largo del tiempo.
Sin embargo, identificar los componentes de BI de su arquitectura es
importante por dos razones: guiará todas las decisiones posteriores
técnicas arquitectónicas.
Podrás diseñar conscientemente un uso particular de la tecnología.
aunque es posible que no obtenga un representante que necesite
tecnología durante varios meses.
Comprender suficientemente los requisitos de su negocio afectará el tipo
de productos que adquirirá para su arquitectura.
El diseño y desarrollo de su arquitectura garantizan
que tu almacén es
no es un evento aleatorio, sino más bien un "bien pensado",
anuncio cuidadosamente construido opera del arte como mosaico de
tecnología combinada.
Diseñar el contenido de la información
Toda la planificación inicial debe enfocarse e identificar
componentes principales de BI que necesitará el medio ambiente
general en el presente y en el futuro.
Conocer los requisitos comerciales es importante.
Incluso antes de que comience toda la planificación convencional,
El planificador de proyectos a menudo puede identificar uno o dos
componente de inmediato.
El equilibrio de componentes que pueden ser necesarios para la
su arquitectura, sin embargo, no se puede encontrar fácilmente.
Durante la fase de diseño, la parte principal de la arquitectura
vincula la sesión de desarrollo de aplicaciones (JAD) en una búsqueda
para identificar los requisitos comerciales.
A veces, estos requisitos se pueden subcontratar a
consultas e informes.
Por ejemplo, los usuarios declaran que si quieren automatizar
Actualmente, un informe tiene que generar manualmente integrando
dos razones actuales y sumando los cálculos derivados de
combinación de adquirir.
Si bien este requisito es simple, define cierto
funcionalidad de la característica que debe incluir cuando
compre herramientas de informes para su organización.
El diseñador también debe perseguir requisitos adicionales para
Obtenga una imagen completa. Los usuarios quieren suscribirse a
¿Este reporte?
Los subconjuntos del informe se generan y se envían por correo electrónico a los distintos
usuarios? ¿Quiere ver este informe en el portal de la empresa?
Todos estos requisitos son parte de la simple necesidad de
reemplace un informe manual según lo requieran los usuarios. El beneficio
de este tipo de requisitos es que todos, usuarios y diseñadores,
comprensión del concepto de informes.
Sin embargo, hay otros tipos de negocios que debemos planificar.
Cuando los requisitos comerciales se expresan en forma de
Preguntas estratégicas comerciales, es fácil para el diseñador experimentado
discernir la medida / hecho y los requisitos dimensionales.
La figura 1.2 ilustra los componentes dimensionales y de medida de un
Problema comercial.
Si los usuarios de JAD no saben cómo declarar sus requisitos
en forma de problema empresarial, el diseñador proporcionará a menudo
ejemplos para omitir el inicio de la sesión de recopilación
requisitos.
El diseñador experto puede ayudar a los usuarios a comprender más que solo el
comercio estratégico, sino también cómo entrenarlo.
El enfoque de recopilación de requisitos se analiza en el capítulo 3; para
ahora solo deseamos indicar la necesidad de diseñar para todos
los tipos de requisitos de BI
Un problema empresarial estratégico no es solo un requisito
Negocios, pero también una pista de diseño. Si tienes que contestar
a una pregunta multidimensional, entonces tienes que memorizar,
enviar yo adquirir dimensiones, y si necesita almacenar i
adquirir multidimensional, tienes que decidir qué tipo de tecnología o
técnica que vas a emplear.
¿Implementas un esquema de estrella de cubo reservado, o ambos?
Como puede ver, incluso un simple problema empresarial
puede tener una influencia considerable en el diseño. sin embargo
Estos tipos de requisitos comerciales son ordinarios y, por supuesto, al menos
por diseñadores y planificadores de proyectos experimentados.
Ha habido suficiente debate sobre las tecnologías y el apoyo de
OLAP y una amplia gama de soluciones están disponibles. Hasta ahora
mencionamos la necesidad de combinar informes simples con i
requisitos dimensionales de la empresa, y cómo estos requisitos
influir en las decisiones arquitectónicas técnicas.
Pero, ¿cuáles son los requisitos que no se comprenden fácilmente
por los usuarios o por el equipo de DW? Nunca necesitarás el análisis
espacial (análisis espacial)?
Los modelos mineros de adquirir serán una parte necesaria de los tuyos
¿futuro? ¿Quién sabe?
Es importante señalar que este tipo de tecnologías no son muchas
conocido por las comunidades de usuarios generales y los miembros del equipo de
Dw, en parte, esto podría suceder porque normalmente
son manejados por algunos expertos técnicos internos o externos. Es un
caso extremo de los problemas que generan este tipo de tecnologías. Yo
los usuarios no pueden describir los requisitos comerciales o enmarcarlos
para proporcionar pautas a los diseñadores, pueden
pasan desapercibidos o, peor aún, simplemente ignorados.
Más problemático se vuelve cuando el diseñador y el desarrollador fallan
pueden reconocer la aplicación de uno de estos avanzados pero
tecnologías críticas.
Como hemos escuchado a menudo a los diseñadores decir, "bueno, ¿por qué
¿No lo dejamos de lado hasta que obtengamos esta otra cosa?
"¿Están realmente interesados ​​en las prioridades o simplemente evitan
requisitos que no comprenden? Probablemente sea la última hipótesis.
Digamos que su equipo de ventas ha comunicado un requisito
de negocio, como se indica en la Figura 1.3, como puede ver, el
El requisito se enmarca en forma de problema empresarial. Allí
La diferencia entre este problema y el problema dimensional típico es
la distancia. En este caso, el grupo de ventas quiere saber,
mensualmente, las ventas totales de productos, almacenes y
clientes que viven a menos de 5 millas del almacén donde se encuentran
ellos compran.
Lamentablemente, los diseñadores o arquitectos simplemente pueden
ignorar el componente de espacio diciendo, "tenemos el cliente, el
producto y yo adquirir del depósito. Mantenemos la distancia hasta
otra iteración.
"Respuesta incorrecta. Este tipo de problema empresarial se refiere
enteramente BI. Representa una comprensión más profunda de la
nuestro negocio y un sólido espacio de análisis para nuestros analistas.
BI va más allá de una simple consulta o informes estándar, o
incluso OLAP. Esto no quiere decir que estas tecnologías no
son importantes para su BI, pero por sí solas no representan
el entorno de BI.
Diseño para el contexto de la información
(Diseño para contenido informativo)
Ahora que hemos identificado los requisitos comerciales que los distinguen
varios componentes fundamentales deben incluirse en un dibujo
arquitectónico general. Algunos de los componentes de BI son parte de
de nuestros esfuerzos iniciales, mientras que algunos no se implementarán para
varios meses.
Sin embargo, todos los requisitos conocidos se reflejan en el diseño para que
cuando tenemos que implementar una tecnología en particular, estamos
prepárate para hacerlo. Algo sobre el proyecto reflejará el pensamiento
Tradicional.
Por ejemplo, la Figura 1.1, al comienzo del capítulo, muestra una fecha
mart que mantiene el adquirir dimensional.
Este conjunto de adquirir se utiliza para admitir usos posteriores de
adquirir impulsado dimensionalmente por las cuestiones comerciales que
hemos identificado. Como documentos adicionales son
generado, como el desarrollo del diseño del adquirir, nosotros
comenzaremos a formalizar como yo adquirir se propagan en el medio ambiente.
Hemos comprobado la necesidad de representar el adquirir así
dimensional, dividiéndolos (según necesidades específicas
determinado) en marts.
La siguiente pregunta a responder es: ¿cómo se construirán?
estos mercados de datos?
¿Construyes las estrellas para sostener los cubos, o solo cubos, o solo las estrellas?
(o cubos de la derecha, o estrellas de la derecha). Genere la arquitectura de los datos
marts dependientes que requieren una capa atómica para todos adquirir
¿adquirido? Permitir que los mercados de datos independientes adquieran adquirir
directamente desde los sistemas operativos?
¿Qué tecnología de cubo intentará estandarizar?
Tienes grandes cantidades de dioses adquirir requerido para el análisis dimensional
o necesita los cubos de su fuerza de ventas nacional en uno
semanalmente o en ambos? Construye un artículo poderoso
como DB2 OLAP Server para finanzas o Cognos cubes
¿PowerPlay para su organización de ventas o ambas?
Estas son las grandes decisiones de diseño arquitectónico que
afectarán su entorno de BI de aquí en adelante. Sip,
ha identificado una necesidad de OLAP. Ahora, ¿cómo vas a realizar eso?
tipo de técnica y tecnología?
Cómo algunas de las tecnologías más avanzadas afectan al tuyo
¿dibujos? Suponemos que ha identificado una necesidad
espacio en su organización. Ahora tienes que llamar al
ediciones de dibujos arquitectónicos, aunque no planificadas
para realizar componentes espaciales durante varios meses. El arquitecto debe
diseñar hoy basado en lo que se necesita. Predecir la necesidad de
análisis espacial que genera, almacena, realiza y proporciona
el acceso a los adquirir espacio. Esto, a su vez, debería servir como
restricción con respecto al tipo de tecnología y especificaciones
plataforma de software que puede considerar actualmente. por
ejemplo, el sistema de administración de base de datos relacional
(RDBMS) que realice para su capa atómica debe tener
una extensión espacial robusta disponible. Esto aseguraría
rendimiento máximo al utilizar geometría y objetos
espacio en sus aplicaciones analíticas. Si su RDBMS no
puedo manejar yo adquirir (centrado en el espacio) internamente, por lo que tendrá que
estabilire una base de datos (espacial-céntrico) externo. Esto complica la
administrar ediciones y comprometer su rendimiento general,
sin mencionar los problemas adicionales creados para el tuyo
DBA, ya que probablemente tengan un conocimiento mínimo
de los fundamentos de adquirir espacio también. Por otro lado, si tu
RDMBS maneja todos los componentes espaciales y relacionados
optimizer es consciente de las necesidades especiales (por ejemplo,
indexación) de los objetos espaciales, entonces sus DBA pueden manejar
Gestione rápidamente las ediciones y podrá aumentar la
el rendimiento.
Además, debe ajustar el área de preparación (área de escena) y la capa
entorno atómico para incluir la limpieza de direcciones (un
elemento clave para el análisis espacial), así como los siguientes
ahorro de objetos espaciales. La sucesión de ediciones de
el diseño continúa ahora que hemos introducido la noción de limpieza
habla a. Por un lado, esta aplicación dictará el tipo de
software necesario para su esfuerzo ETL.
Necesita productos como Trillium para proporcionarle una dirección
clean, o un proveedor ETL que haya elegido para proporcionar ese
funcionalidad?
Por ahora es importante que aprecie el nivel de diseño que se
Debe completarse antes de comenzar a hacer el suyo.
medio ambiente (almacén). Los ejemplos anteriores deben
demostrar la multitud de decisiones de diseño que deben seguirse
la identificación de cualquier requisito comercial en particular. Si esta hecho
correctamente, estas decisiones de diseño promueven
la interdependencia entre las estructuras físicas de su entorno, la
selección de tecnología utilizada y flujo de propagación
contenido de informacion. Sin esta arquitectura convencional
de BI, su organización estará sujeta a una mezcla
caótico de las tecnologías existentes, en el mejor de los casos, tan unido
no es exacto para proporcionar estabilidad aparente.
Mantener el contenido de la información
Llevar el valor de la información a su organización es
una operación muy difícil. Sin suficiente comprensión
y experiencia, o planificación y dibujo adecuados, incluso el
mejores equipos fallarían. Por otro lado, si tienes uno grande
intuición y un diseño detallado pero sin disciplina para
ejecución, acaba de perder su dinero y su tiempo
porque tu esfuerzo está condenado al fracaso. El mensaje debe
Sea claro: si le falta uno o más de estos
habilidades, comprensión / experiencia o planificación / dibujo o
disciplina de implementación, esto conducirá a paralizar o
destruir la construcción de la organización de BI.
¿Está tu equipo lo suficientemente preparado? Hay alguien en el tuyo
Equipo de BI que comprende el vasto panorama analítico disponible
en entornos BI, en las técnicas y tecnologías necesarias
para efectuar ese paisaje? Hay alguien en tu equipo
que puede reconocer la diferencia entre aplicaciones avanzadas
informes estáticos y OLAP, o las diferencias entre ROLAP y OLAP? Uno de los
los miembros de su equipo reconocen claramente el camino
extraer y cómo podría afectar al almacén o cómo
¿Puede el almacén soportar el desempeño de la minería? Un miembro
del equipo comprende el valor de adquirir espacio o tecnología
basado en agentes? ¿Tiene alguien que aprecie la aplicación única?
de herramientas ETL versus tecnología de intermediarios
¿mensaje? Si no lo tiene, consiga uno. BI es mucho más
grande de una capa atómica normalizada, de OLAP, de los esquemas un
estrella y una ODS.
Tener la comprensión y la experiencia para reconocer los requisitos.
de BI y sus soluciones es esencial para su capacidad
formalizar adecuadamente las necesidades y el diseño del usuario
y llevar a cabo sus soluciones. Si su comunidad de usuarios tiene
dificultad para describir los requisitos, es el trabajo del equipo
almacén proporciona esa comprensión. Pero si el equipo de
almacén
no reconoce la aplicación específica de BI - por ejemplo, dado
minería, entonces no es lo mejor que hacen los entornos de BI
a menudo se limita a ser depósitos pasivos. Sin embargo, ignore estos
tecnologías no disminuye su importancia y el efecto que tienen
sobre la aparición de sus posibilidades de inteligencia empresarial
organización, así como la estructura de información que diseñe
promover.
El diseño debe incluir la noción de diseño, ed
ambos requieren una persona competente. Además, el diseño
Requiere un equipo de observación y filosofía de casa
de estándares. Por ejemplo, si su empresa ha establecido una
plataforma estándar o ha identificado un RDBMS particular que usted
quieren estandarizar en toda la plataforma, se avecina que
todos en el equipo se adhieren a esos estándares. Generalmente uno
equipo expone la necesidad de normalización (al usuario
comunidades), pero el equipo en sí no está dispuesto a unirse a la
estándares establecidos en otras áreas de la empresa o quizás incluso en el
empresas similares. Esto no solo es hiporcrítico, sino que garantiza que la empresa no
es capaz de explotar los recursos y las inversiones existentes. No significa
que no hay situaciones que garanticen una plataforma o una
tecnología no estándar; sin embargo, los esfuerzos del almacén
Deben proteger celosamente los estándares de la empresa hasta
que los requisitos comerciales no dictan lo contrario.
El tercer componente clave necesario para construir un BI
la organización es la disciplina.
Depende en su totalidad, tanto de las personas como del medio ambiente.
Los planificadores de proyectos, patrocinadores, arquitectos y usuarios deben apreciar la
disciplina necesaria para construir la estructura de información de la empresa.
Los diseñadores deben dirigir sus esfuerzos de diseño de tal manera que
Completar otros esfuerzos necesarios en la sociedad.
Por ejemplo, suponga que su empresa crea un
Aplicación ERP que tiene un componente de almacén.
Por tanto, es responsabilidad de los diseñadores de ERP asociarse con
equipo de ambiente de almacén para no competir tampoco
trabajo duplicado ya comenzado.
La disciplina también es un tema que debe ocuparse
por toda la organización y generalmente se establece y se confía a un
nivel ejecutivo.
¿Están los ejecutivos dispuestos a adherirse a un enfoque diseñado? UN
enfoque que promete crear contenido de información que al
final traerá valor a todas las áreas de la empresa, pero quizás
¿Compromete agendas individuales o departamentales? Recuerda el dicho
“Pensar en todo es más importante que pensar en una sola cosa”.
Este dicho es cierto para las organizaciones de BI.
Lamentablemente, muchos almacenes centran sus esfuerzos
tratando de abordar y aportar valor a un departamento en particular oa
usuarios específicos, con un poco de atención a la organización en
general. Suponga que el ejecutivo solicita ayuda al
werehouse. El equipo responde con un trabajo de 90 días que
incluye no solo la entrega de los requisitos de notificación definidos por el
ejecutivo pero asegura que todos adquirir base se mezclan en el nivel
atómico antes de ser introducido en la tecnología de cubos
propuesta.
Esta adición de ingeniería asegura que la empresa
werehouse se beneficiará de adquirir necesario para el gerente.
Sin embargo, el ejecutivo habló con firmas consultoras externas que
han propuesto una aplicación similar con entrega en menos de 4
semanas.
Suponiendo que el equipo interno de la casa sea competente, el
El ejecutivo tiene una opción. ¿Quién puede apoyar la disciplina de
ingeniería adicional necesaria para cultivar el bien
empresa informativa o puede optar por realizar su propia
solución rápidamente. Este último parece ser verdaderamente elegido
con demasiada frecuencia y solo sirve para crear contenedores de información de
que benefician solo a unos pocos o al soltero.
Metas a corto y largo plazo
Los arquitectos y planificadores de proyectos deben formalizar una
visión a largo plazo de la arquitectura general y planes para
convertirse en una organización de BI. Esta combinación de
ganancia a corto plazo y planificación a largo plazo
representan las dos caras de los esfuerzos de BI. La ganancia a corto plazo
la caducidad es la faceta de BI que se asocia con iteraciones del
su almacén.
Aquí es donde los planificadores, arquitectos y patrocinadores se centran en
cumplir con requisitos comerciales específicos. Es en este nivel donde el
se construyen estructuras físicas, se compra tecnología y se
se implementan técnicas. De ninguna manera están hechos para lidiar con
requisitos específicos definidos por comunidades de usuarios particulares.
Todo se hace para abordar los requisitos específicos definidos
de una comunidad en particular.
La planificación a largo plazo, sin embargo, es la otra faceta
de BI. Aquí es donde los planes y proyectos aseguraron que fuera
construyó cualquier estructura física, las tecnologías seleccionadas y el
técnicas realizadas con miras a la empresa. Y el
planificación a largo plazo que proporcione cohesión
necesario para asegurar que los beneficios comerciales se deriven de todos
las ganancias a corto plazo encontradas.
Justifique su esfuerzo de BI
Un almacenamiento de datos por sí solo no tiene ningún valor inherente. En otra
palabras, no hay un valor inherente entre las tecnologías de
técnicas de almacenamiento e implementación.
El valor de cualquier esfuerzo de almacén se encuentra en las acciones
realizado como resultado del entorno y el contenido del almacén
informativo crecido con el tiempo. Este es un punto crítico para entender
antes de intentar estimar el valor de cualquier iniciativa
casa.
Con demasiada frecuencia, los arquitectos y planificadores intentan aplicar valor a
componentes físicos y técnicos del almacén cuando en realidad el valor es
fundada con los procesos comerciales que se ven afectados positivamente por
almacén e información bien adquirida.
Aquí radica el desafío para fundar BI: ¿Cómo se justifica la inversión?
Si la casa en sí misma no tiene valor intrínseco, los diseñadores de
El proyecto debe investigar, definir y formalizar los beneficios.
logrado por aquellas personas que utilizarán el almacén para
mejorar procesos comerciales específicos o el valor de
información protegida o ambos.
Para complicar las cosas, cualquier proceso empresarial
afectados por los esfuerzos del almacén podrían proporcionar beneficios
"Considerable" o "leve". Considerables ventajas proporcionan uno
métrica tangible para medir el retorno de la inversión (ROI) - anuncio
por ejemplo, entregue el inventario una vez más durante un período
específico o por menor costo de transporte por envío. Es más
Es difícil definir las leves ventajas, como un mejor acceso a
información, en términos de valor tangible.
Conecta tu proyecto para conocer el
Solicitudes comerciales
Con demasiada frecuencia, los diseñadores de proyectos intentan vincular el valor
del almacén con objetivos amorfos de la firma. Al afirmar que
“El valor de un almacén se basa en nuestra capacidad para
satisfacer solicitudes estratégicas ”abrimos el
habla. Pero por sí solo no es suficiente para determinar si
invertir en inventario tiene sentido. Es mejor conectar representantes
almacén con solicitudes comerciales específicas y conocidas.
Midiendo el ROI
Calcular el ROI en una configuración de almacén puede ser
particularmente difícil. Es especialmente difcil si la ventaja
principio de una repetición particular es algo intangible o
fácil de medir. Un estudio encontró que los usuarios perciben
los dos principales beneficios de las iniciativas de BI:
▪ Crear la capacidad de tomar decisiones.
▪ Crear acceso a la información
Estos beneficios son beneficios suaves (o leves). Es fácil de ver
¿Cómo podemos calcular un ROI basado en un cliente potencial (o
mayor) como la reducción en el costo del transporte, pero cómo
¿medimos la capacidad para tomar mejores decisiones?
Este es definitivamente un desafío para los diseñadores de proyectos cuando
están tratando de que la empresa invierta en uno en particular
esfuerzo de almacén. Incrementar las ventas o disminuir los costos
ya no son los temas centrales que impulsan el entorno de BI.
En cambio, busca acceso en solicitudes comerciales
mejor a la información para que un departamento en particular pueda
tomar decisiones más rápidas. Estos son impulsores estratégicos para
que resulta ser igualmente importante para el negocio, pero son
más ambiguo y más difícil de caracterizar en una métrica tangible.
En este caso, calcular el ROI puede ser engañoso, si no irrelevante.
Los diseñadores de proyectos deben poder demostrar valor
tangible para que los ejecutivos decidan si invertir en
se sostiene una repetición particular. Sin embargo, no propondremos uno nuevo.
método para calcular el ROI, ni haremos ningún pro o argumento
En contra.
Hay muchos artículos y libros disponibles que tratan los fundamentos de
calcular el ROI. Hay propuestas de valor especiales como valor
en inversión (USTED), ofrecido por grupos como Gartner, que puede
a la investigación. En cambio, nos centraremos en los aspectos centrales de cualquier
ROI u otras propuestas de valor que deba considerar.
Aplicando ROI
Además del argumento sobre beneficios "duros" versus beneficios "ligeros"
asociados con los esfuerzos de BI hay otras cuestiones a considerar
cuando aplicamos el ROI. Por ejemplo:
Atribuya demasiados ahorros a los esfuerzos del DW que vendrían
sin embargo
Digamos que su empresa pasó de una arquitectura de
mainframe a un entorno UNIX distribuido. Así que cualquiera
ahorros que pueden (o no) lograrse mediante ese esfuerzo
no debe atribuirse exclusivamente, si a todos (?), a la
almacén.
No tener en cuenta todos los costos. Y hay muchas cosas de
tener en cuenta. Considere la siguiente lista:
▪ Costo de puesta en marcha, incluida la viabilidad.
▪ Costo de hardware dedicado con almacenamiento relacionado e
comunicación
▪ Costo del software, incluida la gestión de adquirir y extensiones
cliente / servidor, software ETL, tecnologías DSS,
aplicaciones de visualización, programación y flujo
software de trabajo y seguimiento.
▪ Costo de diseño de estructura adquirir, con la realización, y
la optimización de
▪ Costo de desarrollo de software directamente asociado con el esfuerzo
BI
▪ Costo de la asistencia domiciliaria, incluida la optimización de
rendimiento, incluido el control de la versión del software e
operaciones de ayuda
Aplique ROI "Big-Bang".
La construcción del almacén como un solo y gigantesco esfuerzo
está condenado al fracaso, por lo que también calcula el ROI de una iniciativa
gran empresa La oferta es sorprendente, y los diseñadores
continúan haciendo débiles intentos de estimar el valor de la totalidad
esfuerzo.
Porque los diseñadores intentan dar un valor monetario
sobre la iniciativa empresarial si es ampliamente conocido y aceptado que
¿Es difícil estimar repeticiones específicas? ¿Como es posible? No lo es
posible con algunas excepciones. No lo hagas.
Ahora que hemos establecido qué no hacer cuando calculamos
ROI, aquí hay algunos puntos que nos ayudarán en la definición de
un proceso confiable para estimar el valor de sus esfuerzos de BI.
Obtención del consentimiento de ROI. Independientemente del tuyo
elección de la técnica para estimar el valor de sus esfuerzos de BI, debe
ser acordados por todas las partes, incluidos los planificadores de proyectos,
patrocinadores y ejecutivos corporativos.
Reduzca el ROI a partes identificables. Un paso necesario hacia adentro
El cálculo de ROI razonable es enfocar ese cálculo en una
proyecto específico. Esto le permite estimar un valor
según los requisitos comerciales específicos que se cumplan
Defina los costos. Como se mencionó, numerosos costos deben ser
considerado. Además, los costos deben incluir no solo los asociados
a la iteración única sino también a los costes asociados
para asegurar el cumplimiento de los estándares de la empresa.
Definir beneficios. Vinculando claramente el ROI a los requisitos
comercial, deberíamos poder identificar el
beneficios que conducirán al cumplimiento de los requisitos.
Reducir costos y beneficios en próximas ganancias. Es el camino
la mejor manera de basar sus valoraciones en el valor actual neto
(VPN) a diferencia de tratar de predecir el valor futuro en
ganancias futuras.
Mantenga su tiempo fraccionado de ROI al mínimo. ES'
bien documentado a largo plazo se ha utilizado en el suyo
ROI.
Utilice más de una fórmula de ROI. Existen numerosos métodos para
Pronóstico del ROI y debe planificar si usar uno o
más, incluido el valor actual neto, la velocidad interna del retorno
(TIR) ​​y recuperación.
Defina el proceso repetible. Esto es crucial para calcular
cualquier valor a largo plazo. UN
proceso único repetible para todas las secuencias del proyecto un
seguir.
Los problemas enumerados son los más comunes definidos por expertos.
del entorno del werehouse. La insistencia por parte de la dirección de
tener un ROI de “Big-Bang” es muy confuso. Si empiezas todo
sus cálculos de ROI reduciéndolos a partes identificables y tangibles, ha
una buena oportunidad para estimar una evaluación precisa del ROI.
Preguntas sobre los beneficios del ROI
Cualesquiera que sean sus beneficios, suaves o duros, puede utilizar
algunas preguntas fundamentales para determinar su valor. A
ejemplo usando un sistema de escala simple, de 1 a 10, usted
puede detectar el impacto de cualquier esfuerzo utilizando lo siguiente
preguntas:
▪ ¿Cómo calificaría la comprensión de adquirir siguiendo esto
el proyecto de su empresa?
▪ ¿Cómo estimaría las mejoras del proceso como resultado de
¿este proyecto?
▪ ¿Cómo mediría ahora el impacto de nuevos conocimientos e inferencias?
puesto a disposición por esta iteración
▪ ¿Cuál ha sido el impacto de los nuevos entornos informáticos?
desempeñándose como resultado de lo aprendido?
Si las respuestas a estas preguntas son pocas, es posible que
la empresa no vale la inversión realizada. Preguntas con un alto
anotar puntos para ganancias de valor significativas y debe
sirven como guías para una mayor investigación.
Por ejemplo, una puntuación alta para las mejoras de procesos.
Debería llevar a los diseñadores a examinar cómo se desarrollan los procesos.
mejorado. Puede encontrar que algunas o todas las ganancias obtenidas
son tangibles y, por lo tanto, un valor monetario puede ser fácilmente
aplicado.
Aprovechando al máximo la primera iteración del
almacén
El mayor resultado de su esfuerzo empresarial suele estar en
primeras iteraciones. Estos primeros esfuerzos tradicionalmente
Establecer el contenido de información más útil para el público e
establece ayudas a la base tecnológica para las siguientes
Aplicaciones de BI.
Por lo general, cada subsecuencia subsiguiente de adquirir de proyecto de
Los almacenes aportan cada vez menos valor adicional a la empresa en
general. Esto es especialmente cierto si la iteración no
agrega nuevos temas o no satisface las necesidades de uno nuevo
comunidad de usuarios.
Esta característica de almacenamiento también se aplica a las baterías.
aumento de adquirir historiadores. A medida que los esfuerzos posteriores requieran más
adquirir y como mas adquirir se vierten en el almacén con el tiempo, la mayor parte de
adquirir se vuelve menos relevante para el análisis utilizado. Estas adquirir son
llamado a menudo adquirir quedarse dormidos y siempre es caro mantenerlos porque
casi nunca se utilizan.
¿Qué significa esto para los patrocinadores de proyectos? Esencialmente, yo
los primeros patrocinadores comparten más que los costos de inversión.
Esto es primario porque son el ímpetu para fundar la capa.
gran entorno tecnológico y recursos de almacén,
incluido orgánico.
Pero estos primeros pasos aportan el mayor valor y, por lo tanto, los diseñadores
A menudo hay que justificar la inversión.
Los proyectos realizados después de su iniciativa de BI pueden tener costos
más bajo (en comparación con el primero) y directo, pero tienen menos valor
a la compañia.
Y los propietarios de organizaciones deben comenzar a considerar
tirar la acumulación de adquirir y tecnologías menos relevantes.
Minería de datos: Minería Datos
Numerosos componentes arquitectónicos requieren variaciones de
tecnologías y técnicas de minería de datos -
por ejemplo, los diferentes "agentes" para el examen de los puntos de interés del
clientes, los sistemas operativos de la empresa y para el mismo dw. Estas
Los agentes pueden ser redes neuronales avanzadas capacitadas en
tendencias de la olla, como la demanda futura de productos basada en
promociones de venta; motores basados ​​en reglas para
reaccionar a un todo fecha circunstancias, por ejemplo, diagnóstico
recomendaciones médicas y de tratamiento; o incluso simples agentes
con la función de informar sobre las excepciones a los altos directivos (superior
ejecutivos). Generalmente estos procesos de extracción adquirir si
verificar en tiempo real; por lo tanto, deben estar unidos
completamente con el movimiento de adquirir ellos mismos.
Procesamiento de procesamiento analítico en línea
Analítica en línea
La capacidad de cortar, picar, rodar, profundizar
y realizar el análisis
qué pasaría si, está dentro del alcance, del objetivo de la suite
Tecnología IBM. Por ejemplo, las funciones de procesamiento analítico
en línea (OLAP) existen para DB2 que lleva el análisis dimensional al
motor de base de datos stesso.
Las funciones agregan utilidad dimensional a SQL mientras
aproveche todos los beneficios de ser una parte natural de DB2. Otro
ejemplo de integración OLAP es la herramienta de extracción, DB2
Analizador de servidores OLAP. Esta tecnología permite que los cubos del
Servidor DB2 OLAP para ser rápida y automáticamente
analizados para identificar e informar sobre los valores de adquirir inusual o inesperado
en todo el cubo al analista comercial. Y finalmente, las funciones del
DW Center proporciona medios para que los arquitectos controlen, entre los
otras cosas, el perfil de un cubo de servidor OLAP de DB2 como parte
naturaleza de los procesos ETL.
Análisis espacial Análisis espacial
El espacio representa la mitad de los anclajes analíticos (conducción)
necesario para un panorama
analítica amplia (el tiempo representa la otra mitad). El nivel atómico
(nivel atómico) del almacén, representado en la Figura 1.1,
incluye los fundamentos tanto del tiempo como del espacio. Las grabaciones
Análisis de anclaje de tiempo para información de tiempo y dirección
análisis del espacio de anclaje. Marcas de tiempo (marcas de tiempo)
Realizan el análisis a tiempo, y la información de la dirección conduce
el análisis por espacio. El diagrama muestra geocodificación - proceso de
convertir direcciones en puntos en un mapa o puntos en el espacio
de modo que conceptos como distancia e interno / externo puedan ser
utilizado en análisis: realizado a nivel atómico y análisis espacial
que se pone a disposición del analista. IBM proporciona extensiones
space, desarrollado con el Environmental System Research Institute (ESRI),
al base de datos DB2 para que los objetos espaciales puedan ser
almacenado como parte normal del base de datos relacional. DB2
Extensores espaciales, también proporcionan todas las extensiones SQL para
aprovechar el análisis espacial. Por ejemplo, extensiones SQL de
pregunta sobre
distancia entre direcciones o si un punto está dentro o fuera de un área
poligonales definidos, son un estándar analítico con el Spatial
Extensor. Consulte el capítulo 16 para obtener más información.
Base de datos-Herramientas para residentes Herramientas Base de datos-
Residente
DB2 tiene muchas características de SQL residente en BI que ayudan
en la acción de análisis. Éstas incluyen:
▪ Funciones de recursividad para realizar análisis, como "buscar
todas las rutas de vuelo posibles desde San Francisco a New York.
▪ Las funciones analíticas para clasificación, funciones acumulativas, cubo
y acumulaciones para facilitar las tareas que normalmente ocurren
sólo con la tecnología OLAP, ahora son una parte natural del
motor de base de datos
▪ La capacidad de crear tablas que contengan resultados.
Vendedores de base de datos los líderes combinan más capacidades de BI
en base de datos mismo.
Los principales proveedores de base de datos están mezclando más de
Funcionalidad BI en el base de datos mismo.
Esto proporciona el mejor rendimiento y más opciones de ejecución para el
Soluciones BI.
Se discuten las características y funciones de DB2 V8
en detalle en los siguientes capítulos:
Fundamentos de arquitectura técnica y gestión de datos
(Capítulo 5)
▪ Fundamentos de DB2 BI (Capítulo 6)
▪ Tablas de consultas materializadas de DB2
Tablas) (Capítulo 7)
▪ Funciones de DB2 OLAP (Capítulo 13)
▪ BI mejorado de DB2
Características y funciones) (Capítulo 15)
Sistema de entrega de datos simplificado
Sistema de entrega de adquirir simplificado
La arquitectura representada en la Figura 1.1 incluye varios
estructuras adquirir físico. Uno es el almacén de adquirir operando.
Generalmente, un ODS es un tema orientado,
integrado y actual. ¿Construiría un ODS para apoyar, ad
ejemplo, la oficina de ventas. Las ventas de SAO se integrarían adquirir
procedente de numerosos sistemas diferentes, pero solo mantendría,
ejemplo, las transacciones de hoy. El ODS se puede actualizar
incluso muchas veces al día. Al mismo tiempo, los procesos
empujar yo adquirir integrado en otras aplicaciones. Esta estructura es
diseñado específicamente para integrar adquirir e actual y dinámico
sería un candidato probable para someterse a análisis en tiempo real,
cómo proporcionar agentes de servicio clientes informacion sobre ventas
corrientes de un cliente extrayendo información de tendencias de ventas
desde el propio almacén. Otra estructura que se muestra en la Figura 1.1 es
un estatus formal para el dw. No solo es este el lugar para
la ejecución de la necesaria integración, de la calidad de adquirir, y con
de la transformación de adquirir de stock en camino, pero también es
un área de almacenamiento temporal y confiable para adquirir respondió que
podría utilizarse en análisis en tiempo real. Si decides
utilizar un ODS o un área de preparación, uno
de las mejores herramientas para poblar estas estructuras adquirir uso
diferentes fuentes operativas es la consulta distribuida heterogénea de DB2.
Esta capacidad la proporciona la función DB2 opcional.
llamado DB2 Relational Connect (solo consulta) y a través de DB2
DataJoiner (un producto separado que entrega la aplicación,
la inserción, actualización y posibilidad de cancelación de un
RDBMS distribuidos heterogéneos).
Esta tecnología permite a los arquitectos adquirir di legare adquirir di
producción con procesos analíticos. No solo la tecnología
adaptarse virtualmente a cualquiera de las solicitudes de replicación que
pueden aparecer con análisis en tiempo real, pero
También pueden conectarse a una amplia variedad de bases de adquirir más
populares, incluidos DB2, Oracle, Sybase, SQL Server,
Informix y otros. DB2 DataJoiner se puede utilizar para completar
una estructura adquirir formal como un ODS o incluso una mesa
permanente representada en el almacén diseñado para restauración
rápido de actualizaciones instantáneas o en venta. Por supuesto,
estas mismas estructuras adquirir se puede poblar usando
otra tecnología importante diseñada para la replicación de adquirir, IBM
DataPropagator relacional. (DataPropagator es un producto separado
para sistemas centrales. DB2 UNIX, Linux, Windows y OS / 2 incluyen
servicios de replicación de adquirir como característica estándar).
Otro método para mover el adquirir operando alrededor
para la empresa es un integrador de aplicaciones empresariales de lo contrario
conocido como el corredor de mensajes
la tecnología única permite un control inigualable para centrarse
(focalización) y mover adquirir alrededor de la empresa. IBM tiene el corredor
del mensaje más utilizado, MQSeries, o una variación
del producto que incluye los requisitos de comercio electrónico, IBM
WebSphere MQ.
Para obtener más información sobre cómo aprovechar MQ para respaldar un
almacén y entorno de BI, visite sitio web del libro. Por ahora, es
Baste decir que esta tecnología es un medio excelente para
capturar y transformar (utilizando MQSeries Integrator) adquirir
operadores específicos contratados para soluciones de BI. Allí
La tecnología MQ se ha integrado y empaquetado en UDB V8, que
significa que las colas de mensajes ahora se pueden administrar
como si fueran tablas DB2. El concepto de soldadura del
mensajes en cola y universales base de datos jefes relacionales
hacia un entorno de entrega potente adquirir.
Latencia cero Latencia cero
El objetivo estratégico final de IBM es el análisis de latencia cero (latencia cero).
Según lo definido por
Gartner, un sistema de BI debe poder deducir, asimilar
y proporcionar información a los analistas que lo soliciten. El reto,
por supuesto, está en cómo mezclar adquirir actual y en tiempo real
con la información histórica necesaria, como i adquirir modelo relacionado / de
tendencia, o comprensión extraída, como una delimitación de la
cliente
Dicha información incluye, por ejemplo, la identificación de clientes ad
alto o bajo riesgo o qué productos clientes ellos comprarán mucho
probablemente si ya tienen algo de queso en sus carritos
compras.
Obtener latencia cero depende en realidad de dos
mecanismos fundamentales:
▪ Unión completa de adquirir que se analizan con el
técnicas establecidas y con las herramientas desarrolladas por BI
▪ Un sistema de entrega de adquirir eficiente para asegurar que
el análisis en tiempo real está realmente disponible
Estos requisitos previos de latencia cero no son diferentes de los dos
metas establecidas por IBM y descritas anteriormente.
El estrecho acoplamiento de la adquirir es parte de la
integración perfecta organizada por IBM. Y crea un sistema
entrega de adquirir eficiente depende completamente de
tecnología disponible que simplifica el proceso de entrega de
adquirir. En consecuencia, dos de los tres objetivos de IBM son fundamentales
para realizar el tercero. IBM está desarrollando conscientemente su propio
tecnología para garantizar que la latencia cero sea una realidad para
esfuerzos de almacén.
Resumen / Síntesis
La organización de BI proporciona una hoja de ruta para
crea tu entorno
iterativamente. Debe ajustarse para reflejar las necesidades de
su negocio, tanto actual como futuro. Sin una visión arquitectónica
grande, las repeticiones de stock son poco más que
implementaciones de almacén central aleatorias que hacen poco por
crear una gran empresa informativa.
El primer obstáculo para los gerentes de proyecto es cómo justificar
inversiones necesarias para el desarrollo de la organización de BI.
Aunque el cálculo del ROI se ha mantenido como un apoyo importante para
logros del almacén, es cada vez más difícil
predecir exactamente. Esto ha llevado a otros métodos para
determinar si está obteniendo el valor de su dinero. los
valor de la inversión2 (USTED), por ejemplo, se adquiere
como solución.
Se cierne sobre los arquitectos de adquirir y en planificadores de proyectos
generar deliberadamente y proporcionar información a asociaciones de
usuarios y no simplemente dar un servicio en adquirir. Hay un
gran diferencia entre los dos. La información es algo que hace que uno
diferencia en la toma de decisiones y la eficacia; relativamente, yo
adquirir son bloques de construcción para derivar esa información.
Aunque crítico con la fuente adquirir para atender solicitudes
comercial, el entorno de BI debería desempeñar un papel más importante
en la creación de contenido de información. Tenemos que tomar
medidas adicionales para limpiar, integrar, transformar o
de lo contrario, para crear un contenido de información según el cual el
los usuarios pueden actuar y, por lo tanto, debemos asegurarnos de que
acciones y esas decisiones, cuando sean razonables, se reflejan
en el entorno de BI. Si relegamos el almacén a servir solo en adquirir,
se asegura que las asociaciones de usuarios crearán el contenido
la información necesaria para actuar. Esto asegura que su
la comunidad podrá tomar mejores decisiones, pero la empresa
sufre de la falta de conocimiento que han utilizado.
Fecha que los arquitectos y planificadores de proyectos inicien proyectos
específicos del entorno de BI, siguen siendo responsables ante la empresa
en general. Un ejemplo sencillo de esta función bidireccional
caras de las iteraciones de BI se encuentran en la fuente adquirir. todos
adquirir recibidos para solicitudes comerciales específicas deben ser
poblado en la primera capa atómica. Esto garantiza el desarrollo de la
activo de información corporativa, así como gestionar, abordar el
solicitudes específicas del usuario definidas en la iteración.

¿Qué casa de datos?
Almacén de datos es el corazón de la arquitectura de los sistemas de información
desde 1990 y apoya los procesos de información ofreciendo una sólida
plataforma integrada de adquirir historiadores tomados como base para posteriores
análisis. LA almacenamiento de datos ofrecen facilidad de integración en un
mundo de sistemas de aplicación que no son compatibles entre sí. Fecha
El almacén ha evolucionado hasta convertirse en tendencia. Almacén de datos
organiza y almacena i adquirir necesario para los procesos de información e
analítico sobre la base de una perspectiva histórica a largo plazo. Todos
esto implica un compromiso considerable y constante en la construcción e
en el mantenimiento de la almacenamiento de datos.
Entonces, que es un almacenamiento de datos? La almacenamiento de datos es:
▪ orientado a materias
▪ sistema integrado
▪ tiempo variable
▪ no volátil (no cancela)
una coleccion de adquirir utilizado para apoyar las decisiones de gestión en
implementación del proceso.
I adquirir insertado en almacenamiento de datos surgen en la mayoría
casos de entornos operativos. La almacenamiento de datos está hecho por un
unidad de almacenamiento, físicamente separada del resto de la
sistema, que contiene adquirir previamente transformado por
Aplicaciones que operan con información derivada del medio ambiente.
operando.
La definición literal de un almacenamiento de datos merece una mirada en profundidad
explicación, ya que hay importantes motivaciones y significados de
Fondo que describe las características de un almacén.
ORIENTACIÓN DE SUJETOS ORIENTACIÓN
TEMÁTICO
La primera característica de un almacenamiento de datos es que está orientado a la ia
actores principales de una empresa. El juicio de los juicios a través de i
adquirir contrasta con el método más clásico que proporciona
la orientación de las aplicaciones hacia procesos y funciones,
método en su mayor parte compartido por la mayoría de los
sistemas direccionales más antiguos.
El mundo operativo está diseñado en torno a aplicaciones y funciones.
como préstamos, ahorros, tarjetas bancarias y fideicomisos para una institución
financiero. El mundo de la dw se organiza en torno a temas
como el cliente, el vendedor, el producto y el negocio.
La alineación en torno a temas afecta el diseño y
en la realización de adquirir encontrado en el dw. Más relevante,
el argumento principal afecta a la parte más importante de la
estructura clave.
El mundo de la aplicación está influenciado tanto por el diseño de la fecha
base y desde el diseño del proceso. El mundo de
dw se centra únicamente en el modelado adquirir y en
dibujo del base de datos. El diseño del proceso (en su forma
classic) no forma parte del entorno dw.
Las diferencias entre la elección del proceso / función y la aplicación.
La elección por tema también se revela como diferencias en el contenido.
de adquirir en un nivel detallado. LA adquirir del dw no incluye i adquirir que
no se utilizarán para el proceso de DSS mientras las aplicaciones
operacional orientado a adquirir contener yo adquirir para satisfacer
inmediatamente los requisitos funcionales / de procesamiento que pueden o
menos tener algún uso para el analista de DSS.
Otra forma importante en la que las aplicaciones orientadas a operaciones
ai adquirir difiere de adquirir de dw está en los informes de adquirir. adquirir
operacional mantener una relación continua entre dos o más tablas
basado en una regla comercial que está activa. LA adquirir por dw
abarcan un espectro de tiempo y las proporciones encontradas en el dw son
mucho. Muchas reglas comerciales (y, en consecuencia, muchas
informes de adquirir ) están representados en el almacén de adquirir entre las dos o
múltiples tablas.
(Para una explicación detallada de cómo las relaciones entre los adquirir son
gestionado en el DW, nos referimos al tema técnico en ese
pregunta.)
Desde ninguna otra perspectiva que la de la diferencia
fundamental entre una elección de funcional / proceso y aplicación
una elección de tema, hay una mayor diferencia entre los sistemas
operativo y adquirir y el DW.
INTEGRACIÓN INTEGRACIÓN
El aspecto más importante del entorno de dw es que yo adquirir encontró
dentro del dw se integran fácilmente. SIEMPRE. SIN QUE
EXCEPCIONES. La esencia misma del entorno dw es que yo adquirir
contenidos dentro de los límites del almacén están integrados.
La integración se revela de muchas formas diferentes: en convenciones
identificado como consistente, en la medida de variables consistentes, en
estructuras codificadas que consisten, en los atributos físicos de adquirir
coherente, etc.
A lo largo de los años los diseñadores de diferentes aplicaciones lo han hecho
teniendo muchas decisiones sobre cómo una aplicación debe
ser desarrollado. Decisiones de diseño y estilo individualizadas
Las aplicaciones de los diseñadores se revelan de cien maneras: en
diferencias en codificación, estructura clave, características físicas,
convenciones de identificación, etc. La capacidad colectiva de muchos
diseñadores de aplicaciones para crear aplicaciones inconsistentes
es legendario. La Figura 3 expone algunas de las más diferencias
importante en la forma en que se diseñan las aplicaciones.
Codificación: Codificar:
Los diseñadores de aplicaciones eligieron la codificación de campo:
sexo - de varias formas. Un diseñador representa el sexo como
una "m" y "f". Otro diseñador representa el sexo como un "1"
y un "0". Otro diseñador representa el sexo como una "x" e
"Y". Otro diseñador representa el sexo como "masculino" e
"hembra". Realmente no importa cómo viene el sexo en el DW. Ellos"
y la "F" probablemente sea tan buena como el conjunto
representación.
Lo que importa es que de cualquier origen venga el campo sexual,
ese campo llega al DW en un estado integrado consistente. De
consecuencia cuando el campo se carga en el DW desde
una aplicación donde se ha representado en formato
"M" y "F", i adquirir debe convertirse al formato DW.
Medida de Atributos: Medida de
Atributos:
Los diseñadores de aplicaciones eligieron medir la tubería en
una variedad de formas en el curso
Algunos años. Un diseñador almacena i adquirir del oleoducto en
centímetros. Otro diseñador de aplicaciones almacena i adquirir
de la tubería en términos de pulgadas. Otro diseñador de
tiendas de aplicaciones i adquirir de la tubería en millones de pies cúbicos
por segundo. Y otro diseñador almacena la información del
oleoducto en términos de yardas. Cualquiera que sea la fuente, cuando el
la información de la tubería llega al DW deben ser
medido de la misma manera.
Según las indicaciones de la figura 3, los problemas de integración
afectan a casi todos los aspectos del proyecto: las características
físico de adquirir, el dilema de tener más de una fuente de adquirir, la
cuestión de muestras identificadas inconsistentes, formatos de adquirir
inconsistente, y así sucesivamente.
Cualquiera que sea el argumento del diseño, el resultado es el mismo:
i adquirir debe almacenarse en el DW en singular e
globalmente aceptable incluso cuando los sistemas operativos de
tienda inferior de manera diferente i adquirir.
Cuando el analista de DSS mira el DW, el objetivo del analista
debería ser la explotación de adquirir que están en el almacén,
en lugar de preguntarse sobre la credibilidad o consistencia de
adquirir.
VARIANCIA DE TIEMPO
Todas adquirir en el DW son precisos en algún momento.
Esta característica básica del adquirir en DW es muy diferente de adquirir
que se encuentran en el entorno operativo. LA adquirir del entorno operativo son
tan preciso como en el momento del acceso. En otras palabras,
en el entorno operativo al acceder a una unidad adquirir, Pero también
espere a que refleje valores precisos como en el momento del acceso.
Porque yo adquirir en el DW son tan precisos como en algún punto de la
tiempo (es decir, no "ahora mismo"), yo adquirir encontrado en el DW
son "variación en el tiempo".
La variación temporal de adquirir Se hace referencia a DW de muchas formas.
La forma más sencilla es que yo adquirir de un DW representan adquirir en un
horizonte a largo plazo: de cinco a diez años. El horizonte
el tiempo representado para el entorno operativo es mucho más corto
▪ de los valores actuales de hoy de hasta sesenta noventa
Aplicaciones que deben funcionar bien y deben ser
disponible para el procesamiento de transacciones debe llevar el
cantidad mínima de adquirir si admiten algún grado de
flexibilidad. Entonces las aplicaciones operativas tienen un horizonte
poco tiempo, como tema de diseño de
aplicaciones de audio.
La segunda forma en que aparece la 'variación en el tiempo' en el DW es en el
estructura clave. Cada estructura clave en el DW contiene,
implícita o explícitamente, un elemento de tiempo, como
día, semana, mes, etc. El elemento de tiempo es casi siempre
en la parte inferior de la clave concatenada que se encuentra en el DW. En estos
ocasiones, el elemento tiempo existirá implícitamente, según sea el caso
donde se duplica un archivo completo al final del mes o trimestre.
La tercera forma en que se muestra la varianza de tiempo es que i adquirir de los
DW, recién registrado correctamente, no se puede
actualizado. LA adquirir de la DW son, a todos los efectos prácticos, una larga
serie de instantáneas (instantánea). Por supuesto, si las instantáneas son
tomado incorrectamente, entonces las instantáneas pueden ser
modificado. Pero suponiendo que las instantáneas estén listas
correctamente, no se cambian tan pronto como se hacen. En algunos
casos pueden ser poco éticos o incluso inválidos que las instantáneas en el
Se modifican los DW. LA adquirir operativo, siendo preciso como en
al acceder, se pueden actualizar tal como se presenta
la necesidad.
NO VOLÁTIL
La cuarta característica importante de DW es que no es volátil.
Se realizan actualizaciones, inserciones, cancelaciones y cambios
regularmente para entornos operativos registro por registro. Pero el
manipulación básica de adquirir necesario en el DW es mucho más
simple. Solo hay dos tipos de operaciones que ocurren en el
DW - la carga inicial del adquirir y acceso a adquirir. No hay
cualquier actualización del adquirir (en el sentido general de
actualización) en el DW como una operación de procesamiento normal.
Hay algunas consecuencias muy poderosas de esta diferencia.
base entre el procesamiento operativo y el procesamiento DW. En el nivel
diseño, la necesidad de tener cuidado al actualizar
anómalo no es un factor en el DW, ya que la actualización del adquirir no es
llevado a cabo. Esto significa que a nivel físico de diseño,
se pueden tomar libertades para optimizar el acceso a adquirir,
en particular en el tratamiento de los temas de normalización y
desnormalización física. Otra consecuencia de la sencillez
de las operaciones de DW se encuentra en la tecnología subyacente utilizada para
ejecutar el entorno DW. Tener que soportar actualizaciones
registro por registro en línea (como suele ser el caso con
procesamiento operativo) se requiere que la tecnología tenga
cimientos muy complejos bajo una aparente sencillez.
La tecnología que admite transacciones de respaldo y recuperación
e integridad de adquirir y el descubrimiento y solución de la condición de interbloqueo es
bastante complejo y no necesario para el procesamiento DW.
Las características de un DW, orientación de diseño,
integración de adquirir dentro del DW, varianza temporal y simplicidad
administración de adquirir, todo conduce a un entorno que es muy, muy
diferente del entorno operativo clásico. La fuente de casi todos
adquirir de DW son el entorno operativo. Es tentador pensar
que hay una redundancia masiva de adquirir entre los dos ambientes.
De hecho, la primera impresión que recibe mucha gente es la de
gran redundancia de adquirir entre el entorno operativo y el
DW. Tal interpretación es superficial y demuestra que uno
falta de comprensión de lo que sucede en el DW.
De hecho, existe un mínimo de redundancia de adquirir entre el entorno operativo
y adquirir de la DW. Consideremos lo siguiente:
▪ yo adquirir se filtran fecha que pasa del entorno operativo
al entorno DW. Mucho adquirir nunca se desmayan
del entorno operativo. Excepto que yo adquirir que son necesarios para
El procesamiento DSS encuentra su dirección en el medio ambiente
▪ el horizonte temporal del adquirir es muy diferente de un entorno
al otro. LA adquirir en el entorno operativo son muy frescos. LA adquirir
en DW son mucho mayores. Solo desde la perspectiva
del horizonte temporal, hay muy poca superposición
entre el entorno operativo y el DW.
▪ El DW contiene adquirir resumen que nunca se encuentran
en el entorno
▪ yo adquirir sufrir una transformación fundamental desde
a medida que pasan a la Figura 3 ilustra que la mayoría
parte de adquirir se modifican significativamente siempre que
para ser seleccionado y movido a la DW. Dicho de otra manera, el
la mayoría adquirir está físicamente modificado e
radicalmente cómo se traslada al DW. Desde el punto de vista
la integración no es lo mismo adquirir que residen
en el entorno operativo.
A la luz de estos factores, la redundancia de adquirir entre los dos entornos es
un evento raro, que conduce a menos del 1% de redundancia entre los dos
Ambientes.
LA ESTRUCTURA DEL ALMACÉN
Los DW tienen una estructura distinta. Hay varios niveles de resumen y di
detalle que demarcan las DW.
Los diversos componentes de un DW son:
▪ Metadatos
Datos detalles actuales
Datos de detalle antiguo
Datos ligeramente resumido
Datos muy resumido
De lejos, la principal preocupación es para yo adquirir de detalle
corrientes. Es la principal preocupación porque:
▪ yo adquirir los detalles actuales reflejan los eventos más recientes,
que siempre son de gran interés y
▪ yo adquirir de detalles actuales son voluminosos porque es
almacenado al nivel más bajo de granularidad e
▪ yo adquirir los detalles actuales casi siempre se almacenan en
memoria de disco, que es de acceso rápido, pero cara e
complejo de
I adquirir los detalles más antiguos son adquirir que se almacenan en
algún recuerdo de massa. Tiene acceso esporádico y es
almacenado a un nivel de detalle compatible con adquirir detallado
corrientes. Si bien no es obligatorio almacenar en un
memoria alternativa, debido al gran volumen de adquirir unido con
acceso esporádico de adquirir, el medio de memoria para adquirir di
Los detalles más antiguos generalmente no se almacenan en el disco.
I adquirir resumidos a la ligera son adquirir que se destilan desde abajo
nivel de detalle encontrado en el nivel de detalle actual. Esta
El nivel DW casi siempre se almacena en la memoria del disco. LA
problemas del diseño que se presentan al arquitecto de la adquirir
en la construcción de este nivel del DW son:
▪ ¿Qué unidad de tiempo es el resumen realizado arriba?
▪ Qué contenido, atributos resumirán ligeramente la
contenido de adquirir
El siguiente nivel de adquirir encontrado en el DW es el de adquirir muy
resumido. LA adquirir altamente resumidos son compactos y fáciles
accesible. LA adquirir muy resumidos a veces se encuentran
en el entorno DW y en otros casos i adquirir altamente resumidos son
que se encuentran fuera de las paredes inmediatas de la tecnología que aloja el DW.
(en cualquier caso, yo adquirir altamente resumidos son parte de la DW
independientemente de donde yo adquirir están alojados físicamente).
El componente final del DW es el de los metadatos. En muchos aspectos
los metadatos se encuentran en una dimensión diferente a otras adquirir
del DW, porque los metadatos no contienen ningún fecha directamente
tomado del entorno operativo. Los metadatos tienen un papel especial e
muy importante en el DW. Los metadatos se utilizan como:
▪ un directorio para ayudar al analista de DSS a localizar el
contenido del DW,
▪ una guía para el mapeo de adquirir de como yo adquirir Han sido
transformado del entorno operativo al entorno DW,
▪ una guía de los algoritmos utilizados para resumir entre adquirir di
detalle actual ei adquirir ligeramente resumido, yo adquirir muy
resúmenes,
Los metadatos juegan un papel mucho más importante en el entorno DW
en comparación con lo que alguna vez tuvieron en el entorno operativo
MEDIO DE ALMACENAMIENTO DE DETALLE ANTIGUO
Se puede utilizar cinta magnética para almacenar ese tipo de
adquirir. De hecho, existe una amplia variedad de herramientas de memorización que
debe ser considerado para la preservación de viejos adquirir di
detalle.
Dependiendo del volumen de la adquirir, la frecuencia de acceso, el costo
de las herramientas y el tipo de acceso, es completamente probable
que otras herramientas necesitarán el antiguo nivel de detalle
en el DW.
FLUJO DE DATOS
Hay un flujo normal y predecible de dioses. adquirir dentro de la DW.
I adquirir ingrese el DW desde el entorno operativo. (NOTA: hay
algunas excepciones muy interesantes a esta regla. Sin embargo, casi
todos adquirir ingrese el DW desde el entorno operativo). Fecha que adquirir
ingrese al DW desde el entorno operativo, se transforma como ha sido
descrito arriba. Siempre que ingrese el DW, yo adquirir introducir el
nivel de detalle actual, como se muestra. Allí reside y se usa
hasta que ocurra uno de los tres eventos:
▪ está purificado,
▪ se resume y / o
▪ es
Proceso obsoleto dentro de un movimiento DW i adquirir detalles actuales
a adquirir de detalle antiguo, según la edad de adquirir. El proceso
el resumen utiliza el detalle de adquirir para calcular yo adquirir
niveles ligeramente resumidos y muy resumidos de adquirir. hay
algunas excepciones al flujo mostrado (que se discutirán más adelante).
Sin embargo, por lo general, para la gran mayoría de adquirir encontró
dentro de un DW, el flujo de adquirir es como se muestra en la imagen.
USANDO EL ALMACEN DE DATOS
No es sorprendente que los diversos niveles de adquirir dentro del DW no
reciben diferentes niveles de uso. Como regla, cuanto mayor sea el nivel de
resumen, más i adquirir son usados.
Muchos usos ocurren en adquirir altamente resumido, mientras que el viejo
adquirir los detalles casi nunca se utilizan. Hay una buena razón en el
mover la organización al paradigma del uso de recursos. Más tiene
resumen i adquirir, cuanto más rápido y eficiente sea llegar al adquirir. Si
un tienda encuentra que hace muchos procesos en el nivel de detalle del DW,
luego una gran cantidad correspondiente de recursos de la máquina
se consume. Lo mejor para todos es enjuiciar
como en un alto nivel de resumen lo antes posible.
Para muchas tiendas, el analista de DSS en un DW previo al entorno utilizó
adquirir a nivel de detalle. En muchos aspectos, la llegada de un adquirir detallado
parece una manta de seguridad, incluso cuando están disponibles
otros niveles de resumen. Una de las actividades del arquitecto de adquirir è
desacostumbrado al usuario de DSS del uso constante de adquirir en el nivel plus
bajo detalle. Hay dos razones disponibles
por el arquitecto de adquirir:
▪ mediante la instalación de un sistema de devolución de cargo, donde el usuario final paga el
recursos consumidos e
▪ que indican que el tiempo de respuesta muy bueno puede ser
obtenido cuando el comportamiento con i adquirir es de alto nivel
de resumen, mientras que el tiempo de respuesta deficiente se debe a la
comportamiento de adquirir a un nivel bajo de
OTRAS CONSIDERACIONES
Hay algunas otras consideraciones de construcción y gestión.
D. W.
La primera consideración es la de los índices. LA adquirir en los niveles más altos de
el resumen se puede indexar libremente, mientras que yo adquirir
en niveles más bajos de detalle, son tan voluminosos que pueden ser
indexado frugalmente. De la misma manera, yo adquirir en los altos niveles de
los detalles se pueden restaurar con relativa facilidad,
mientras que el volumen de adquirir en los niveles inferiores es tan grande que yo adquirir no
se pueden renovar fácilmente. En consecuencia, el modelo
de adquirir y el trabajo formal realizado por el diseño estableció el
base para el DW aplicado casi exclusivamente al nivel
detalle actual. En otras palabras, las actividades de modelado de
adquirir no se aplican a los niveles de resumen en casi todos los casos.
Otra consideración estructural es la de la subdivisión de
adquirir por DW.
La partición se puede realizar en dos niveles: en el nivel de dbms y el
nivel de aplicación. En la división del nivel dbms, la dbms è
informado de las divisiones y las verifica en consecuencia. En el caso de
división en el nivel de aplicación, solo el programador es
informado de las divisiones y responsabilidad de las mismas
la administración le queda a él
Debajo del nivel dbms, mucho trabajo se realiza automáticamente. Hay
mucha inflexibilidad relacionada con la administración automática de
divisiones. En el caso de la división a nivel de aplicación del adquirir de los
almacenamiento de datos, hay mucho trabajo en el programador, pero el
El resultado final es la flexibilidad en la administración de adquirir en la fecha
almacén
OTRAS ANOMALIAS
Mientras que los componentes del almacenamiento de datos trabajar como se describe
para casi todos adquirir, hay algunas excepciones útiles que deben
ser discutido. Una excepción es la de adquirir resúmenes públicos
(resumen de datos públicos). Estos son adquirir resúmenes que han sido
calculado fuera del almacenamiento de datos pero son utilizados por la sociedad. LA adquirir
Los resúmenes públicos se almacenan y gestionan en el almacenamiento de datos,
aunque, como se mencionó anteriormente, están resueltos. LA
los contadores trabajan para producir tales adquirir como el
ingresos, gastos trimestrales, beneficios trimestrales, etc. La obra
hecho por los contables es externo al almacenamiento de datos. Sin embargo, yo adquirir son
utilizado “internamente” dentro de la empresa – desde Marketing, ventas, etc
Otra anomalía, que no se discutirá, es la de adquirir externo.
Otro gran tipo de adquirir que se puede encontrar en una cita
almacén es el de datos de detalle permanentes. Estos causan el
Necesito almacenar permanentemente i adquirir en un nivel
detallado por razones éticas o legales. Si una empresa exhibe i
trabajadores relacionados con sustancias peligrosas existe la necesidad de adquirir
detallado y permanente. Si una empresa produce un producto que
se trata de seguridad pública, qué partes de un avión, hay
la necesidad de adquirir detalles permanentes, así como si una empresa
entra en contratos peligrosos.
La empresa no puede permitirse el lujo de pasar por alto los detalles por qué
durante los próximos años, en el caso de una demanda, un retiro, un
defecto de construcción en disputa, etc. exposición de la empresa
podría ser genial. En consecuencia, existe un tipo único de adquirir
conocido como datos de detalle permanente.
RESUMEN
Un almacenamiento de datos es un objeto orientado, integrado, variante de
tiempo, una colección de adquirir no volátil en apoyo de las necesidades de
decisión de la administración. Cada una de las funciones destacadas de
un almacenamiento de datos tiene sus implicaciones. Además hay cuatro
niveles de adquirir de los almacenamiento de datos:
▪ Detalle antiguo
▪ Detalle actual
Datos ligeramente resumido
Datos muy resumido
Los metadatos también son una parte importante del almacenamiento de datos.
RESUMEN
El concepto de almacenamiento de adquirir recibido recientemente
mucha atención y se convirtió en una tendencia de los 90. Eso es todo
debido a la capacidad de un almacenamiento de datos para superar el
limitaciones de los sistemas de apoyo a la administración como i
sistemas de ayuda a la decisión (DSS) y sistemas de información
ejecutivo (EIS).
Aunque el concepto de almacenamiento de datos parece prometedor,
implementar yo almacenamiento de datos puede ser problemático porque
Procesos de almacenamiento a gran escala. A pesar de la
complejidad de los proyectos de almacenamiento adquirir, muchos proveedores
y consultores que almacenan adquirir argumentar que
el almacenamiento de adquirir La corriente no implica problemas.
Sin embargo, al inicio de este proyecto de investigación, casi ninguno
Se ha llevado a cabo una investigación independiente, rigurosa y sistemática. De
En consecuencia, es difícil decir qué sucede realmente
en la industria al construir almacenamiento de datos.
Este estudio exploró la práctica de almacenamiento de adquirir
contemporáneos que tiene como objetivo desarrollar una comprensión más rica
de la práctica australiana. El análisis de la literatura proporcionó la
contexto y fundamento para el estudio empírico.
Hay varios resultados de esta búsqueda. Primero
lugar, este estudio reveló las actividades que ocurrieron
durante el desarrollo de la almacenamiento de datos. En muchas áreas, yo adquirir reunido
confirmó la práctica reportada en la literatura. Segundo
sitio, problemas y problemas que pueden afectar
desarrollo de la almacenamiento de datos se identificaron a partir de este estudio.
Finalmente, los beneficios derivados de las organizaciones australianas asociadas con
el uso de almacenamiento de datos han sido revelados.
Capítulo 1
Contexto de investigación
El concepto de almacenamiento de datos ha recibido una gran popularidad.
exposición y se ha transformado en una tendencia emergente en
90 (McFadden 1996, TDWI 1996, Shah y Milstein 1997,
Shanks y otros. 1997, Eckerson 1998, Adelman y Oates 2000). Esta
se puede ver por el creciente número de artículos en la fecha
almacenamiento en publicaciones comerciales (Little y Gibson 1999).
Muchos artículos (ver, por ejemplo, Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett y King 1996, Graham et al. 1996,
Sakaguchi y Frolick 1996, Alvarez 1997, Brousell 1997, Clarke
1997, McCarthy 1997, O'Donnell 1997, Edwards 1998, TDWI
1999) reportó beneficios significativos para las organizaciones.
que implemento yo almacenamiento de datos. Apoyaron su teoría
con evidencia anecdótica de implementaciones exitosas, el alto rendimiento
sobre las cifras de inversión (ROI) y, también, brindando orientación
referencia o metodologías para el desarrollo de almacenamiento de datos
(Shanks et al. 1997, Seddon y Benjamin 1998, Little y Gibson
1999). En un caso extremo, Graham et al. (1996) tienen
informó un rendimiento promedio de una inversión de tres años del 401%.
Gran parte de la literatura actual, sin embargo, ha pasado por alto
complejidades involucradas en la realización de tales proyectos. Los proyectos de
almacenamiento de datos normalmente son complejos y de gran escala e
por lo tanto, implican una alta probabilidad de fallar si no son
cuidadosamente controlados (Shah y Milstein 1997, Eckerson 1997,
Foley 1997b, Zimmer 1997, Bort 1998, Gibbs y Clymer 1998, Rao
1998). Requieren grandes cantidades de recursos humanos y
financiero y tiempo y esfuerzo para construirlos (Hill 1998, Crofts 1998). los
el tiempo típico y los medios económicos necesarios son respectivamente
unos dos años y dos o tres millones de dólares (Braly 1995, Foley
1997b, Bort 1998, Humphries et al. 1999). Estos tiempos y medios
Se requieren finanzas para controlar y consolidar muchos aspectos.
diferentes tipos de almacenamiento de datos (Cafasso 1995, Hill 1998). Por el lado
consideraciones de hardware y software, otras funciones, que varían
de la extracción de adquirir a los procesos de carga de adquirir, a partir de
capacidad de memoria para gestionar actualizaciones y meta adquirir
para la formación de usuarios, deben tenerse en cuenta.
En el momento del inicio de este proyecto de investigación, había muy poca
investigación académica realizada en el campo del almacenamiento de datos,
especialmente en Australia. Esto fue evidente por la escasez de artículos.
publicado sobre almacenamiento de datos por periódicos u otros escritos
académicos de la época. Muchos de los escritos académicos
disponible describió la experiencia estadounidense. La falta de
La investigación académica en el área de almacenamiento de datos sl ha provocado la
demanda de investigaciones rigurosas y estudios empíricos (McFadden 1996,
Shanks y otros. 1997, Little y Gibson 1999). En particular, los estudios
investigación sobre el proceso de implementación de almacenamiento de datos
deben hacerse para ampliar el conocimiento
general sobre la implementación de almacenamiento de datos e
servirá como base para un estudio de investigación futuro (Shanks ed
otros. 1997, Little y Gibson 1999).
El propósito de este estudio, por tanto, es estudiar qué es realmente
sucede cuando las organizaciones mantienen y usan datos
almacén en Australia. Específicamente, este estudio involucrará
un análisis de todo un proceso de desarrollo de un almacenamiento de datos,
desde el inicio y la planificación hasta el diseño y
implementación y uso posterior dentro de las organizaciones
Australiano. Además, el estudio también contribuirá a la práctica existente
Identificar áreas donde la práctica puede ser más amplia.
mejorar y las ineficiencias y los riesgos se pueden minimizar o
evitado. Además, servirá de base para otros estudios sobre almacenamiento de datos in
Australia y llenará el vacío que existe actualmente en la literatura.
Preguntas de investigación
El objetivo de esta investigación es estudiar las actividades involucradas
en la implementación de almacenamiento de datos y su uso por
Organizaciones australianas. En particular, se estudian los elementos
con respecto a la planificación de proyectos, desarrollo, al
funcionamiento, uso y riesgos en cuestión. De ahí la pregunta
de esta investigación es:
"¿Cómo es la práctica actual de almacenamiento de datos ¿en Australia?"
Para responder eficazmente a este problema,
cierto número de preguntas de investigación subsidiarias. En particular, tres
Se identificaron sub-preguntas de la literatura, es decir
presentado en el capítulo 2, para orientar este proyecto de investigación:
Como estoy almacenamiento de datos por organizaciones
¿Australiano? ¿Cuáles son los problemas encontrados?
¿Cuáles son los beneficios experimentados?
Para responder a estas preguntas, se utilizó un dibujo
investigación exploratoria que emplea la indagación. Como estudio
exploratorio, las respuestas a las preguntas anteriores no están completas
(Shanks et al. 1993, Denscombe 1998). En este caso lo es
Se requiere triangulación para mejorar las respuestas a estos
preguntas. Sin embargo, la investigación proporcionará una base sólida para
trabajo futuro examinando estas cuestiones. Uno detallado
Discusión sobre la justificación del método y diseño de investigación.
se presenta en el capítulo 3.
Estructura del proyecto de investigación
Este proyecto de investigación se divide en dos partes: el estudio contextual
del concepto de almacenamiento de datos e investigación empírica (ver
figura 1.1), cada uno de los cuales se analiza a continuación.
Parte I: Estudio contextual
La primera parte de la investigación consistió en reexaminar la
literatura actual sobre varios tipos de almacenamiento de datos, incluido i
sistemas de ayuda a la decisión (DSS), sistemas de información
ejecutivo (EIS), los estudios de caso de almacenamiento de datos y conceptos de fecha
depósito. Además, los resultados del foum sui almacenamiento de datos y
grupos de encuentro de expertos y profesionales liderados por el grupo de
La investigación de Monash DSS contribuyó a esta fase del estudio.
que estaba destinado a obtener información sobre la práctica de los datos
almacén e identificar los riesgos que implica su adopción.
Durante este período de estudio contextual, la comprensión
el área del problema se ha establecido para proporcionar conocimiento de
base para investigaciones empíricas posteriores. Sin embargo, esto
fue un proceso continuo mientras se realizaba el estudio de
la investigación.
Parte II: Investigación empírica
El concepto relativamente nuevo de almacenamiento de datos, especialmente
en Australia, creó la necesidad de realizar una investigación para
Obtenga una imagen completa de la experiencia de uso. Esta
parte se hizo una vez que el dominio del problema fue
se ha establecido a través de una extensa revisión de la literatura. El concepto
de almacenamiento de datos formado durante la fase de estudio contextual es
se utilizó como entrada para el cuestionario inicial de este estudio.
Posteriormente, se revisó el cuestionario. Expertos en seis citas
almacén participó en la prueba. El propósito de
El cuestionario inicial fue para verificar la integridad y precisión.
algunas preguntas. Basado en los resultados de la prueba, el cuestionario es
ha sido modificado y la versión modificada se envió a
participantes de la encuesta. Los cuestionarios devueltos luego fueron
analizado para yo adquirir en tablas, diagramas y otros formatos. LA
resultados del análisis de adquirir formar una instantánea de la
práctica del almacenamiento de datos en Australia.
RESUMEN DEL ALMACENAMIENTO DE DATOS
El concepto de almacenamiento de datos ha evolucionado con las mejoras
de la tecnología informática.
Tiene como objetivo superar los problemas encontrados por grupos de
soporte de aplicaciones como el sistema de soporte de decisiones (DSS) e
Sistema de información ejecutivo (EIS).
En el pasado, el mayor obstáculo de estas aplicaciones ha sido
la incapacidad de estas aplicaciones para proporcionar una base de datos
necesario para el análisis.
Esto se debe principalmente a la naturaleza del trabajo del
liderazgo. Los intereses de la dirección de una empresa varían
constantemente dependiendo de la zona tratada. Por lo tanto, yo adquirir
fundamental para estas aplicaciones debe poder
cambiar rápidamente dependiendo de la parte a tratar.
Esto significa que yo adquirir deben estar disponibles en el formulario
adecuado para los análisis requeridos. De hecho, los grupos de apoyo del
aplicaciones encontraron muchas dificultades en el pasado para recopilar y
integración adquirir de fuentes complejas y diversas.
El resto de esta sección presenta una descripción general del concepto de
almacenamiento de datos y se ocupa de cómo almacenamiento de datos puede exceder i
Problemas con los grupos de soporte de aplicaciones.
El término "Almacenamiento de Datos”Fue lanzado por William Inmon en 1990.
Su definición a menudo citada ve la Almacenamiento de Datos cómo
colección de adquirir orientado al sujeto, integrado, no volátil y variable
a lo largo del tiempo, para respaldar las decisiones de gestión.
Usando esta definición, Inmon señala que yo adquirir residentes
en un almacenamiento de datos debe poseer los siguientes 4
características:
▪ Orientado al tema
▪ Integrado
▪ No volátil
▪ Variable en el tiempo
Por Subject Oriented Inmon significa que yo adquirir en la fecha
almacén en las áreas organizativas más grandes que se han
definido en el modelo adquirir. Por ejemplo todos adquirir acerca de i clientes
están contenidos en el área temática CLIENTES. Igualmente todos
adquirir relacionados con los productos están contenidos en el área temática
PRODUCTOS.
Por Integrati Inmon significa que yo adquirir viniendo de diferentes
plataformas, sistemas y ubicaciones se combinan y almacenan en
único lugar. como consecuencia adquirir similar debe ser transformado
en formatos consistentes para agregar y comparar
fácilmente.
Por ejemplo, el género masculino y femenino están representados
por las letras M y F en un sistema, y ​​con 1 y 0 en otro. por
integrarlos de la manera correcta, uno o ambos formatos deben
transformarse para que los dos formatos sean iguales. En esto
caso podríamos cambiar M a 1 y F a 0 o viceversa. orientado a
sujeto e integra indican que el almacenamiento de datos Esta diseñado para
proporcionar una visión funcional y transversal de adquirir lado
la empresa.
No volátil significa que yo adquirir en almacenamiento de datos permanecer
coherente y actualizado de adquirir no es necesario. En cambio, cada
cambiar en adquirir los originales se añaden al base de datos de la fecha
depósito. Esto significa que el historiador de la adquirir está contenido en el
almacenamiento de datos.
Para variables a lo largo del tiempo, Inmon indica que i adquirir en almacenamiento de datos
siempre contienen marcadores de tiempo y yo adquirir normalmente
cruzan un horizonte temporal determinado. Por ejemplo un
almacenamiento de datos puede contener 5 años de valores históricos de la clientes dal
1993 a 1997. La disponibilidad del historiador y una serie temporal
de adquirir le permite analizar tendencias.
Un almacenamiento de datos él puede recoger el suyo adquirir de los sistemas
OLTP; desde los orígenes adquirir externos a la organización y / o por otros especialistas
proyectos del sistema de captura adquirir.
I adquirir extractos pueden pasar por un proceso de limpieza, en
este caso yo adquirir se transforman e integran antes de ser
almacenado en el base de datos de los almacenamiento de datos. Entonces yo adquirir
residiendo dentro del base de datos de los almacenamiento de datos están disponibles
herramientas de recuperación y acceso del usuario final. Utilizando
estas herramientas el usuario final puede acceder a la vista integrada
de la organización de adquirir.
I adquirir residiendo dentro del base de datos de los almacenamiento de datos son
almacenados tanto en formato de detalle como de resumen.
El nivel de resumen puede depender de la naturaleza del adquirir. adquirir
detallado puede consistir en adquirir actual y adquirir histórico
I adquirir reales no están incluidos en el almacenamiento de datos hasta que yo adquirir
en almacenamiento de datos se actualizan.
Además de almacenar i adquirir ellos mismos, un almacenamiento de datos puede también
almacenar un tipo diferente de fecha llamados METADATOS que
describir yo adquirir residiendo en su base de datos.
Hay dos tipos de metadatos: metadatos de desarrollo y
análisis.
Los metadatos de desarrollo se utilizan para gestionar y automatizar
procesos de extracción, limpieza, mapeo y carga de adquirir en
almacenamiento de datos.
La información contenida en los metadatos de desarrollo puede contener
detalles de los sistemas operativos, detalles de los elementos a extraer,
modelo adquirir de los almacenamiento de datos y reglas corporativas para el
conversión de adquirir.
El segundo tipo de metadatos, conocido como metadatos analíticos.
permite al usuario final explorar el contenido de los datos
almacén para encontrar el adquirir disponibles y su significado en términos
claro y no técnico.
Por lo tanto, los metadatos analíticos funcionan como un puente entre los datos
aplicaciones de almacén y de usuario final. Estos metadatos pueden
contienen el modelo de negocio, descripciones de adquirir corresponsales
al modelo de negocio, consultas e informes predefinidos,
información para los inicios de sesión de los usuarios y el índice.
Los metadatos de análisis y desarrollo deben combinarse en uno
metadatos de contención integrados para funcionar correctamente.
Desafortunadamente, muchas de las herramientas existentes tienen sus propias
metadatos y actualmente no existen estándares que
Permitir que las herramientas de almacenamiento de datos integren estos
metadatos. Para remediar esta situación, muchos comerciantes del
las principales herramientas de almacenamiento de datos han formado metadatos
Council que más tarde se convirtió en la Meta Data Coalition.
El propósito de esta coalición es construir un conjunto de metadatos
estándar que permite diferentes herramientas de almacenamiento de datos de
convertir metadatos
Sus esfuerzos dieron como resultado el nacimiento del Meta
Especificación de intercambio de datos (MDIS) que permitirá el intercambio
de información entre los archivos de Microsoft y los archivos MDIS relacionados.
La existencia de adquirir tanto resumidos / indexados como detallados da
al usuario la posibilidad de realizar un taladro ahogado
(taladrando) vamos adquirir indexados a detallados y viceversa.
La existencia de adquirir historias detalladas permiten la realización de
análisis de tendencias a lo largo del tiempo. Además, los metadatos del análisis pueden
ser utilizado como directorio del base de datos de los almacenamiento de datos para
ayudar a los usuarios finales a localizar i adquirir necesario.
En comparación con los sistemas OLTP, con su capacidad para admitir
análisis de adquirir y reportando, el almacenamiento de datos se ve como un sistema
más apropiado para procesos de información como la realización de e
responder consultas y generar informes. La siguiente sección
destacará las diferencias de los dos sistemas en detalle.
ALMACÉN DE DATOS CONTRA LOS SISTEMAS OLTP
Muchos de los sistemas de información dentro de las organizaciones
están destinados a respaldar las operaciones diarias. Estas
sistemas conocidos como SISTEMAS OLTP, capturan transacciones
continuamente actualizado todos los días.
I adquirir dentro de estos sistemas a menudo se modifican, agregan o
eliminado. Por ejemplo, la dirección de un cliente simplemente cambia
se mueve de un lugar a otro. En este caso la nueva dirección
se registrará cambiando el campo de dirección de base de datos.
El principal objetivo de estos sistemas es reducir los costes de
transacciones y al mismo tiempo reducir los tiempos de procesamiento.
Los ejemplos de sistemas OLTP incluyen acciones críticas como escrituras
contabilidad de pedidos, nóminas, facturas, fabricación, servicios de ia clientes.
A diferencia de los sistemas OLTP, que fueron creados para procesos
basado en transacciones y eventos, i almacenamiento de datos fueron creados
para dar soporte a los procesos basados ​​en análisis de adquirir o de
procesos de decisión.
Esto normalmente se logra integrando i adquirir de varios sistemas
OLTP y externo en un solo "contenedor" de adquirir,como se discutio
en la sección anterior.
Modelo de proceso de almacenamiento de datos de Monash
El modelo de proceso para almacenamiento de datos Monash fue desarrollado por el
investigadores del Grupo de Investigación Monash DSS, se basa en el
literaturas de almacenamiento de datos, sobre la experiencia en el apoyo a la
desarrollo de campos de sistemas, en discusiones con proveedores de
aplicaciones para usar en almacenamiento de datos, sobre un grupo de expertos
en el uso de almacenamiento de datos.
Las fases son: Iniciación, Planificación, Desarrollo, Operaciones y
Explicaciones. El diagrama explica la naturaleza iterativa o
desarrollo evolutivo de un almacenamiento de datos proceso usando
flechas bidireccionales colocadas entre las diferentes etapas. En esto
contexto "iterativo" y "evolutivo" significa que, en cada
paso del proceso, las actividades de implementación son posibles
siempre se propagan de regreso a la etapa anterior. Este es
debido a la naturaleza del proyecto de un almacenamiento de datos en el que
solicitudes adicionales de la pieza se hacen cargo en cualquier momento
usuario final. Por ejemplo, durante la fase de desarrollo de un
proceso de almacenamiento de datos, uno es requerido por el usuario final
nueva dimensión o área temática, que no pertenecía a la
plan original, este debe ser agregado al sistema. Esta
provoca un cambio en el proyecto. El resultado es que el
el diseño debe cambiar los requisitos de los documentos creados hasta ahora
durante la fase de diseño. En muchos casos, el estado actual del
El proyecto debe volver a la etapa de diseño donde
la nueva solicitud debe agregarse y documentarse. El usuario
final debe poder ver la documentación específica revisada y
cambios que se han realizado en la fase de desarrollo. Al final de
Este ciclo de desarrollo, el proyecto debe obtener una excelente retroalimentación de
ambos equipos, el equipo de desarrollo y el equipo de usuarios. LA
los comentarios se reutilizan para mejorar un proyecto futuro.
Planificación de capacidad
Los DW tienden a ser de tamaño muy grande y a crecer
muy rápidamente (Best 1995, Rudin 1997a) siguiendo el
cantidad de adquirir historiadores que conservan de su vida. Allí
el crecimiento también puede ser causado por adquirir adicional requerido por
usuarios para aumentar el valor de adquirir que ya tienen. De
en consecuencia, los requisitos de almacenamiento para adquirir lata
mejorar significativamente (Eckerson 1997). Así es
esencial para asegurar, realizar una planificación de la
capacidad, que el sistema a construir puede crecer con la
necesidades crecientes (Best 1995, LaPlante 1996, Lang 1997,
Eckerson 1997, Rudin 1997a, Foley 1997a).
Al planificar la escalabilidad de dw, uno debe conocer el
Crecimiento esperado en el tamaño del almacén, tipos de preguntas
probable que se lleve a cabo, y el número de usuarios finales admitidos (mejor
1995, Rudin 1997b, Foley 1997a). Cree aplicaciones escalables
requiere una combinación de tecnologías de servidor escalables y técnicas
diseño de aplicaciones escalables (Best 1995, Rudin 1997b.
Ambos son necesarios para crear una aplicación.
extremadamente escalable. Las tecnologías de servidor escalables pueden
hacer que sea fácil y rentable agregar almacenamiento, memoria y
CPU sin degradar el rendimiento (Lang 1997, Telephony 1997).
Hay dos tecnologías principales de servidor escalable: compute
procesamiento múltiple simétrico (SMP) y masivo
paralelo (MPP)) (IDC 1997, Humphries et al. 1999). Un servidor
SMP normalmente tiene varios procesadores que comparten una memoria,
sistema de autobuses y otros recursos (IDC 1997, Humphries et al. 1999).
Se pueden agregar procesadores adicionales para aumentar
su potenza computacional. Otro método para aumentar la
potenza computacional del servidor SMP, combina numerosos
Máquinas SMP. Esta técnica se conoce como agrupación (Humphries
et al. 1999). Un servidor MPP, por otro lado, tiene varios procesadores cada uno
con su propia memoria, sistema de bus y otros recursos (IDC 1997,
Humphries y col. 1999). Cada procesador se llama nodo. A
aumento en potenza se puede lograr computacional
agregar nodos adicionales a los servidores MPP (Humphries et al.
1999).
Una debilidad de los servidores SMP es que demasiadas operaciones de entrada y salida
(E / S) puede congestionar el sistema de bus (IDC 1997). Esta
El problema no ocurre dentro de los servidores MPP ya que cada
El procesador tiene su propio sistema de bus. Sin embargo, las interconexiones
entre cada nodo son generalmente mucho más lentos que el sistema de bus
de las SMP. Además, los servidores MPP pueden agregar una capa
complejidad adicional para los desarrolladores de aplicaciones (IDC
1997). Por lo tanto, la elección entre servidores SMP y MPP puede verse afectada.
por muchos factores, incluida la complejidad de las preguntas, la relación
precio / rendimiento, la capacidad de procesamiento requerida, la
dw aplicaciones prevenidas y el aumento de tamaño de base de datos
de dw y en el número de usuarios finales.
Numerosas técnicas de diseño de aplicaciones escalables
se pueden utilizar en la planificación de la capacidad. Uno
utiliza varios períodos de notificación, como días, semanas, meses y años.
Teniendo varios períodos de notificación, el base de datos puede dividirse en
piezas agrupadas de forma manejable (Inmon et al. 1997). Otro
técnica es utilizar tablas de resumen que se construyen
Resumiendo adquirir da adquirir detallado. Por lo tanto, yo adquirir los resúmenes son más
compacto que detallado, que requiere menos espacio de memoria.
Así que el adquirir los detalles se pueden almacenar en una unidad de
almacenamiento más económico, lo que ahorra aún más almacenamiento.
Aunque el uso de tablas de resumen puede ahorrar espacio
memoria, requieren mucho esfuerzo para mantenerlos actualizados y en
en consonancia con las necesidades comerciales. Sin embargo, esta técnica es
ampliamente utilizado y utilizado a menudo junto con la técnica
anterior (Best 1995, Inmon 1996a, Chauduri y Dayal
1997).
Definición Almacenamiento de Datos Técnico
Arquitecturas Definición de técnicas
arquitecturas por dw
Los primeros en adoptar el almacenamiento de datos se concibieron principalmente
una implementación centralizada de dw donde todos adquirir, Incluyendo
i adquirir externos, se integraron en un solo,
repositorio físico (Inmon 1996a, Bresnahan 1996, Peacock 1998).
La principal ventaja de este enfoque es que los usuarios finales
Puedo acceder a la vista a escala empresarial
(vista de toda la empresa) del adquirir organizacional (Ovum 1998). Otro
La ventaja es que ofrece estandarización de adquirir a través de
la organización, lo que significa que solo hay una versión o
definición para cada terminología utilizada en el repositorio dw
(reposidad) metadatos (Flanagan y Safdie 1997, Ovum 1998). los
La desventaja de este enfoque, por otro lado, es que es costoso y difícil
por construir (Flanagan y Safdie 1997, Ovum 1998, Inmon et al.
1998). Poco después de la arquitectura de almacenamiento adquirir
centralizado se hizo popular, el concepto de extracción evolucionó
de los subconjuntos más pequeños de la adquirir para apoyar las necesidades de
aplicaciones específicas (Varney 1996, IDC 1997, Berson y Smith
1997, pavo real 1998). Estos pequeños sistemas se derivan de los más
gran almacenamiento de datos centralizado. Se llaman fecha
almacenes departamentales dependientes o data marts dependientes.
La arquitectura de data mart dependiente se conoce como
arquitectura de tres niveles en la que la primera fila consta de la fecha
almacén centralizado, el segundo está formado por los almacenes de adquirir
departamental y el tercero consiste en el acceso a adquirir y las herramientas de
análisis (Demarest 1994, Inmon et al. 1997).
Los data marts normalmente se construyen después de almacenamiento de datos
centralizado fue construido para satisfacer las necesidades de
especificaciones de la unidad (White 1995, Varney 1996).
Tienda de data marts i adquirir muy relevante en relación con los detalles
unidades (Inmon et al. 1997, Inmon et al. 1998, IA 1998).
La ventaja de este método es que no habrá fecha no
integrado y que yo adquirir serán menos redundantes dentro de los datos
marts desde todos adquirir provienen de un depósito de adquirir integrado.
Otra ventaja es que habrá pocos vínculos entre cada
data mart y fuentes relacionadas de adquirir porque cada data mart solo tiene
una fuente de adquirir. Además, con esta arquitectura implementada, los usuarios
Los finales todavía pueden acceder a la descripción general de adquirir
organizacional corporativa. Este método se conoce como
método de arriba hacia abajo, en el que los mercados de datos se construyen después de la fecha
almacén (pavo real 1998, Goff 1998).
Aumentando la necesidad de mostrar resultados temprano, algunos
las organizaciones han comenzado a construir mercados de datos independientes
(Flanagan y Safdie 1997, White 2000). En este caso, los mercados de datos
ellos toman el suyo adquirir directamente de los fundamentos de adquirir OLTP y no desde
almacenamiento centralizado e integrado, eliminando así la necesidad de
tener el almacén central en su lugar.
Cada data mart requiere al menos un enlace a sus fuentes
di adquirir. Una desventaja de tener varios enlaces para cada fecha.
mart es que, en comparación con las dos arquitecturas anteriores, el
sobreabundancia de adquirir aumenta significativamente.
Cada data mart debe almacenar todos adquirir requerido localmente para
no tienen ningún efecto en los sistemas OLTP. Esto hace que el adquirir
se almacenan en diferentes mercados de datos (Inmon et al. 1997).
Otra desventaja de esta arquitectura es que conduce a la
creación de interconexiones complejas entre los mercados de datos y los suyos
fuentes de adquirir que son difíciles de realizar y controlar (Inmon ed
otros. 1997).
Otro inconveniente es que los usuarios finales no pueden
acceder a la descripción general de la información de la empresa desde adquirir
de los diferentes mercados de datos no están integrados (Ovum 1998).
Otro inconveniente más es que puede haber más de una
definición de cualquier terminología utilizada en los mercados de datos que genera
inconsistencias de adquirir en la organización (Ovum 1998).
A pesar de las desventajas discutidas anteriormente, los mercados de datos independientes
todavía atraen el interés de muchas organizaciones (IDC 1997).
Un factor que los hace atractivos es que se desarrollan más rápido.
y requieren menos tiempo y recursos (Bresnahan 1996, Berson e
Smith 1997, Ovum 1998). En consecuencia, sirven principalmente
como proyectos de prueba que se pueden utilizar para identificar
rápidamente los beneficios y / o imperfecciones en el proyecto (Parsaye
1995, Braly 1995, Newing 1996). En este caso, la parte de
La implementación en el proyecto piloto debe ser pequeña pero importante.
para la organización (Newing 1996, Mansell-Lewis 1996).
Al examinar el prototipo, los usuarios finales y la administración pueden
decidir si continuar o detener el proyecto (Flanagan y Safdie
1997).
Si la decisión es continuar, los mercados de datos para otros sectores
deben construirse uno a la vez. Hay dos opciones para
usuarios finales en función de sus necesidades en la creación de datos
matrices independientes: integradas / federadas y no integradas (Ovum
1998).
En el primer método, se debe construir cada nueva despensa de datos
basado en marts de datos actuales y modelo adquirir usado
de la firma (Varney 1996, Berson y Smith 1997, Peacock 1998).
La necesidad de usar el modelo. adquirir de la empresa lo hace necesario
asegúrese de que haya solo una definición para cada terminología
utilizado a través de data marts, esto también para asegurarse de que la fecha
Se pueden unir diferentes mercados para dar una descripción general de la
información corporativa (Bresnahan 1996). Este método es
referido como el de abajo hacia arriba y es mejor cuando hay una restricción en
medios financieros y tiempo (Flanagan y Safdie 1997, Ovum 1998,
pavo real 1998, Goff 1998). En el segundo método, los mercados de datos
construido solo puede satisfacer las necesidades de una unidad específica.
Una variante del data mart federado es el almacenamiento de datos distribuidos
en la que el base de datos El middleware del concentrador del servidor se utiliza para unir muchos
mercados de datos en un único depósito de adquirir distribuido (White 1995). En
este caso, yo adquirir las empresas se distribuyen en varios data marts.
Las solicitudes de los usuarios finales se reenvían a base de datos
middleware del concentrador del servidor, que extrae todos adquirir requerido por los datos
marts y devuelve los resultados a las aplicaciones del usuario final. Esta
El método proporciona información comercial a los usuarios finales. Sin embargo,
los problemas de los data marts aún no se han eliminado
independiente. Hay otra arquitectura que se puede utilizar que es
llamó al almacenamiento de datos virtual (White 1995). Sin embargo, este
La arquitectura, que se describe en la figura 2.9, no es una arquitectura
de almacenamiento de adquirir real ya que no mueve la carga
desde sistemas OLTP hasta almacenamiento de datos (Demarest 1994).
De hecho, las solicitudes de adquirir los usuarios finales han pasado por
Los sistemas OLTP que devuelven resultados después de procesar el
solicitudes de usuario. Aunque esta arquitectura permite a los usuarios
para generar informes y formular solicitudes, no puedo proporcionar i
adquirir historial y descripción general de la información de la empresa desde adquirir
de los diferentes sistemas OLTP no están integrados. Entonces, este
la arquitectura no puede satisfacer el análisis de adquirir complejo que anuncio
ejemplo de pronóstico.
Selección de las aplicaciones de acceso y
recuperación de adquirir
El propósito de construir un almacenamiento de datos es transmitir
información a los usuarios finales (Inmon et al 1997, Poe 1996,
McFadden 1996, Shanks et al 1997, Hammergren 1998); uno o
múltiples aplicaciones de acceso y recuperación adquirir debe ser provisto. A
Hoy en día, existe una amplia variedad de estas aplicaciones entre las que el usuario puede
elegir (Hammergren 1998, Humphries et al 1999). los
las aplicaciones seleccionadas determinan el éxito del esfuerzo
de almacenamiento de adquirir en una organización porque el
Las aplicaciones son la parte más visible de la almacenamiento de datos al usuario
final (Inmon et al 1997, Poe 1996). Para una cita exitosa
almacén, debe poder soportar las actividades de análisis del adquirir
usuario final (Poe 1996, Seddon y Benjamin 1998, Eckerson
1999). Por lo tanto, el "nivel" de lo que quiere el usuario final debe ser
identificado (Poe 1996, Mattison 1996, Inmon et al 1997,
Humphries et al 1999).
En general, los usuarios finales se pueden agrupar en tres
categorías: usuarios ejecutivos, analistas de negocios y usuarios avanzados (Poe
1996, Humphries et al.1999). Los usuarios ejecutivos necesitan
fácil acceso a conjuntos de informes predefinidos (Humphries ed
otros 1999). Estas relaciones se pueden lograr fácilmente con
navegación de los menús (Poe 1996). Además, los informes deben
presentar información mediante representación gráfica
como tablas y plantillas para entregar rápidamente
información (Humphries et al 1999). Analistas de negocios, que no
pueden tener las capacidades técnicas para construir relaciones desde
cero por sí mismos, necesitan poder cambiar las relaciones actuales para
satisfacer sus necesidades específicas (Poe 1996, Humphries et al.
1999). Los usuarios avanzados, por otro lado, son el tipo de usuarios finales que
tienen la capacidad de generar y escribir solicitudes e informes desde
cero (Poe 1996, Humphries et al 1999). Ellos son los que
desarrollar informes para otros tipos de usuarios (Poe 1996, Humphries
et al 1999).
Una vez determinados los requisitos del usuario final se debe realizar
una selección de aplicaciones de acceso y recuperación adquirir tra tutti
los disponibles (Poe 1996, Inmon et al 1997).
El acceso a los adquirir y las herramientas de recuperación pueden ser
clasificados en 4 tipos: herramienta OLAP, herramienta EIS / DSS, herramienta de consulta y
herramienta de generación de informes y minería de datos.
Las herramientas OLAP permiten a los usuarios crear consultas ad hoc, así como
los hechos en base de datos de los almacenamiento de datos. Además de estos productos
Permitir a los usuarios profundizar desde adquirir general a aquellos
detallado.
Las herramientas EIS / DSS proporcionan informes ejecutivos como análisis de "qué pasaría si"
y acceso a informes organizados en menús. Los informes deben ser
predefinidos y combinados con menús para facilitar la navegación.
Las herramientas de consulta y generación de informes permiten a los usuarios generar informes
predefinido y específico.
Las herramientas de minería de datos se utilizan para identificar relaciones que
podría arrojar nueva luz sobre operaciones olvidadas en adquirir de los
almacén de datos.
Junto a la optimización de los requerimientos de cada tipo de usuario, i
las herramientas seleccionadas deben ser intuitivas, eficientes y fáciles de usar.
También deben ser compatibles con otras partes de la arquitectura.
capaz de trabajar con sistemas existentes. También se sugiere
elegir herramientas de acceso y recuperación de datos con precios y rendimiento
razonable. Otros criterios a considerar incluyen el compromiso de la
proveedor de la herramienta para respaldar su producto y los desarrollos que lo hacen
lo mismo tendrá en futuras versiones. Para garantizar la participación de los usuarios
en el uso del almacén de datos, el equipo de desarrollo involucra al
usuarios en el proceso de selección de herramientas. En este caso
debe llevarse a cabo una evaluación práctica del usuario.
Para mejorar el valor del almacén de datos, el equipo de desarrollo puede
también proporcionan acceso web a sus almacenes de datos. A
Datawarehouse habilitado para la web permite a los usuarios acceder adquirir
desde lugares remotos o mientras viaja. También la información puede
se proporcionará a costos más bajos al reducir los costos
de entrenamiento.
2.4.3 Almacenamiento de Datos Fase de operación
Esta fase consta de tres actividades: definición de estrategias de fechas
actualización, control de las actividades de almacenamiento de datos y gestión de
seguridad del almacén de datos.
Definición de estrategias de actualización de datos
Después de la carga inicial, yo adquirir en base de datos del almacén de datos
deben actualizarse periódicamente para reproducirse
cambios realizados en adquirir originales. Por tanto, es necesario decidir
cuándo actualizar, con qué frecuencia
actualizar y cómo actualizar el adquirir. Se sugiere hacer el
actualización de adquirir cuando el sistema se puede desconectar. Allí
La frecuencia de actualización la determina el equipo de desarrollo dependiente.
sobre los requisitos del usuario. Hay dos enfoques para actualizar el
datawarehouse: actualización completa y carga continua de
cambios.
El primer enfoque, la actualización completa, requiere volver a cargar el
todos adquirir desde cero. Esto significa que todos adquirir requerido debe
ser extraídos, limpiados, transformados e integrados en cada actualización. Esta
El enfoque debe evitarse tanto como sea posible porque
requiere mucho tiempo y recursos.
Un enfoque alternativo es cargar continuamente el
cambios. Esto agrega yo adquirir que han sido cambiados
desde el último ciclo de actualización del almacén de datos. La identificación de
registros nuevos o modificados reduce significativamente la cantidad de
adquirir que deben propagarse al almacén de datos en cada
actualizar ya que solo estos adquirir se agregará a la base de datos
del almacén de datos.
Hay al menos 5 enfoques que se pueden utilizar para retirar
i adquirir nuevo o modificado. Para obtener una estrategia eficiente de
actualización de adquirir una combinación de estos enfoques puede ser útil
recoger todos los cambios en el sistema.
El primer enfoque, que utiliza marcas de tiempo, asume que viene
asignado a todos adquirir modificado y actualizado una marca de tiempo para
para poder identificar fácilmente a todos adquirir modificado y nuevo.
Este enfoque, sin embargo, no se ha utilizado ampliamente en la mayoría de
parte de los sistemas operativos actuales.
El segundo enfoque es utilizar un archivo delta generado por
una aplicación que contiene solo los cambios realizados en el adquirir.
El uso de este archivo también amplifica el ciclo de actualización.
Sin embargo, incluso este método no se ha utilizado en muchos
aplicaciones.
El tercer enfoque es escanear un archivo de registro, que
básicamente contiene información similar al archivo delta. El único
La diferencia es que se crea un archivo de registro para el proceso de recuperación y
puede ser difícil de entender.
El cuarto enfoque consiste en modificar el código de la aplicación.
Sin embargo, la mayor parte del código de la aplicación es antiguo y
frágil; por lo tanto, esta técnica debe evitarse.
El último enfoque es comparar el adquirir fuentes con el archivo
principal de adquirir.
Control de las actividades del almacén de datos
Una vez que el almacén de datos se ha entregado a los usuarios, es
necesario monitorearlo a lo largo del tiempo. En este caso, el administrador
del almacén de datos puede utilizar una o más herramientas de gestión e
control para monitorear el uso del almacén de datos. En particular
La información sobre las personas y el tiempo se puede recopilar en
que acceden al almacén de datos. Vamos adquirir recopilado se puede crear
un perfil del trabajo realizado que se puede utilizar como entrada
en la implementación del contracargo del usuario. El contracargo
permite a los usuarios estar informados sobre el coste de tramitación de la
almacén de datos.
Además, el control del almacén de datos también se puede utilizar para
identificar los tipos de consultas, su tamaño, el número de consultas por
día, tiempos de respuesta a consultas, sectores alcanzados y cantidad
di adquirir procesada. Otro propósito de hacer la verificación de la
datawarehouse es identificar el adquirir que no están en uso. Estas adquirir
se pueden eliminar del almacén de datos para mejorar el tiempo
respuesta de ejecución de consultas y control del crecimiento de
adquirir que residen dentro del base de datos del almacén de datos.
Gestión de la seguridad del almacén de datos
Un almacén de datos contiene adquirir integrado, crítico, sensible que
se puede llegar fácilmente. Por esta razón debería
estar protegido de usuarios no autorizados. Una manera de
implementar la seguridad es utilizar la función del DBMS
para asignar diferentes privilegios a diferentes tipos de usuarios. En esto
De esta manera, se debe mantener un perfil para cada tipo de usuario.
acceso. Otra forma de proteger el almacén de datos es cifrarlo.
como está escrito en base de datos del almacén de datos. El acceso a los
adquirir y las herramientas de recuperación deben descifrar el adquirir antes de presentar yo
resultados a los usuarios.
2.4.4 Almacenamiento de Datos Fase de implementación
Es la última fase del ciclo de implementación del almacén de datos. los
Las actividades a realizar en esta fase incluyen la formación de
que los usuarios utilicen el almacén de datos y realicen revisiones
del almacén de datos.
Entrenamiento de usuario
La capacitación del usuario debe realizarse primero
el acceso a los adquirir del almacén de datos y el uso de la
recuperación. Generalmente, las sesiones deben comenzar con
la introducción al concepto de almacenamiento de adquirir, en el
contenido del almacén de datos, al meta adquirir y las características básicas
de herramientas. Entonces, los usuarios más avanzados también podrían estudiar el
tablas físicas y las características de los usuarios del acceso a datos y herramientas de
recuperación.
Hay muchos enfoques para capacitar a los usuarios. Uno de
Estos proporcionan una selección de muchos usuarios o analistas elegidos por un
conjunto de usuarios, confiando en su liderazgo y habilidades
comunicación. Estos se forman a título personal en
todo lo que necesitan saber para familiarizarse con el
sistema. Después de la formación, vuelven a su trabajo e
comienzan a enseñar a otros usuarios a utilizar el sistema. En
basándose en lo que han aprendido, otros usuarios pueden comenzar a
explorar el almacén de datos.
Otro enfoque es capacitar a muchos usuarios en el mismo
tiempo, como si estuvieras tomando un curso presencial. Este método
es adecuado cuando hay muchos usuarios que necesitan formación
al mismo tiempo. Otro método más es entrenar
cada usuario individualmente, uno por uno. Este método es
adecuado cuando hay pocos usuarios.
El propósito de la formación del usuario es familiarizarse
con acceso a adquirir y las herramientas de recuperación, así como el contenido de la
almacén de datos. Sin embargo, algunos usuarios pueden sentirse abrumados
la cantidad de información proporcionada durante la sesión
capacitación. Así que se deben hacer varias
actualizar sesiones asistencia continua y responder
a preguntas específicas. En algunos casos, un grupo de
usuarios para brindar este tipo de soporte.
Recopilación de comentarios
Una vez que se ha implementado el almacén de datos, los usuarios pueden
uso yo adquirir residiendo en el almacén de datos para diversos fines.
Principalmente, los analistas o usuarios utilizan adquirir en
almacén de datos para:
1 Identificar las tendencias de la empresa
2 Analizar los perfiles de compra de clientes
3 Dividir i clientes y
4 Brindar los mejores servicios a clientes - personalizar servicios
5 Formular estrategias Marketing
6 Haga estimaciones competitivas para análisis de costos y ayude
control
7 Apoyar la toma de decisiones estratégicas
8 Identificar oportunidades para emerger
9 Mejorar la calidad de los procesos comerciales actuales
10 Compruebe la ganancia
Siguiendo la dirección de desarrollo del almacén de datos, podrían
Realizar una serie de revisiones del sistema para obtener comentarios.
tanto del equipo de desarrollo como de la comunidad
los usuarios finales.
Los resultados obtenidos se pueden tener en cuenta para la
próximo ciclo de desarrollo.
Dado que el almacén de datos tiene un enfoque incremental,
es fundamental aprender de los aciertos y errores de los anteriores
desarrollos.
2.5 Resumen
En este capítulo, los enfoques que se encuentran en
literatura. La sección 1 discutió el concepto de
datawarehouse y su papel en la ciencia de la decisión. En
En la sección 2 se describen las principales diferencias entre
almacén de datos y sistemas OLTP. La sección 3 discutió el
Modelo de almacén de datos de Monash que se utilizó
en la sección 4 para describir las actividades involucradas en el proceso
desarrollo de un almacén de datos, estas tesis no se basaron en
investigación rigurosa. Lo que sucede en realidad puede ser
muy diferente de lo que informa la literatura, sin embargo, estos
Los resultados se pueden utilizar para crear un equipaje básico que
subrayar el concepto de almacén de datos para esta investigación.
Capítulo 3
Métodos de investigación y diseño
Este capítulo trata sobre métodos de investigación y diseño para
este estudio. La primera parte muestra una vista genérica de los métodos.
también disponible para la recuperación de información
Se discuten los criterios para seleccionar el mejor método para uno.
estudio particular. Luego se analizan dos métodos en la sección 2
seleccionados con los criterios establecidos anteriormente; de estos serán elegidos y
adoptado uno con las razones expuestas en la sección 3 donde se
También se presentaron las razones de la exclusión del otro criterio. Allí
la sección 4 presenta el proyecto de investigación y la sección 5 le
conclusiones.
3.1 Investigación en sistemas de información
La investigación en sistemas de información no se limita simplemente a
al ámbito tecnológico, pero también debe ampliarse para incluir
fines relacionados con el comportamiento y la organización.
Esto se lo debemos a las tesis de diversas disciplinas que van desde
ciencias sociales a las naturales; esto lleva a la necesidad de una
cierto espectro de métodos de investigación que involucran métodos cuantitativos
y cualitativo para ser utilizado en sistemas de información.
Todos los métodos de investigación disponibles son importantes, de hecho variados
investigadores como Jenkins (1985), Nunamaker et al. (1991) y Galliers
(1992) argumentan que no existe un método específico universal
realizar investigaciones en diversos campos de los sistemas de información; Por supuesto
un método puede ser adecuado para una búsqueda en particular, pero no
para otros. Esto nos lleva a la necesidad de seleccionar un método que
es adecuado para nuestro proyecto de investigación particular: para esto
elección Benbasat et al. (1987) afirman que deben ser considerados
la naturaleza y el propósito de la investigación.
3.1.1 Naturaleza de la investigación
Se pueden utilizar varios métodos basados ​​en la naturaleza de la investigación.
clasificado en tres tradiciones científicas ampliamente conocidas
información: investigación positivista, interpretativa y crítica.
3.1.1.1 Investigación positivista
La investigación positivista también se conoce como estudio científico o
empírico. Intenta: “explicar y predecir lo que sucederá en el
mundo social mirando regularidades y relaciones de causa-efecto
entre sus elementos constitutivos "(Shanks et al 1993).
La investigación positivista también se caracteriza por la repetibilidad,
simplificaciones y refutaciones. Además, la investigación positivista admite
la existencia de relaciones a priori entre los fenómenos estudiados.
Según Galliers (1992), la taxonomía es un método de investigación
incluido en el paradigma positivista, que sin embargo no se limita a esto,
de hecho hay experimentos de laboratorio, experimentos de campo,
estudios de casos, demostraciones de teoremas, predicciones y simulaciones.
Usando estos métodos, los investigadores admiten que los fenómenos
estudiado se puede observar objetiva y rigurosamente.
3.1.1.2 Investigación interpretativa
La investigación interpretativa, que a menudo se denomina fenomenología o
El anti-positivismo es descrito por Neuman (1994) como "análisis
sistemática del significado social de la acción a través de e
observación detallada de personas en situaciones naturales con el fin de
para llegar a la comprensión e interpretación de cómo
las personas crean y mantienen su mundo social ”. Estudios
interpretativa rechaza la suposición de que los fenómenos observados
se puede observar objetivamente. De hecho se basan
sobre interpretaciones subjetivas. Además, los investigadores interpretativos no
imponen significados a priori a los fenómenos que estudian.
Este método incluye estudios subjetivos / argumentativos, acciones de
investigación, estudios descriptivos / interpretativos, investigaciones futuras y juegos de
papel. Además de estas encuestas y estudios de casos, se pueden
incluidos en este enfoque, ya que se refieren a los estudios de
individuos u organizaciones en situaciones complejas
del mundo real.
3.1.1.3 Investigación crítica
La investigación crítica es el enfoque menos conocido en las ciencias.
social pero ha recibido recientemente la atención de investigadores
en el campo de los sistemas de información. La suposición filosófica de que el
la realidad social es históricamente producida y reproducida por personas,
así como los sistemas sociales con sus acciones e interacciones. Su
habilidad, sin embargo, está mediada por una serie de consideraciones
social, cultural y político.
Además de la investigación interpretativa, la investigación crítica sostiene que la
La investigación positivista no tiene nada que ver con el contexto social e ignora la
su influencia en las acciones humanas.
La investigación crítica, por otro lado, critica la investigación interpretativa para
ser demasiado subjetivo y porque no pretende ayudar
personas para mejorar sus vidas. La mayor diferencia entre el
la investigación crítica y los otros dos enfoques es su dimensión evaluativa.
Si bien la objetividad de las tradiciones positivista e interpretativa es para
predecir o explicar el status quo o la realidad social, investigación crítica
tiene como objetivo evaluar críticamente y transformar la realidad social a continuación
estudio.
Los investigadores críticos suelen oponerse al statu quo para
eliminar las diferencias sociales y mejorar las condiciones sociales. Allí
La investigación crítica tiene un compromiso con una visión procedimental de la
fenómenos de interés y, por tanto, normalmente es longitudinal.
Ejemplos de métodos de investigación son estudios históricos a largo plazo y
estudios etnográficos. La investigación crítica, sin embargo, no fue
ampliamente utilizado en la investigación de sistemas de información
3.1.2 Propósito de la investigación
Junto con la naturaleza de la investigación, su propósito se puede utilizar
para guiar al investigador en la selección de un método en particular
Investigación. El propósito de un proyecto de investigación está estrechamente relacionado
la posición de la búsqueda con respecto al ciclo de búsqueda que consta de
tres fases: construcción de la teoría, prueba de la teoría y refinamiento de la
teoría. Así, basándose en el momento relativo al ciclo de investigación, un
El proyecto de investigación puede tener un propósito explicativo, descriptivo.
exploración o predictiva.
3.1.2.1 Investigación exploratoria
La investigación exploratoria tiene como objetivo investigar un tema
totalmente nuevo y formular preguntas e hipótesis para la investigación
futuro. Este tipo de investigación se utiliza en la construcción de la
teoría para obtener referencias iniciales en una nueva área.
Normalmente se utilizan métodos de investigación cualitativos, como casos
estudio o estudios fenomenológicos.
Sin embargo, también es posible emplear técnicas cuantitativas como
investigaciones o experimentos exploratorios.
3.1.3.3 Investigación descriptiva
La investigación descriptiva tiene como objetivo analizar y describir en gran medida
detallar una situación o práctica organizativa particular. Esta
es adecuado para la construcción de teorías y también se puede utilizar para
confirmar o disputar hipótesis. La investigación descriptiva generalmente
incluye el uso de medidas y muestras. Los métodos de investigación más adecuados
incluyen investigación y análisis de antecedentes.
3.1.2.3 Investigación explicativa
La investigación explicativa intenta explicar por qué suceden las cosas.
Se basa en hechos que ya se han estudiado y trata de encontrar
las razones de estos hechos.
Por lo tanto, la investigación explicativa se basa normalmente en la investigación.
exploratorio o descriptivo y es auxiliar para probar y refinar
las teorías. La investigación explicativa generalmente emplea estudios de casos
o métodos de investigación basados ​​en encuestas.
3.1.2.4 Investigación preventiva
La investigación preventiva tiene como objetivo predecir eventos y comportamientos
bajo observación de que están siendo estudiados (Marshall y Rossman
1995). La predicción es la prueba científica estándar de la verdad.
Este tipo de investigación generalmente emplea investigación o análisis de
adquirir historiadores. (Yin 1989)
La discusión anterior muestra que hay una serie de
posibles métodos de investigación que se pueden utilizar en un estudio
especial. Sin embargo, debe haber un método específico que sea más adecuado
otros para un tipo particular de proyecto de investigación. (Galliers
1987, Yin 1989, De Vaus 1991). Todo investigador, por tanto, tiene
necesidad de evaluar cuidadosamente las fortalezas y debilidades de
varios métodos, con el fin de adoptar el método de investigación más adecuado e
compatible con el proyecto de investigación. (Jenkins 1985, Pervan y Klass
1992, Bonomia 1985, Yin 1989, Himilton e Ives 1992).
3.2. Posibles métodos de investigación
El objetivo de este proyecto fue estudiar la experiencia en
Organizaciones australianas con i adquirir almacenado con uno
desarrollo de almacenamiento de datos. Fecha que, actualmente, hay uno
falta de investigación en el área del almacenamiento de datos en Australia,
este proyecto de investigación se encuentra todavía en la fase teórica del ciclo
investigación y tiene un propósito exploratorio. Explorando la experiencia en
Organizaciones australianas que adoptan el almacenamiento de datos
requiere la interpretación de la sociedad real. En consecuencia, el
el supuesto filosófico que subyace al proyecto de investigación sigue
la interpretación tradicional.
Después de una revisión rigurosa de los métodos disponibles, se identificaron
dos posibles métodos de investigación: encuestas y estudios de caso
(estudios de caso), que se pueden utilizar para la investigación
exploratorio (Shanks et al. 1993). Galliers (1992) sostiene que
la idoneidad de estos dos métodos para este estudio particular en el
su taxonomía revisada diciendo que son aptas para la construcción
teórico. Las siguientes dos subsecciones discuten cada método en
detalle.
3.2.1 Método de investigación investigación
El método de investigación de la investigación proviene del antiguo método de
censo. Un censo consiste en recopilar información de
toda una población. Este método es caro y poco práctico, en
particularmente si la población es numerosa. Entonces, comparado con el
censo, una encuesta normalmente se centra en el
recopilar información para un pequeño número, o muestra, de los
representantes de la población (Fowler 1988, Neuman 1994). A
muestra refleja la población de la que se extrae, con diferentes
niveles de precisión, de acuerdo con la estructura de la muestra, el
tamaño y método de selección utilizado (Fowler 1988, Babbie
1982, Neumann 1994).
El método de encuesta se define como "instantáneas de prácticas,
situaciones o puntos de vista en un punto particular en el tiempo, realizado utilizando
cuestionarios o entrevistas, de las cuales se pueden hacer inferencias
hecho "(Galliers 1992: 153) [instantánea de los archivos,
situaciones o puntos de vista en un punto de tiempo particular, realizado utilizando
cuestionarios o entrevistas, a partir de los cuales se pueden hacer inferencias]. los
Las encuestas se ocupan de la recopilación de información sobre determinados aspectos.
del estudio, por varios participantes, haciendo
preguntas (Fowler 1988). Incluso estos cuestionarios y entrevistas, que
incluir entrevistas telefónicas cara a cara y entrevistas estructuradas,
son las técnicas de recolección de adquirir más comúnmente utilizado en
investigaciones (Blalock 1970, Nachmias y Nachmias 1976, Fowler
1988), se pueden utilizar observaciones y análisis (Gable
1994). De todos estos métodos de recolección de adquirir, el uso de la
cuestionario es la técnica más popular, ya que asegura que yo adquirir
recopilados están estructurados y formateados, lo que facilita la
clasificación de la información (Hwang 1987, de Vaus 1991).
Al analizar el adquirir, una estrategia de investigación a menudo emplea
técnicas cuantitativas, como el análisis estadístico, pero pueden ser
También se emplean técnicas cualitativas (Galliers 1992, Pervan
y Klass 1992, Gable 1994). Normalmente yo adquirir recogidos son
utilizado para analizar distribuciones y modelos de asociación
(Fowler 1988).
Aunque las encuestas son generalmente apropiadas para la investigación
lidiando con la pregunta "¿qué?" (que) o de el
resultante, como 'quantum' (cuánto) y 'quant'è' (cuántos), esse
se puede hacer a través de la pregunta 'por qué' (Sonquist y
Dunkelberg 1977, Yin 1989). Según Sonquist y Dunkelberg
(1977), la investigación apunta a hipótesis difíciles, programa de
evaluación, describiendo la población y desarrollando modelos de la
comportamiento humano. Además, se pueden utilizar encuestas
estudiar una determinada opinión de la población, condiciones,
opiniones pasadas, características, expectativas e incluso comportamientos
o presente (Neuman 1994).
Las investigaciones permiten al investigador descubrir las relaciones entre los
población y los resultados suelen ser más genéricos que
otros métodos (Sonquist y Dunkelberg 1977, Gable 1994). los
Las encuestas permiten a los investigadores relacionarse con un área geográfica.
más amplia y para llegar a muchos solicitantes de registro (Blalock 1970,
Sonquist y Dunkelberg 1977, Hwang y Lin 1987, Gable 1994,
Neuman 1994). Finalmente, las encuestas pueden proporcionar la información
que no están disponibles en otros lugares o en la forma requerida para el análisis
(Fowler 1988).
Sin embargo, existen algunas limitaciones para realizar una investigación. Uno
La desventaja es que el investigador no puede obtener mucha información.
sobre el objeto estudiado. Esto se debe al hecho de que el
Las investigaciones se llevan a cabo solo en un momento determinado y, por lo tanto,
hay un número limitado de variables y personas que el investigador puede
estudiar (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
Otro inconveniente es lo que puede ser realizar una encuesta.
muy caro en términos de tiempo y recursos, especialmente si
implica entrevistas cara a cara (Fowler 1988).
3.2.2. Método de investigación de investigación
El método de investigación implica un estudio en profundidad sobre
una situación particular dentro de su contexto real en un
período de tiempo definido, sin ninguna intervención del
investigador (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
Este método se utiliza principalmente para describir las relaciones entre
las variables que se están estudiando en una situación particular
(Galliers 1992). Las investigaciones pueden involucrar casos individuales o
múltiples, dependiendo del fenómeno analizado (Franz y Robey 1987,
Eisenhardt 1989, Yin 1989).
El método de investigación de indagación se denomina "indagación
estudio empírico que estudia un fenómeno contemporáneo dentro del
su contexto real, utilizando múltiples fuentes recopiladas de
múltiples entidades como personas, grupos u organizaciones ”(Yin 1989).
No existe una separación clara entre el fenómeno y su contexto e
no hay control experimental o manipulación de las variables (Yin
1989, Benbasat et al 1987).
Existe una variedad de técnicas para la recolección de adquirir eso puede
ser empleado en el método de investigación, que incluye la
observaciones directas, revisiones de registros de archivo, cuestionarios,
revisión de documentación y entrevistas estructuradas. Teniendo
una amplia gama de técnicas de recolección adquirir, las consultas
Permitir que los investigadores se ocupen de ambos adquirir cualitativo que
cuantitativo al mismo tiempo (Bonoma 1985, Eisenhardt 1989, Yin
1989, Gable 1994). Como es el caso del método de encuesta, un
El investigador investigador actúa como observador o investigador y no
como participante activo de la organización en estudio.
Benbasat et al. (1987) afirman que el método de investigación es
particularmente adecuado para la construcción de la teoría de la investigación, que
comienza con una pregunta de investigación y continúa con la formación
de una teoría durante el proceso de recopilación adquirir. ser
también apto para el escenario
de la teoría de la construcción, Franz y Robey (1987) sugieren que
el método de investigación también se puede utilizar para el complejo
etapa de la teoría. En este caso, con base en la evidencia reunida, uno
una teoría o hipótesis dada se verifica o refuta. Además, la investigación es
También es adecuado para la investigación que se ocupa de cuestiones 'como' o
'por qué' (Yin 1989).
En comparación con otros métodos, las investigaciones permiten al investigador
capturar información esencial con mayor detalle (Galliers
1992, Shanks et al. 1993). Además, las investigaciones permiten al
investigador para comprender la naturaleza y complejidad de los procesos estudiados
(Benbasat et al 1987).
Hay cuatro inconvenientes principales asociados con el método.
investigación. El primero es la falta de deducciones controladas. Allí
La subjetividad del investigador puede sesgar los resultados y las conclusiones.
del estudio (Yin 1989). El segundo inconveniente es la falta de
observación controlada. A diferencia de los métodos experimentales, el
El investigador investigador no puede controlar los fenómenos estudiados.
ya que se examinan en su contexto natural (Gable 1994). los
La tercera desventaja es la falta de replicabilidad. Esto se debe al hecho
que es poco probable que el investigador observe los mismos eventos, e
no puede verificar los resultados de un estudio en particular (Lee 1989).
Finalmente, como consecuencia de la no replicabilidad, es difícil
generalizar los resultados obtenidos de una o más investigaciones (Galliers
1992, Shanks et al. 1993). Todos estos problemas, sin embargo, fallan
son insuperables y, de hecho, pueden minimizarse mediante
investigador aplicando acciones apropiadas (Lee 1989).
3.3. Justificar la metodología de investigación
adoptado
De los dos posibles métodos de investigación para este estudio, el
la encuesta se considera la más adecuada. El de la indagación es
fue descartado tras una cuidadosa consideración de la relativa
méritos y debilidades. La conveniencia o lo inapropiado de cada
El método para este estudio se discute a continuación.
3.3.1. Método de investigación inadecuado
de consulta
El método de investigación requiere un estudio exhaustivo de uno
situación particular dentro de una o más organizaciones para un
período de tiempo (Eisenhardt 1989). En este caso, el período puede
exceder el marco de tiempo dado para este estudio. Otro
La razón para no adoptar el método de investigación es que los resultados
pueden sufrir de falta de rigor (Yin 1989). Subjetividad
del investigador puede influir en los resultados y conclusiones. Otro
La razón es que este método es más adecuado para la investigación de cuestiones
del tipo 'cómo' o 'por qué' (Yin 1989), mientras que la pregunta de investigación
para este estudio es del tipo "qué". Por último, si bien no menos importante
Es importante destacar que es difícil generalizar los resultados de una sola o
pocas investigaciones (Galliers 1992, Shanks et al 1993). En la base de
este razonamiento, el método de investigación no es
fue elegido como inadecuado para este estudio.
3.3.2. Conveniencia del método de investigación.
estudio
Cuando se realizó esta investigación, la práctica del almacenamiento de datos
no había sido ampliamente adoptado por
Organizaciones australianas. Entonces, no había mucha información
en cuanto a su implementación dentro del
Organizaciones australianas. La información disponible vino
por organizaciones que han implementado o usado datos
depósito. En este caso, el método de investigación por encuestas es el más
adecuado ya que permite obtener información que no es
disponible en otros lugares o en la forma requerida para el análisis (Fowler 1988).
Además, el método de investigación por encuestas permite al investigador
obtener una buena visión de las prácticas, situaciones o situaciones
visto en un momento dado (Galliers 1992, Denscombe 1998).
Se había solicitado una descripción general para aumentar la
conocimiento sobre la experiencia australiana de almacenamiento de datos.
Nuevamente, Sonquist y Dunkelberg (1977) afirman que los resultados de
La investigación por encuestas es más general que otros métodos.
3.4. Diseño de investigación de encuestas
La investigación sobre la práctica del almacenamiento de datos se llevó a cabo en 1999.

La población objetivo estaba formada por organizaciones
Los australianos interesados ​​en estudios de almacenamiento de datos, ya que
probablemente ya informado sobre i adquirir que almacenan y,
por lo tanto, podría proporcionar información útil para este estudio. Allí
La población objetivo se identificó con una encuesta inicial de
todos los miembros australianos de 'The Data Warehousing Institute' (Tdwiaap).
Esta sección analiza el diseño de la fase de investigación.
análisis empírico de este estudio.
3.4.1. Técnica de recogida de adquirir
De las tres técnicas comúnmente utilizadas en la investigación de encuestas
(es decir, cuestionario por correo, entrevista telefónica y entrevista
personal) (Nachmias 1976, Fowler 1988, de Vaus 1991), por
En este estudio se adoptó el cuestionario por correo. El primero
La razón para adoptar este último es que puede lograr un
población geográficamente dispersa (Blalock 1970, Nachmias e
Nachmias 1976, Hwang y Lin 1987, de Vaus 1991, Gable 1994).
En segundo lugar, el cuestionario de envío es adecuado para los participantes.
altamente educado (Fowler 1988). El cuestionario por correo para este
El estudio se dirigió a los patrocinadores de proyectos de almacenamiento de datos.
directores y / o jefes de proyecto. En tercer lugar, los cuestionarios sobre
mail son adecuados cuando tienes una lista segura de
direcciones (Salant y Dilman 1994). TDWI, en este caso, un
La asociación de almacenamiento de datos de confianza proporcionó la lista de correo.
de sus miembros australianos. Otra ventaja del cuestionario
por correo con respecto al cuestionario telefónico o entrevistas
personal es que permite a los registrantes responder con mayor
precisión, especialmente cuando los solicitantes de registro necesitan consultar
registros o discutir preguntas con otras personas (Fowler
1988).
Un posible inconveniente puede ser el tiempo que se tarda en
realizar cuestionarios por correo. Normalmente, un cuestionario sobre
el correo se lleva a cabo en esta secuencia: envíe cartas, espérelas
responde y envía la confirmación (Fowler 1988, Bainbridge 1989).
Por lo tanto, el tiempo total puede ser mayor que el tiempo requerido para
entrevistas personales o entrevistas telefónicas. sin embargo, el
el tiempo total se puede conocer de antemano (Fowler 1988,
Denscombe 1998). El tiempo dedicado a realizar las entrevistas.
personal no puede ser conocido de antemano ya que varía de
una entrevista con el otro (Fowler 1988). Entrevistas telefónicas
puede ser más rápido que enviar cuestionarios y
entrevistas personales, pero pueden tener una alta tasa de falta de
respuesta debido a la falta de disponibilidad de algunas personas (Fowler 1988).
Además, las entrevistas telefónicas generalmente se limitan a listas de
preguntas relativamente breves (Bainbridge 1989).
Otra debilidad de un cuestionario por correo es la alta tasa de
falta de respuesta (Fowler 1988, Bainbridge 1989, Neuman
1994). Sin embargo, se tomaron contramedidas asociando
este estudio con una institución de confianza en el campo de los datos
almacenamiento (es decir, TDWI) (Bainbridge 1989, Neuman 1994), el
que envía dos cartas recordatorias a quienes no han respondido
(Fowler 1988, Neuman 1994) y también incluye una carta
lo que explica el propósito del estudio (Neuman 1994).
3.4.2. Unidad de Análisis
El propósito de este estudio es obtener la información sobre
la implementación del almacenamiento de datos y su uso
dentro de las organizaciones australianas. La población objetivo
está compuesto por todas las organizaciones australianas que tienen
implementado, o están implementando, i almacenamiento de datos. En
luego se registran las organizaciones individuales. El cuestionario
se envió por correo a organizaciones interesadas en la adopción
di almacenamiento de datos. Este método garantiza que la información
Las colecciones provienen de los recursos más adecuados de cada organización.
participante.
3.4.3. Muestra de encuesta
La lista de correo de los encuestados se obtuvo de
TDWI. De esta lista, 3000 organizaciones australianas
han sido seleccionados como base para el muestreo. A
carta adicional explicando el proyecto y el propósito de la investigación,
junto con una tarjeta de respuesta y un sobre prepago para
devuelva el cuestionario cumplimentado se envió a la muestra.
De las 3000 organizaciones, 198 aceptaron participar en la
estudio. Se esperaba una cantidad tan pequeña de respuestas fecha il
gran número de organizaciones australianas que tenían entonces
abrazó o abrazó la estrategia de la cita
almacenamiento dentro de sus organizaciones. Entonces el
La población objetivo de este estudio consistió en solo 198
Organizaciones.
3.4.4. Contenido del cuestionario
La estructura del cuestionario se basó en el modelo de fechas
Almacenamiento de Monash (discutido anteriormente en la parte 2.3). los
El contenido del cuestionario se basó en el análisis de
literatura presentada en el capítulo 2. Una copia del cuestionario
enviado por correo a los participantes de la encuesta se puede encontrar
en el Apéndice B. El cuestionario consta de seis secciones, que
siguen las fases del modelo tratado. Los siguientes seis párrafos
Resuma brevemente el contenido de cada sección.
Sección A: Información básica sobre la organización
Esta sección contiene preguntas relacionadas con el perfil de
organizaciones participantes. Además, algunas de las preguntas son
relativo a la condición del proyecto de almacenamiento de datos de
partícipe. Información confidencial como el nombre
de la organización no se divulgaron en el análisis de la encuesta.
Sección B: Inicio
Las preguntas de esta sección están relacionadas con la actividad inicial de
almacenamiento de datos. Se han hecho preguntas sobre cuánto tiempo
se trata de iniciadores de proyectos, patrocinadores, habilidades y conocimientos
demandas, los objetivos del desarrollo del almacenamiento de datos y la
expectativas del usuario final.
Sección C: Diseño
Esta sección contiene preguntas relacionadas con las actividades de
planificación de almacenamiento de datos. Específicamente, las preguntas son
indicar el alcance de la ejecución, la duración del proyecto, el costo
del proyecto y el análisis costo / beneficio.
Sección D: Desarrollo
En la sección de desarrollo hay preguntas relacionadas con las actividades de
desarrollo de la almacenamiento de datos: recopilación de requisitos de usuario
final, las fuentes de adquirir, el modelo lógico de adquirir, prototipos, el
planificación de capacidad, arquitecturas técnicas y selección de
herramientas de desarrollo de almacenamiento de datos.
Sección E: Operación
Preguntas de operación relacionadas con la operación ed
extensibilidad de almacenamiento de datos, a medida que evoluciona hacia el
siguiente etapa de desarrollo. Allí calidad de los datos, las estrategias de
actualización de adquirir, la granularidad del adquirir, escalabilidad de datos
almacén y los problemas de seguridad del almacenamiento de datos estaban entre
los tipos de preguntas formuladas.
Sección F: Desarrollo
Esta sección contiene preguntas relacionadas con el uso de la fecha
almacén por usuarios finales. El investigador estaba interesado
para el propósito y utilidad de la almacenamiento de datos, revisión y estrategias
programas de formación adoptados y la estrategia de control de datos
almacén adoptado.
3.4.5. Tasa de respuesta
Aunque las encuestas postales son criticadas por tener un
baja respuesta, se han tomado medidas para aumentar la
tasa de rendimiento (como se discutió anteriormente en parte
3.4.1). El término 'tasa de respuesta' se refiere al porcentaje de
personas en una muestra de encuesta en particular que responde
cuestionario (Denscombe 1998). Se utilizó lo siguiente
fórmula para calcular la tasa de respuesta para este estudio:
Número de personas que respondieron
Tasa de respuesta =
——————————————————————————— X 100
Número total de cuestionarios enviados
3.4.6. Prueba piloto
Antes de enviar el cuestionario a la muestra, las preguntas se
fueron probados mediante la realización de pruebas piloto, como lo sugirió Luck
y Rubin (1987), Jackson (1988) y de Vaus (1991). El propósito de
La prueba piloto es revelar todas las expresiones incómodas, ambiguas y
preguntas difíciles de interpretar, para aclarar cualquier
definiciones y términos utilizados y para identificar el tiempo aproximado
necesario para completar el cuestionario (Warwick y Lininger 1975,
Jackson 1988, Salant y Dilman 1994). Las pruebas piloto fueron
llevado a cabo mediante la selección de sujetos con características similares a los
de los sujetos finales, como sugirió Davis e Cosenza (1993). En
Este estudio, seis profesionales de almacenamiento de datos fueron
seleccionados como sujetos piloto. Después de cada prueba piloto, se
se han realizado las correcciones necesarias. De las pruebas piloto realizadas, i
los participantes ayudaron a remodelar y restablecer el
versión final del cuestionario.
3.4.7. Métodos de análisis Di Datos
I adquirir de la encuesta recopilada a partir de cuestionarios de preguntas cerradas son
fueron analizados utilizando un paquete de programa estadístico
llamado SPSS. Muchas de las respuestas han sido analizadas
utilizando estadística descriptiva. Varios cuestionarios
regresaron incompletos. Estos fueron tratados con importantes
atención para asegurarse de que yo adquirir faltantes no eran uno
consecuencia de los errores de entrada de datos, pero por qué las preguntas no
eran adecuados para el declarante, o el declarante decidió no
responder una o más preguntas específicas. Estas respuestas
desaparecidos fueron ignorados durante el análisis de adquirir y ellos fueron
codificado como '- 9' para determinar su exclusión del proceso
análisis.
Al preparar el cuestionario, las preguntas cerradas fueron
precodificado asignando un número a cada opción. El número
luego se usó para preparar el adquirir durante el análisis
(Denscombe 1998, Sapsford y Jupp 1996). Por ejemplo, hubo
seis opciones enumeradas en la pregunta 1 de la sección B: asesoramiento
administración, ejecutivo senior, departamento de TI, unidad
de empresas, consultores y más. En el archivo de adquirir de SPSS, es
se ha generado una variable para indicar 'el iniciador del proyecto',
con seis etiquetas de valor: '1' para la 'junta directiva', '2'
para 'el ejecutivo de alto nivel' y así sucesivamente. El uso de la escala Likertin
en algunas de las preguntas cerradas también se permitió
una identificación que no requiere esfuerzo dado el uso de valores
números correspondientes ingresados ​​en SPSS. Para preguntas con
respuestas no exhaustivas, que no se excluyen mutuamente,
cada opción se trató como una sola variable con dos
etiquetas de valor: '1' para 'marcado' y '2' para 'no marcado'.
Las preguntas abiertas se trataron de manera diferente a las preguntas
cerrado. Las respuestas a estas preguntas no se publicaron en
SPSS. Al contrario, se analizaron a mano. El uso de este
tipo de preguntas le permite obtener información sobre las ideas
experiencias personales y libremente expresadas de los registrantes
(Bainbridge 1989, Denscombe 1998). Siempre que sea posible, se ha hecho
una categorización de respuestas.
Para el análisis de adquirir, se utilizan métodos de análisis estadístico simple,
como la frecuencia de las respuestas, la media, la desviación al cuadrado
media y mediana (Argyrous 1996, Denscombe 1998).
La prueba Gamma se estaba realizando para obtener medidas cuantitativas.
asociaciones entre adquirir ordinales (Norusis 1983, Argyrous 1996).
Estas pruebas fueron apropiadas porque las escalas ordinales utilizadas no fueron
tenían muchas categorías y se podían mostrar en una tabla
(Norusis 1983).
3.5 Resumen
En este capítulo, la metodología de investigación y la
diseños adoptados para este estudio.
Seleccionar el método de búsqueda más apropiado para un
estudio particular toma en
considerar una serie de reglas, incluida la naturaleza y el tipo
investigación, así como los méritos y debilidades de cada posible
método (Jenkins 1985, Benbasat et al. 1097, Galliers y Land 1987,
Yin 1989, Hamilton y Ives 1992, Galliers 1992, Neuman 1994). Vista
la falta de conocimientos y teorías existentes al respecto
de la adopción del almacenamiento de datos en Australia, este estudio de
la investigación requiere un método de investigación interpretativa con una habilidad
exploratorio para explorar las experiencias de las organizaciones
Australiano. El método de búsqueda elegido ha sido seleccionado para
recopilar información sobre la adopción del concepto de fecha
almacenes por organizaciones australianas. A
Se eligió el cuestionario postal como técnica de recogida. adquirir. El
justificaciones para el método de investigación y la técnica de recolección adquirir
seleccionados se proporcionarán en este capítulo. También fue
Se presentó una discusión sobre la unidad de análisis, la muestra
utilizado, los porcentajes de respuestas, el contenido del cuestionario, la
prueba previa del cuestionario y el método de análisis adquirir.

Diseñando un Almacenamiento de Datos:
Combinando relación entre entidades y modelado dimensional
RESUMEN
Tienda i adquirir es un problema actual importante para muchos
Organizaciones. Un problema de desarrollo clave
del almacenamiento de adquirir es su diseño.
El diseño debe soportar la detección de conceptos en los datos.
almacenar un sistema heredado y otras fuentes de adquirir y también uno
fácil comprensión y eficiencia en la implementación de datos
almacén.
Gran parte de la literatura sobre almacenamiento adquirir recomendado
el uso de modelos de relación de entidades o modelos dimensionales para
representar el dibujo de almacenamiento de datos.
En este periódico mostramos cómo ambos
Las representaciones pueden combinarse en un enfoque para la
dibujo de almacenamiento de datos. El enfoque utilizado es sistemáticamente
examinado en un estudio de caso y se identifica en una serie de
implicaciones importantes con los profesionales.
ALMACENAMIENTO DE DATOS
Un almacenamiento de datos por lo general, se define como una "orientación temática,
recopilación de datos integrada, variable en el tiempo y no volátil en apoyo
de las decisiones de la dirección "(Inmon y Hackathorn, 1994).
Orientado al sujeto e integrado indica que el almacenamiento de datos è
diseñado para cruzar los límites funcionales de los sistemas legales por
ofrecer una perspectiva integrada de adquirir.
La variante temporal afecta la naturaleza histórica o de serie temporal de adquirir in
un almacenamiento de datos, que permite analizar las tendencias.
No volátil indica que el almacenamiento de datos no es continuamente
actualizado como base de datos de OLTP. Más bien está actualizado
periódicamente, con adquirir de fuentes internas y externas. La
almacenamiento de datos está diseñado específicamente para la investigación
en lugar de por la integridad de las actualizaciones y el desempeño de la
operaciones.
La idea de almacenar i adquirir no es nuevo, era uno de los propósitos
administración de adquirir desde la década de 1982 (Il Martin, XNUMX).
I almacenamiento de datos ellos ofrecen la infraestructura adquirir para la gestión
soporte de sistemas. Los sistemas de apoyo a la gestión incluyen decisiones
sistemas de apoyo (DSS) y sistemas de información ejecutiva (EIS).
Un DSS es un sistema de información basado en computadora que
diseñado para mejorar el proceso y, en consecuencia, el agarre de
decisión humana. Un EIS es típicamente un sistema de entrega de
adquirir que permite a los ejecutivos de negocios acceder fácilmente a la vista
de adquirir.
La arquitectura general de un almacenamiento de datos destaca el papel de
almacenamiento de datos en apoyo a la gestión. Además de ofrecer
la infraestructura adquirir para EIS y DSS, al almacenamiento de datos es posible
acceder a él directamente a través de consultas. LA adquirir incluido en una fecha
almacén se basan en un análisis de los requisitos de información de
gestión y se obtienen de tres fuentes: sistemas heredados internos,
sistemas de captura de datos de propósito especial y fuentes de datos externas. LA
adquirir en los sistemas heredados internos, con frecuencia son redundantes,
inconsistente, de baja calidad y almacenado en diferentes formatos
por lo que deben reconciliarse y limpiarse antes de que puedan cargarse en el
almacenamiento de datos (Inmon, 1992; McFadden, 1996). LA adquirir desde
de los sistemas de almacenamiento adquirir ad hoc y de fuentes adquirir
externos se utilizan para aumentar (actualizar, reemplazar) i
adquirir de sistemas heredados.
Hay muchas razones de peso para desarrollar un almacenamiento de datos,
que incluyen una mejor toma de decisiones mediante el uso
más información real (Ives 1995), apoyo para un enfoque
sobre el negocio completo (Graham 1996), y la reducción en los costos de
provisión de adquirir para EIS y DSS (Graham 1996, McFadden
1996).
Un estudio empírico reciente encontró, en promedio, un retorno de
inversiones para yo almacenamiento de datos 401% después de tres años (Graham,
1996). Sin embargo, los otros estudios empíricos de almacenamiento de datos tener
encontró problemas importantes, incluida la dificultad para medir y
asignar beneficios, carecer de un propósito claro, subestimarlo
propósito y complejidad del proceso de almacenamiento i adquiriren
particularmente con respecto a las fuentes y la limpieza de la adquirir.
Tienda i adquirir puede considerarse como una solución
al problema de la gestión adquirir entre organizaciones. Allí
manipulación de adquirir como recurso social se ha mantenido como uno de los
cuestiones clave en la gestión de los sistemas de información en torno a la
mundo durante muchos años (Brancheau et al. 1996, Galliers et al. 1994,
Niederman y col. 1990, Pervan 1993).
Un enfoque popular para administrar adquirir en los ochenta fue
el desarrollo de un modelo adquirir social. Modelo adquirir social era
diseñado para ofrecer una base estable para el desarrollo de nuevos sistemas
aplicaciones y base de datos y reconstrucción e integración del legado
sistemas (Brancheau et al.
1989, Goodhue et al. 1988: 1992, Kim y Everest 1994).
Sin embargo, hay muchos problemas con este enfoque, en
en particular, la complejidad y el costo de cada tarea, y el largo tiempo
necesarios para obtener resultados tangibles (Beynon-Davies 1994, Earl
1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997).
Il almacenamiento de datos es una base de datos separada que coexiste con el legado
bases de datos en lugar de reemplazarlas. Por lo tanto, te permite
dirigir la gestión de adquirir y evitar costosas reconstrucciones
de sistemas heredados.
ENFOQUES EXISTENTES AL DIBUJO DE FECHA
ALMACÉN
El proceso de construcción y perfeccionamiento de un almacenamiento de datos
debe entenderse más como un proceso evolutivo que como un
ciclo de vida de desarrollo de sistemas tradicionales (Desio, 1995, cañas,
O'Donnell y Arnott 1997a). Hay muchos procesos involucrados en un
proyecto de almacenamiento de datos como inicialización, planificación;
información obtenida de los requisitos solicitados a los gerentes de la empresa;
fuentes, transformaciones, limpieza de adquirir y sincronización de legacy
sistemas y otras fuentes de adquirir; sistemas de entrega en desarrollo;
seguimiento de almacenamiento de datos; y tonterías del proceso
evolutivo y construcción de un almacenamiento de datos (Espinillas, O'Donnell
y Arnott 1997b). En esta revista, nos enfocamos en cómo
dibujar yo adquirir almacenados en el contexto de estos otros procesos.
Hay una serie de enfoques propuestos para la arquitectura de datos.
almacén en la literatura (Inmon 1994, Ives 1995, Kimball 1994
McFadden 1996). Cada una de estas metodologías tiene una breve
revisar con un análisis de sus fortalezas y no.
Enfoque de Inmon (1994) para Almacenamiento de Datos
Diseño
Inmon (1994) propuso cuatro pasos iterativos para diseñar una fecha
almacén (ver Figura 2). El primer paso es diseñar un modelo.
adquirir social para entender cómo adquirir se puede integrar
a través de áreas funcionales dentro de una organización
dividiendo el adquirir almacenar en áreas. Modelo adquirir está hecho para
para almacenar adquirir relacionados con la toma de decisiones, incluyendo adquirir
histórico, e incluido adquirir deducido y agregado. El segundo paso es
identificar áreas temáticas para la implementación. Estos se basan
sobre las prioridades determinadas por una organización en particular. El tercero
El paso implica dibujar un base de datos para el área temática, posa
Se presta especial atención a la inclusión de niveles adecuados de granularidad.
Inmon recomienda utilizar el modelo de entidad y relación. Cuatro
El paso es identificar sistemas de fuentes. adquirir requerido y desarrollar
procesos de transformación para adquirir, limpiar y formatear i adquirir.
Los puntos fuertes del enfoque de Inmon son que el modelo adquirir social
proporciona la base para la integración de adquirir dentro de la organización
y planificación de apoyos para el desarrollo iterativo de datos
depósito. Sus inconvenientes son la dificultad y el costo de dibujar.
el modelo adquirir social, la dificultad para comprender los patrones de las entidades e
relaciones utilizadas en ambos modelos, que adquirir social y la de adquirir
almacenados por área temática, y la idoneidad de adquirir de los
dibujo de almacenamiento de datos para la realizacion de base de datos
relacional pero no para base de datos multidimensional.
Enfoque de Ives (1995) Almacenamiento de Datos
Diseño
Ives (1995) propone un enfoque de cuatro pasos para dibujar un
sistema de información que estime aplicable al diseño de una fecha
almacén (ver Figura 3). El enfoque se basa en gran medida en
Ingeniería de la información para el desarrollo de sistemas de información
(Martín 1990). El primer paso es determinar los objetivos, los factores
indicadores de desempeño críticos y exitosos y clave. LA
Los procesos comerciales clave y la información necesaria son
moldeado para llevarnos a un modelo adquirir social. el segundo paso
Implica el desarrollo de una arquitectura definitoria. adquirir
almacenado por áreas, base de datos di almacenamiento de datos, los componentes
de tecnología que se requieren, el conjunto de soporte organizacional
necesarios para implementar y operar con almacenamiento de datos. El tercero
El paso incluye la selección de los paquetes de software y las herramientas necesarios.
El cuarto paso es el diseño detallado y la construcción del
almacenamiento de datos. Ives señala que para almacenar adquirir es un límite
proceso iterativo.
La fuerza del enfoque de Ives es el uso de especificaciones técnicas para
determinar los requisitos de información, el uso de uno estructurado
proceso para apoyar la integración de almacenamiento de datos,
la selección adecuada de hardware y software, y el uso de múltiples
técnicas de representación para el almacenamiento de datos. Sus defectos
son inherentes a la complejidad. Otros incluyen dificultad en
desarrollar muchos niveles de base de datos dentro del almacenamiento de datos in
tiempo y costo razonables.
Enfoque de Kimball (1994) Almacenamiento de Datos
Diseño
Kimball (1994) propuso cinco pasos iterativos para dibujar una fecha
almacén (ver Figuras 4). Su enfoque es particularmente
dedicado al dibujo de un solo almacenamiento de datos y sobre el uso de plantillas
dimensional con preferencia a los modelos de entidades y relaciones. Kimball
analizar esos modelos dimensionales porque es más fácil para mí entender
los ejecutivos de negocios son más eficientes al tratar
consultas complejas, y el diseño de base de datos físico es más
eficiente (Kimball 1994). Kimball reconoce que el desarrollo de un
almacenamiento de datos es iterativo, y que almacenamiento de datos lata separada
integrarse mediante la división en tablas de dimensiones
común.
El primer paso es identificar el área temática particular que se
perfeccionado. El segundo y tercer paso se refieren al modelado.
dimensional. En el segundo paso, las mediciones identifican cosas de
interés en el área temática y agrupados en una tabla de hechos.
Por ejemplo, en un área temática de ventas, las medidas de interés
podrían incluir la cantidad de artículos vendidos y el dólar
como moneda de venta. El tercer paso consiste en identificar el
dimensiones que son las formas en que se pueden agrupar i
hechos. En un área temática de ventas, dimensiones relevantes
podrían incluir artículo, ubicación y período de tiempo. Allí
La tabla de hechos tiene una clave de varias partes para vincular a cada
de tablas de dimensiones y normalmente contiene una gran cantidad
genial de hecho. Por el contrario, las tablas de tamaño contienen
información descriptiva sobre las dimensiones y otros atributos que
se pueden utilizar para agrupar hechos. La tabla de hechos e
dimensiones asociadas con la propuesta forman lo que se llama uno
patrón de estrella debido a su forma. El cuarto paso implica
construyendo un base de datos multidimensional para perfeccionarlo
esquema de estrella. El paso final es identificar los sistemas de origen adquirir
requeridos y desarrollar procesos de transformación para adquirir, limpiar
y formato i adquirir.
Las fortalezas del enfoque de Kimball incluyen el uso de modelos
dimensional para representar i adquirir almacenados que lo hacen
fácil de entender y conduce a un diseño físico eficiente. A
modelo dimensional que utiliza fácilmente tanto
sistemas de base de datos los sistemas relacionales pueden perfeccionarse o los sistemas
base de datos multidimensional. Sus defectos incluyen la falta
algunas técnicas para facilitar la planificación o integración de
muchos patrones de estrellas dentro de uno almacenamiento de datos y
dificultad de diseñar a partir de la estructura desnormalizada extrema en un
modelo dimensional a adquirir en el sistema heredado.
Enfoque de los datos de McFadden (1996)
Diseño de Almacén
McFadden (1996) propone un enfoque de cinco pasos para
dibuja un almacenamiento de datos (ver Figura 5).
Su enfoque se basa en una síntesis de ideas de la literatura.
y se centra en el dibujo de uno almacenamiento de datos. El primero
El paso implica un análisis de requisitos. Incluso si los detalles
técnicas no están prescritas, las notas de McFadden identifican
entidad adquirir especificaciones y sus atributos, y se refiere a los lectores de Watson
y Frolick (1993) para la adquisición de los requisitos.
En el segundo paso, se dibuja un modelo de entidad de relación para
almacenamiento de datos y luego validado por ejecutivos de empresas. El tercero
El paso incluye determinar el mapeo del sistema heredado.
y fuentes externas de almacenamiento de datos. El cuarto paso implica
procesos en desarrollo, distribución y sincronización de adquirir en
almacenamiento de datos. En el paso final, la entrega del sistema es
desarrollado con especial énfasis en una interfaz de usuario.
McFadden señala que el proceso de dibujo es generalmente
iterativo.
Las fortalezas del enfoque de McFadden se basan en la participación
por los ejecutivos de negocios para determinar los requisitos y también
la importancia de los recursos adquirir, su limpieza y recogida. Su
Los inconvenientes se relacionan con la falta de un proceso para dividir un
gran proyecto de almacenamiento de datos en muchas etapas integradas, y el
dificultad para comprender los modelos de entidad y relación utilizados en el diseño de
almacenamiento de datos.

    0/5 (0 Comentarios)
    0/5 (0 Comentarios)
    0/5 (0 Comentarios)

    Obtenga más información de la Agencia Web Online

    Suscríbete para recibir los últimos artículos por correo electrónico.

    avatar del autor
    Admin CEO
    👍Agencia Web Online | Agencia Web experta en Marketing Digital y SEO. Agencia Web Online es una Agencia Web. Para Agenzia Web Online el éxito en la transformación digital se basa en los fundamentos de Iron SEO versión 3. Especialidades: Integración de sistemas, Integración de aplicaciones empresariales, Arquitectura orientada a servicios, Computación en la nube, Almacén de datos, inteligencia de negocios, Big Data, portales, intranets, Aplicación web Diseño y gestión de bases de datos relacionales y multidimensionales. Diseño de interfaces para medios digitales: usabilidad y gráficos. La agencia web online ofrece a las empresas los siguientes servicios: -SEO en Google, Amazon, Bing, Yandex; -Análisis web: Google Analytics, Google Tag Manager, Yandex Metrica; -Conversiones de usuarios: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM en Google, Bing, Amazon Ads; -Marketing en Redes Sociales (Facebook, Linkedin, Youtube, Instagram).
    Mi privacidad ágil
    Este sitio utiliza cookies técnicas y de elaboración de perfiles. Al hacer clic en aceptar, autoriza todas las cookies de creación de perfiles. Al hacer clic en rechazar o en la X, se rechazan todas las cookies de creación de perfiles. Al hacer clic en personalizar, puede seleccionar qué cookies de perfil activar.
    Este sitio cumple con la Ley de Protección de Datos (LPD), la Ley Federal Suiza del 25 de septiembre de 2020, y el GDPR, Reglamento de la UE 2016/679, relacionado con la protección de datos personales, así como con la libre circulación de dichos datos.