fbpx

Almacenamiento de datos y planificación de recursos empresariales | DWH y ERP

ARCHIVO DATOS CENTRAL: ED HISTORIA EVOLUCIONES

Los dos temas dominantes de la tecnología corporativa en la década de 90 fueron i almacenamiento de datos y el ERP. Durante mucho tiempo, estas dos poderosas corrientes han sido parte de la TI corporativa sin haber tenido nunca intersecciones. Era casi como si fueran materia y antimateria. Pero el crecimiento de ambos fenómenos ha conducido inevitablemente a su intersección. Hoy en día las empresas se enfrentan al problema de qué hacer con el ERP y almacenamiento de datos. Este artículo describirá cuáles son los problemas y cómo los abordan las empresas.

AL PRINCIPIO…

Al principio estaba el almacenamiento de datos. Almacén de datos fue creado para contrarrestar el sistema de aplicación de procesamiento de transacciones. En los primeros días la memorización de adquirir estaba destinado a ser sólo un contrapunto a las aplicaciones de procesamiento de transacciones. Pero hoy en día existen visiones mucho más sofisticadas de lo que es un almacenamiento de datos. En el mundo de hoy el almacenamiento de datos se inserta dentro de una estructura que se puede denominar Fábrica de Información Corporativa.

LA FÁBRICA DE INFORMACIÓN CORPORATIVA (CIF)

La Corporate Information Factory tiene componentes arquitectónicos estándar: un nivel de transformación e integración de código que integra el adquirir mientras yo adquirir pasan del entorno de aplicación al entorno de almacenamiento de datos de la compañia; a almacenamiento de datos de la empresa donde yo adquirir Historias detalladas e integradas. La almacenamiento de datos de la empresa sirve como base sobre la cual se pueden construir todas las demás partes del entorno de la empresa almacenamiento de datos; un almacén de datos operativos (ODS). Un ODS es una estructura híbrida que contiene algunos aspectos de la almacenamiento de datos y otros aspectos de un entorno OLTP; data marts, donde diferentes departamentos pueden tener su propia versión del almacenamiento de datos; a almacenamiento de datos de exploración en el que los "filósofos" de la empresa pueden presentar sus consultas de 72 horas sin efectos nocivos para el almacenamiento de datos; y una memoria de línea cercana, en la que adquirir viejo y adquirir Los detalles a granel se pueden almacenar de forma económica.

DONDE ERP SE COMBINA CON EL FÁBRICA DE INFORMACIÓN CORPORATIVA

El ERP se fusiona con la Corporate Information Factory en dos lugares. Primero como una aplicación básica (baseline) que me proporciona adquirir de la aplicación a almacenamiento de datos. En este caso yo adquirir, generados como subproducto de un proceso de transacción, se integran y cargan en el almacenamiento de datos de la compañia. El segundo punto de unión entre ERP y CIF y ODS. De hecho, en muchos entornos el ERP se utiliza como un ODS clásico.

En caso de que se utilice ERP como aplicación básica, el mismo ERP también se puede utilizar en el CIF como ODS. En cualquier caso, si se va a utilizar el ERP en ambos roles, debe haber una distinción clara entre las dos entidades. En otras palabras, cuando el ERP desempeña el papel de aplicación básica y ODS, se deben distinguir las dos entidades arquitectónicas. Si una única implementación de ERP intenta realizar ambas funciones simultáneamente, inevitablemente habrá problemas en el diseño y la implementación de esa estructura.

SAO SEPARADO Y APLICACIONES BÁSICAS

Son muchas las razones que llevan a la división de componentes arquitectónicos. Quizás la cuestión más reveladora a la hora de separar los diferentes componentes de una arquitectura es que cada componente de la arquitectura tiene su propia vista. La aplicación de referencia tiene un propósito diferente al del ODS. Intenta superponerte

una visión básica de la aplicación sobre el mundo de un ODS o viceversa no es una forma correcta de trabajar.

En consecuencia, el primer problema de un ERP en el CIF es verificar si existe una distinción entre las aplicaciones base y los ODS.

MODELOS DE DATOS EN LA CORPORATIVA FABRICA DE INFORMACION

Para lograr la cohesión entre los diferentes componentes de la arquitectura CIF, debe existir un modelo de adquirir. los modelos de adquirir sirven como vínculo entre los distintos componentes de la arquitectura, como las aplicaciones básicas y el ODS. los modelos de adquirir se convierten en la “hoja de ruta intelectual” para obtener el significado correcto de los diferentes componentes arquitectónicos del CIF.

De la mano de esta noción, la idea es que debería haber un modelo único y amplio de adquirir. Obviamente tiene que haber un modelo de adquirir para cada uno de los componentes y además debe existir un camino sensato que conecte los diferentes modelos. Cada componente de la arquitectura (ODS, aplicaciones básicas, almacenamiento de datos de la empresa, etc. – necesita su propio modelo adquirir. Por eso tiene que haber una definición precisa de cómo funcionan estos modelos. adquirir interactúan entre sí.

MOVE I DATOS DE LA FECHA DEL ERP ALMACÉN

Si el origen de la adquirir es una aplicación base y/o un ODS, cuando el ERP lo inserta adquirir en almacenamiento de datos, esta inserción debe realizarse en el nivel más bajo de "granularidad". Simplemente resuma o agregue i adquirir tal como salen de la aplicación básica de ERP o ERP ODS no es lo correcto. EL adquirir se necesitan detalles en almacenamiento de datos para formar la base del proceso DSS. Semejante adquirir se verá remodelado en muchos sentidos por los mercados de datos y las exploraciones de almacenamiento de datos.

El desplazamiento de adquirir desde el entorno de aplicación de referencia del ERP hasta el almacenamiento de datos de la empresa se realiza de forma razonablemente relajada. Este movimiento ocurre aproximadamente 24 horas después de la actualización o creación en el ERP. El hecho de tener un movimiento "perezoso" del adquirir en almacenamiento de datos de la empresa permite adquirir procedente del ERP para "depositar". Una vez yo adquirir están almacenados en la aplicación de línea base, entonces puede mover con seguridad adquirir del ERP en la empresa. Otro objetivo alcanzable gracias al movimiento "perezoso" del adquirir es la clara delimitación entre los procesos operativos y DSS. Con un movimiento “rápido” del adquirir la línea divisoria entre DSS y operacional sigue siendo vaga.

El movimiento de adquirir del ODS del ERP a almacenamiento de datos de la empresa se realiza periódicamente, normalmente semanal o mensualmente. En este caso el movimiento de adquirir se basa en la necesidad de "limpiar" el viejo adquirir historiadores. Por supuesto, el ODS contiene i adquirir que son mucho más recientes que los adquirir historiadores encontrados en almacenamiento de datos.

El desplazamiento de adquirir en almacenamiento de datos casi nunca se hace "al por mayor" (a modo de mayorista). Copie una tabla del entorno ERP a almacenamiento de datos No tiene sentido. Un enfoque mucho más realista es mover unidades seleccionadas del adquirir. Solo yo adquirir que han cambiado desde la última actualización de almacenamiento de datos ellos son los que deben ser trasladados al almacenamiento de datos. Una forma de saber cuáles adquirir han cambiado desde la última actualización es mirar las marcas de tiempo de la adquirir que se encuentran en el entorno ERP. El diseñador selecciona todos los cambios que han ocurrido desde la última actualización. Otro enfoque es utilizar técnicas de captura de cambios. adquirir. Con estas técnicas, se analizan registros y cintas de diarios para determinar cuáles adquirir debe trasladarse del entorno ERP al de almacenamiento de datos. Estas técnicas son mejores porque los registros y las cintas de diario se pueden leer desde archivos ERP sin afectar más otros recursos de ERP.

OTRAS COMPLICACIONES

Uno de los problemas de ERP en CIF es lo que sucede con otras fuentes de aplicaciones o con adquirir de las SAO que deben contribuir a almacenamiento de datos pero no forman parte del entorno ERP. Dada la naturaleza cerrada de los ERP, especialmente SAP, el intento de integrar claves de fuentes externas de adquirir con el adquirir que provienen del ERP al mover el adquirir en almacenamiento de datos, es un gran desafío. ¿Y exactamente cuáles son las probabilidades de que yo adquirir de aplicaciones u ODS fuera del entorno ERP se integrarán en el almacenamiento de datos? En realidad, las probabilidades son muy altas.

ENCONTRAR DATOS HISTÓRICOS DE ERP

Otro problema con el adquirir de ERP es el derivado de la necesidad de tener adquirir historiadores dentro del almacenamiento de datos. Por lo general, el almacenamiento de datos él necesita adquirir historiadores. Y la tecnología ERP normalmente no almacena estos adquirir histórico, al menos no hasta el punto en que sea necesario en el almacenamiento de datos. Cuando una gran cantidad de adquirir La historia comienza a acumularse en el entorno ERP, ese entorno necesita ser limpiado. Por ejemplo, supongamos que un almacenamiento de datos debe estar cargado con cinco años de adquirir datos históricos mientras que el ERP guarda un máximo de seis meses de estos adquirir. Siempre que la empresa se conforme con recopilar una serie de adquirir historiadores a medida que pasa el tiempo, entonces no hay problemas en utilizar el ERP como fuente para el almacenamiento de datos. Pero cuando el almacenamiento de datos tiene que retroceder en el tiempo y conseguir dioses adquirir historiales que el ERP no ha recopilado ni guardado previamente, el entorno del ERP se vuelve ineficiente.

ERP Y METADATOS

Otra consideración a tener en cuenta sobre ERP y almacenamiento de datos es el de los metadatos existentes en el entorno ERP. Así como los metadatos pasan del entorno ERP al entorno de TI almacenamiento de datos, los metadatos deben moverse de la misma manera. Además, los metadatos deben transformarse al formato y estructura requeridos por la infraestructura del almacenamiento de datos. Existe una gran diferencia entre los metadatos operativos y los metadatos DSS. Los metadatos operativos son principalmente para el desarrollador y el

programador. Los metadatos DSS son principalmente para el usuario final. Es necesario convertir los metadatos existentes en aplicaciones ERP o ODS, y esta conversión no siempre es fácil y directa.

OBTENER LOS DATOS DEL ERP

Si el ERP se utiliza como proveedor de adquirir para la almacenamiento de datos debe haber una interfaz sólida que mueva el adquirir Del entorno ERP al entorno almacenamiento de datos. La interfaz debe:

  • ▪  ser fácil de usar
  • ▪  permitir el acceso a adquirir del ERP
  • ▪  captar el significado de adquirir que están a punto de ser trasladados a la almacenamiento de datos
  • ▪  conocer las limitaciones del ERP que podrían surgir al acceder al adquirir del ERP:
  • ▪  integridad referencial
  • ▪  relaciones jerárquicas
  • ▪  relaciones lógicas implícitas
  • ▪  convención de aplicación
  • ▪  todas las estructuras de adquirir soportado por el ERP, y así sucesivamente ...
  • ▪  ser eficiente en el acceso adquirir, proporcionando:
  • ▪  movimiento directo de adquirir
  • ▪  adquisición de cambio adquirir
  • ▪  apoyar el acceso oportuno a adquirir
  • ▪  comprender el formato de adquirir, y así… INTERFAZ CON SAP La interfaz puede ser de dos tipos, propia o comercial. Algunas de las principales interfaces comerciales incluyen:
  • ▪ SAS
  • ▪  Soluciones Prims
  • ▪  D2k, etc.… MÚLTIPLES TECNOLOGÍAS ERP Tratar el entorno ERP como si fuera una única tecnología es un gran error. Existen muchas tecnologías ERP, cada una con sus propios puntos fuertes. Los proveedores más conocidos del mercado son:
  • ▪SAP
  • ▪  Oracle Finanzas
  • ▪  PersonasSoft
  • ▪ JD Edwards
  • ▪ Baño SAP SAP es el software ERP más grande y completo. Las aplicaciones SAP incluyen muchos tipos de aplicaciones en muchas áreas. SAP tiene la reputación de ser:
  • ▪  muy grande
  • ▪  muy difícil y costoso de implementar
  • ▪  necesita mucha gente y consultores para implementar
  • ▪  requiere personas especializadas para su implementación
  • ▪  necesita mucho tiempo para implementarse Además, SAP tiene la reputación de memorizar sus propios adquirir con mucho cuidado, lo que dificulta el acceso a ellos para una persona fuera del área de SAP. La fortaleza de SAP es que es capaz de capturar y almacenar una gran cantidad de adquirir. Recientemente SAP anunció su intención de extender sus aplicaciones a almacenamiento de datos. Existen muchos pros y contras de utilizar SAP como proveedor almacenamiento de datos. Una ventaja es que SAP ya está instalado y que la mayoría de los consultores ya conocen SAP.
    Las desventajas de tener a SAP como proveedor de almacenamiento de datos hay muchos: SAP no tiene experiencia en el mundo de almacenamiento de datos Si SAP es el proveedor de almacenamiento de datos, es necesario “sacar” i adquirir de SAP al almacenamiento de datos. Fecha Dado el historial de sistema cerrado de SAP, es poco probable que sea fácil incorporarlo desde SAP (???). Existen muchos entornos heredados que impulsan SAP, como IMS, VSAM, ADABAS, ORACLE, DB2, etc. SAP insiste en un enfoque “no inventado aquí”. SAP no desea asociarse con otros proveedores para utilizar o crear el almacenamiento de datos. SAP insiste en generar todo su software por sí misma.

Aunque SAP es una empresa grande y poderosa, intentar reescribir la tecnología de ELT, OLAP, la administración de sistemas e incluso el código central de dbms es simplemente una locura. En lugar de adoptar una actitud cooperativa con los proveedores de almacenamiento de datos Desde hace mucho tiempo, SAP ha seguido el enfoque de “ellos saben más”. Esta actitud obstaculiza el éxito que SAP podría tener en el área de almacenamiento de datos.
La negativa de SAP a permitir que los proveedores externos accedan rápida y elegantemente a sus adquirir. La esencia misma de utilizar un almacenamiento de datos es de fácil acceso a adquirir. Toda la historia de SAP se basa en dificultar el acceso adquirir.
La falta de experiencia de SAP en el manejo de grandes volúmenes de adquirir; en el campo de almacenamiento de datos hay volúmenes de adquirir nunca visto por SAP y para gestionar estas grandes cantidades de adquirir es necesario contar con la tecnología adecuada. SAP aparentemente no es consciente de esta barrera tecnológica que existe para ingresar al campo de almacenamiento de datos.
Cultura corporativa de SAP: SAP ha convertido en un negocio la obtención de adquirir del sistema. Pero para ello es necesario tener una mentalidad diferente. Tradicionalmente, las empresas de software que eran buenas para introducir datos en un entorno no han sido buenas para conseguir que los datos vayan en sentido contrario. Si SAP logra realizar este tipo de cambio, será la primera empresa en hacerlo.

En resumen, es cuestionable si una empresa debería seleccionar a SAP como su proveedor. almacenamiento de datos. Hay riesgos muy graves por un lado y muy pocas recompensas por el otro. Pero hay otro motivo que desalienta la elección de SAP como proveedor almacenamiento de datos. Porque todas las empresas deberían tener el mismo almacenamiento de datos de todas las demás empresas? El almacenamiento de datos es el corazón de la ventaja competitiva. Si todas las empresas adoptaran las mismas almacenamiento de datos Sería difícil, aunque no imposible, lograr una ventaja competitiva. SAP parece pensar que un almacenamiento de datos puede verse como una cookie y esto es una señal más de la mentalidad de las aplicaciones de "obtener los datos".

Ningún otro proveedor de ERP es tan dominante como SAP. Sin duda habrá empresas que seguirán el camino de SAP para el suyo almacenamiento de datos pero presumiblemente estos almacenamiento de datos SAP será grande, costoso y llevará mucho tiempo crearlo.

Estos entornos incluyen actividades tales como procesamiento de cajeros bancarios, procesos de reservas de aerolíneas, procesos de reclamaciones de seguros, etc. Cuanto más eficaz era el sistema de transacciones, más obvia era la necesidad de separación entre el proceso operativo y el DSS (Sistema de Apoyo a la Decisión). Sin embargo, con los sistemas de personal y recursos humanos, nunca se enfrenta a grandes volúmenes de transacciones. Y, por supuesto, cuando una persona es contratada o deja la empresa esto es un registro de una transacción. Pero en comparación con otros sistemas, los sistemas de recursos humanos y de personal simplemente no tienen muchas transacciones. Por lo tanto, en los sistemas de personal y recursos humanos no es del todo obvio que exista la necesidad de un DataWarehouse. En muchos sentidos, estos sistemas representan la fusión de los sistemas DSS.

Pero hay otro factor que se debe considerar si se trata de almacenes de datos y PeopleSoft. En muchos entornos, yo adquirir de los recursos humanos y personales son secundarios respecto del negocio principal de la empresa. La mayoría de las empresas se dedican a la fabricación, las ventas, la prestación de servicios, etc. Los sistemas de recursos humanos y de personal suelen ser secundarios (o respaldar) la línea principal de negocios de la empresa. Por tanto, es equívoco e inconveniente almacenamiento de datos separada para recursos humanos y personal de apoyo.

PeopleSoft es muy diferente de SAP en este sentido. Con SAP, es obligatorio que exista un almacenamiento de datos. Con PeopleSoft, no está tan claro. Un almacén de datos es opcional con PeopleSoft.

Lo mejor que se puede decir del adquirir PeopleSoft es que el almacenamiento de datos se puede utilizar para archivar i adquirir relativos a antiguos recursos humanos y personales. Una segunda razón por la que una empresa querría utilizar un almacenamiento de datos a

perjuicio del entorno PeopleSoft es permitir el acceso y libre acceso a las herramientas de análisis, adquirir por PeopleSoft. Pero más allá de estos motivos, puede haber casos en los que sea preferible no disponer de un almacén de datos para adquirir GenteSoft.

En fin

Hay muchas ideas sobre la construcción de un almacenamiento de datos dentro de un software ERP.
Algunos de estos son:

  • ▪  Tiene sentido tener un almacenamiento de datos ¿Eso es similar a cualquier otra persona en la industria?
  • ▪  Qué tan flexible es un ERP almacenamiento de datos software?
  • ▪ Un ERP almacenamiento de datos el software puede manejar un volumen de adquirir que se encuentra en un "almacenamiento de datos arena"?
  • ▪  ¿Cuál es el registro de seguimiento que realiza el proveedor de ERP de forma fácil y económica, en términos de tiempo, adquirir? (¿Cuál es el historial de los proveedores de ERP en cuanto a la entrega de datos económicos, puntuales y de fácil acceso?)
  • ▪  ¿Cómo entiende el proveedor de ERP la arquitectura DSS y la fábrica de información corporativa?
  • ▪  Los proveedores de ERP entienden cómo lograr adquirir dentro del medio ambiente, pero ¿saben también cómo exportarlos?
  • ▪  ¿Qué tan abierto está el proveedor de ERP a las herramientas de almacenamiento de datos?
    Todas estas consideraciones deben hacerse al determinar dónde colocar el almacenamiento de datos que me alojará adquirir ERP y otros adquirir. En general, a menos que exista una razón convincente para hacer lo contrario, se recomienda construir almacenamiento de datos fuera del entorno del proveedor de ERP. CAPÍTULO 1 Descripción general de los puntos clave de la organización de BI:
    Los repositorios de información funcionan a la inversa de la arquitectura de inteligencia empresarial (BI):
    La cultura corporativa y la TI pueden limitar el éxito en la creación de organizaciones de BI.

La tecnología ya no es el factor limitante para las organizaciones de BI. La pregunta para arquitectos y planificadores de proyectos no es si la tecnología existe, sino si pueden implementar efectivamente la tecnología disponible.

Para muchas empresas un almacenamiento de datos es poco más que un depósito pasivo que distribuye el adquirir a los usuarios que lo necesiten. LA adquirir se extraen de los sistemas de origen y se completan en estructuras de destino de almacenamiento de datos. adquirir También se pueden limpiar con un poco de suerte. Sin embargo, no se añade ni recoge ningún valor adicional por adquirir Durante este proceso.

Esencialmente, Dw pasivo, en el mejor de los casos, sólo proporciona i adquirir limpio y operativo para las asociaciones de usuarios. La creación de información y la comprensión analítica dependen totalmente de los usuarios. Juzgue si el DW (Almacén de datos) es un éxito es subjetivo. Si juzgamos el éxito por la capacidad de recolectar, integrar y limpiar eficientemente el adquirir empresarial de forma predecible, entonces sí, el DW es un éxito. Por otro lado, si miramos la recopilación, consolidación y explotación de información en la organización en su conjunto, entonces el DW es un fracaso. Un DW proporciona poco o ningún valor informativo. Como resultado, los usuarios se ven obligados a arreglárselas, creando así silos de información. Este capítulo presenta una visión integral para resumir la arquitectura de BI (Business Intelligence) de la empresa. Comenzamos con una descripción de BI y luego pasamos a discusiones sobre diseño y desarrollo de información, en lugar de simplemente proporcionar información. adquirir a los usuarios. Luego, las discusiones se centran en calcular el valor de sus esfuerzos de BI. Concluimos definiendo cómo IBM aborda los requisitos arquitectónicos de BI de su organización.

Descripción de la arquitectura de organización de BI

Los poderosos sistemas de información orientados a las transacciones son ahora comunes en todas las grandes empresas, nivelando efectivamente el campo de juego para las corporaciones de todo el mundo.

Sin embargo, para seguir siendo competitivo ahora se requieren sistemas orientados al análisis que puedan revolucionar la capacidad de la empresa para redescubrir y utilizar la información que ya posee. Estos sistemas analíticos derivan de la comprensión de la riqueza de adquirir disponible. BI puede mejorar el rendimiento en toda la empresa. Las empresas pueden mejorar las relaciones cliente-proveedor, mejorar la rentabilidad de los productos y servicios, generar nuevas y mejores ofertas, controlar el riesgo y, entre muchas otras ganancias, reducir los gastos drásticamente. Con BI tu empresa por fin empieza a utilizar la información de los clientes como un activo competitivo gracias a aplicaciones que tienen objetivos de mercado.

Tener las herramientas comerciales adecuadas significa tener respuestas definitivas a preguntas clave como:

  • ▪  ¿Cuál de los nuestros? clientes ¿Nos hacen ganar más o nos hacen perder dinero?
  • ▪  Donde viven nuestros mejores clientes en relación con tienda/ almacén que frecuentan?
  • ▪  ¿Cuáles de nuestros productos y servicios se pueden vender de forma más eficaz y a quién?
  • ▪  ¿Qué productos se pueden vender de forma más eficaz y a quién?
  • ▪  ¿Qué campaña de ventas tiene más éxito y por qué?
  • ▪  ¿Qué canales de ventas son más eficaces para qué productos?
  • ▪  Cómo podemos mejorar las relaciones con nuestra mejor gente clientes? La mayoría de las empresas tienen adquirir formas aproximadas de responder a estas preguntas.
    Los sistemas operativos generan grandes cantidades de productos, clientes y adquirir mercado desde puntos de venta, reservas, atención al cliente y sistemas de soporte técnico. El desafío es extraer y explotar esta información. Muchas empresas sólo se benefician de pequeñas fracciones de lo suyo adquirir para análisis estratégicos.
    I adquirir restante, a menudo unido con i adquirir derivados de fuentes externas, como informes gubernamentales y otra información comprada, son una mina de oro esperando a ser explorada, y la adquirir sólo necesitan perfeccionarse dentro del contexto de información de su organización.

Este conocimiento se puede aplicar de varias maneras, que van desde el diseño de una estrategia corporativa general hasta la comunicación personal con los proveedores, pasando por call center, facturación, Internet y otros puntos. El entorno empresarial actual exige que DW y las soluciones de BI relacionadas evolucionen más allá de la gestión de estructuras empresariales tradicionales. adquirir cual yo adquirir normalizado a nivel atómico y “granjas de estrellas/cubos”.

Lo que se necesita para seguir siendo competitivo es una fusión de tecnologías tradicionales y avanzadas en un esfuerzo por respaldar un vasto panorama analítico.
En conclusión, el entorno general debe mejorar el conocimiento de la empresa en su conjunto, asegurando que las acciones que se adopten como resultado de los análisis realizados sean útiles para que todos se beneficien.

Por ejemplo, digamos que clasifica el suyo clientes en categorías de alto o bajo riesgo.
Si esta información se genera mediante un extractor de modelos u otro medio, debe introducirse en el DW y hacerse accesible a cualquier persona, mediante cualquier herramienta de acceso, como informes estáticos, hojas de cálculo, tablas o procesamiento analítico en línea (OLAP). .

Sin embargo, actualmente, gran parte de este tipo de información permanece en silos. adquirir de las personas o departamentos que generan el análisis. La organización, en su conjunto, tiene poca o ninguna visibilidad para la comprensión. Sólo combinando este tipo de contenido de información en su DW empresarial podrá eliminar los silos de información y mejorar su entorno de DW.
Hay dos obstáculos principales para desarrollar una organización de BI.
Primero, tenemos el problema de la organización misma y su disciplina.
Si bien no podemos ayudar con los cambios de políticas organizacionales, podemos ayudar a comprender los componentes del BI de una organización, su arquitectura y cómo la tecnología de IBM facilita su desarrollo.
La segunda barrera a superar es la falta de tecnología integrada y de conocimiento de un método que abarque todo el espacio de BI en lugar de solo un pequeño componente.

IBM se está enfrentando a los cambios en la tecnología de integración. Es su responsabilidad proporcionar un diseño bien pensado. Esta arquitectura debe desarrollarse con tecnología elegida para una integración sin restricciones o, al menos, con tecnología que se adhiera a estándares abiertos. Además, la dirección de su empresa debe garantizar que la tarea de BI se lleve a cabo según el plan y no permitir el desarrollo de silos de información que surjan de agendas u objetivos egoístas.
Esto no quiere decir que el entorno de BI no sea sensible a reaccionar ante las diferentes necesidades y requisitos de los distintos usuarios; en cambio, significa que la implementación de esas necesidades y requisitos individuales se realiza en beneficio de toda la organización de BI.
Puede encontrar una descripción de la arquitectura de la organización de BI en la Figura 9, página 1.1. La arquitectura demuestra una rica combinación de tecnologías y técnicas.
Desde la vista tradicional, la arquitectura incluye los siguientes componentes de almacén.

Capa atómica.

Ésta es la base, el corazón de todo el DW y, por tanto, del reporting estratégico.
I adquirir almacenados aquí conservarán la integridad histórica, los informes de adquirir e incluir las métricas derivadas, además de limpiarse, integrarse y almacenarse utilizando los modelos extraídos.
Todo uso posterior de estos adquirir y la información relacionada se deriva de esta estructura. Esta es una excelente fuente para la minería. adquirir y para informes con consultas SQL estructuradas

Depósito operativo de adquirir o informe base de adquirir(Almacén de datos operativos (ODS) o informes base de datos.)

Esta es una estructura de adquirir Diseñado específicamente para informes técnicos.

I adquirir almacenado y reportado sobre estas estructuras finalmente puede propagarse al almacén a través del área de preparación, donde podría usarse para señalización estratégica.

Área de ensayo.

La primera parada para la mayoría adquirir destinada al entorno del almacén es el área de organización.
Aquí yo adquirir se integran, limpian y transforman en adquirir ganancias que poblarán la estructura del almacén

Mercados de citas.

Esta parte de la arquitectura representa la estructura de adquirir utilizado específicamente para OLAP. La presencia de datamarts, si adquirir se almacenan en los esquemas en estrella superpuestos adquirir multidimensional en un entorno relacional, o en los archivos de adquirir La confidencialidad utilizada por tecnología OLAP específica, como DB2 OLAP Server, no es relevante.

La única limitación es que la arquitectura facilita el uso de adquirir multidimensional.
La arquitectura también incluye tecnologías y técnicas de BI críticas que se destacan como:

Análisis espacial

El espacio es una fuente de información inesperada para el analista y es fundamental para completar la resolución. El espacio puede representar información sobre las personas que viven en un lugar determinado, así como información sobre dónde está físicamente ese lugar en relación con el resto del mundo.

Para realizar este análisis, debe comenzar vinculando su información a las coordenadas de latitud y longitud. Esto se conoce como "codificación geográfica" y debe ser parte del proceso de extracción, transformación y carga (ETL) a nivel atómico de su almacén.

Procesamiento de datos.

La extracción de adquirir permite a nuestras empresas aumentar el número de clientes, para predecir tendencias de ventas y permitir la gestión de relaciones con clientes (CRM), entre otras iniciativas de BI.

La extracción de adquirir por lo tanto, debe integrarse con las estructuras de adquirir del DWhouse y respaldado por procesos de almacén para garantizar el uso efectivo y eficiente de la tecnología y las técnicas relacionadas.

Como se indica en la arquitectura BI, el nivel atómico del Dwhouse, así como los datamarts, es una excelente fuente de adquirir para extracción. Esas mismas instalaciones también deben ser receptoras de los resultados de la extracción para garantizar su disponibilidad para el público más amplio.

Agentes

Hay varios "agentes" para examinar al cliente en cada punto, como los sistemas operativos de la empresa y el propio dw. Estos agentes pueden ser redes neuronales avanzadas entrenadas para aprender sobre las tendencias en cada punto, como la demanda futura de productos basada en promociones de ventas, motores basados ​​en reglas para reaccionar ante una fecha conjunto de circunstancias, o incluso simples agentes que informan de excepciones a los “altos ejecutivos”. Estos procesos generalmente ocurren en tiempo real y, por lo tanto, deben estar estrechamente acoplados con su movimiento. adquirir. Todas estas estructuras de adquirir, tecnologías y técnicas garantizan que no pasará la noche generando una organización de su BI.

Esta actividad se desarrollará en pasos incrementales, para puntos pequeños.
Cada paso es un esfuerzo de proyecto independiente y se denomina iteración en su iniciativa DW o BI. Las iteraciones pueden incluir la implementación de nuevas tecnologías, comenzando con nuevas técnicas, agregando nuevas estructuras. adquirir , cargando yo adquirir adicionales, o con la ampliación del análisis de su entorno. Este párrafo se analiza con más profundidad en el capítulo 3.

Además de las estructuras DW tradicionales y las herramientas de BI, existen otras funciones de su organización de BI para las que debe diseñar, como por ejemplo:

Puntos de contacto con el cliente (contacto con el cliente Puntos).

Como ocurre con cualquier organización moderna, existen varios puntos de contacto con el cliente que indican cómo tener una experiencia positiva para el suyo. clientes. Existen canales tradicionales como los minoristas, telefonistas, correo directo, publicidad multimedia y impresa, así como canales más actuales como el correo electrónico y la web. adquirir Los productos con algún punto de contacto deben adquirirse, transportarse, limpiarse, procesarse y luego poblarse en las instalaciones. adquirir de BI.

Bases de adquirir asociaciones operativas y de usuarios (operativa

bases de datos y comunidades de usuarios).
Al final de los puntos de contacto del clientes encontrarás los conceptos básicos de adquirir aplicación de la empresa y comunidades de usuarios. LA adquirir existentes son adquirir tradicional que debe reunirse y fusionarse con el adquirir que fluyen desde los puntos de contacto para satisfacer la información necesaria.

Analistas. (Analistas)

El principal beneficiario del entorno de BI es el analista. Es él quien se beneficia de la actual extracción de adquirir operativo, integrado con diferentes fuentes de adquirir , aumentado con funciones como análisis geográfico (geocodificación) y presentado en tecnologías de BI que permiten extracción, OLAP, informes SQL avanzados y análisis geográfico. La principal interfaz del analista para el entorno de generación de informes es el portal de BI.

Sin embargo, el analista no es el único que se beneficia de la arquitectura BI.
Ejecutivos, grandes asociaciones de usuarios, e incluso socios, proveedores y yo clientes deberían encontrar beneficios en la BI empresarial.

Bucle de retroalimentación.

La arquitectura BI es un entorno de aprendizaje. Un principio característico del desarrollo es permitir estructuras persistentes de adquirir ser actualizado por la tecnología de BI utilizada y por las acciones realizadas por el usuario. Un ejemplo es la puntuación de los clientes.

Si el departamento de ventas modela las puntuaciones de los clientes para utilizar un nuevo servicio, entonces el departamento de ventas no debería ser el único grupo que se beneficia del servicio.

En cambio, la extracción del modelo debe realizarse como una parte natural del flujo de datos dentro de la empresa y las puntuaciones de los clientes deben convertirse en una parte integrada del contexto de información del almacén, visible para todos los usuarios. La suite centrada en Bi-bI de IBM, que incluye DB2 UDB y DB2 OLAP Server, incluye la mayoría de los principales componentes tecnológicos, definidos en la Figura 1.1.

Usamos la arquitectura tal como aparece en esta ilustración del libro para brindarnos un nivel de continuidad y demostrar cómo cada producto de IBM encaja en el esquema general de BI.

Proporcionar el contenido de la información (proporcionar Contenido de informacion)

Diseñar, desarrollar e implementar su entorno de BI es una tarea desalentadora. El diseño debe abarcar los requisitos comerciales actuales y futuros. El dibujo arquitectónico debe estar completo para incluir todas las conclusiones encontradas durante la fase de diseño. La ejecución debe permanecer comprometida con un único propósito: desarrollar la arquitectura de BI tal como se presenta formalmente en el diseño y se basa en los requisitos comerciales.

Es particularmente difícil argumentar que la disciplina garantizará un éxito relativo.
Esto es sencillo porque no se desarrolla un entorno de BI de una sola vez, sino que se hace en pequeños pasos a lo largo del tiempo.

Sin embargo, identificar los componentes de BI de su arquitectura es importante por dos razones: Usted guiará todas las decisiones técnicas de arquitectura posteriores.
Podrá planificar conscientemente un uso particular de la tecnología incluso aunque no vuelva a necesitar la tecnología durante varios meses.

Comprender suficientemente los requisitos de su negocio influirá en el tipo de productos que adquiera para su arquitectura.
Diseñar y desarrollar su arquitectura garantiza que su almacén esté

No es un evento aleatorio, sino más bien un evento “bien pensado” cuidadosamente construido. opera del arte como un mosaico de tecnología mixta.

Diseñar el contenido de la información

Todo el diseño inicial debe centrarse e identificar los componentes clave de BI que necesitará el entorno general ahora y en el futuro.
Conocer los requisitos comerciales es importante.

Incluso antes de que comience cualquier diseño formal, el planificador del proyecto a menudo puede identificar uno o dos componentes de inmediato.
Sin embargo, no es fácil encontrar el equilibrio de componentes que pueden ser necesarios para su arquitectura. Durante la fase de diseño, la parte principal de la arquitectura vincula la sesión de desarrollo de aplicaciones (JAD) con una investigación para identificar los requisitos comerciales.

A veces, estos requisitos se pueden confiar a herramientas de consulta y generación de informes.
Por ejemplo, los usuarios afirman que si quieren automatizar un informe actual deben generarlo manualmente integrando dos informes actuales y agregando cálculos derivados de la combinación de los adquirir.
Aunque este requisito es simple, define una determinada funcionalidad de la característica que debe incluir al comprar herramientas de informes para su organización.

El diseñador también debe cumplir requisitos adicionales para obtener una imagen completa. ¿Los usuarios quieren suscribirse a este informe?
¿Se generan subconjuntos de informes y se envían por correo electrónico a varios usuarios? ¿Quieren ver este informe en el portal de la empresa? Todos estos requisitos son parte de la simple necesidad de sustituir un informe manual según lo solicitado por los usuarios. El beneficio de este tipo de requisitos es que todos, usuarios y diseñadores, comprenden el concepto de informes.

Sin embargo, hay otros tipos de negocios para los que debemos planificar. Cuando los requisitos comerciales se expresan en forma de preguntas comerciales estratégicas, es fácil para el diseñador experto discernir medidas/hechos y requisitos dimensionales.

Si los usuarios de JAD no saben cómo expresar sus requisitos en forma de un problema empresarial, el diseñador suele proporcionar ejemplos para iniciar la sesión de recopilación de requisitos.
El diseñador experto puede ayudar a los usuarios a comprender no sólo el comercio estratégico, sino también cómo configurarlo.
El enfoque de recopilación de requisitos se analiza en el capítulo 3; Por ahora sólo queremos señalar la necesidad de diseñar para todo tipo de requisitos de BI.

Un problema empresarial estratégico no es sólo un requisito empresarial, sino también una pista de diseño. Si tienes que responder una pregunta multidimensional, entonces tienes que memorizar, presentar i adquirir dimensiones, y si necesita almacenar i adquirir multidimensional, debes decidir qué tipo de tecnología o técnica vas a emplear.

¿Implementa un esquema de estrella de cubo reservado, o ambos? Como puede ver, incluso un simple problema empresarial puede influir significativamente en el diseño. Pero este tipo de requisitos empresariales son comunes y comprendidos, al menos por los diseñadores y planificadores con experiencia en proyectos.

Ha habido suficiente discusión sobre las tecnologías y el soporte OLAP, y hay una amplia gama de soluciones disponibles. Hasta ahora hemos mencionado la necesidad de combinar informes simples con requisitos dimensionales comerciales y cómo estos requisitos influyen en las decisiones técnicas de arquitectura.

Pero, ¿cuáles son los requisitos que los usuarios o el equipo de Dw no comprenden fácilmente? ¿Necesitará alguna vez un análisis espacial?
Los modelos mineros de adquirir ¿Serán una parte necesaria de tu futuro? ¿Quién sabe?

Es importante tener en cuenta que este tipo de tecnologías no son bien conocidas por las comunidades de usuarios en general y los miembros del equipo de Dw, en parte, esto puede deberse a que generalmente son manejadas por algunos expertos técnicos internos o externos. Es un caso extremo de los problemas que generan este tipo de tecnologías. Si los usuarios no pueden describir los requisitos comerciales o formularlos de manera que sirvan de guía a los diseñadores, pueden pasar desapercibidos o, peor aún, simplemente ignorarse.

Más problemático se vuelve cuando el diseñador y el desarrollador no pueden reconocer la aplicación de una de estas tecnologías avanzadas pero críticas.
Como hemos escuchado a menudo decir a los Diseñadores, “bueno, ¿por qué no lo dejamos de lado hasta que consigamos esta otra cosa? “¿Están realmente interesados ​​en las prioridades o simplemente evitan requisitos que no comprenden? Lo más probable es que sea la última hipótesis. Digamos que su equipo de ventas ha comunicado un requisito comercial, como se indica en la Figura 1.3, como puede ver, el requisito está enmarcado en la forma de un problema comercial. La diferencia entre este problema y el típico problema dimensional es la distancia. En este caso, el equipo de ventas quiere saber, mensualmente, las ventas totales de los productos, almacenes y tiendas. clientes que viven dentro de 5 millas del almacén donde compran.

Lamentablemente, los diseñadores o arquitectos pueden simplemente ignorar el componente espacial diciendo: “tenemos el cliente, el producto y el adquirir del depósito. Mantengamos la distancia hasta otra iteración.

"Respuesta incorrecta. Este tipo de problema empresarial tiene que ver con BI. Representa una comprensión más profunda de nuestro negocio y un espacio analítico sólido para nuestros analistas. BI va más allá de simples consultas o informes estándar, o incluso OLAP. Esto no quiere decir que estas tecnologías no sean importantes para su BI, pero por sí solas no representan el entorno de BI.

Diseño para el contexto de la información (Diseño para contenido informativo)

Ahora que hemos identificado los requisitos comerciales que distinguen varios componentes fundamentales, deben incluirse en un diseño arquitectónico general. Algunos de los componentes de BI son parte de nuestros esfuerzos iniciales, mientras que otros no se implementarán hasta dentro de varios meses.

Sin embargo, todos los requisitos conocidos se reflejan en el diseño, de modo que cuando necesitemos implementar una tecnología particular, estemos preparados para hacerlo. Algo en el proyecto reflejará el pensamiento tradicional.

Este conjunto de adquirir se utiliza para admitir usos posteriores de adquirir dimensional guiado por los temas de Negocio que hemos identificado. A medida que se generan documentos adicionales, como el desarrollo del diseño de adquirir, comenzaremos a formalizar cómo adquirir se propagan en el ambiente. Hemos constatado la necesidad de representarme. adquirir de forma dimensional, dividiéndolos (según necesidades específicas específicas) en data marts.

La siguiente pregunta a responder es: ¿cómo se construirán estos mercados de datos?
¿Construyes las estrellas para sostener los cubos, o solo los cubos, o solo las estrellas? (o cubos correctos, o estrellas correctas). Generar arquitectura para data marts dependientes que requieren una capa atómica para todos adquirir ¿adquirido? Permitir que los mercados de datos independientes adquieran adquirir directamente desde los sistemas operativos?

¿Qué tecnología de cubo intentará estandarizar?

Tienes grandes cantidades de dioses adquirir ¿Necesita cubos para el análisis dimensional o necesita cubos de su fuerza de ventas nacional semanalmente o ambos? ¿Está creando algo tan potente como DB2 OLAP Server para finanzas o cubos Cognos PowerPlay para su organización de ventas, o ambos? Estas son las grandes decisiones de diseño arquitectónico que afectarán su entorno de BI de ahora en adelante. Sí, ha establecido la necesidad de OLAP. Ahora ¿cómo llevarán a cabo ese tipo de técnica y tecnología?

¿Cómo afectan algunas de las tecnologías más avanzadas a sus diseños? Supongamos que ha identificado una necesidad de espacio en su organización. Ahora debe recordar las ediciones de los dibujos arquitectónicos incluso si no planea realizar componentes espaciales durante varios meses. El arquitecto debe diseñar hoy en base a lo que se necesita. Anticipar la necesidad de análisis espaciales que generen, almacenen, realicen y proporcionen acceso a adquirir espacial. Esto, a su vez, debería servir como una limitación con respecto al tipo de tecnología de software y especificaciones de plataforma que se pueden considerar actualmente. Por ejemplo, el sistema de administración de base de datos La capa relacional (RDBMS) que realice para su capa atómica debe tener disponible una extensión espacial sólida. Esto garantizaría el máximo rendimiento al utilizar geometría y objetos espaciales en sus aplicaciones analíticas. Si su RDBMS no puede manejar el adquirir (centrado en el espacio) internamente, por lo que tendrás que establecer un base de datos (centrado espacial) externo. Esto complica la gestión de problemas y compromete su rendimiento general, sin mencionar los problemas adicionales creados para sus DBA, ya que probablemente tengan un conocimiento mínimo de los conceptos básicos de adquirir espacial también. Por otro lado, si su motor RDMBS maneja todos los componentes espaciales y su optimizador es consciente de las necesidades especiales (por ejemplo, indexación) de los objetos espaciales, entonces sus DBA pueden manejar fácilmente la gestión de los problemas y usted puede maximizar el rendimiento.

Además, debe ajustar el área de preparación y la capa del entorno atómico para incluir la limpieza de direcciones (una

elemento clave para el análisis espacial), así como el posterior ahorro de objetos espaciales. La sucesión de ediciones de dibujos continúa ahora que hemos introducido la noción de dirección clara. Por un lado, esta aplicación dictará el tipo de software necesario para su esfuerzo ETL.

¿Necesita productos como Trillium para proporcionarle una dirección limpia o un proveedor de ETL de su elección para proporcionar esa funcionalidad?
Por ahora es importante que aprecie el nivel de diseño que debe completarse antes de comenzar a implementar su almacén. Los ejemplos anteriores deberían demostrar la multitud de decisiones de diseño que deben seguir a la identificación de cualquier requisito comercial en particular. Si se toman correctamente, estas decisiones de diseño promueven la interdependencia entre las estructuras físicas de su entorno, la selección de la tecnología utilizada y el flujo de propagación del contenido de la información. Sin esta arquitectura de BI convencional, su organización estará sujeta a una combinación caótica de tecnologías existentes, en el mejor de los casos unidas de manera informal para proporcionar una estabilidad aparente.

Mantener el contenido de la información

Llevar el valor de la información a su organización es una tarea muy difícil. Sin suficiente comprensión y experiencia, o sin una planificación y diseño adecuados, incluso los mejores equipos fracasarán. Por otro lado, si tiene una gran intuición y una planificación detallada pero no tiene disciplina para la ejecución, simplemente habrá desperdiciado su dinero y su tiempo porque su esfuerzo está condenado al fracaso. El mensaje debe ser claro: si le falta una o más de estas habilidades, comprensión/experiencia o disciplina de planificación/diseño o implementación, paralizará o destruirá la construcción de la organización de BI.

¿Está su equipo lo suficientemente preparado? ¿Hay alguien en su equipo de BI que comprenda el vasto panorama analítico disponible en los entornos de BI y las técnicas y tecnologías necesarias para mantener ese panorama? ¿Hay alguien en su equipo que pueda reconocer la diferencia entre aplicaciones avanzadas y

¿Informes estáticos y OLAP, o las diferencias entre ROLAP y OLAP? ¿Alguno de los miembros de su equipo reconoce claramente cómo extraer y cómo podría afectar al almacén o cómo el almacén puede respaldar el rendimiento de la extracción? Un miembro del equipo comprende el valor de adquirir ¿Tecnología espacial o basada en agentes? ¿Tiene a alguien que aprecie la aplicación única de las herramientas ETL frente a la tecnología de intermediario de mensajes? Si no lo tienes, consigue uno. BI es mucho más grande que una capa atómica normalizada, OLAP, esquemas en estrella y un ODS.

Tener la comprensión y la experiencia para reconocer los requisitos de BI y sus soluciones es esencial para su capacidad de formalizar adecuadamente las necesidades de los usuarios y diseñar e implementar sus soluciones. Si su comunidad de usuarios tiene dificultades para describir los requisitos, es trabajo del equipo del almacén brindar esa comprensión. Pero si el equipo del almacén

no reconoce la aplicación específica de BI - por ejemplo, la minería de datos - entonces no es lo mejor que los entornos de BI a menudo se limiten a ser repositorios pasivos. Sin embargo, ignorar estas tecnologías no disminuye su importancia y el efecto que tienen en el surgimiento de las capacidades de inteligencia empresarial de su organización, así como en el panorama de la información que planea fomentar.

La planificación debe incluir la noción de dibujo, y ambos requieren de una persona competente. Además, el diseño requiere una filosofía de almacén en equipo y el cumplimiento de los estándares. Por ejemplo, si su empresa ha establecido una plataforma estándar o ha identificado un RDBMS en particular que desea estandarizar en toda la plataforma, todos los miembros del equipo tienen la responsabilidad de cumplir esos estándares. Generalmente un equipo expone la necesidad de estandarización (a las comunidades de usuarios), pero el propio equipo no está dispuesto a adherirse a los estándares establecidos también en otras áreas de la empresa o quizás incluso en empresas similares. Esto no sólo es hipócrita, sino que establece que la empresa es incapaz de explotar los recursos y las inversiones existentes. No significa que no existan situaciones que ameriten una plataforma o tecnología no estandarizada; sin embargo, los esfuerzos del almacén

deben proteger celosamente los estándares de la empresa hasta que los requisitos comerciales indiquen lo contrario.

El tercer componente clave necesario para construir una organización de BI es la disciplina.
Depende en total, igualmente de los individuos y del medio ambiente. Los planificadores de proyectos, patrocinadores, arquitectos y usuarios deben apreciar la disciplina necesaria para construir la estructura de información de la empresa. Los diseñadores deben dirigir sus esfuerzos de diseño de tal manera que complementen otros esfuerzos necesarios en la sociedad.

Por ejemplo, digamos que su empresa crea una aplicación ERP que tiene un componente de almacén.
Por lo tanto, es responsabilidad de los diseñadores de ERP colaborar con el equipo de entorno del almacén para no competir o duplicar el trabajo ya iniciado.

La disciplina también es un tema que debe ser abordado por toda la organización y generalmente se establece y se encomienda a un nivel ejecutivo.
¿Están los gerentes dispuestos a adherirse a un enfoque diseñado? ¿Un enfoque que promete crear contenido informativo que en última instancia aportará valor a todas las áreas de la empresa, pero que tal vez comprometa las agendas individuales o departamentales? Recuerda el dicho “Pensar en todo es más importante que pensar en una sola cosa”. Este dicho es válido para las organizaciones de BI.

Desafortunadamente, muchos almacenes centran sus esfuerzos en intentar apuntar y aportar valor a un departamento en particular o a usuarios específicos, sin tener en cuenta la organización en general. Supongamos que el ejecutivo solicita ayuda al equipo del almacén. El equipo responde con un esfuerzo de 90 días que incluye no solo cumplir con los requisitos de notificación definidos por el gerente sino también garantizar que todos adquirir La base se mezcla a nivel atómico antes de introducirse en la tecnología de cubo propuesta.
Esta adición de ingeniería garantiza que la empresa de almacenes se beneficiará de adquirir necesario para el gerente.
Sin embargo, el ejecutivo habló con consultoras externas que propusieron una aplicación similar con entrega en menos de 4 semanas.

Suponiendo que el equipo interno del almacén sea competente, el ejecutivo tiene una opción. ¿Quién puede respaldar la disciplina de ingeniería adicional necesaria para cultivar la empresa de activos de información o puede optar por crear su propia solución rápidamente? Este último parece ser elegido con demasiada frecuencia y sólo sirve para crear contenedores de información que benefician sólo a unos pocos o al individuo.

Metas a corto y largo plazo

Los arquitectos y diseñadores de proyectos deben formalizar una visión a largo plazo de la arquitectura general y los planes de crecimiento de una organización de BI. Esta combinación de ganancias a corto plazo y planificación a largo plazo representa los dos lados de los esfuerzos de BI. La ganancia a corto plazo es la faceta de BI asociada con las iteraciones de su almacén.

Aquí es donde los planificadores, arquitectos y patrocinadores se centran en satisfacer requisitos comerciales específicos. Es en este nivel donde se construyen las estructuras físicas, se compra tecnología y se implementan técnicas. De ninguna manera están diseñados para abordar requisitos específicos definidos por comunidades de usuarios particulares. Todo se hace para abordar los requisitos específicos definidos por una comunidad en particular.
Sin embargo, la planificación a largo plazo es la otra faceta de la BI. Es aquí donde los planos y diseños aseguraron que cualquier estructura física fuera construida, las tecnologías seleccionadas y las técnicas implementadas con miras a la empresa. Es la planificación a largo plazo la que proporciona la cohesión necesaria para garantizar que los beneficios empresariales surjan de cualquier ganancia a corto plazo encontrada.

Justifique su esfuerzo de BI

Un almacenamiento de datos por sí solo no tiene valor inherente. En otras palabras, no existe un valor inherente entre las tecnologías de almacén y las técnicas de implementación.

El valor de cualquier esfuerzo de almacén se encuentra en las acciones realizadas como resultado del entorno del almacén y el contenido de información cultivado a lo largo del tiempo. Este es un punto crítico que se debe comprender antes de intentar estimar el valor de cualquier iniciativa de Wherehouse.

Con demasiada frecuencia, los arquitectos y diseñadores intentan aplicar valor a los componentes físicos y técnicos del almacén cuando, en realidad, el valor se basa en los procesos de negocio que se ven afectados positivamente por el almacén y la información bien adquirida.

Aquí radica el desafío de establecer BI: ¿Cómo se justifica la inversión? Si el almacén en sí no tiene valor intrínseco, los diseñadores del proyecto deben investigar, definir y formalizar los beneficios logrados por aquellas personas que utilizarán el almacén para mejorar procesos comerciales específicos o el valor de la información protegida, o ambos.

Para complicar las cosas, cualquier proceso de negocio afectado por los esfuerzos de almacenamiento podría proporcionar beneficios “considerables” o “ligeros”. Beneficios considerables proporcionan una métrica tangible para medir el retorno de la inversión (ROI), por ejemplo, rotar el inventario una vez más durante un período específico o reducir el costo de transporte por envío. Es más difícil definir beneficios sutiles, como un mejor acceso a la información, en términos de valor tangible.

Conecta tu proyecto para conocer el Solicitudes comerciales

Con demasiada frecuencia, los planificadores de proyectos intentan vincular el valor del almacén con objetivos empresariales amorfos. Al afirmar que "el valor de un almacén se basa en nuestra capacidad para satisfacer solicitudes estratégicas", abrimos la discusión de forma amena. Pero esto por sí solo no es suficiente para determinar si tiene sentido invertir en inventario. Lo mejor es vincular las iteraciones del almacén con demandas comerciales específicas y conocidas.

Midiendo el ROI

Calcular el retorno de la inversión en un almacén puede resultar especialmente difícil. Es especialmente difícil si la ventaja

El principio de una repetición particular es algo que no es tangible ni fácil de medir. Un estudio encontró que los usuarios perciben dos beneficios principales de las iniciativas de BI:

  • ▪  Crear la capacidad de tomar decisiones
  • ▪  Crear acceso a la información
    Estos beneficios son beneficios suaves (o leves). Es fácil ver cómo podemos calcular un retorno de la inversión en función de un beneficio concreto (o importante), como la reducción de los costos de transporte, pero ¿cómo medimos la capacidad de tomar mejores decisiones?
    Esto es definitivamente un desafío para los planificadores de proyectos cuando intentan convencer a la empresa de invertir en un esfuerzo de almacén particular. El aumento de las ventas o la disminución de los costos ya no son los temas centrales que impulsan el entorno de BI.
    En cambio, está analizando las solicitudes comerciales de un mejor acceso a la información para que un departamento en particular pueda tomar decisiones más rápidas. Se trata de impulsores estratégicos que resultan ser igualmente importantes para la empresa, pero que son más ambiguos y difíciles de caracterizar en una métrica tangible. En este caso, calcular el ROI puede resultar engañoso, si no irrelevante.
    Los diseñadores de proyectos deben poder demostrar un valor tangible para que los ejecutivos decidan si vale la pena invertir en una iteración particular. Sin embargo, no propondremos un nuevo método para calcular el ROI, ni presentaremos ningún argumento a favor o en contra.
    Hay muchos artículos y libros disponibles que analizan los fundamentos del cálculo del ROI. Existen propuestas de valor especiales, como el valor de la inversión (VOI), ofrecidas por grupos como Gartner, que puede investigar. En cambio, nos centraremos en los aspectos centrales de cualquier ROI u otras propuestas de valor que deba considerar. Aplicando ROI Más allá del argumento sobre los beneficios “duros” versus los beneficios “blandos” asociados con los esfuerzos de BI, existen otras cuestiones a considerar al aplicar el ROI. Por ejemplo:

Atribuir demasiados ahorros a los esfuerzos de DW que se producirían de todos modos
Supongamos que su empresa pasó de una arquitectura de mainframe a un entorno UNIX distribuido. Por lo tanto, cualquier ahorro que pueda (o no) lograrse gracias a ese esfuerzo no debe atribuirse exclusivamente, en todo caso (?), al almacén.

No contabilizarlo todo cuesta. Y hay muchas cosas a tener en cuenta. Considere la siguiente lista:

  • ▪  Costo inicial, incluida la viabilidad.
  • ▪  Costo del hardware dedicado con almacenamiento y comunicaciones relacionados.
  • ▪  Costo del software, incluida la gestión de adquirir y extensiones cliente/servidor, software ETL, tecnologías DSS, herramientas de visualización, aplicaciones de programación y flujo de trabajo, y software de monitoreo.
  • ▪  Costo del diseño de la estructura adquirir, con la creación y optimización de
  • ▪  Costo de desarrollo de software directamente asociado con el esfuerzo de BI
  • ▪  Costo del soporte técnico interno, incluida la optimización del rendimiento, incluido el control de la versión del software y las operaciones de ayuda. Aplique ROI "Big-Bang". Construir el almacén como un esfuerzo único y gigantesco está condenado al fracaso, por lo que incluso calcular el retorno de la inversión para una iniciativa de una gran empresa. La oferta es sorprendente y los planificadores continúan haciendo débiles intentos de estimar el valor de todo el esfuerzo. ¿Por qué los planificadores intentan asignar un valor monetario a la iniciativa empresarial si es ampliamente conocido y aceptado que estimar repeticiones específicas es difícil? ¿Como es posible? No es posible con algunas excepciones. No lo hagas. Ahora que hemos establecido qué no hacer al calcular el ROI, aquí hay algunos puntos que nos ayudarán a establecer un proceso confiable para estimar el valor de sus esfuerzos de BI.

Obtención de consenso de ROI. Independientemente de la técnica que elija para estimar el valor de sus esfuerzos de BI, todas las partes deben acordarla, incluidos los diseñadores de proyectos, los patrocinadores y los ejecutivos comerciales.

Reduzca el ROI en partes identificables. Un paso necesario para calcular razonablemente el retorno de la inversión es centrar ese cálculo en un proyecto específico. Esto luego le permite estimar un valor basado en los requisitos comerciales específicos que se cumplen.

Definir los costos. Como ya hemos mencionado, hay que tener en cuenta numerosos costes. Además, los costos deben incluir no sólo los asociados con la iteración única sino también los costos asociados con garantizar el cumplimiento de los estándares de la empresa.

Definir beneficios. Al vincular claramente el ROI con los requisitos comerciales específicos, deberíamos poder identificar los beneficios que conducirán al cumplimiento de los requisitos.

Reducir costos y beneficios en ganancias inminentes. Es la mejor manera de basar sus valoraciones en el valor actual neto (VAN) en lugar de intentar predecir el valor futuro de las ganancias futuras.

Mantenga el momento de dividir su ROI al mínimo. Está bien documentado durante el largo período de tiempo que se ha utilizado en su retorno de la inversión.

Utilice más de una fórmula de retorno de la inversión. Existen numerosos métodos para pronosticar el ROI y debe planificar si utilizará uno o más de ellos, incluido el valor actual neto, la tasa interna de retorno (TIR) ​​y la recuperación de la inversión.

Definir proceso repetible. Esto es crucial para calcular cualquier valor a largo plazo. Se debe documentar un único proceso repetible para todas las subsecuencias del proyecto a seguir.

Los problemas enumerados son los más comunes definidos por expertos en el entorno de los almacenes. La insistencia de la gerencia en lograr un retorno de la inversión espectacular es muy desorientadora. Si comienza todos sus cálculos de ROI dividiéndolos en partes tangibles e identificables, tiene buenas posibilidades de estimar una calificación de ROI precisa.

Preguntas sobre los beneficios del ROI

Cualesquiera que sean sus beneficios, blandos o duros, puede utilizar algunas preguntas básicas para determinar su valor. Por ejemplo, utilizando un sistema de escala simple, del 1 al 10, puedes medir el impacto de cualquier esfuerzo mediante las siguientes preguntas:

  • ¿Cómo calificaría la comprensión de adquirir siguiendo este proyecto de su empresa?
  • ¿Cómo estimaría las mejoras en los procesos como resultado de este proyecto?
  • ¿Cómo mediría el impacto de los nuevos conocimientos e inferencias que ahora están disponibles gracias a esta iteración?
  • ¿Cuál fue el impacto de los nuevos entornos informáticos de alto rendimiento como resultado de lo aprendido? Si las respuestas a estas preguntas son pocas, es posible que la empresa no merezca la inversión realizada. Las preguntas con puntuación alta apuntan a ganancias de valor significativas y deberían servir como guías para futuras investigaciones. Por ejemplo, una puntuación alta en mejoras de procesos debería llevar a los diseñadores a examinar cómo se han mejorado los procesos. Es posible que descubra que algunas o todas las ganancias obtenidas son tangibles y, por lo tanto, se puede aplicar fácilmente un valor monetario. Aprovechando al máximo la primera iteración del almacén El mayor resultado de su esfuerzo empresarial suele encontrarse en las primeras iteraciones. Estos primeros esfuerzos tradicionalmente establecen el contenido de información más útil para el público y ayudan a establecer la base tecnológica para aplicaciones de BI posteriores. Por lo general, cada subsecuencia posterior de adquirir de los proyectos de almacén aportan cada vez menos valor añadido a la empresa en general. Esto es especialmente cierto si la iteración no agrega nuevos temas ni satisface las necesidades de una nueva comunidad de usuarios.

Esta característica de almacenamiento también se aplica a pilas crecientes de adquirir historiadores. A medida que los esfuerzos posteriores requieran más adquirir y como mas adquirir se vierten en el almacén con el tiempo, la mayor parte de adquirir se vuelve menos relevante para el análisis utilizado. Estas adquirir a menudo se les llama adquirir inactivos y siempre es costoso mantenerlos porque casi nunca se utilizan.

¿Qué significa esto para los patrocinadores del proyecto? Básicamente, los primeros patrocinadores comparten más de lo que cuesta la inversión. Esto es fundamental porque son el impulso para establecer el amplio entorno tecnológico y la capa de recursos del almacén, incluidos los orgánicos.

Pero estos primeros pasos aportan el mayor valor y, por lo tanto, los diseñadores del proyecto a menudo tienen que justificar la inversión.
Los proyectos realizados después de su iniciativa de BI pueden tener costos más bajos (en comparación con el primero) y directos, pero aportan menos valor a la empresa.

Y los dueños de organizaciones deben comenzar a considerar desechar la acumulación. adquirir y tecnologías menos relevantes.

Minería de datos: Minería Datos

Numerosos componentes arquitectónicos requieren variaciones en las tecnologías y técnicas de minería de datos.
por ejemplo, los diferentes "agentes" para el examen de los puntos de interés del clientes, los sistemas operativos de la empresa y para el propio dw. Estos agentes pueden ser redes neuronales avanzadas entrenadas en tendencias POT, como la demanda futura de productos basada en promociones de ventas; motores basados ​​en reglas para reaccionar ante un conjunto fecha de circunstancias, por ejemplo, diagnóstico médico y recomendaciones de tratamiento; o incluso simples agentes con la función de informar excepciones a los altos ejecutivos. Generalmente estos procesos de extracción adquirir si

verificar en tiempo real; por lo tanto, deben estar completamente unidos con el movimiento de adquirir ellos mismos.

Procesamiento de procesamiento analítico en línea

Analítica en línea

La capacidad de cortar, dividir, rodar, desglosar y realizar análisis
qué pasaría si, está dentro del alcance, el enfoque de la suite de tecnología de IBM. Por ejemplo, existen funciones de procesamiento analítico en línea (OLAP) para DB2 que incorporan el análisis dimensional al motor de software. base de datos stesso.

Las funciones agregan utilidad dimensional a SQL y al mismo tiempo aprovechan todos los beneficios de ser una parte natural de DB2. Otro ejemplo de integración OLAP es la herramienta de extracción DB2 OLAP Server Analyzer. Esta tecnología permite que los cubos de DB2 OLAP Server se analicen rápida y automáticamente para localizar e informar sobre valores. adquirir inusual o inesperado en todo el cubo para el analista de negocios. Y finalmente, las características de DW Center proporcionan un medio para que los arquitectos controlen, entre otras cosas, el perfil de un cubo de servidor DB2 OLAP como parte natural de los procesos ETL.

Análisis espacial Análisis espacial

El espacio representa la mitad de las anclas analíticas (leads) necesarias para un panorama.
analítica amplia (el tiempo representa la otra mitad). El nivel atómico del almacén, representado en la Figura 1.1, incluye fundamentos tanto de tiempo como de espacio. Análisis de anclaje de marcas de tiempo por tiempo y análisis de anclaje de información de dirección por espacio. Las marcas de tiempo realizan análisis por tiempo y la información de direcciones realiza análisis por espacio. El diagrama muestra la geocodificación (el proceso de convertir direcciones en puntos en un mapa o puntos en el espacio para que conceptos como distancia e interior/exterior puedan usarse en el análisis) realizado a nivel atómico y el análisis espacial que está disponible para el analista. IBM proporciona extensiones espaciales, desarrolladas con el Environmental System Research Institute (ESRI), para base de datos DB2 para que los objetos espaciales puedan almacenarse como parte normal del base de datos relacional. DB2

Spatial Extenders también proporciona todas las extensiones SQL para explotar el análisis espacial. Por ejemplo, las extensiones SQL para consultar
La distancia entre direcciones o si un punto está dentro o fuera de un área poligonal definida, son un estándar analítico con Spatial Extender. Consulte el capítulo 16 para obtener más información.

Base de datos-Herramientas para residentes Herramientas Base de datos-Residente

DB2 tiene muchas características SQL residentes en BI que ayudan en la acción de análisis. Éstas incluyen:

  • Funciones de recursividad para realizar análisis, como "encontrar todas las rutas de vuelo posibles desde San Francisco a New York.
  • Las funciones analíticas para clasificación, funciones acumulativas, cubo y resumen para facilitar tareas que normalmente solo ocurren con la tecnología OLAP, son ahora una parte natural del motor. base de datos
  • La capacidad de crear tablas que contengan resultados.
    Vendedores de base de datos Los líderes combinan más capacidades de BI en el base de datos mismo.
    Los principales proveedores de base de datos están mezclando más capacidades de BI en el base de datos mismo.
    Esto proporciona un mejor rendimiento y más opciones de ejecución para las soluciones de BI.
    Las características y funciones de DB2 V8 se analizan en detalle en los siguientes capítulos:
    Fundamentos de arquitectura técnica y gestión de datos (Capítulo 5)
  • Fundamentos de DB2 BI (Capítulo 6)
  • Tablas de consultas materializadas de DB2 (Capítulo 7)
  • Funciones de DB2 OLAP (Capítulo 13)
  • Características y funciones de BI mejoradas de DB2 (Capítulo 15) Sistema de entrega de datos simplificado Sistema de entrega de adquirir simplificado

La arquitectura representada en la Figura 1.1 incluye numerosas estructuras. adquirir físico. Uno es el almacén de adquirir operando. Generalmente, un ODS es un objeto temático, integrado y actual. Construiría un ODS para respaldar, por ejemplo, la oficina de ventas. Las ventas de SAO complementarían adquirir de numerosos sistemas diferentes, pero sólo conservaría, por ejemplo, las transacciones actuales. El ODS también se puede actualizar muchas veces al día. Al mismo tiempo, los procesos empujan a la adquirir integrado en otras aplicaciones. Esta estructura está diseñada específicamente para integrar adquirir actual y dinámico y sería un candidato probable para respaldar análisis en tiempo real, como brindar servicios a los agentes clientes la información de ventas actual de un cliente extrayendo información de tendencias de ventas del propio almacén. Otra estructura que se muestra en la Figura 1.1 es un estado formal para el dw. No sólo es este el lugar para la ejecución de la integración necesaria, de la calidad de adquirir, y de la transformación de adquirir del almacén entrante, pero también es un área de almacenamiento confiable y temporal para adquirir réplicas que podrían usarse en análisis en tiempo real. Si decide utilizar un ODS o un área de preparación, una de las mejores herramientas para poblar estas estructuras adquirir El uso de diferentes fuentes operativas es la consulta distribuida heterogénea de DB2. Esta capacidad se proporciona mediante la característica opcional de DB2 denominada DB2 Relational Connect (sólo consulta) y a través de DB2 DataJoiner (un producto independiente que ofrece capacidad de consulta, inserción, actualización y eliminación de RDBMS distribuidos heterogéneos).

Esta tecnología permite a los arquitectos adquirir di legare adquirir producción con procesos analíticos. La tecnología no sólo puede adaptarse a prácticamente cualquiera de las demandas de replicación que puedan surgir con el análisis en tiempo real, sino que también puede conectarse a una amplia variedad de bases. adquirir más populares, incluidos DB2, Oracle, Sybase, SQL Server, Informix y otros. DB2 DataJoiner se puede utilizar para rellenar una estructura adquirir formal como ODS o incluso una mesa permanente representada en el almacén diseñada para la recuperación rápida de actualizaciones instantáneas o para la venta. Por supuesto, estas mismas estructuras adquirir se puede poblar usando

otra tecnología importante diseñada para la replicación de adquirir, IBM DataPropagator relacional. (DataPropagator es un producto independiente para sistemas centrales. DB2 UNIX, Linux, Windows y OS/2 incluyen servicios de replicación de datos. adquirir como característica estándar).
Otro método para mover el adquirir En toda la empresa hay un integrador de aplicaciones empresariales, también conocido como intermediario de mensajes. Esta tecnología única permite un control incomparable para la orientación y el movimiento. adquirir alrededor de la empresa. IBM tiene el intermediario de mensajes más utilizado, MQSeries, o una variación del producto que incluye los requisitos de comercio electrónico, IBM WebSphere MQ.
Para obtener más información sobre cómo aprovechar MQ para respaldar un entorno de almacén y BI, visite sitio web del libro. Por ahora basta decir que esta tecnología es un excelente medio para capturar y transformar (usando MQSeries Integrator) adquirir Operadores centrados (dirigidos) contratados para soluciones de BI. La tecnología MQ se ha integrado y empaquetado en UDB V8, lo que significa que ahora las colas de mensajes se pueden gestionar como si fueran tablas DB2. El concepto de soldar mensajes en cola y el universo de base de datos relacional se dirige hacia un poderoso entorno de entrega de adquirir.

Latencia cero Latencia cero

El objetivo estratégico final de IBM es el análisis de latencia cero. Según lo definido por
Gartner, un sistema de BI debe ser capaz de inferir, asimilar y proporcionar información a los analistas bajo demanda. El desafío, por supuesto, es cómo mezclar adquirir actual y en tiempo real con información histórica necesaria, como i adquirir patrón/tendencia relacionado, o comprensión extraída, como la elaboración de perfiles de clientes.

Dicha información incluye, por ejemplo, la identificación de clientes riesgo alto o bajo o qué productos clientes lo más probable es que compren si ya tienen queso en sus carritos de compras.

Lograr una latencia cero depende en realidad de dos mecanismos fundamentales:

  • Unión completa de adquirir los cuales son analizados con las técnicas y herramientas establecidas creadas por BI
  • Un sistema de entrega de adquirir eficiente para garantizar que los análisis en tiempo real estén realmente disponibles. Estos requisitos previos para la latencia cero no son diferentes de los dos objetivos establecidos por IBM y descritos anteriormente. El estrecho acoplamiento de adquirir Es parte del programa de integración perfecta de IBM. Y crear un sistema de entrega de adquirir eficiente depende completamente de la tecnología disponible que simplifique el proceso de entrega de adquirir. Como resultado, dos de los tres objetivos de IBM son fundamentales para alcanzar el tercero. IBM está evolucionando conscientemente su tecnología para garantizar que la latencia cero sea una realidad para los esfuerzos de almacén. Resumen / Síntesis La organización de BI proporciona una hoja de ruta para construir su entorno
    iterativamente. Debe ajustarse para reflejar las necesidades de su negocio, tanto actuales como futuras. Sin una visión arquitectónica amplia, las iteraciones del almacén son poco más que implementaciones aleatorias del almacén central que hacen poco para crear una empresa amplia e informativa. El primer obstáculo para los directores de proyectos es cómo justificar las inversiones necesarias para desarrollar la organización de BI. Si bien el cálculo del ROI sigue siendo un pilar de las implementaciones de almacenes, cada vez es más difícil predecir con precisión. Esto ha llevado a otros métodos para determinar si está obteniendo el valor de su dinero. El valor de la inversión2 (VOI), por ejemplo, se promociona como una solución. Corresponde a los arquitectos de adquirir y los planificadores de proyectos generan y proporcionan información deliberadamente a las asociaciones de usuarios y no simplemente les brindan un servicio. adquirir. Hay una gran diferencia entre los dos. La información es algo que marca la diferencia en los procesos de toma de decisiones y en su efectividad; relativamente, yo adquirir son bloques de construcción para derivar esa información.

Aunque crítico con la fuente adquirir Para abordar las solicitudes comerciales, el entorno de BI debe desempeñar un papel más importante en la creación de contenido de información. Debemos tomar medidas adicionales para limpiar, integrar, transformar o crear contenido de información sobre el cual los usuarios puedan actuar, y luego debemos asegurarnos de que esas acciones y decisiones, cuando sean razonables, se reflejen en el entorno de BI. Si relegamos el almacén a servir sólo en adquirir, se garantiza que las asociaciones de usuarios crearán el contenido de información necesario para tomar medidas. Esto asegura que su comunidad podrá tomar mejores decisiones, pero la empresa sufre por la falta de conocimiento que utilizaron. Fecha Aunque los arquitectos y planificadores de proyectos inician proyectos específicos en el entorno de BI, siguen siendo responsables ante la empresa en su conjunto. Un ejemplo simple de esta característica bilateral de las iteraciones de BI se encuentra en el código fuente. adquirir. todos adquirir Los datos recibidos para solicitudes comerciales específicas deben completarse en la primera capa atómica. Esto garantiza el desarrollo del activo de información empresarial, además de gestionar y abordar las solicitudes específicas de los usuarios definidas en la iteración.

¿Qué es DataWarehouse?

Almacén de datos Ha sido el corazón de la arquitectura de sistemas de información desde 1990 y soporta los procesos de información ofreciendo una sólida plataforma integrada. adquirir datos históricos tomados como base para análisis posteriores. EL almacenamiento de datos Ofrecen facilidad de integración en un mundo de sistemas de aplicaciones incompatibles. Almacén de datos se ha convertido en una tendencia. Almacén de datos organiza y almacena i adquirir necesaria para procesos de información y análisis basados ​​en una larga perspectiva temporal histórica. Todo ello implica un importante y constante compromiso en la construcción y mantenimiento de almacenamiento de datos.

Entonces, que es un almacenamiento de datos? La almacenamiento de datos es:

  • ▪  orientado al tema
  • ▪  sistema integrado
  • ▪  variante de tiempo
  • ▪  no volátil (no se borra)

una coleccion de adquirir Se utiliza para apoyar las decisiones gerenciales en la implementación de procesos.
I adquirir insertado en almacenamiento de datos en la mayoría de los casos derivan de entornos operativos. El almacenamiento de datos Está creado por una unidad de almacenamiento, físicamente separada del resto del sistema, que contiene. adquirir previamente transformados por aplicaciones que operan con información derivada del entorno operativo.

La definición literal de un almacenamiento de datos Merece una explicación en profundidad ya que existen importantes motivaciones y significados subyacentes que describen las características de un almacén.

ORIENTACIÓN DE SUJETOS ORIENTACIÓN TEMÁTICO

La primera característica de un almacenamiento de datos es que está orientado a los principales actores de una empresa. La guía de las pruebas a través del adquirir contrasta con el método más clásico que implica la orientación de las aplicaciones hacia procesos y funciones, método compartido en gran medida por la mayoría de los sistemas de gestión menos recientes.

El mundo operativo está diseñado en torno a aplicaciones y funciones como préstamos, ahorros, tarjetas bancarias y fideicomisos para una institución financiera. El mundo de dw se organiza en torno a temas principales como el cliente, el vendedor, el producto y la actividad. La alineación en torno a los temas afecta el diseño y la implementación de adquirir encontrado en el dw. Más importante aún, el tema principal afecta la parte más importante de la estructura clave.

El mundo de la aplicación está influenciado tanto por el diseño de la base de datos como por el diseño del proceso. El mundo de dw está centrado exclusivamente en el modelaje. adquirir y sobre el diseño del base de datos. El diseño del proceso (en su forma clásica) no forma parte del entorno dw.

Las diferencias entre la elección de la aplicación del proceso/función y la elección del tema también se revelan como diferencias en el contenido de la adquirir en un nivel detallado. LA adquirir del dw no incluye i adquirir que no se utilizará para el proceso DSS mientras las solicitudes

operacional orientado a adquirir contener yo adquirir para satisfacer inmediatamente requisitos funcionales/de procesamiento que pueden o no tener algún uso para el analista DSS.
Otra forma importante en la que las aplicaciones orientadas a las operaciones adquirir difiere de adquirir de dw está en los informes de adquirir. adquirir Las operaciones mantienen una relación continua entre dos o más tablas basándose en una regla de negocio que está activa. EL adquirir de dw cruzan un espectro de tiempo y las relaciones que se encuentran en el dw son muchas. Muchas reglas comerciales (y en consecuencia, muchas relaciones de adquirir ) están representados en el almacén de adquirir entre dos o más mesas.

(Para una explicación detallada de cómo las relaciones entre los adquirir se manejan en el DW, nos remitimos al Tech Topic sobre ese tema.)
Desde ninguna otra perspectiva que la de la diferencia fundamental entre una elección de aplicación funcional/de proceso y una elección de tema, ¿existe una diferencia mayor entre los sistemas operativos y los sistemas operativos? adquirir y el DW.

INTEGRACIÓN INTEGRACIÓN

El aspecto más importante del entorno de dw es que yo adquirir que se encuentran dentro del dw se integran fácilmente. SIEMPRE. SIN EXCEPCIONES. La esencia misma del entorno dw es que yo adquirir contenidos dentro de los límites del almacén están integrados.

La integración se revela de muchas maneras diferentes: en convenciones identificadas consistentemente, en mediciones variables consistentes, en estructuras codificadas consistentes, en los atributos físicos de adquirir coherente, etc.

A lo largo de los años, los diseñadores de diversas aplicaciones han tomado muchas decisiones sobre cómo se debe desarrollar una aplicación. El estilo y las decisiones de diseño individualizadas de las aplicaciones de los diseñadores se revelan de cientos de maneras: en diferencias en codificación, estructura clave, características físicas, convenciones de identificación, etc. La capacidad colectiva de muchos diseñadores de aplicaciones para crear aplicaciones inconsistentes es legendaria. La Figura 3 muestra algunas de las diferencias más importantes en la forma en que se diseñan las aplicaciones.

Codificación: Codificar:

Los diseñadores de aplicaciones han elegido la codificación del campo (sexo) de diferentes maneras. Un diseñador representa el sexo como una “m” y una “f”. Otro diseñador representa el género como un “1” y un “0”. Otro diseñador representa el sexo como una “x” y una “y”. Otro diseñador representa el sexo como “masculino” y “femenino”. No importa mucho cómo llega el sexo al DW. La “M” y la “F” probablemente sean tan buenas como toda la obra.

Lo que importa es que, sea cual sea el origen del que derive el campo sexual, ese campo llega al TD en un estado consistentemente integrado. En consecuencia, cuando el campo se carga en el DW desde una aplicación donde ha sido representado en el formato "M" y "F", el adquirir debe convertirse al formato DW.

Medida de Atributos: Medida de Atributos:

Los diseñadores de aplicaciones han optado por medir la canalización de diversas formas a lo largo de los años. Un diseñador almacena el adquirir de la tubería en centímetros. Otro diseñador de aplicaciones almacena el adquirir de la tubería en términos de pulgadas. Otro diseñador de aplicaciones almacena el adquirir de tubería en millones de pies cúbicos por segundo. Y otro diseñador almacena información sobre tuberías en términos de yardas. Cualquiera que sea la fuente, cuando la información del pipeline llega al DW se debe medir de la misma manera.

Según lo indicado en la figura 3, los problemas de integración afectan a casi todos los aspectos del proyecto: las características físicas de adquirir, el dilema de tener más de una fuente de adquirir, la cuestión de las muestras identificadas inconsistentes, los formatos de adquirir inconsistente, y así sucesivamente.

Cualquiera que sea el tema de diseño, el resultado es el mismo. adquirir deben almacenarse en el DW de una manera singular y globalmente aceptable incluso cuando los sistemas operativos subyacentes los almacenan de manera diferente adquirir.

Cuando el analista de DSS mira el DW, el objetivo del analista debe ser la explotación del adquirir que están en el almacén,

en lugar de preguntarse sobre la credibilidad o consistencia de adquirir.

VARIANCIA DE TIEMPO

Todas adquirir en DW son exactos hasta cierto punto en el tiempo. Esta característica básica de la adquirir en DW es muy diferente de adquirir que se encuentran en el entorno operativo. LA adquirir del entorno operativo son tan precisos como en el momento del acceso. En otras palabras, en el entorno operativo cuando se accede a una unidad adquirir, se espera que refleje valores precisos en el momento del acceso. Porque yo adquirir en el DW son precisos como que en algún momento (es decir, no “ahora mismo”), se dice que adquirir encontradas en el DW son “variación temporal”.
La variación temporal de adquirir Se hace referencia a DW de muchas formas.
La forma más sencilla es que yo adquirir de un DW representan adquirir en un horizonte temporal largo: de cinco a diez años. El horizonte temporal representado para el entorno operativo es mucho más corto que los valores actuales de hasta sesenta noventa
Las aplicaciones que deben funcionar bien y deben estar disponibles para el procesamiento de transacciones deben llevar la cantidad mínima de adquirir si permiten algún grado de flexibilidad. Por lo tanto, las aplicaciones operativas tienen un horizonte temporal corto, como un tema de diseño de una aplicación de audio.
La segunda forma en que aparece la 'variación de tiempo' en el DW es en la estructura clave. Cada estructura clave en el DW contiene, implícita o explícitamente, un elemento de tiempo, como día, semana, mes, etc. El elemento de tiempo casi siempre se encuentra en la parte inferior de la clave concatenada que se encuentra en el DW. En estas ocasiones, el elemento tiempo existirá implícitamente, como en el caso de que un expediente completo se duplique al final del mes o trimestre.
La tercera forma en que se muestra la varianza de tiempo es que i adquirir del DW, una vez registrado correctamente, no se puede actualizar. EL adquirir del DW son, a todos los efectos prácticos, una larga serie de instantáneas. Por supuesto, si las instantáneas se tomaron incorrectamente, entonces se pueden modificar. Pero suponiendo que las instantáneas se tomen correctamente, no se modifican tan pronto como se toman. En algunos

En algunos casos, puede ser poco ético o incluso no válido modificar las instantáneas en el DW. EL adquirir operativos, siendo precisos en el momento del acceso, pueden actualizarse según sea necesario.

NO VOLÁTIL

La cuarta característica importante de DW es que no es volátil.
Se realizan actualizaciones, inserciones, eliminaciones y modificaciones periódicamente en los entornos operativos, registro por registro. Pero la manipulación básica de la adquirir que se necesitan en el DW es mucho más sencillo. Sólo hay dos tipos de operaciones que ocurren en el DW: la carga inicial de adquirir y acceso a adquirir. No hay actualización del adquirir (en el sentido general de actualización) en el DW como una operación de procesamiento normal. Hay algunas consecuencias muy poderosas de esta diferencia básica entre el procesamiento operativo y el procesamiento DW. A nivel de diseño, la necesidad de tener cuidado con las actualizaciones anómalas no es un factor en DW, ya que la actualización de adquirir no se lleva a cabo. Esto significa que en el nivel de diseño físico, se pueden tomar libertades para optimizar el acceso a adquirir, en particular al abordar los temas de normalización y desnormalización física. Otra consecuencia de la simplicidad de las operaciones de DW está en la tecnología subyacente utilizada para ejecutar el entorno de DW. Tener que admitir actualizaciones en línea registro por registro (como suele ser el caso con el procesamiento operativo) requiere que la tecnología tenga una base muy compleja detrás de una aparente simplicidad.
La tecnología que respalda el respaldo y la recuperación, las transacciones y la integridad de adquirir y la detección y solución de la condición de punto muerto es bastante compleja y no es necesaria para el procesamiento DW. Las características de un DW, orientación del diseño, integración de adquirir dentro del DW, variación temporal y simplicidad de gestión de adquirir, todo conduce a un entorno muy, muy diferente al entorno operativo clásico. La fuente de casi todos adquirir de DW son el entorno operativo. Es tentador pensar que existe una enorme redundancia de adquirir entre los dos ambientes.
De hecho, la primera impresión que tiene mucha gente es la de una gran redundancia adquirir entre el entorno operativo y el

DW. Tal interpretación es superficial y demuestra una falta de comprensión de lo que sucede en el TD.
De hecho, existe un mínimo de redundancia de adquirir entre el entorno operativo y yo adquirir del DW. Considere lo siguiente: yo adquirir se filtran fecha que pasa del entorno operativo al entorno DW. Muchos adquirir nunca pasan fuera del entorno operativo. Excepto que yo adquirir que son necesarios para el procesamiento DSS encuentran su dirección en el entorno

▪  el horizonte temporal de adquirir es muy diferente de un entorno a otro. EL adquirir en el entorno operativo son muy frescos. LA adquirir en DW son mucho mayores. Sólo desde la perspectiva del horizonte temporal, hay muy poca superposición entre el entorno operativo y el DW.

▪  El DW contiene adquirir resumen que nunca se encuentran en el medio ambiente

▪  yo adquirir experimentan una transformación fundamental a medida que pasan a la Figura 3 ilustra que la mayoría adquirir se modifican significativamente siempre que sean seleccionados y trasladados al DW. Dicho de otra manera, la mayoría de los adquirir cambia física y radicalmente a medida que se traslada al DW. Desde el punto de vista de la integración no son lo mismo adquirir que residen en el entorno operativo. A la luz de estos factores, la redundancia de adquirir entre los dos entornos es un evento poco común, que conduce a menos del 1% de redundancia entre los dos entornos. LA ESTRUCTURA DEL ALMACÉN Los DW tienen una estructura distinta. Hay varios niveles de resumen y detalle que delimitan los TD.
Los diversos componentes de un DW son:

  • metadatos
  • Datos detalles actuales
  • Datos de detalle antiguo
  • Datos ligeramente resumido
  • Datos muy resumido

De lejos, la principal preocupación es para yo adquirir detalles actuales. Es la principal preocupación porque:

  • I adquirir Los detalles actuales reflejan los acontecimientos más recientes, que siempre son de gran interés y
  • i adquirir El detalle actual es voluminoso porque se almacena en el nivel más bajo de granularidad y
  • i adquirir Los detalles actuales casi siempre se almacenan en la memoria del disco, a la que se puede acceder rápidamente, pero que es costosa y compleja de usar. adquirir los detalles más antiguos son adquirir que se almacenan en alguna memoria massa. Se accede a él esporádicamente y se almacena con un nivel de detalle compatible con adquirir detalles actuales. Si bien no es obligatorio almacenar en un medio de almacenamiento alternativo, debido al gran volumen de adquirir combinado con el acceso esporádico de adquirir, el medio de memoria para adquirir Los datos detallados más antiguos generalmente no se almacenan en el disco. EL adquirir resumidos a la ligera son adquirir que se destilan desde el bajo nivel de detalle encontrado hasta el nivel de detalle actual. Este nivel del DW casi siempre se almacena en el disco. Los problemas de diseño que se le plantean al arquitecto adquirir en la construcción de este nivel del DW son:
  • ¿Qué unidad de tiempo es el resumen hecho arriba?
  • Qué contenido, los atributos resumirán ligeramente el contenido del adquirir El siguiente nivel de adquirir encontrado en el DW es el de adquirir muy resumido. EL adquirir Los contenidos muy resumidos son compactos y de fácil acceso. EL adquirir muy resumidos se encuentran a veces en el entorno DW y en otros casos i adquirir Muy resumidos se encuentran fuera de los muros inmediatos de la tecnología que alberga el DW. (en cualquier caso, yo adquirir altamente resumidos son parte del DW independientemente de dónde esté adquirir están físicamente alojados). El componente final del DW son los metadatos. En muchos aspectos, los metadatos se encuentran en una dimensión diferente a la de otros. adquirir del DW, porque los metadatos no contienen ningún fecha tomado directamente del entorno operativo. Los metadatos tienen un papel especial y muy importante en DW. Los metadatos se utilizan como:
  • un directorio para ayudar al analista de DSS a identificar el contenido del DW,
  • una guía para mapear el adquirir de como yo adquirir se han transformado del entorno operativo al entorno DW,
  • una guía de los algoritmos utilizados para el resumen entre los adquirir de detalles actuales y yo adquirir ligeramente resumido, yo adquirir En resumen, los metadatos desempeñan un papel mucho más importante en el entorno DW que en el entorno operativo. MEDIO DE ALMACENAMIENTO DE DETALLE ANTIGUO Se puede utilizar cinta magnética para almacenar ese tipo de adquirir. De hecho, existe una amplia variedad de medios de almacenamiento que se deben considerar para el almacenamiento antiguo. adquirir de detalle. Dependiendo del volumen de adquirir, la frecuencia de acceso, el coste de las herramientas y el tipo de acceso, es muy probable que otras herramientas necesiten el antiguo nivel de detalle del DW. FLUJO DE DATOS Hay un flujo normal y predecible de dioses. adquirir dentro de la DW.
    I adquirir ingrese al DW desde el entorno operativo. (NOTA: Hay algunas excepciones muy interesantes a esta regla. Sin embargo, casi todas adquirir ingrese el DW desde el entorno operativo). Fecha que adquirir ingresa al DW desde el entorno operativo, se transforma como se describió anteriormente. Con la condición de ingresar al DW, yo adquirir introduzca el nivel de detalle actual, como se muestra. Reside allí y se utiliza hasta que ocurre uno de tres eventos:
  • es purificado,
  • se resume, y/o ▪è El proceso obsoleto dentro de un DW se mueve adquirir detalles actuales un adquirir de detalle antiguo, según la edad de adquirir. El proceso

el resumen utiliza el detalle de adquirir para calcular yo adquirir niveles ligeramente resumidos y muy resumidos de adquirir. Hay algunas excepciones al flujo que se muestra (se analizarán más adelante). Sin embargo, normalmente, para la gran mayoría de adquirir encontrado dentro de un DW, el flujo de adquirir es como se muestra en la imagen.

USANDO EL ALMACEN DE DATOS

No es sorprendente que los diversos niveles de adquirir dentro del DW no reciben diferentes niveles de uso. Como regla general, cuanto mayor sea el nivel de resumen, más adquirir son usados.
Muchos usos ocurren en adquirir altamente resumido, mientras que el viejo adquirir Los detalles casi nunca se utilizan. Hay una buena razón para trasladar la organización al paradigma de utilización de recursos. Más resumido yo adquirir, cuanto más rápido y eficiente sea llegar al adquirir. Si un tienda descubre que realiza muchos procesos en el nivel de detalle del DW, entonces se consume una gran cantidad correspondiente de recursos de la máquina. Lo mejor para todos es procesar el mayor nivel de resumen lo antes posible.

Para muchas tiendas, el analista de DSS en un DW previo al entorno utilizó adquirir a nivel de detalle. En muchos aspectos, la llegada de un adquirir El resumen detallado se asemeja a una manta de seguridad, incluso cuando hay otros niveles de resumen disponibles. Una de las actividades del arquitecto. adquirir es destetar al usuario de DSS del uso constante de adquirir al nivel más bajo de detalle. Hay dos motivaciones disponibles para el arquitecto de adquirir:

  • mediante la instalación de un sistema de contracargo, donde el usuario final paga por los recursos consumidos e
  • lo que indica que se puede lograr un tiempo de respuesta muy bueno cuando el comportamiento con i adquirir se encuentra en un alto nivel de resumen, mientras que el pobre tiempo de respuesta proviene del comportamiento del adquirir a un nivel bajo de OTRAS CONSIDERACIONES Hay algunas otras consideraciones sobre la construcción y gestión de DW.
    La primera consideración es la de los índices. LA adquirir en niveles más altos de resumen se pueden indexar libremente, mientras que yo adquirir

en niveles más bajos de detalle son tan voluminosos que pueden indexarse ​​frugalmente. De la misma manera, yo adquirir con altos niveles de detalle se puede reestructurar con relativa facilidad, mientras que el volumen de adquirir en los niveles inferiores es tan grande que yo adquirir no pueden renovarse fácilmente. En consecuencia, el modelo de adquirir y el trabajo formal realizado por el diseño sentó las bases para el DW aplicado casi exclusivamente al nivel de detalle actual. En otras palabras, las actividades de modelado de adquirir no se aplican a los niveles de resumen, en casi todos los casos. Otra consideración estructural es la de la subdivisión de adquirir por DW.

La partición se puede realizar en dos niveles: en el nivel de dbms y a nivel de aplicación. En la división al nivel. dbms, la dbms está informado de las divisiones y las controla en consecuencia. En el caso de división a nivel de aplicación, sólo se informa al programador de las divisiones y le queda a él la responsabilidad de su administración.

Debajo del nivel dbms, gran parte del trabajo se realiza automáticamente. Hay mucha inflexibilidad asociada con la administración automática de divisiones. En el caso de divisiones a nivel de aplicación de adquirir de los almacenamiento de datos, pesa mucho trabajo sobre el programador, pero el resultado final es flexibilidad en la administración de adquirir en almacenamiento de datos

OTRAS ANOMALIAS

Mientras que los componentes del almacenamiento de datos Funcionan como se describe para casi todos. adquirir, existen algunas excepciones útiles que es necesario analizar. Una excepción es la de adquirir datos resumidos públicos. Estos son adquirir resúmenes que han sido calculados a partir de almacenamiento de datos pero son utilizados por la sociedad. LA adquirir Los resúmenes públicos se almacenan y gestionan en el almacenamiento de datos, aunque como se ha comentado anteriormente están calculados. Los contadores trabajan para producir dichos informes trimestrales. adquirir como ingresos, gastos trimestrales, ganancias trimestrales, etc. El trabajo realizado por los contadores es externo a almacenamiento de datos. Sin embargo, yo adquirir se utilizan “internamente” dentro de la empresa – desde Marketing, ventas, etc Otra anomalía, que no será discutida, es la de adquirir externo.

Otro gran tipo de adquirir que se puede encontrar en un almacenamiento de datos es el de los datos de detalle permanente. Esto provoca la necesidad de almacenar permanentemente el adquirir a nivel detallado por razones éticas o legales. Si una empresa expone a sus trabajadores a sustancias peligrosas, es necesario adquirir detallado y permanente. Si una empresa produce un producto que implica seguridad pública, como piezas de aviones, es necesario adquirir detalles permanentes, así como si una empresa celebra contratos peligrosos.

La empresa no puede permitirse el lujo de pasar por alto detalles porque en los próximos años, en caso de demanda, retirada del mercado, defecto de construcción en disputa, etc. La exposición de la empresa podría ser grande. Como resultado, existe un tipo único de adquirir conocido como datos de detalle permanente.

RESUMEN

Un almacenamiento de datos es una variante temporal integrada y orientada a objetos, una colección de adquirir no volátil para apoyar las necesidades de toma de decisiones de la administración. Cada una de las funciones más destacadas de un almacenamiento de datos tiene sus implicaciones. Además, hay cuatro niveles de adquirir de los almacenamiento de datos:

  • Detalle antiguo
  • Detalle actual
  • Datos ligeramente resumido
  • Datos Los metadatos altamente resumidos también son una parte importante del almacenamiento de datos. RESUMEN El concepto de almacenamiento de adquirir Recientemente ha recibido mucha atención y se ha convertido en una tendencia de los años 90. Esto se debe a la capacidad de un almacenamiento de datos para superar las limitaciones de los sistemas de soporte administrativo, como los sistemas de soporte a la decisión (DSS) y los sistemas de información ejecutiva (EIS). Incluso si el concepto de almacenamiento de datos parece prometedor, implementarlo almacenamiento de datos puede ser problemático debido a los procesos de almacenamiento a gran escala. A pesar de la complejidad de los proyectos de almacenamiento de adquirir, muchos proveedores y consultores que almacenan adquirir afirmar que el almacenamiento de adquirir La corriente no causa ningún problema. Sin embargo, al inicio de este proyecto de investigación, casi no se había llevado a cabo ninguna investigación independiente, rigurosa y sistemática. Como resultado, es difícil decir qué sucede realmente en la industria cuando se construyen. almacenamiento de datos. Este estudio exploró la práctica de almacenamiento de adquirir contemporáneos cuyo objetivo es desarrollar una comprensión más rica de la práctica australiana. La revisión de la literatura proporcionó el contexto y la base para el estudio empírico. Hay una serie de hallazgos de esta investigación. En primer lugar, este estudio reveló las actividades que surgieron durante el desarrollo del almacenamiento de datos. En muchas áreas, yo adquirir Los datos recopilados confirmaron la práctica reportada en la literatura. En segundo lugar, las cuestiones y problemas que pueden afectar el desarrollo de la almacenamiento de datos fueron identificados por este estudio. Finalmente, los beneficios obtenidos por las organizaciones australianas asociadas con el uso de almacenamiento de datos han sido revelados.

Capítulo 1

Contexto de investigación

El concepto de almacenamiento de datos recibió una amplia exposición y se convirtió en una tendencia emergente en la década de 90 (McFadden 1996, TDWI 1996, Shah y Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman y Oates 2000). Esto se puede ver en el creciente número de artículos sobre almacenamiento de datos en publicaciones comerciales (Little y Gibson 1999). Muchos artículos (ver, por ejemplo, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett y King 1996, Graham et al. 1996, Sakaguchi y Frolick 1996, Alvarez 1997, Brousell 1997, Clarke 1997, McCarthy 1997, O' Donnell 1997, Edwards 1998, TDWI 1999) han informado beneficios significativos obtenidos por las organizaciones que implementan i almacenamiento de datos. Apoyaron su teoría con evidencia anecdótica de implementaciones exitosas, cifras de alto retorno de la inversión (ROI) y, también, proporcionando pautas o metodologías para desarrollar el almacenamiento de datos

(Shanks et al. 1997, Seddon y Benjamin 1998, Little y Gibson 1999). En un caso extremo, Graham et al. (1996) informaron un rendimiento promedio de una inversión a tres años del 401%.

Sin embargo, gran parte de la literatura actual ha pasado por alto las complejidades que implica emprender tales proyectos. los proyectos de almacenamiento de datos normalmente son complejos y de gran escala y, por lo tanto, conllevan una alta probabilidad de fallar si no se controlan cuidadosamente (Shah y Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs y Clymer 1998, Rao 1998). Requieren enormes cantidades de recursos humanos y financieros, así como de tiempo y esfuerzo para construirlos (Hill 1998, Crofts 1998). El tiempo y los medios financieros típicos necesarios son aproximadamente dos años y entre dos y tres millones de dólares, respectivamente (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Este tiempo y medios financieros son necesarios para controlar y consolidar muchos aspectos diferentes del almacenamiento de datos (Cafasso 1995, Hill 1998). Además de las consideraciones de hardware y software, otras funciones, que varían desde la extracción de adquirir a los procesos de carga de adquirir, la capacidad de memoria para gestionar actualizaciones y el meta adquirir para la formación de usuarios, deben tenerse en cuenta.

En el momento en que comenzó este proyecto de investigación, se llevaban a cabo muy pocas investigaciones académicas en el campo del almacenamiento de datos, especialmente en Australia. Esto fue evidente por la escasez de artículos publicados sobre almacenamiento de datos en revistas u otros escritos académicos de la época. Muchos de los escritos académicos disponibles describieron la experiencia estadounidense. La falta de investigación académica en el área del almacenamiento de datos ha provocado llamados a investigaciones y estudios empíricos rigurosos (McFadden 1996, Shanks et al. 1997, Little y Gibson 1999). En particular, los estudios de investigación sobre el proceso de implementación de almacenamiento de datos Es necesario llevar a cabo para ampliar el conocimiento general sobre la implementación de almacenamiento de datos y servirá como base para un estudio de investigación futuro (Shanks et al. 1997, Little y Gibson 1999).

El propósito de este estudio, por tanto, es estudiar qué sucede realmente cuando las organizaciones llevan a cabo y utilizan i almacenamiento de datos en Australia. En concreto, este estudio supondrá el análisis de todo un proceso de desarrollo de una almacenamiento de datos, desde el inicio y la planificación hasta el diseño, la implementación y el uso posterior dentro de las organizaciones australianas. Además, el estudio también contribuirá a la práctica actual al identificar áreas donde la práctica se puede mejorar aún más y las ineficiencias y los riesgos se pueden minimizar o evitar. Además, servirá de base para otros estudios sobre almacenamiento de datos en Australia y llenará el vacío que existe actualmente en la literatura.

Preguntas de investigación

El objetivo de esta investigación es estudiar las actividades involucradas en la implementación de almacenamiento de datos y su uso por parte de organizaciones australianas. En particular, se estudian elementos relacionados con la planificación, el desarrollo, la operación, el uso y los riesgos involucrados del proyecto. Entonces la pregunta de esta investigación es:

"¿Cómo es la práctica actual de almacenamiento de datos ¿en Australia?"

Para responder eficazmente a esta pregunta, se requieren una serie de preguntas de investigación subsidiarias. En particular, se identificaron tres subpreguntas de la literatura, que se presenta en el capítulo 2, para guiar este proyecto de investigación: ¿Cómo se almacenamiento de datos de organizaciones australianas? ¿Qué problemas has encontrado?

¿Cuáles son los beneficios experimentados?
Para responder a estas preguntas, se utilizó un diseño de investigación exploratoria que emplea una encuesta. Como estudio exploratorio, las respuestas a las preguntas anteriores no están completas (Shanks et al. 1993, Denscombe 1998). En este caso, se requiere una triangulación para mejorar las respuestas a estas preguntas. Sin embargo, la investigación proporcionará una base sólida para trabajos futuros que examinen estas cuestiones. En el Capítulo 3 se presenta una discusión detallada sobre la justificación y el diseño del método de investigación.

Estructura del proyecto de investigación

Este proyecto de investigación se divide en dos partes: el estudio contextual del concepto de almacenamiento de datos y la investigación empírica (ver Figura 1.1), cada una de las cuales se analiza a continuación.

Parte I: Estudio contextual

La primera parte de la investigación consistió en revisar la literatura actual sobre varios tipos de almacenamiento de datos, incluidos sistemas de soporte a decisiones (DSS), sistemas de información ejecutiva (EIS), estudios de caso de almacenamiento de datos y los conceptos de almacenamiento de datos. Además, los resultados de los foros almacenamiento de datos y grupos de reuniones de expertos y profesionales dirigidos por el equipo de investigación de Monash DSS, contribuyeron a esta fase del estudio que tenía como objetivo obtener información sobre la práctica de almacenamiento de datos e identificar los riesgos involucrados en su adopción. Durante este período de estudio contextual, se estableció la comprensión del área problemática para proporcionar el conocimiento previo para investigaciones empíricas posteriores. Sin embargo, este fue un proceso continuo durante la realización del estudio de investigación.

Parte II: Investigación empírica

El concepto relativamente nuevo de almacenamiento de datos, especialmente en Australia, ha creado la necesidad de realizar una encuesta para obtener una imagen amplia de la experiencia del usuario. Esta parte se llevó a cabo una vez que se había establecido el dominio del problema mediante una extensa revisión de la literatura. El concepto de almacenamiento de datos formado durante la fase de estudio contextual se utilizó como insumo para el cuestionario inicial de este estudio. Después de esto, se examinó el cuestionario. sois expertos en almacenamiento de datos participó en la prueba. El propósito de probar el cuestionario inicial fue comprobar la integridad y precisión de las preguntas. Con base en los resultados de la prueba, se modificó el cuestionario y la versión modificada se envió a los participantes de la encuesta. Los cuestionarios devueltos fueron luego analizados para i adquirir en tablas, diagramas y otros formatos. LA

resultados del análisis de adquirir Forman una instantánea de la práctica de almacenamiento de datos en Australia.

RESUMEN DEL ALMACENAMIENTO DE DATOS

El concepto de almacenamiento de datos ha evolucionado con las mejoras en la tecnología informática.
Su objetivo es superar los problemas que enfrentan los grupos de soporte de aplicaciones, como el Sistema de soporte de decisiones (DSS) y el Sistema de información ejecutiva (EIS).

En el pasado, el mayor obstáculo de estas aplicaciones ha sido la incapacidad de estas aplicaciones para proporcionar una base de datos necesario para el análisis.
Esto se debe principalmente a la naturaleza del trabajo de la dirección. Los intereses de la dirección de una empresa varían constantemente según el ámbito que abarca. Por lo tanto, yo adquirir fundamental para estas aplicaciones deben poder cambiar rápidamente dependiendo de la pieza a tratar.
Esto significa que yo adquirir debe estar disponible en la forma adecuada para los análisis solicitados. De hecho, a los grupos de soporte de aplicaciones les resultó muy difícil en el pasado recopilar e integrar adquirir de fuentes complejas y diversas.

El resto de esta sección presenta una descripción general del concepto de almacenamiento de datos y analiza cómo almacenamiento de datos puede superar los problemas de los grupos de soporte de aplicaciones.
El término "Almacenamiento de Datos”fue popularizado por William Inmon en 1990. Su definición, frecuentemente citada, ve la Almacenamiento de Datos como una colección de adquirir orientado a un tema, integrado, no volátil y variable en el tiempo, en apoyo de las decisiones de gestión.

Usando esta definición, Inmon señala que yo adquirir residiendo en un almacenamiento de datos deben poseer las siguientes 4 características:

  • ▪  Orientado al tema
  • ▪  Integrado
  • ▪  No volátil
  • ▪  Varía con el tiempo Por Inmon orientado a temas significa que i adquirir en almacenamiento de datos en las áreas organizacionales más grandes que han sido

definido en el modelo adquirir. Por ejemplo todos adquirir acerca de i clientes están contenidos en el área temática CLIENTES. Igualmente todos adquirir relacionados con los productos están contenidos en el área temática PRODUCTOS.

Por Integrati Inmon significa que yo adquirir provenientes de diferentes plataformas, sistemas y ubicaciones se combinan y almacenan en un solo lugar. Importantemente adquirir los similares deben transformarse en formatos consistentes para que puedan agregarse y compararse fácilmente.
Por ejemplo, los géneros masculino y femenino están representados por las letras M y F en un sistema, y ​​por 1 y 0 en otro. Para integrarlos correctamente, uno o ambos formatos deben transformarse para que los dos formatos sean iguales. En este caso podríamos cambiar M a 1 y F a 0 o viceversa. Orientado a materias e Integrado indican que el almacenamiento de datos está diseñado para proporcionar una visión funcional y transversal de adquirir por la compañía.

No volátil significa que yo adquirir en almacenamiento de datos mantener la coherencia y la actualización de adquirir no es necesario. En cambio, cada cambio en adquirir los originales se añaden al base de datos de los almacenamiento de datos. Esto significa que el dei histórico adquirir está contenido en el almacenamiento de datos.

Para variables a lo largo del tiempo, Inmon indica que i adquirir en almacenamiento de datos siempre contienen marcadores de tiempo y yo adquirir normalmente cruzan un horizonte temporal determinado. Por ejemplo un
almacenamiento de datos puede contener 5 años de valores históricos de la clientes de 1993 a 1997. La disponibilidad de la historia y una serie temporal de adquirir le permite analizar tendencias.

Un almacenamiento de datos él puede recoger el suyo adquirir de sistemas OLTP; de fuentes adquirir externos a la organización y/o por otros proyectos especiales de sistemas de captura adquirir.
I adquirir Los extractos pueden pasar por un proceso de limpieza, en este caso i adquirir se transforman e integran antes de ser almacenados en el base de datos de los almacenamiento de datos. Entonces yo adquirir

residiendo dentro del base de datos de los almacenamiento de datos están disponibles para los inicios de sesión de los usuarios finales y las herramientas de recuperación. Utilizando estas herramientas el usuario final puede acceder a la vista integrada de la organización del adquirir.

I adquirir residiendo dentro del base de datos de los almacenamiento de datos se almacenan tanto en formato detallado como resumido.
El nivel de resumen puede depender de la naturaleza del adquirir. adquirir detallado puede consistir en adquirir actual y adquirir histórico
I adquirir reales no están incluidos en el almacenamiento de datos hasta que yo adquirir en almacenamiento de datos se actualizan.
Además de almacenar i adquirir ellos mismos, un almacenamiento de datos También puede almacenar un tipo diferente de fecha llamado METADATOS que describe el adquirir residiendo en su base de datos.
Hay dos tipos de metadatos: metadatos de desarrollo y metadatos de análisis.
Los metadatos de desarrollo se utilizan para gestionar y automatizar los procesos de extracción, limpieza, mapeo y carga del adquirir en almacenamiento de datos.
La información contenida en los metadatos de desarrollo puede contener detalles de sistemas operativos, detalles de los elementos a extraer, el modelo adquirir de los almacenamiento de datos y reglas de negocio para la conversión adquirir.

El segundo tipo de metadatos, conocido como metadatos analíticos, permite al usuario final explorar el contenido del almacenamiento de datos para encontrar el adquirir disponibles y su significado en términos claros y no técnicos.

Por lo tanto, los metadatos analíticos funcionan como un puente entre almacenamiento de datos y aplicaciones de usuario final. Estos metadatos pueden contener el modelo de negocio, descripciones de adquirir correspondiente al modelo de negocio, consultas e informes predefinidos, información de acceso de los usuarios y el índice.

Los metadatos de análisis y desarrollo deben combinarse en un único metadato de contención integrado para funcionar correctamente.

Desafortunadamente, muchas de las herramientas existentes tienen sus propios metadatos y actualmente no existen estándares para eso.

Permitir que las herramientas de almacenamiento de datos integren estos metadatos. Para remediar esta situación, muchos comerciantes de las principales herramientas de almacenamiento de datos formaron el Meta Data Council, que más tarde se convirtió en Meta Data Coalition.

El objetivo de esta coalición es construir un conjunto de metadatos estándar que permita que diferentes herramientas de almacenamiento de datos conviertan los metadatos.
Sus esfuerzos dieron como resultado el nacimiento de la Especificación de intercambio de metadatos (MDIS), que permitirá el intercambio de información entre archivos de Microsoft y los archivos MDIS relacionados.

La existencia de adquirir tanto resumido/indexado como detallado le da al usuario la posibilidad de realizar un DRILL DROWN (perforación) desde adquirir indexados a los detallados y viceversa. La existencia de adquirir Los historiales detallados permiten la creación de análisis de tendencias a lo largo del tiempo. Además, los metadatos analíticos se pueden utilizar como un directorio de base de datos de los almacenamiento de datos para ayudar a los usuarios finales a localizar el adquirir necesario.

En comparación con los sistemas OLTP, con su capacidad para soportar el análisis de adquirir y reportando, el almacenamiento de datos se considera un sistema más apropiado para procesos de información como realizar y responder consultas y producir informes. La siguiente sección resaltará las diferencias de los dos sistemas en detalle.

ALMACÉN DE DATOS CONTRA LOS SISTEMAS OLTP

Muchos de los sistemas de información dentro de las organizaciones están destinados a respaldar las operaciones diarias. Estos sistemas conocidos como SISTEMAS OLTP, capturan transacciones diarias actualizadas continuamente.

I adquirir dentro de estos sistemas a menudo se modifican, agregan o eliminan. Por ejemplo, la dirección de un cliente cambia tan pronto como se muda de un lugar a otro. En este caso la nueva dirección quedará registrada modificando el campo de dirección base de datos. El principal objetivo de estos sistemas es reducir los costos de transacción y al mismo tiempo reducir los tiempos de procesamiento. Ejemplos de sistemas OLTP incluyen acciones críticas como entrada de pedidos, nómina, factura, fabricación, servicio al cliente. clientes.

A diferencia de los sistemas OLTP, que fueron creados para procesos basados ​​en transacciones y eventos, yo almacenamiento de datos fueron creados para brindar soporte a procesos basados ​​en análisis adquirir y procesos de toma de decisiones.

Esto normalmente se logra integrando i adquirir desde varios sistemas OLTP y externos en un único “contenedor” de adquirir, como se discutió en la sección anterior.

Modelo de proceso de almacenamiento de datos de Monash

El modelo de proceso para almacenamiento de datos Monash fue desarrollado por investigadores del Monash DSS Research Group y se basa en la literatura de almacenamiento de datos, sobre la experiencia en el apoyo al desarrollo de campos de sistemas, sobre discusiones con proveedores de aplicaciones para su uso en almacenamiento de datos, sobre un grupo de expertos en el uso de almacenamiento de datos.

Las fases son: Iniciación, Planificación, Desarrollo, Operaciones y Explicaciones. El diagrama explica la naturaleza iterativa o evolutiva del desarrollo de un almacenamiento de datos proceso mediante flechas bidireccionales colocadas entre las diferentes fases. En este contexto, “iterativo” y “evolutivo” significan que, en cada paso del proceso, las actividades de implementación siempre pueden propagarse hacia atrás, hacia la fase anterior. Esto se debe a la naturaleza del proyecto. almacenamiento de datos en el que en cualquier momento surjan solicitudes adicionales por parte del usuario final. Por ejemplo, durante la fase de desarrollo de un proceso. almacenamiento de datos, si el usuario final solicita una nueva dimensión o área temática, que no formaba parte del plan original, esta deberá ser agregada al sistema. Esto provoca un cambio en el proyecto. El resultado es que el equipo de diseño debe cambiar los requisitos de los documentos creados hasta el momento durante la fase de diseño. En muchos casos, el estado actual del proyecto debe retroceder a la fase de diseño donde se debe agregar y documentar el nuevo requisito. El usuario final debe poder ver la documentación específica revisada y los cambios que se han realizado en la fase de desarrollo. Al final de este ciclo de desarrollo, el proyecto debe obtener excelentes comentarios tanto del equipo de desarrollo como del de usuarios. Luego, los comentarios se reutilizan para mejorar un proyecto futuro.

Planificación de capacidad
Los Dw tienden a ser muy grandes y crecer muy rápidamente (Best 1995, Rudin 1997a) como resultado de la cantidad de adquirir historias que conservan desde su duración. El crecimiento también puede ser causado por adquirir adiciones solicitadas por los usuarios para aumentar el valor de adquirir que ya tienen. En consecuencia, los requisitos de almacenamiento para adquirir puede mejorarse significativamente (Eckerson 1997). Por lo tanto, es esencial garantizar, mediante la planificación de la capacidad, que el sistema que se está construyendo pueda crecer a medida que aumentan las necesidades (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
Al planificar la escalabilidad de la base de datos, se debe conocer el crecimiento esperado en el tamaño del almacén, los tipos de consultas que probablemente se realizarán y el número de usuarios finales admitidos (Best 1995, Rudin 1997b, Foley 1997a). La creación de aplicaciones escalables requiere una combinación de tecnologías de servidor escalables y técnicas de diseño de aplicaciones escalables (Best 1995, Rudin 1997b. Ambas son necesarias para crear una aplicación altamente escalable. Las tecnologías de servidor escalables pueden hacer que sea fácil y ventajoso agregar almacenamiento, memoria y CPU sin degradar rendimiento (Lang 1997, Telephony 1997).

Hay dos tecnologías principales de servidores escalables: procesamiento múltiple simétrico (SMP) y procesamiento masivo paralelo (MPP) (IDC 1997, Humphries et al. 1999). Un servidor SMP normalmente tiene múltiples procesadores que comparten una memoria, un bus del sistema y otros recursos (IDC 1997, Humphries et al. 1999). Se pueden agregar procesadores adicionales para aumentar su potenza computacional. Otro método para aumentar la potenza del servidor SMP, es combinar numerosas máquinas SMP. Esta técnica se conoce como agrupación (Humphries et al. 1999). Un servidor MPP, por otro lado, tiene múltiples procesadores, cada uno con su propia memoria, sistema de bus y otros recursos (IDC 1997, Humphries et al. 1999). Cada procesador se llama nodo. Un aumento en potenza se puede lograr computacional

agregar nodos adicionales a los servidores MPP (Humphries et al. 1999).

Una debilidad de los servidores SMP es que demasiadas operaciones de entrada y salida (E/S) pueden congestionar el bus del sistema (IDC 1997). Este problema no ocurre dentro de los servidores MPP ya que cada procesador tiene su propio sistema de bus. Sin embargo, las interconexiones entre cada nodo son generalmente mucho más lentas que las del sistema de bus SMP. Además, los servidores MPP pueden añadir un nivel adicional de complejidad a los desarrolladores de aplicaciones (IDC 1997). Por lo tanto, la elección entre servidores SMP y MPP puede verse influenciada por muchos factores, incluida la complejidad de las aplicaciones, la relación precio/rendimiento, la capacidad de procesamiento requerida, las aplicaciones dw evitadas y el aumento del tamaño del servidor. base de datos de dw y en el número de usuarios finales.

Se pueden emplear numerosas técnicas de diseño de aplicaciones escalables en la planificación de capacidad. Se utilizan varios períodos de notificación, como días, semanas, meses y años. Al tener varios plazos de notificación, el base de datos se puede dividir en partes agrupadas de manera manejable (Inmon et al. 1997). Otra técnica es utilizar tablas resumen que se construyen resumiendo adquirir da adquirir detallado. Por lo tanto, yo adquirir Los resumidos son más compactos que los detallados, lo que requiere menos espacio de memoria. Entonces el adquirir Muchos detalles se pueden almacenar en una unidad de almacenamiento menos costosa, lo que ahorra aún más espacio de almacenamiento. Aunque el uso de tablas de resumen puede ahorrar espacio en la memoria, requiere mucho esfuerzo para mantenerlas actualizadas y alineadas con las necesidades comerciales. Sin embargo, esta técnica se utiliza ampliamente y a menudo se utiliza junto con la técnica anterior (Best 1995, Inmon 1996a, Chauduri y Dayal
1997).

Definición Almacenamiento de Datos Arquitecturas Técnicas Definición de técnicas de arquitectura dw.

Los primeros en adoptar el almacenamiento de datos concibieron principalmente una implementación centralizada del dw en la que todos los adquirir, incluido yo adquirir externos, se integraron en un solo,
repositorio físico (Inmon 1996a, Bresnahan 1996, Peacock 1998).

La principal ventaja de este enfoque es que los usuarios finales pueden acceder a la vista de toda la empresa del adquirir organizacional (Ovum 1998). Otra ventaja es que ofrece estandarización de adquirir a través de la organización, lo que significa que hay sólo una versión o definición para cada terminología utilizada en el repositorio dw (metadatos) (Flanagan y Safdie 1997, Ovum 1998). La desventaja de este enfoque, por otra parte, es que es caro y difícil de construir (Flanagan y Safdie 1997, Ovum 1998, Inmon et al. 1998). Poco después de la arquitectura de almacenamiento adquirir centralizado se hizo popular, el concepto de extraer subconjuntos más pequeños de los evolucionados adquirir para apoyar las necesidades de aplicaciones específicas (Varney 1996, IDC 1997, Berson y Smith 1997, peacock 1998). Estos pequeños sistemas son derivados del más grande. almacenamiento de datos centralizado. ellos son nombrados almacenamiento de datos data marts dependientes departamentales o dependientes. La arquitectura del data mart dependiente se conoce como arquitectura de tres niveles, donde el primer nivel consta del almacenamiento de datos centralizada, la segunda está formada por los depósitos de adquirir departamental y el tercero consiste en el acceso a adquirir y por herramientas de análisis (Demarest 1994, Inmon et al. 1997).

Los data marts normalmente se construyen después de almacenamiento de datos centralizado se construyó para satisfacer las necesidades de unidades específicas (White 1995, Varney 1996).
Tienda de data marts i adquirir muy relevante en relación con unidades particulares (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

La ventaja de este método es que no habrá fecha no integrado y que yo adquirir será menos redundante dentro de los mercados de datos ya que todos adquirir provienen de un depósito de adquirir integrado. Otra ventaja es que habrá pocas conexiones entre cada data mart y sus fuentes. adquirir porque cada mercado de datos tiene sólo una fuente de adquirir. Además, con esta arquitectura implementada, los usuarios finales aún pueden acceder a la descripción general de adquirir

organizaciones corporativas. Este método se conoce como método de arriba hacia abajo, donde los data marts se construyen después de la almacenamiento de datos (pavo real 1998, Goff 1998).
Al aumentar la necesidad de mostrar resultados tempranamente, algunas organizaciones han comenzado a construir mercados de datos independientes (Flanagan y Safdie 1997, White 2000). En este caso, los mercados de datos tienen su propio adquirir directamente de los fundamentos de adquirir OLTP y no desde el almacén centralizado e integrado, eliminando así la necesidad de tener el almacén central en sitio.

Cada data mart requiere al menos un enlace a sus fuentes adquirir. Una desventaja de tener múltiples conexiones para cada data mart es que, en comparación con las dos arquitecturas anteriores, la sobreabundancia de adquirir aumenta significativamente.

Cada data mart debe almacenar todos adquirir requerido localmente para no tener ningún efecto en los sistemas OLTP. Esto provoca que yo adquirir se almacenan en diferentes mercados de datos (Inmon et al. 1997). Otra desventaja de esta arquitectura es que conduce a la creación de interconexiones complejas entre los mercados de datos y sus fuentes de datos. adquirir que son difíciles de realizar y controlar (Inmon et al. 1997).

Otra desventaja es que los usuarios finales no pueden acceder a la descripción general de la información de la empresa porque adquirir de los diferentes mercados de datos no están integrados (Ovum 1998).
Otra desventaja más es que puede haber más de una definición para cada terminología utilizada en los mercados de datos, lo que genera inconsistencias en los términos. adquirir en la organización (Ovum 1998).
A pesar de las desventajas discutidas anteriormente, los mercados de datos independientes todavía atraen el interés de muchas organizaciones (IDC 1997). Un factor que los hace atractivos es que se desarrollan más rápidamente y requieren menos tiempo y recursos (Bresnahan 1996, Berson y Smith 1997, Ovum 1998). En consecuencia, sirven principalmente como proyectos de prueba que pueden usarse para identificar rápidamente beneficios y/o imperfecciones en el proyecto (Parsaye 1995, Braly 1995, Newing 1996). En este caso, la parte a implementar en el proyecto piloto debe ser pequeña pero importante para la organización (Newing 1996, Mansell-Lewis 1996).

Al examinar el prototipo, los usuarios finales y la administración pueden decidir si continuar o detener el proyecto (Flanagan y Safdie 1997).
Si se va a continuar con la decisión, los mercados de datos para otras industrias deberían construirse uno a la vez. Hay dos opciones para los usuarios finales según sus necesidades en la construcción de matrices de datos independientes: integrada/federada y no integrada (Ovum 1998)

En el primer método, cada nuevo data mart debe construirse en función de los data marts actuales y el modelo. adquirir utilizado por la empresa (Varney 1996, Berson y Smith 1997, Peacock 1998). La necesidad de utilizar el modelo. adquirir de la empresa significa que se debe garantizar que haya sólo una definición para cada terminología utilizada en los mercados de datos, también para garantizar que se puedan combinar diferentes mercados de datos para brindar una visión general de la información de la empresa (Bresnahan 1996). Este método se llama ascendente y es mejor cuando hay limitaciones de tiempo y medios financieros (Flanagan y Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). En el segundo método, los data marts construidos sólo pueden satisfacer las necesidades de una unidad específica. Una variante del mercado de datos federado es el almacenamiento de datos distribuido en el que el base de datos El middleware del servidor del concentrador se utiliza para fusionar muchos data marts en un único repositorio. adquirir distribuido (White 1995). En este caso, yo adquirir Las empresas están distribuidas en varios mercados de datos. Las solicitudes de los usuarios finales se transmiten a base de datos middleware del concentrador del servidor, que extrae todos adquirir solicitado por los mercados de datos y devuelve los resultados a las aplicaciones del usuario final. Este método proporciona información comercial a los usuarios finales. Sin embargo, los problemas de los mercados de datos independientes aún no se han eliminado. Hay otra arquitectura que se puede utilizar que se llama almacenamiento de datos virtual (Blanco 1995). Sin embargo, esta arquitectura, que se describe en la Figura 2.9, no es una arquitectura de almacenamiento de datos. adquirir real ya que no mueve la carga de los sistemas OLTP a almacenamiento de datos (Demarest 1994).

De hecho, las solicitudes de adquirir por los usuarios finales se pasan a sistemas OLTP que devuelven resultados después de procesar las solicitudes de los usuarios. Aunque esta arquitectura permite a los usuarios finales generar informes y realizar solicitudes, no puede proporcionar la

adquirir historial y descripción general de la información de la empresa desde adquirir de los diferentes sistemas OLTP no están integrados. Por lo tanto, esta arquitectura no puede satisfacer el análisis de adquirir complejos como las previsiones.

Selección de aplicaciones de acceso y recuperación. adquirir

El propósito de construir un almacenamiento de datos es transmitir información a los usuarios finales (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); una o más aplicaciones de acceso y recuperación adquirir debe ser provisto. Hasta la fecha, existe una amplia variedad de estas aplicaciones entre las que el usuario puede elegir (Hammergren 1998, Humphries et al. 1999). Las aplicaciones que seleccione determinan el éxito de su esfuerzo de almacenamiento. adquirir en una organización porque las aplicaciones son la parte más visible del almacenamiento de datos al usuario final (Inmon et al 1997, Poe 1996). Para tener éxito un almacenamiento de datos, debe ser capaz de soportar las actividades de análisis de adquirir del usuario final (Poe 1996, Seddon y Benjamin 1998, Eckerson 1999). Por lo tanto, se debe identificar el “nivel” de lo que quiere el usuario final (Poe 1996, Mattison 1996, Inmon et al 1997, Humphries et al 1999).

En general, los usuarios finales pueden agruparse en tres categorías: usuarios ejecutivos, analistas de negocios y usuarios avanzados (Poe 1996, Humphries et al. 1999). Los usuarios ejecutivos necesitan un fácil acceso a conjuntos de informes predefinidos (Humphries et al. 1999). Se puede acceder fácilmente a estas proporciones mediante el menú de navegación (Poe 1996). Además, los informes deben presentar información mediante representaciones gráficas, como tablas y plantillas, para transmitir información rápidamente (Humphries et al. 1999). Los analistas de negocios, que tal vez no tengan las capacidades técnicas para desarrollar informes desde cero por sí solos, necesitan poder modificar los informes actuales para satisfacer sus necesidades específicas (Poe 1996, Humphries et al. 1999). Los usuarios avanzados, por otro lado, son el tipo de usuarios finales que tienen la capacidad de generar y escribir solicitudes e informes desde cero (Poe 1996, Humphries et al. 1999). Ellos son los que

desarrollan informes para otros tipos de usuarios (Poe 1996, Humphries et al. 1999).

Una vez determinados los requisitos del usuario final, se debe realizar una selección de aplicaciones de acceso y recuperación. adquirir entre todos los disponibles (Poe 1996, Inmon et al. 1997).
El acceso a los adquirir y las herramientas de recuperación se pueden clasificar en 4 tipos: herramientas OLAP, herramientas EIS/DSS, herramientas de consulta e informes y herramientas de minería de datos.

Las herramientas OLAP permiten a los usuarios crear consultas ad hoc, así como aquellas realizadas en el base de datos de los almacenamiento de datos. Además, estos productos permiten a los usuarios profundizar desde adquirir generales a los detallados.

Las herramientas EIS/DSS proporcionan informes ejecutivos, como análisis "qué pasaría si" y acceso a informes basados ​​en menús. Los informes deben estar predefinidos y combinados con menús para facilitar la navegación.
Las herramientas de consultas y generación de informes permiten a los usuarios producir informes predefinidos y específicos.

Las herramientas de minería de datos se utilizan para identificar relaciones que podrían arrojar nueva luz sobre operaciones olvidadas en el adquirir del almacén de datos.

Además de optimizar los requerimientos de cada tipo de usuario, las herramientas seleccionadas deben ser intuitivas, eficientes y fáciles de usar. También deben ser compatibles con otras partes de la arquitectura y poder funcionar con los sistemas existentes. También se recomienda elegir herramientas de acceso y recuperación de datos con precios y rendimiento razonables. Otros criterios a considerar incluyen el compromiso del proveedor de la herramienta para respaldar su producto y los desarrollos que el mismo tendrá en futuras versiones. Para garantizar la participación del usuario en el uso del almacén de datos, el equipo de desarrollo involucra a los usuarios en el proceso de selección de herramientas. En este caso se debe realizar una evaluación práctica del usuario.

Para mejorar el valor del almacén de datos, el equipo de desarrollo también puede proporcionar acceso web a su almacén de datos. Un almacén de datos habilitado para la web permite a los usuarios acceder a adquirir desde lugares remotos o mientras viaja. También la información puede

proporcionarse a costos más bajos mediante una reducción de los costos de capacitación.

2.4.3 Almacenamiento de Datos Fase de operación

Esta fase consta de tres actividades: definición de estrategias de actualización de datos, control de las actividades del data warehouse y gestión de la seguridad del data warehouse.

Definición de estrategias de actualización de datos

Después de la carga inicial, yo adquirir en base de datos del almacén de datos deben actualizarse periódicamente para reproducir los cambios realizados en ellos adquirir originales. Por lo tanto, debe decidir cuándo actualizar, con qué frecuencia se debe programar la actualización y cómo actualizar los datos. adquirir. Se sugiere actualizar el adquirir cuándo el sistema se puede desconectar. La frecuencia de actualización la determina el equipo de desarrollo en función de los requisitos del usuario. Hay dos enfoques para actualizar el almacén de datos: la actualización completa y la carga continua de cambios.

El primer enfoque, actualización completa, requiere recargar todos adquirir desde cero. Esto significa que todos adquirir necesario debe ser extraído, limpiado, transformado e integrado en cada refresco. Este enfoque debería, en la medida de lo posible, evitarse porque requiere mucho tiempo y recursos.

Un enfoque alternativo es cargar cambios continuamente. Esto me suma adquirir que se han modificado desde el último ciclo de actualización del almacén de datos. La identificación de registros nuevos o modificados reduce significativamente la cantidad de adquirir que deben propagarse al almacén de datos en cada actualización, ya que solo estos adquirir se agregará a la base de datos del almacén de datos.

Hay al menos 5 enfoques que se pueden utilizar para retirarme. adquirir nuevo o modificado. Para obtener una estrategia de actualización de datos eficiente adquirir puede resultar útil una combinación de estos enfoques que capture todos los cambios en el sistema.

El primer enfoque, que utiliza marcas de tiempo, supone que todos están asignados adquirir editó y actualizó una marca de tiempo para que pueda identificar fácilmente todos adquirir modificado y nuevo. Sin embargo, este enfoque no se ha utilizado ampliamente en la mayoría de los sistemas operativos actuales.
El segundo enfoque es utilizar un archivo delta generado por una aplicación que contenga solo los cambios realizados en el adquirir. El uso de este archivo también amplifica el ciclo de actualización. Sin embargo, ni siquiera este método se ha utilizado en muchas aplicaciones.
El tercer método consiste en escanear un archivo de registro, que básicamente contiene información similar al archivo delta. La única diferencia es que se crea un archivo de registro para el proceso de recuperación y puede ser difícil de entender.
El cuarto enfoque es modificar el código de la aplicación. Sin embargo, la mayor parte del código de las aplicaciones es antiguo y frágil; por lo tanto, se debe evitar esta técnica.
El último enfoque es comparar el adquirir fuentes con el archivo dei principal adquirir.

Control de las actividades del almacén de datos

Una vez que el almacén de datos ha sido entregado a los usuarios, debe ser monitoreado a lo largo del tiempo. En este caso, el administrador del almacén de datos puede emplear una o más herramientas de gestión y control para monitorear el uso del almacén de datos. En particular, se puede recopilar información sobre las personas y el momento en que acceden al almacén de datos. Vamos adquirir recopilados, se puede crear un perfil del trabajo realizado que se puede utilizar como entrada en la implementación del contracargo del usuario. El contracargo permite a los usuarios estar informados sobre el costo de procesamiento del almacén de datos.

Además, la auditoría del almacén de datos también se puede utilizar para identificar los tipos de consultas, su tamaño, el número de consultas por día, los tiempos de reacción de las consultas, los sectores alcanzados y la cantidad de adquirir procesada. Otro propósito de realizar una auditoría del almacén de datos es identificar los adquirir que no están en uso. Estas adquirir se pueden eliminar del almacén de datos para mejorar el tiempo

respuesta de ejecución de consultas y control del crecimiento de adquirir que residen dentro del base de datos del almacén de datos.

Gestión de la seguridad del almacén de datos

Un almacén de datos contiene adquirir integrado, crítico, sensible y de fácil acceso. Por este motivo debe protegerse de usuarios no autorizados. Una forma de implementar la seguridad es utilizar la función del. DBMS para asignar diferentes privilegios a diferentes tipos de usuarios. De esta forma se deberá mantener un perfil de acceso para cada tipo de usuario. Otra forma de proteger el almacén de datos es cifrarlo como está escrito en el base de datos del almacén de datos. El acceso a los adquirir y las herramientas de recuperación deben descifrar el adquirir antes de presentar los resultados a los usuarios.

2.4.4 Almacenamiento de Datos Fase de implementación

Es la última fase del ciclo de implementación del almacén de datos. Las actividades a realizar en esta fase incluyen capacitar a los usuarios para utilizar el almacén de datos y realizar revisiones del almacén de datos.

Entrenamiento de usuario

La formación del usuario debe realizarse antes de acceder a la adquirir del almacén de datos y el uso de herramientas de recuperación. Generalmente, las sesiones deben comenzar con una introducción al concepto de almacenamiento. adquirir, el contenido del almacén de datos, el meta adquirir y las características básicas de las herramientas. Luego, los usuarios más avanzados también podrían estudiar las tablas físicas y las características del usuario de las herramientas de acceso y recuperación de datos.

Existen muchos enfoques para realizar la capacitación de usuarios. Uno de ellos implica una selección de muchos usuarios o analistas elegidos entre un conjunto de usuarios, en función de sus habilidades de liderazgo y comunicación. Reciben formación personal sobre todo lo que necesitan saber para familiarizarse con el sistema. Una vez finalizada la capacitación, regresan a sus trabajos y comienzan a enseñar a otros usuarios cómo utilizar el sistema. Sobre el

Según lo que han aprendido, otros usuarios pueden empezar a explorar el almacén de datos.
Otro enfoque consiste en formar a muchos usuarios al mismo tiempo, como si estuviera realizando un curso presencial. Este método es adecuado cuando hay muchos usuarios que necesitan ser capacitados al mismo tiempo. Otro método más consiste en formar a cada usuario individualmente, uno por uno. Este método es adecuado cuando hay pocos usuarios.

El objetivo de la formación del usuario es familiarizarle con el acceso a la adquirir y herramientas de recuperación, así como el contenido del almacén de datos. Sin embargo, algunos usuarios pueden sentirse abrumados por la cantidad de información proporcionada durante la sesión de formación. Por lo tanto, se deben realizar un cierto número de sesiones de actualización para una asistencia continua y para responder preguntas específicas. En algunos casos se forma un grupo de usuarios para brindar este tipo de soporte.

Recopilación de comentarios

Una vez que se haya implementado el almacén de datos, los usuarios pueden utilizar i adquirir que residen en el almacén de datos para diversos fines. Principalmente, los analistas o usuarios usan i adquirir en el almacén de datos para:

  1. 1  Identificar las tendencias de la empresa
  2. 2  Analizar los perfiles de compra de clientes
  3. 3  Dividir i clientes y
  4. 4  Brindar los mejores servicios a clientes - personalizar servicios
  5. 5  Formular estrategias Marketing
  6. 6  Produzca cotizaciones competitivas para análisis de costos y ayude a controlar
  7. 7  Apoyar la toma de decisiones estratégicas
  8. 8  Identificar oportunidades para destacar
  9. 9  Mejorar la calidad de los procesos empresariales actuales
  10. 10  Comprueba el beneficio

Siguiendo la dirección de desarrollo del almacén de datos, se podrían realizar una serie de revisiones del sistema para obtener comentarios.

tanto del equipo de desarrollo como de la comunidad de usuarios finales.
Los resultados obtenidos se pueden tener en cuenta para el próximo ciclo de desarrollo.

Dado que el almacén de datos tiene un enfoque incremental, es fundamental aprender de los éxitos y errores de desarrollos anteriores.

2.5 Resumen

En este capítulo se han discutido los enfoques presentes en la literatura. En la sección 1, se discutió el concepto de almacén de datos y su papel en la ciencia de la toma de decisiones. La sección 2 describió las principales diferencias entre los almacenes de datos y los sistemas OLTP. En la sección 3 analizamos el modelo de almacén de datos de Monash que se utilizó en la sección 4 para describir las actividades involucradas en el proceso de desarrollo de un almacén de datos; estas tesis no se basaron en una investigación rigurosa. Lo que sucede en la realidad puede ser muy diferente de lo que informa la literatura; sin embargo, estos resultados pueden usarse para crear una base básica que subraye el concepto de almacén de datos para esta investigación.

Capítulo 3

Métodos de investigación y diseño

Este capítulo aborda los métodos de investigación y diseño para este estudio. La primera parte muestra una visión genérica de los métodos de investigación disponibles para recuperar información y se discuten los criterios para seleccionar el mejor método para un estudio en particular. En la sección 2 se discuten luego dos métodos seleccionados con los criterios recién expuestos; de ellos, se elegirá y adoptará uno con las razones expuestas en el apartado 3 donde también se exponen los motivos de exclusión del otro criterio. La sección 4 presenta el diseño de la investigación y la sección 5 las conclusiones.

3.1 Investigación en sistemas de información

La investigación en sistemas de información no se limita simplemente al campo tecnológico, sino que también debe ampliarse para incluir fines comportamentales y organizativos.
Esto se lo debemos a las tesis de diversas disciplinas que van desde las ciencias sociales hasta las naturales; Esto conduce a la necesidad de utilizar un cierto espectro de métodos de investigación que incluyan métodos cuantitativos y cualitativos para los sistemas de información.
Todos los métodos de investigación disponibles son importantes, de hecho varios investigadores como Jenkins (1985), Nunamaker et al. (1991) y Galliers (1992) sostienen que no existe un método universal específico para realizar investigaciones en los diversos campos de los sistemas de información; de hecho, un método puede ser adecuado para una investigación particular pero no para otras. Esto nos trae la necesidad de seleccionar un método que sea adecuado para nuestro proyecto de investigación particular: para esta elección Benbasat et al. (1987) afirman que se debe considerar la naturaleza y el propósito de la investigación.

3.1.1 Naturaleza de la investigación

Los diversos métodos basados ​​en la naturaleza de la investigación se pueden clasificar en tres tradiciones ampliamente conocidas en las ciencias de la información: investigación positivista, interpretativa y crítica.

3.1.1.1 Investigación positivista

La investigación positivista también se conoce como estudio científico o empírico. Busca: “explicar y predecir lo que sucederá en el mundo social observando las regularidades y las relaciones causa-efecto entre los elementos que lo constituyen” (Shanks et al 1993).

La investigación positivista también se caracteriza por la repetibilidad, las simplificaciones y las refutaciones. Además, la investigación positivista admite la existencia de relaciones a priori entre los fenómenos estudiados.
Según Galliers (1992) la taxonomía es un método de investigación incluido en el paradigma positivista, que sin embargo no se limita a este, de hecho existen experimentos de laboratorio, experimentos de campo, estudios de casos, demostraciones de teoremas, predicciones y simulaciones. Al utilizar estos métodos, los investigadores admiten que los fenómenos estudiados pueden observarse de manera objetiva y rigurosa.

3.1.1.2 Investigación interpretativa

La investigación interpretativa, a menudo llamada fenomenología o antipositivismo, es descrita por Neuman (1994) como “el análisis sistemático del significado social de la acción a través de la observación directa y detallada de las personas en situaciones naturales, con el fin de llegar a una comprensión y a la interpretación de cómo las personas crean y mantienen su mundo social”. Los estudios interpretativos rechazan el supuesto de que los fenómenos observados puedan observarse objetivamente. De hecho, se basan en interpretaciones subjetivas. Además, los investigadores interpretativos no imponen significados a priori a los fenómenos que estudian.

Este método incluye estudios subjetivos/argumentativos, investigación-acción, estudios descriptivos/interpretativos, investigaciones futuras y juegos de roles. Además de estas encuestas, se pueden incluir estudios de casos en este enfoque, ya que se refieren a estudios de individuos u organizaciones dentro de situaciones complejas del mundo real.

3.1.1.3 Investigación crítica

La investigación crítica es el enfoque menos conocido en las ciencias sociales, pero recientemente ha recibido atención por parte de los investigadores de sistemas de información. El supuesto filosófico de que la realidad social es históricamente producida y reproducida por las personas, así como por los sistemas sociales con sus acciones e interacciones. Sin embargo, su capacidad está mediada por una serie de consideraciones sociales, culturales y políticas.

Al igual que la investigación interpretativa, la investigación crítica sostiene que la investigación positivista no tiene nada que ver con el contexto social e ignora su influencia en las acciones humanas.
La investigación crítica, por otro lado, critica la investigación interpretativa por ser demasiado subjetiva y por no apuntar a ayudar a las personas a mejorar sus vidas. La mayor diferencia entre la investigación crítica y los otros dos enfoques es su dimensión evaluativa. Mientras que la objetividad de las tradiciones positivistas e interpretativas es predecir o explicar el status quo o la realidad social, la investigación crítica apunta a evaluar y transformar críticamente la realidad social bajo estudio.

Los investigadores críticos suelen oponerse al status quo para eliminar las diferencias sociales y mejorar las condiciones sociales. La investigación crítica apuesta por una visión procesual de los fenómenos de interés y, por tanto, es normalmente longitudinal. Ejemplos de métodos de investigación son los estudios históricos a largo plazo y los estudios etnográficos. Sin embargo, la investigación crítica no se ha utilizado ampliamente en la investigación de sistemas de información.

3.1.2 Propósito de la investigación

Junto con la naturaleza de la investigación, su propósito puede usarse para guiar al investigador en la selección de un método de investigación particular. El propósito de un proyecto de investigación está estrechamente relacionado con la posición de la investigación en relación con el ciclo de investigación, que consta de tres fases: construcción de la teoría, prueba de la teoría y refinamiento de la teoría. Así, según el momento del ciclo de investigación, un proyecto de investigación puede tener un propósito explicativo, descriptivo, exploratorio o predictivo.

3.1.2.1 Investigación exploratoria

La investigación exploratoria tiene como objetivo investigar un tema totalmente nuevo y formular preguntas e hipótesis para futuras investigaciones. Este tipo de investigación se utiliza en la construcción de teorías para obtener referencias iniciales en un área nueva. Normalmente se utilizan métodos de investigación cualitativos, como estudios de casos o estudios fenomenológicos.

Sin embargo, también es posible emplear técnicas cuantitativas como encuestas o experimentos exploratorios.

3.1.3.3 Investigación descriptiva

La investigación descriptiva tiene como objetivo analizar y describir con gran detalle una situación o práctica organizacional particular. Esto es apropiado para construir teorías y también puede usarse para confirmar o cuestionar hipótesis. La investigación descriptiva suele incluir el uso de medidas y muestras. Los métodos de investigación más adecuados incluyen encuestas y análisis de antecedentes.

3.1.2.3 Investigación explicativa

La investigación explicativa intenta explicar por qué suceden las cosas. Se basa en hechos que ya han sido estudiados y trata de encontrar las razones de estos hechos.
Por lo tanto, la investigación explicativa normalmente se basa en la investigación exploratoria o descriptiva y es auxiliar para probar y refinar teorías. La investigación explicativa normalmente emplea estudios de casos o métodos de investigación basados ​​en encuestas.

3.1.2.4 Investigación preventiva

La investigación preventiva tiene como objetivo predecir los eventos y comportamientos observados que se están estudiando (Marshall y Rossman 1995). La predicción es la prueba científica estándar de la verdad. Este tipo de investigación generalmente emplea encuestas o análisis de adquirir historiadores. (Yin 1989)

La discusión anterior demuestra que existen varios métodos de investigación posibles que pueden usarse en un estudio en particular. Sin embargo, debe haber un método específico que sea más adecuado que los demás para un tipo particular de proyecto de investigación. (Galliers 1987, Yin 1989, De Vaus 1991). Por lo tanto, cada investigador debe evaluar cuidadosamente las fortalezas y debilidades de varios métodos, con el fin de adoptar el método de investigación más adecuado y compatible con el proyecto de investigación. (Jenkins 1985, Pervan y Klass 1992, Bonomia 1985, Yin 1989, Himilton e Ives 1992).

3.2. Posibles métodos de investigación

El objetivo de este proyecto fue estudiar la experiencia en organizaciones australianas con i adquirir almacenado con un desarrollo de almacenamiento de datos. Fecha que, actualmente, existe una falta de investigación en el área de data warehousing en Australia, este proyecto de investigación aún se encuentra en la fase teórica del ciclo de investigación y tiene un propósito exploratorio. Explorar la experiencia de las organizaciones australianas que adoptan el almacenamiento de datos requiere una interpretación de la sociedad real. En consecuencia, el supuesto filosófico que subyace al proyecto de investigación sigue la interpretación tradicional.

Después de un examen riguroso de los métodos disponibles, se identificaron dos posibles métodos de investigación: encuestas y estudios de casos, que pueden usarse para investigaciones exploratorias (Shanks et al. 1993). Galliers (1992) defiende la idoneidad de estos dos métodos para este estudio particular en su taxonomía revisada diciendo que son adecuados para la construcción de teorías. Las siguientes dos subsecciones analizan cada método en detalle.

3.2.1 Método de investigación investigación

El método de investigación por encuestas proviene del antiguo método del censo. Un censo consiste en recoger información de toda una población. Este método es caro y poco práctico, especialmente si la población es grande. Así, en comparación con un censo, una encuesta normalmente se centra en recopilar información para un pequeño número, o muestra, de representantes de la población (Fowler 1988, Neuman 1994). Una muestra refleja la población de la que se extrae, con diferentes niveles de precisión, dependiendo de la estructura de la muestra, el tamaño y el método de selección utilizado (Fowler 1988, Babbie 1982, Neuman 1994).

El método de encuesta se define como "instantáneas de prácticas, situaciones o puntos de vista en un momento determinado, realizadas mediante cuestionarios o entrevistas, a partir de las cuales se pueden extraer inferencias".
made” (Galliers 1992:153) [instantánea de prácticas, situaciones o puntos de vista en un momento particular, realizada mediante cuestionarios o entrevistas, a partir de las cuales se pueden hacer inferencias]. Las encuestas tratan de recopilar información sobre algún aspecto del estudio, de un cierto número de participantes, mediante preguntas (Fowler 1988). Estos cuestionarios y entrevistas, que incluyen entrevistas telefónicas presenciales y estructuradas, son también las técnicas de recogida de datos. adquirir Aunque se emplean más comúnmente en investigaciones (Blalock 1970, Nachmias y Nachmias 1976, Fowler 1988), se pueden utilizar observaciones y análisis (Gable 1994). De todos estos métodos de recolección de adquirir, el uso del cuestionario es la técnica más popular, ya que asegura que adquirir

Los datos recopilados están estructurados y formateados, lo que facilita la clasificación de la información (Hwang 1987, de Vaus 1991).

Al analizar el adquirir, una estrategia de investigación a menudo emplea técnicas cuantitativas, como el análisis estadístico, pero también se pueden utilizar técnicas cualitativas (Galliers 1992, Pervan

y Klass 1992, Gable 1994). Normalmente yo adquirir Los datos recopilados se utilizan para analizar distribuciones y patrones de asociaciones (Fowler 1988).

Si bien las encuestas son generalmente apropiadas para consultas que abordan o surgen de la pregunta "¿qué?", ​​como "cuánto" y "cuántos", se pueden formular a través de la pregunta "por qué" (Sonquist y Dunkelberg 1977, Yin 1989). . Según Sonquist y Dunkelberg (1977), la investigación de indagación tiene como objetivo desafiar hipótesis, evaluar programas, describir la población y desarrollar modelos de comportamiento humano. Además, las encuestas pueden utilizarse para estudiar la opinión, las condiciones, las opiniones, las características, las expectativas e incluso los comportamientos pasados ​​o presentes de una determinada población (Neuman 1994).

Las encuestas permiten al investigador descubrir relaciones entre la población y los resultados normalmente son más generales que otros métodos (Sonquist y Dunkelberg 1977, Gable 1994). Las encuestas permiten a los investigadores cubrir un área geográfica más amplia y llegar a muchos encuestados (Blalock 1970, Sonquist y Dunkelberg 1977, Hwang y Lin 1987, Gable 1994, Neuman 1994). Finalmente, las encuestas pueden proporcionar información que no está disponible en otros lugares o en la forma requerida para los análisis (Fowler 1988).

Sin embargo, existen algunas limitaciones a la hora de realizar una encuesta. Una desventaja es que el investigador no puede obtener mucha información sobre el objeto estudiado. Esto se debe a que las encuestas se realizan sólo en un momento determinado y, por lo tanto, hay un número limitado de variables y personas que el investigador puede

estudio (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Otra desventaja es que realizar una encuesta puede resultar muy costoso en términos de tiempo y recursos, especialmente si implica entrevistas cara a cara (Fowler 1988).

3.2.2. Método de investigación de investigación

El método de investigación por indagación implica el estudio en profundidad de una situación particular dentro de su contexto del mundo real durante un período de tiempo definido, sin ninguna intervención por parte del investigador (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Principalmente este método se utiliza para describir las relaciones entre las variables que se están estudiando en una situación particular (Galliers 1992). Las investigaciones pueden involucrar casos únicos o múltiples, dependiendo del fenómeno analizado (Franz y Robey 1987, Eisenhardt 1989, Yin 1989).

El método de investigación por indagación se define como “una investigación empírica que estudia un fenómeno contemporáneo dentro de su contexto real, utilizando múltiples fuentes recopiladas de una o más entidades como personas, grupos u organizaciones” (Yin 1989). No existe una separación clara entre el fenómeno y su contexto y no existe control o manipulación experimental de las variables (Yin 1989, Benbasat et al. 1987).

Existe una variedad de técnicas para la recolección de adquirir que pueden emplearse en el método de indagación, que incluye observaciones directas, revisiones de registros de archivo, cuestionarios, revisión de documentación y entrevistas estructuradas. Tener una amplia gama de técnicas de recolección. adquirir, las investigaciones permiten a los investigadores abordar ambos adquirir cualitativo y cuantitativo al mismo tiempo (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Como es el caso con el método de indagación, un investigador de indagación actúa como observador o investigador y no como participante activo en la organización bajo estudio.

Benbasat y otros (1987) afirman que el método de investigación es particularmente adecuado para construir una teoría de investigación, que comienza con una pregunta de investigación y continúa con la educación.

de una teoría durante el proceso de recopilación adquirir. Siendo también apto para el escenario.

En el ámbito de la construcción de teorías, Franz y Robey (1987) sugieren que el método de indagación también puede utilizarse para la fase de teoría compleja. En este caso, a partir de la evidencia recopilada, se verifica o refuta una determinada teoría o hipótesis. Además, la encuesta también es adecuada para investigaciones que aborden preguntas de "cómo" o "por qué" (Yin 1989).

En comparación con otros métodos, las encuestas permiten al investigador capturar información esencial con más detalle (Galliers 1992, Shanks et al. 1993). Además, las encuestas permiten al investigador comprender la naturaleza y complejidad de los procesos estudiados (Benbasat et al. 1987).

Hay cuatro desventajas principales asociadas con el método de encuesta. La primera es la falta de deducciones controladas. La subjetividad del investigador puede alterar los resultados y conclusiones del estudio (Yin 1989). La segunda desventaja es la falta de observación controlada. A diferencia de los métodos experimentales, el investigador de investigación no puede controlar los fenómenos estudiados tal como se examinan en su contexto natural (Gable 1994). La tercera desventaja es la falta de replicabilidad. Esto se debe a que es poco probable que el investigador observe los mismos eventos y no puede verificar los resultados de un estudio en particular (Lee 1989). Finalmente, como consecuencia de la no replicabilidad, es difícil generalizar los resultados obtenidos de una o más investigaciones (Galliers 1992, Shanks et al 1993). Todos estos problemas, sin embargo, no son insuperables y, de hecho, el investigador puede minimizarlos aplicando las acciones apropiadas (Lee 1989).

3.3. Justificar la metodología de investigación adoptado

De los dos métodos de investigación posibles para este estudio, se considera que el método de encuesta es el más adecuado. La investigación fue descartada tras una cuidadosa consideración de las pertinentes.

méritos y debilidades. La idoneidad o inadecuación de cada método para este estudio se analiza a continuación.

3.3.1. Método de investigación inadecuado de consulta

El método de investigación requiere un estudio en profundidad sobre una situación particular dentro de una o más organizaciones durante un período de tiempo (Eisenhardt 1989). En este caso, el plazo podrá exceder el plazo previsto para este estudio. Otra razón para no adoptar el método de encuesta es que los resultados pueden adolecer de falta de rigor (Yin 1989). La subjetividad del investigador puede influir en los resultados y conclusiones. Otra razón es que este método es más adecuado para investigaciones sobre preguntas del tipo "cómo" o "por qué" (Yin 1989), mientras que la pregunta de investigación para este estudio es del tipo "qué". Por último, pero no menos importante, es difícil generalizar los resultados de una o unas pocas investigaciones (Galliers 1992, Shanks et al. 1993). Con base en este razonamiento, no se eligió el método de investigación por encuestas porque no era adecuado para este estudio.

3.3.2. Conveniencia del método de investigación. estudio

Cuando se realizó esta investigación, las organizaciones australianas no habían adoptado ampliamente la práctica del almacenamiento de datos. Por lo tanto, no había mucha información sobre su implementación dentro de las organizaciones australianas. La información disponible provino de organizaciones que habían implementado o utilizado un almacenamiento de datos. En este caso, el método de investigación por encuestas es el más adecuado ya que permite obtener información que no está disponible en otros lugares ni en la forma requerida para el análisis (Fowler 1988). Además, el método de investigación por encuesta permite al investigador obtener una buena visión de las prácticas, situaciones o puntos de vista en un momento particular (Galliers 1992, Denscombe 1998). Se necesitaba una visión general para aumentar el conocimiento sobre la experiencia australiana en materia de almacenamiento de datos.

Además, Sonquist y Dunkelberg (1977) afirman que los resultados de la investigación por encuestas son más generales que otros métodos.

3.4. Diseño de investigación de encuestas

La encuesta sobre prácticas de almacenamiento de datos se llevó a cabo en 1999. La población objetivo estuvo compuesta por organizaciones australianas interesadas en estudios de almacenamiento de datos, ya que probablemente ya estaban informadas sobre las prácticas de almacenamiento de datos. adquirir que almacenan y, por tanto, podrían aportar información útil para este estudio. La población objetivo se identificó con una encuesta inicial de todos los miembros australianos del Data Warehousing Institute (Tdwi-aap). Esta sección analiza el diseño de la fase de investigación empírica de este estudio.

3.4.1. Técnica de recogida de adquirir

De las tres técnicas comúnmente utilizadas en la investigación por encuestas (es decir, cuestionario por correo, entrevista telefónica y entrevista personal) (Nachmias 1976, Fowler 1988, de Vaus 1991), se adoptó el cuestionario por correo para este estudio. La primera razón para adoptar este último es que puede llegar a una población geográficamente dispersa (Blalock 1970, Nachmias y Nachmias 1976, Hwang y Lin 1987, de Vaus 1991, Gable 1994). En segundo lugar, el cuestionario por correo es adecuado para participantes con un alto nivel educativo (Fowler 1988). El cuestionario por correo para este estudio fue dirigido a los patrocinadores, directores y/o gerentes de proyectos de proyectos de almacenamiento de datos. En tercer lugar, los cuestionarios por correo son adecuados cuando se dispone de una lista de correo segura (Salant y Dilman 1994). TDWI, en este caso, una asociación confiable de almacenamiento de datos ha proporcionado la lista de correo de sus miembros australianos. Otra ventaja del cuestionario por correo sobre el cuestionario telefónico o las entrevistas personales es que permite a los encuestados responder con mayor precisión, particularmente cuando deben consultar notas o discutir preguntas con otras personas (Fowler 1988).

Una posible desventaja puede ser el tiempo necesario para realizar los cuestionarios por correo. Normalmente, una encuesta por correo se realiza en esta secuencia: enviar cartas, esperar respuestas y enviar confirmación (Fowler 1988, Bainbridge 1989). Por lo tanto, el tiempo total puede ser mayor que el tiempo requerido para las entrevistas personales o telefónicas. Sin embargo, el tiempo total se puede conocer de antemano (Fowler 1988, Denscombe 1998). El tiempo dedicado a realizar entrevistas personales no puede conocerse de antemano ya que varía de una entrevista a otra (Fowler 1988). Las entrevistas telefónicas pueden ser más rápidas que los cuestionarios postales y las entrevistas personales, pero pueden tener una alta tasa de falta de respuesta debido a la falta de disponibilidad de algunas personas (Fowler 1988). Además, las entrevistas telefónicas generalmente se limitan a listas de preguntas relativamente cortas (Bainbridge 1989).

Otra debilidad de un cuestionario por correo es la alta tasa de falta de respuesta (Fowler 1988, Bainbridge 1989, Neuman 1994). Sin embargo, se han tomado contramedidas al asociar este estudio con una institución confiable de almacenamiento de datos (es decir, TDWI) (Bainbridge 1989, Neuman 1994), que envía dos cartas recordatorias a quienes no respondieron (Fowler 1988, Neuman 1994) y también incluye una carta adicional. explicando el propósito del estudio (Neuman 1994).

3.4.2. Unidad de Análisis

El propósito de este estudio es obtener información sobre la implementación del almacenamiento de datos y su uso dentro de las organizaciones australianas. La población objetivo está formada por todas las organizaciones australianas que han implementado, o están implementando, i almacenamiento de datos. A continuación, las organizaciones individuales se registran a su nombre. El cuestionario fue enviado por correo postal a las organizaciones interesadas en adoptar almacenamiento de datos. Este método asegura que la información recopilada provenga de los recursos más adecuados de cada organización participante.

3.4.3. Muestra de encuesta

La “lista de correo” de los participantes de la encuesta se obtuvo de TDWI. De esta lista, se seleccionaron 3000 organizaciones australianas como base para el muestreo. Se envió a la muestra una carta adicional explicando el proyecto y el propósito de la encuesta, junto con una hoja de respuestas y un sobre prepago para devolver el cuestionario completado. De las 3000 organizaciones, 198 aceptaron participar en el estudio. Se esperaba un número tan pequeño de respuestas fecha la gran cantidad de organizaciones australianas que entonces habían adoptado o estaban adoptando la estrategia de almacenamiento de datos dentro de sus organizaciones. Por tanto, la población objetivo de este estudio está formada por sólo 198 organizaciones.

3.4.4. Contenido del cuestionario

La estructura del cuestionario se basó en el modelo de almacenamiento de datos de Monash (analizado anteriormente en la parte 2.3). El contenido del cuestionario se basó en el análisis de la literatura presentado en el capítulo 2. En el Apéndice B se puede encontrar una copia del cuestionario enviado a los participantes de la encuesta. El cuestionario consta de seis secciones, que siguen las fases del modelo cubiertas. Los siguientes seis párrafos resumen brevemente el contenido de cada sección.

Sección A: Información básica sobre la organización
Esta sección contiene preguntas relacionadas con el perfil de las organizaciones participantes. Además, algunas de las preguntas están relacionadas con el estado del proyecto de almacenamiento de datos del participante. Información confidencial como el nombre de la organización no fue revelada en el análisis de la encuesta.

Sección B: Inicio
Las preguntas de esta sección están relacionadas con la actividad de inicio del almacenamiento de datos. Se formularon preguntas sobre los iniciadores del proyecto, los garantes, las habilidades y conocimientos necesarios, los objetivos de desarrollo del almacenamiento de datos y las expectativas del usuario final.

Sección C: Diseño
Esta sección contiene preguntas relacionadas con la planificación de actividades. almacenamiento de datos. En particular, las preguntas fueron sobre el alcance de la ejecución, la duración del proyecto, el costo del proyecto y el análisis costo/beneficio.

Sección D: Desarrollo
En la sección de desarrollo hay preguntas relacionadas con las actividades de desarrollo de la almacenamiento de datos: recopilación de requisitos del usuario final, fuentes de adquirir, el modelo lógico de adquirir, prototipos, planificación de capacidades, arquitecturas técnicas y selección de herramientas de desarrollo de almacenamiento de datos.

Sección E: Operación
Cuestiones operativas relacionadas con el funcionamiento y extensibilidad del almacenamiento de datos, cómo evoluciona en la siguiente fase de desarrollo. Allá calidad de los datos, las estrategias de actualización de adquirir, la granularidad del adquirir, escalabilidad de almacenamiento de datos y los problemas de seguridad de almacenamiento de datos estaban entre los tipos de preguntas formuladas.

Sección F: Desarrollo
Esta sección contiene preguntas sobre el uso de la almacenamiento de datos por los usuarios finales. El investigador se interesó por el propósito y utilidad de la almacenamiento de datos, las estrategias de revisión y capacitación adoptadas y la estrategia de control de almacenamiento de datos adoptado.

3.4.5. Tasa de respuesta

Aunque las encuestas por correo son criticadas por tener una baja tasa de respuesta, se han tomado medidas para aumentar la tasa de respuesta (como se analizó anteriormente en la parte 3.4.1). El término "tasa de respuesta" se refiere al porcentaje de personas en una muestra de encuesta particular que responden al cuestionario (Denscombe 1998). Se utilizó la siguiente fórmula para calcular la tasa de respuesta de este estudio:

Número de personas que respondieron
Tasa de respuesta = ——————————————————————————– X 100 Número total de cuestionarios enviados

3.4.6. Prueba piloto

Antes de enviar el cuestionario a la muestra, las preguntas fueron examinadas mediante la realización de pruebas piloto, tal como sugieren Luck y Rubin (1987), Jackson (1988) y de Vaus (1991). El objetivo de las pruebas piloto es revelar expresiones y preguntas incómodas y ambiguas que sean difíciles de interpretar, aclarar las definiciones y términos utilizados e identificar el tiempo aproximado necesario para completar el cuestionario (Warwick y Lininger 1975, Jackson 1988, Salant y Dilman 1994). Las pruebas piloto se realizaron seleccionando sujetos con características similares a las de los sujetos finales, tal como sugiere Davis e Cosenza (1993). En este estudio, se seleccionaron seis profesionales del almacenamiento de datos como sujetos piloto. Después de cada prueba piloto, se hicieron las correcciones necesarias. A partir de las pruebas piloto realizadas, los participantes contribuyeron a remodelar y resetear la versión final del cuestionario.

3.4.7. Métodos de análisis Di Datos

I adquirir de las encuestas recopiladas a partir de cuestionarios cerrados se analizaron utilizando un paquete de programa estadístico llamado SPSS. Muchas de las respuestas se analizaron mediante estadística descriptiva. Varios cuestionarios fueron devueltos incompletos. Estos fueron tratados con mayor cuidado para garantizar que yo adquirir faltantes no fueron consecuencia de errores en el ingreso de datos, sino porque las preguntas no eran adecuadas para el solicitante de registro, o el solicitante de registro decidió no responder una o más preguntas específicas. Estas respuestas faltantes fueron ignoradas durante el análisis. adquirir y fueron codificados como '- 9' para asegurar su exclusión del proceso de análisis.

Al elaborar el cuestionario, las preguntas cerradas fueron precodificadas asignando un número a cada opción. El número se utilizó luego para preparar el adquirir durante el análisis (Denscombe 1998, Sapsford y Jupp 1996). Por ejemplo, había seis opciones enumeradas en la pregunta 1 de la sección B: junta directiva, alto ejecutivo, departamento de TI, unidad de negocios, consultores y otros. en el archivo de adquirir de SPSS, se generó una variable para indicar "el iniciador del proyecto", con seis etiquetas de valor: "1" para "junta directiva", "2" para "alto ejecutivo", etc. El uso de la escala Likertin en algunas de las preguntas cerradas también permitió una identificación sin esfuerzo dado el uso de los valores numéricos correspondientes ingresados ​​en SPSS. Para las preguntas con respuestas no exhaustivas, que no eran mutuamente excluyentes, cada opción se trató como una única variable con dos etiquetas de valor: '1' para 'marcado' y '2' para 'no marcado'.

Las preguntas abiertas se trataron de manera diferente a las cerradas. Las respuestas a estas preguntas no se ingresaron en SPSS. En cambio, fueron analizados a mano. El uso de este tipo de preguntas nos permite adquirir información sobre las ideas libremente expresadas y las experiencias personales de los encuestados (Bainbridge 1989, Denscombe 1998). Cuando fue posible, se realizó una categorización de las respuestas.

Para el análisis de adquirir, se utilizan métodos de análisis estadístico simples, como frecuencia de respuesta, media, desviación estándar y mediana (Argyrous 1996, Denscombe 1998).
La prueba Gamma funcionó bien para obtener medidas cuantitativas de las asociaciones entre adquirir ordinales (Norusis 1983, Argyrous 1996). Estas pruebas fueron apropiadas porque las escalas ordinales utilizadas no tenían muchas categorías y podían mostrarse en una tabla (Norusis 1983).

3.5 Resumen

En este capítulo, se discutieron la metodología de investigación y el diseño adoptado para este estudio.

La selección del método de investigación más apropiado para un estudio en particular tiene en cuenta
consideración de una serie de reglas, incluyendo la naturaleza y el tipo de investigación, así como los méritos y debilidades de cada método posible (Jenkins 1985, Benbasat et al. 1097, Galliers y Land 1987, yin 1989, Hamilton y ives 1992, Galliers 1992, Neuman 1994). Dada la falta de conocimientos y teorías existentes sobre la adopción del almacenamiento de datos en Australia, este estudio de investigación requiere un método de investigación interpretativo con capacidad exploratoria para explorar las experiencias de las organizaciones australianas. El método de investigación elegido fue el de recopilar información sobre la adopción del concepto de almacenamiento de datos por parte de las organizaciones australianas. Se optó por un cuestionario postal como técnica de recogida. adquirir. Justificaciones del método de investigación y técnica de recolección. adquirir seleccionados se proporcionarán en este capítulo. Además, se presentó una discusión sobre la unidad de análisis, la muestra utilizada, los porcentajes de respuestas, el contenido del cuestionario, el pretest del cuestionario y el método de análisis de los resultados. adquirir.

Diseñando un Almacenamiento de Datos:

Combinando relación entre entidades y modelado dimensional

RESUMEN
Tienda i adquirir es un tema importante de actualidad para muchas organizaciones. Una cuestión clave en el desarrollo del almacenamiento de alimentos. adquirir es su diseño.
El diseño debe soportar la detección de conceptos en la almacenamiento de datos al sistema heredado y otras fuentes de adquirir y también una fácil comprensión y eficiencia en la implementación de almacenamiento de datos.
Gran parte de la literatura sobre almacenamiento adquirir recomienda el uso de modelado entidad-relación o modelado dimensional para representar el diseño de almacenamiento de datos.
En este artículo mostramos cómo ambas representaciones se pueden combinar en un solo enfoque para dibujar. almacenamiento de datos. El enfoque utilizado es sistemáticamente

examinado en un estudio de caso y se identifica en una serie de implicaciones importantes para los profesionales.

ALMACENAMIENTO DE DATOS

Un almacenamiento de datos generalmente se define como una “recopilación de datos no volátil, integrada, variable en el tiempo y orientada a un sujeto en apoyo de las decisiones de la gerencia” (Inmon y Hackathorn, 1994). Orientado al sujeto e integrado indica que el almacenamiento de datos está diseñado para cruzar los límites funcionales de los sistemas Legaci para ofrecer una perspectiva integrada de adquirir.
La variante temporal afecta la naturaleza histórica o de serie temporal de adquirir en un almacenamiento de datos, que permite analizar las tendencias. No volátil indica que el almacenamiento de datos no se actualiza continuamente como un base de datos de OLTP. Más bien se actualiza periódicamente, con adquirir de fuentes internas y externas. La almacenamiento de datos está diseñado específicamente para buscar en lugar de actualizar la integridad y el rendimiento operativo.
La idea de almacenar i adquirir no es nuevo, era uno de los propósitos de gestión de adquirir desde la década de 1982 (Il Martin, XNUMX).
I almacenamiento de datos ellos ofrecen la infraestructura adquirir para sistemas de apoyo a la gestión. Los sistemas de apoyo a la gestión incluyen sistemas de apoyo a la toma de decisiones (DSS) y sistemas de información ejecutiva (EIS). Un DSS es un sistema de información basado en computadora que está diseñado para mejorar la toma de decisiones humanas. Un EIS suele ser un sistema de entrega de adquirir que permite a los líderes empresariales acceder fácilmente a la vista de adquirir.
La arquitectura general de un almacenamiento de datos destaca el papel de almacenamiento de datos en apoyo a la gestión. Además de ofrecer la infraestructura adquirir para EIS y DSS, al almacenamiento de datos se puede acceder directamente a través de consultas. EL adquirir incluido en un almacenamiento de datos se basan en un análisis de los requisitos de información de gestión y se obtienen de tres fuentes: sistemas internos heredados, sistemas de captura de datos con fines especiales y fuentes de datos externas. EL adquirir en los sistemas heredados internos con frecuencia son redundantes, inconsistentes, de baja calidad y se almacenan en diferentes formatos, por lo que deben conciliarse y limpiarse antes de que puedan cargarse en el sistema.

almacenamiento de datos (Inmon, 1992; McFadden, 1996). LA adquirir procedentes de sistemas de almacenamiento adquirir ad hoc y de fuentes adquirir externos se utilizan para aumentar (actualizar, reemplazar) i adquirir de sistemas heredados.

Hay muchas razones de peso para desarrollar un almacenamiento de datos, que incluyen una mejor toma de decisiones mediante el uso efectivo de más información (Ives 1995), el apoyo a un enfoque en acuerdos completos (Graham 1996) y reducciones en adquirir para EIS y DSS (Graham 1996, McFadden 1996).

Un estudio empírico reciente encontró, en promedio, un retorno de la inversión para almacenamiento de datos en un 401% después de tres años (Graham, 1996). Sin embargo, los otros estudios empíricos de almacenamiento de datos encontró problemas significativos que incluyen dificultad para medir y asignar beneficios, falta de un propósito claro, subestimación del propósito y complejidad del proceso de almacenamiento de beneficios. adquirir, en particular en lo que respecta a las fuentes y la limpieza de adquirir. almacenándome adquirir Puede considerarse como una solución al problema de gestión. adquirir entre organizaciones. La manipulación de adquirir como recurso social, ha seguido siendo uno de los problemas clave en la gestión de sistemas de información en todo el mundo durante muchos años (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

Un enfoque popular para administrar adquirir en los años ochenta fue el desarrollo de un modelo adquirir social. Modelo adquirir social fue diseñado para ofrecer una base estable para el desarrollo de nuevos sistemas de aplicaciones y base de datos y la reconstrucción e integración de sistemas heredados (Brancheau et al.

1989, Goodhue et al. 1988:1992, Kim y Everest 1994). Sin embargo, este enfoque plantea muchos problemas, en particular la complejidad y el coste de cada tarea, y el largo tiempo necesario para producir resultados tangibles (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997). ).

Il almacenamiento de datos es una base de datos separada que coexiste con bases de datos heredadas en lugar de reemplazarlas. Por lo tanto, le permite dirigir la gestión de adquirir y evitar la costosa reconstrucción de sistemas heredados.

ENFOQUES EXISTENTES AL DIBUJO DE FECHA

ALMACÉN

El proceso de construcción y perfeccionamiento de un almacenamiento de datos debe entenderse más como un proceso evolutivo que como un ciclo de vida de desarrollo de los sistemas tradicionales (Desio, 1995, Shanks, O'Donnell y Arnott 1997a). Hay muchos procesos involucrados en un proyecto. almacenamiento de datos como inicialización, planificación; información adquirida a partir de los requerimientos solicitados a los directivos de la empresa; fuentes, transformaciones, limpieza de adquirir y sincronización desde sistemas heredados y otras fuentes adquirir; sistemas de entrega en desarrollo; seguimiento de almacenamiento de datos; y sinsentido del proceso evolutivo y de construcción de un almacenamiento de datos (Stinchi, O'Donnell y Arnott 1997b). En este diario, nos centramos en cómo dibujar el adquirir almacenados en el contexto de estos otros procesos. Hay una serie de enfoques propuestos para la arquitectura. almacenamiento de datos en la literatura (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Cada una de estas metodologías cuenta con una breve reseña con un análisis de sus fortalezas y debilidades.

Enfoque de Inmon (1994) para Almacenamiento de Datos Diseño

Inmon (1994) propuso cuatro pasos iterativos para diseñar un almacenamiento de datos (ver Figura 2). El primer paso es diseñar una plantilla. adquirir social para entender cómo adquirir se puede integrar en áreas funcionales dentro de una organización dividiendo las adquirir almacenar en áreas. Modelo adquirir está hecho para almacenamiento adquirir relacionados con la toma de decisiones, incluyendo adquirir histórico, e incluido adquirir deducidos y agregados. El segundo paso es identificar áreas temáticas para la implementación. Estos se basan en prioridades determinadas por una organización en particular. El tercer paso consiste en dibujar un base de datos Para el área temática, preste especial atención a incluir niveles apropiados de granularidad. Inmon recomienda utilizar el modelo de entidades y relaciones. El cuarto paso es identificar los sistemas fuente. adquirir requiere y desarrolla procesos de transformación para capturar, limpiar y formatear i adquirir.

Los puntos fuertes del enfoque de Inmon son que el modelo adquirir social ofrece la base para la integración de adquirir dentro de la organización y planificación de apoyos para el desarrollo iterativo de almacenamiento de datos. Sus defectos son la dificultad y el coste en el diseño del modelo. adquirir social, la dificultad para comprender los modelos de entidades y relaciones utilizados en ambos modelos, que adquirir social y la de adquirir almacenados por área temática, y la idoneidad de adquirir del dibujo de almacenamiento de datos para la realizacion de base de datos relacional pero no para base de datos multidimensional.

Enfoque de Ives (1995) Almacenamiento de Datos Diseño

Ives (1995) propone un enfoque de cuatro pasos para diseñar un sistema de información que cree que es aplicable al diseño de una almacenamiento de datos (ver Figura 3). El enfoque se basa en gran medida en la Ingeniería de la Información para el desarrollo de sistemas de información (Martin 1990). El primer paso es determinar los objetivos, los factores críticos y de éxito y los indicadores clave de desempeño. Se modelan los procesos comerciales clave y la información necesaria para llevarnos a un modelo. adquirir social. El segundo paso implica desarrollar una arquitectura definitoria. adquirir almacenado por áreas, base de datos di almacenamiento de datos, los componentes tecnológicos que se requieren, el conjunto de soporte organizacional requerido para implementar y operar con almacenamiento de datos. El tercer paso incluye seleccionar los paquetes de software y las herramientas necesarios. El cuarto paso es el diseño detallado y la construcción del almacenamiento de datos. Ives señala que para almacenar adquirir es un proceso iterativo restringido.

La fortaleza del enfoque de Ives es el uso de técnicas específicas para determinar los requisitos de información, el uso de un proceso estructurado para apoyar la integración de almacenamiento de datos, la selección adecuada de hardware y software y el uso de múltiples técnicas de representación para la almacenamiento de datos. Sus defectos son inherentes a la complejidad. Otros incluyen dificultad para desarrollar muchos niveles de base de datos dentro del almacenamiento de datos en tiempos y costos razonables.

Enfoque de Kimball (1994) Almacenamiento de Datos Diseño

Kimball (1994) propuso cinco pasos iterativos para diseñar un almacenamiento de datos (ver Figuras 4). Su enfoque está particularmente dedicado al diseño de un solo. almacenamiento de datos y sobre el uso de modelos dimensionales con preferencia a modelos de entidades y relaciones. Kimball analiza esos modelos dimensionales porque es más fácil para los líderes empresariales entender los negocios, es más eficiente cuando se trata de consultas complejas y el diseño de base de datos lo físico es más eficiente (Kimball 1994). Kimball reconoce que el desarrollo de una almacenamiento de datos es iterativo, y que almacenamiento de datos Se pueden integrar tablas separadas dividiéndolas en tablas de dimensiones comunes.

El primer paso es identificar el área temática particular que se va a perfeccionar. El segundo y tercer paso se refieren al modelado dimensional. En el segundo paso, las mediciones identifican aspectos de interés en el área temática y los agrupan en una tabla de hechos. Por ejemplo, en un área temática de ventas, las medidas de interés podrían incluir la cantidad de artículos vendidos y el dólar como moneda de venta. El tercer paso implica identificar dimensiones que son las formas en que se pueden agrupar los hechos. En un área temática de ventas, las dimensiones relevantes pueden incluir artículo, ubicación y período de tiempo. La tabla de hechos tiene una clave de varias partes para vincularla a cada una de las tablas de dimensiones y normalmente contiene una gran cantidad de hechos. Por el contrario, las tablas de dimensiones contienen información descriptiva sobre dimensiones y otros atributos que pueden usarse para agrupar hechos. La tabla de hechos y dimensiones propuesta asociada forma lo que se llama un esquema en estrella debido a su forma. El cuarto paso consiste en construir un base de datos multidimensional para perfeccionar el patrón de estrella. El último paso es identificar los sistemas fuente. adquirir requiere y desarrolla procesos de transformación para capturar, limpiar y formatear i adquirir.

Los puntos fuertes del enfoque de Kimball incluyen el uso de modelos dimensionales para representar la adquirir almacenado, lo que lo hace fácil de entender y conduce a un diseño físico eficiente. Un modelo dimensional que también utiliza fácilmente ambos sistemas de base de datos los sistemas relacionales pueden perfeccionarse o los sistemas base de datos multidimensional. Sus defectos incluyen la falta de algunas técnicas para facilitar la planificación o la integración de muchos patrones estelares dentro de un almacenamiento de datos y la dificultad de diseñar desde la estructura extrema desnormalizada a un modelo dimensional adquirir en el sistema heredado.

Enfoque de los datos de McFadden (1996) Diseño de Almacén

McFadden (1996) propone un enfoque de cinco pasos para diseñar un almacenamiento de datos (ver Figura 5).
Su enfoque se basa en una síntesis de ideas de la literatura y se centra en el diseño de un único almacenamiento de datos. El primer paso implica un análisis de requisitos. Aunque las especificaciones técnicas no están prescritas, las notas de McFadden identifican las entidades adquirir especificaciones y sus atributos, y remite a los lectores de Watson y Frolick (1993) para la captura de requisitos.
En el segundo paso, se dibuja un modelo de entidad de relación para almacenamiento de datos y luego validado por ejecutivos de la empresa. El tercer paso incluye determinar el mapeo de sistemas heredados y fuentes externas. almacenamiento de datos. El cuarto paso involucra procesos de desarrollo, implementación y sincronización. adquirir en almacenamiento de datos. En el paso final, se desarrolla la entrega del sistema con especial énfasis en una interfaz de usuario. McFadden señala que el proceso de dibujo es generalmente iterativo.

Los puntos fuertes del enfoque de McFadden apuntan a la participación de los líderes empresariales a la hora de determinar los requisitos y también la importancia de los recursos. adquirir, su limpieza y recogida. Sus defectos incluyen la falta de un proceso para desglosar un proyecto grande. almacenamiento de datos en muchas etapas integradas, y el

dificultad para comprender los modelos de entidad y relación utilizados en el diseño de almacenamiento de datos.

No son solo quienes están cerca de nosotros los que nos eligen.

    0/5 (0 Comentarios)
    0/5 (0 Comentarios)
    0/5 (0 Comentarios)

    Obtenga más información de la Agencia Web Online

    Suscríbete para recibir los últimos artículos por correo electrónico.

    avatar del autor
    Admin CEO
    👍Agencia Web Online | Agencia Web experta en Marketing Digital y SEO. Agencia Web Online es una Agencia Web. Para Agenzia Web Online el éxito en la transformación digital se basa en los fundamentos de Iron SEO versión 3. Especialidades: Integración de sistemas, Integración de aplicaciones empresariales, Arquitectura orientada a servicios, Computación en la nube, Almacén de datos, inteligencia de negocios, Big Data, portales, intranets, Aplicación web Diseño y gestión de bases de datos relacionales y multidimensionales. Diseño de interfaces para medios digitales: usabilidad y gráficos. La agencia web online ofrece a las empresas los siguientes servicios: -SEO en Google, Amazon, Bing, Yandex; -Análisis web: Google Analytics, Google Tag Manager, Yandex Metrica; -Conversiones de usuarios: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM en Google, Bing, Amazon Ads; -Marketing en Redes Sociales (Facebook, Linkedin, Youtube, Instagram).
    Mi privacidad ágil
    Este sitio utiliza cookies técnicas y de elaboración de perfiles. Al hacer clic en aceptar, autoriza todas las cookies de creación de perfiles. Al hacer clic en rechazar o en la X, se rechazan todas las cookies de creación de perfiles. Al hacer clic en personalizar, puede seleccionar qué cookies de perfil activar.
    Este sitio cumple con la Ley de Protección de Datos (LPD), la Ley Federal Suiza del 25 de septiembre de 2020, y el GDPR, Reglamento de la UE 2016/679, relacionado con la protección de datos personales, así como con la libre circulación de dichos datos.