fbpx

데이터 웨어하우징 및 기업 자원 계획 | DWH 및 ERP

아키 비오 데이터 중앙: 역사 ED 진화

90년대 기업 기술의 두 가지 지배적인 주제는 바로 '나'였습니다. 데이터웨어 하우스 그리고 ERP. 오랫동안 이 두 가지 강력한 흐름은 교차점 없이 기업 IT의 일부였습니다. 마치 물질이면서 반물질인 것 같았습니다. 그러나 두 현상의 성장은 필연적으로 교차점으로 이어졌습니다. 오늘날 기업들은 ERP를 어떻게 처리해야 하는지에 대한 문제에 직면해 있습니다. 데이터웨어 하우스. 이 기사에서는 문제가 무엇인지, 기업이 이를 어떻게 해결하고 있는지 간략하게 설명합니다.

처음에는…

처음에는 데이터웨어 하우스. 데이터웨어 하우스 거래처리 응용시스템에 대응하기 위해 만들어졌습니다. 초기에는 암기하는 것이 주기 이는 트랜잭션 처리 애플리케이션에 대한 대위법일 뿐이었습니다. 그러나 요즘에는 어떤 것이 무엇인지에 대한 훨씬 더 정교한 견해가 있습니다. 데이터웨어 하우스. 오늘날의 세계에서는 데이터웨어 하우스 이는 Corporate Information Factory라고 불리는 구조 내에 삽입됩니다.

기업 정보 공장 (CIF)

Corporate Information Factory에는 표준 아키텍처 구성 요소가 있습니다. 주기 나 동안 주기 그들은 애플리케이션 환경에서 다음 환경으로 이동합니다. 데이터웨어 하우스 회사의; ㅏ 데이터웨어 하우스 그 회사의 주기 상세하고 통합된 이력. 그만큼 데이터웨어 하우스 회사는 환경의 다른 모든 부분이 구축될 수 있는 기반이 됩니다. 데이터웨어 하우스; 운영 데이터 저장소(ODS). ODS는 다음과 같은 몇 가지 측면을 포함하는 하이브리드 구조입니다. 데이터웨어 하우스 OLTP 환경의 다른 측면; 다양한 부서가 자신만의 버전을 보유할 수 있는 데이터 마트 데이터웨어 하우스; ㅏ 데이터웨어 하우스 회사의 "철학자"가 72시간 동안 회사에 해로운 영향을 주지 않고 쿼리를 제출할 수 있는 탐색 데이터웨어 하우스; 그리고 니어 라인 메모리(Near Line Memory), 주기 오래되고 주기 대량 세부 정보를 저렴하게 저장할 수 있습니다.

ERP가 LA와 합류하는 곳 기업 정보 공장

ERP는 두 곳에서 Corporate Information Factory와 통합됩니다. 먼저 i를 제공하는 기본 애플리케이션(기준)으로 주기 신청의 데이터웨어 하우스. 이 경우 주기거래 프로세스의 부산물로 생성된 은(는) 통합되어 로드됩니다. 데이터웨어 하우스 회사의. ERP와 CIF 및 ODS 간의 두 번째 결합 지점입니다. 실제로 많은 환경에서 ERP는 전통적인 ODS로 사용됩니다.

ERP를 기본 어플리케이션으로 사용하는 경우, 동일한 ERP를 CIF에서도 ODS로 사용할 수 있습니다. 어떤 경우든 ERP를 두 역할 모두에 사용하려면 두 엔터티 사이에 명확한 구분이 있어야 합니다. 즉, ERP가 핵심 애플리케이션 역할과 ODS 역할을 할 때 두 아키텍처 엔터티를 구별해야 합니다. 단일 ERP 구현이 두 역할을 동시에 수행하려고 하면 해당 구조의 설계 및 구현에 필연적으로 문제가 발생합니다.

별도의 ODS 및 기본 애플리케이션

건축 구성 요소를 분할하는 데에는 여러 가지 이유가 있습니다. 아마도 아키텍처의 다양한 구성 요소를 분리하는 데 있어 가장 중요한 문제는 아키텍처의 각 구성 요소가 고유한 뷰를 갖고 있다는 점일 것입니다. 기준 애플리케이션은 ODS와 다른 용도로 사용됩니다. 겹쳐 보세요

ODS 세계에 대한 기본 애플리케이션 보기 또는 그 반대의 경우는 올바른 작업 방식이 아닙니다.

결과적으로 CIF에서 ERP의 첫 번째 문제는 기본 애플리케이션과 ODS 사이에 차이가 있는지 확인하는 것입니다.

기업의 데이터 모델 정보공장

CIF 아키텍처의 다양한 구성 요소 간의 응집력을 달성하려면 다음과 같은 모델이 있어야 합니다. 주기. 모델 주기 이는 기본 애플리케이션 및 ODS와 같은 아키텍처의 다양한 구성 요소 간의 링크 역할을 합니다. 모델 주기 이는 CIF의 다양한 아키텍처 구성 요소에서 올바른 의미를 얻기 위한 "지적 로드맵"이 됩니다.

이 개념과 함께, 하나의 크고 단일한 모델이 있어야 한다는 아이디어가 있습니다. 주기. 분명히 모델이 있어야합니다. 주기 각 구성요소에 대해 서로 다른 모델을 연결하는 합리적인 경로가 있어야 합니다. 아키텍처의 각 구성 요소 – ODS, 기본 애플리케이션, 데이터웨어 하우스 회사 등.. – 자체 모델이 필요합니다. 주기. 따라서 이러한 모델이 어떻게 작동하는지에 대한 정확한 정의가 있어야 합니다. 주기 그들은 서로 인터페이스합니다.

무브 I 데이터 데이터의 ERP 창고

원산지라면, 주기 ERP가 주기 nel 데이터웨어 하우스, 이 삽입은 가장 낮은 수준의 "세분성"에서 이루어져야 합니다. 간단히 요약하거나 집계합니다. 주기 ERP 기본 애플리케이션이나 ERP ODS에서 나오는 것은 올바른 일이 아닙니다. 그만큼 주기 세부 사항이 필요합니다 데이터웨어 하우스 DSS 프로세스의 기초를 형성합니다. 그런 주기 데이터 마트와 탐색을 통해 다양한 방식으로 재편될 것입니다. 데이터웨어 하우스.

변위 주기 ERP 기본 애플리케이션 환경부터 데이터웨어 하우스 회사의 업무는 합리적으로 편안한 방식으로 이루어집니다. 이러한 이동은 ERP에서 업데이트 또는 생성 후 약 24시간 후에 발생합니다. '게으른' 움직임을 가지고 있다는 사실 주기 nel 데이터웨어 하우스 회사의 허용 주기 ERP에서 "예금"으로 옵니다. 전에 저는 주기 기본 애플리케이션에 저장되어 있으면 안전하게 이동할 수 있습니다. 주기 기업의 ERP. "게으른" 움직임 덕분에 달성 가능한 또 다른 목표 주기 이는 운영 프로세스와 DSS 간의 명확한 설명입니다. "빠른" 움직임으로 주기 DSS와 운영 간의 구분선은 여전히 ​​모호합니다.

운동 주기 ERP ODS부터 데이터웨어 하우스 회사의 업무는 정기적으로, 일반적으로 매주 또는 매월 수행됩니다. 이 경우의 움직임은 주기 그것은 오래된 것을 "청소"해야 할 필요성에 기초합니다. 주기 역사가. 물론 ODS에는 i가 포함되어 있습니다. 주기 것보다 훨씬 최근의 것입니다. 주기 역사학자들이 발견한 데이터웨어 하우스.

변위 주기 nel 데이터웨어 하우스 (도매상 방식으로) "도매"되는 경우는 거의 없습니다. ERP 환경에서 테이블을 복사하여 데이터웨어 하우스 그것은 이해가되지 않습니다. 훨씬 더 현실적인 접근 방식은 선택한 유닛을 이동하는 것입니다. 주기. 오직 주기 마지막 업데이트 이후 변경된 사항 데이터웨어 하우스 그들은 데이터웨어 하우스. 어떤 것을 아는 한 가지 방법 주기 마지막 업데이트 이후 변경된 사항은 주기 ERP 환경에서 찾을 수 있습니다. 디자이너는 마지막 업데이트 이후 발생한 모든 변경 사항을 선택합니다. 또 다른 접근 방식은 변경 캡처 기술을 사용하는 것입니다. 주기. 이러한 기술을 사용하면 로그와 저널 테이프를 분석하여 어떤 테이프인지 결정합니다. 주기 ERP 환경에서 다른 환경으로 이동해야 합니다. 데이터웨어 하우스. 이러한 기술은 다른 ERP 리소스에 추가 영향을 주지 않고 ERP 파일에서 로그 및 저널 테이프를 읽을 수 있기 때문에 가장 좋습니다.

기타 합병증

CIF의 ERP 문제 중 하나는 다른 애플리케이션 소스나 애플리케이션에 어떤 일이 발생하는가입니다. 주기 기여해야 하는 ODS 데이터웨어 하우스 그러나 ERP 환경의 일부는 아닙니다. ERP, 특히 SAP의 폐쇄적 특성을 고려하여 외부 소스의 키를 통합하려고 시도합니다. 주기 나와 함께 주기 이동할 때 ERP에서 나오는 주기 nel 데이터웨어 하우스, 그것은 큰 도전입니다. 그리고 내가 할 확률은 정확히 얼마인가? 주기 ERP 환경 외부의 애플리케이션이나 ODS는 데이터웨어 하우스? 실제로 확률은 매우 높습니다.

찾다 데이터 ERP의 역사

나에게 또 다른 문제가 있다 주기 ERP의 필요성은 다음과 같습니다. 주기 내부의 역사가들 데이터웨어 하우스. 일반적으로 데이터웨어 하우스 그는 필요하다. 주기 역사가. 그리고 ERP 기술은 일반적으로 이러한 정보를 저장하지 않습니다. 주기 적어도 역사적으로 필요한 시점까지는 아니었습니다. 데이터웨어 하우스. 양이 많을 때 주기 ERP 환경에 기록이 쌓이기 시작하면 해당 환경을 정리해야 합니다. 예를 들어, 데이터웨어 하우스 5년을 채워야 한다 주기 ERP는 이러한 기록을 최대 6개월 동안 보관합니다. 주기. 회사가 일련의 수집에 만족하는 한 주기 시간이 지날수록 역사가들은 ERP를 소스로 활용하는데 문제가 없을 것입니다. 데이터웨어 하우스. 그러나 언제 데이터웨어 하우스 그는 시간을 거슬러 올라가서 신들을 구해야 해요 주기 이전에 ERP에서 수집하고 저장하지 않은 이력이 있으면 ERP 환경은 비효율적이 됩니다.

ERP와 메타데이터

ERP e에 관해 고려해야 할 또 다른 고려사항 데이터웨어 하우스 ERP 환경에 존재하는 메타데이터에 대한 것입니다. 메타데이터가 ERP 환경에서 데이터웨어 하우스, 메타데이터도 같은 방식으로 이동해야 합니다. 또한 메타데이터는 인프라에 필요한 형식과 구조로 변환되어야 합니다. 데이터웨어 하우스. 운영 메타데이터와 DSS 메타데이터 간에는 큰 차이가 있습니다. 운영 메타데이터는 주로 개발자와

프로그램 제작자. DSS 메타데이터는 기본적으로 최종 사용자를 위한 것입니다. ERP 애플리케이션이나 ODS의 기존 메타데이터를 변환해야 하는데, 이 변환이 항상 쉽고 간단하지는 않습니다.

ERP 데이터 소싱

ERP를 공급자로 사용하는 경우 주기 IL 당 데이터웨어 하우스 이동하는 견고한 인터페이스가 있어야합니다. 주기 ERP 환경부터 환경까지 데이터웨어 하우스. 인터페이스는 다음을 충족해야 합니다.

  • ▪ 사용하기 쉬울 것
  • ▪ 다음 항목에 대한 액세스를 허용합니다. 주기 ERP의
  • ▪ 의미를 취하다 주기 곧 옮겨질 예정인 것 데이터웨어 하우스
  • ▪ 액세스할 때 발생할 수 있는 ERP 제한 사항을 알고 있습니다. 주기 ERP의:
  • ▪ 참조 무결성
  • ▪ 계층적 관계
  • ▪ 암묵적인 논리적 관계
  • ▪ 지원 관례
  • ▪ 모든 구조 주기 ERP 등에서 지원됩니다.
  • ▪ 접근이 효율적이어야 합니다. 주기, 를 제공함으로써:
  • ▪ 직접적인 움직임 주기
  • ▪ 변화의 획득 주기
  • ▪ 시기적절한 액세스를 지원합니다. 주기
  • ▪ 형식을 이해합니다. 주기, 등등… SAP와의 인터페이스 인터페이스는 자체 개발 또는 상용의 두 가지 유형이 있습니다. 주요 거래 인터페이스 중 일부는 다음과 같습니다:
  • ▪ SAS
  • ▪ 프림스솔루션
  • ▪ D2k 등… 다양한 ERP 기술 ERP 환경을 하나의 기술인 것처럼 취급하는 것은 큰 실수입니다. 많은 ERP 기술이 있으며 각각 고유한 장점을 가지고 있습니다. 시장에서 가장 잘 알려진 공급업체는 다음과 같습니다.
  • ▪ SAP
  • ▪ 오라클 파이낸셜스
  • ▪ 피플소프트
  • ▪ JD 에드워즈
  • ▪ 반 SAP SAP는 가장 크고 가장 완벽한 ERP 소프트웨어입니다. SAP 애플리케이션에는 다양한 영역의 다양한 유형의 애플리케이션이 포함되어 있습니다. SAP는 다음과 같은 평판을 얻고 있습니다.
  • ▪ 매우 크다
  • ▪ 구현하기가 매우 어렵고 비용이 많이 듭니다.
  • ▪ 구현에는 많은 인력과 컨설턴트가 필요함
  • ▪ 구현을 위해서는 전문 인력이 필요합니다.
  • ▪ 구현하는 데 오랜 시간이 걸립니다. 또한 SAP는 다음과 같은 사항을 기억하는 것으로 유명합니다. 주기 SAP 영역 외부의 누군가가 접근하기 어렵게 만듭니다. SAP의 강점은 대량의 데이터를 캡처하고 저장할 수 있다는 것입니다. 주기. 최근 SAP는 애플리케이션을 다음으로 확장하겠다는 계획을 발표했습니다. 데이터웨어 하우스. 공급업체로서 SAP를 사용하는 데에는 많은 장단점이 있습니다. 데이터웨어 하우스. 장점은 SAP가 이미 설치되어 있고 대부분의 컨설턴트가 이미 SAP를 알고 있다는 것입니다.
    SAP를 공급업체로 사용하는 경우의 단점 데이터웨어 하우스 많은 것들이 있습니다. SAP는 다음과 같은 분야에 대한 경험이 없습니다. 데이터웨어 하우스 SAP가 공급업체인 경우 데이터웨어 하우스, 나는 "제거"할 필요가 주기 SAP에서 데이터웨어 하우스. 다토 SAP의 폐쇄형 시스템 기록으로는 SAP에서 그 시스템으로 i를 가져오는 것이 쉽지 않을 것입니다(???). IMS, VSAM, ADABAS, ORACLE, DB2 등과 같이 SAP를 강화하는 레거시 환경이 많이 있습니다. SAP는 "여기에서 발명되지 않은" 접근 방식을 고집합니다. SAP는 다른 공급업체와 협력하여 다음을 사용하거나 생성하기를 원하지 않습니다. 데이터웨어 하우스. SAP는 모든 소프트웨어 자체를 생성해야 한다고 주장합니다.

SAP는 크고 강력한 회사임에도 불구하고 ELT, OLAP, 시스템 관리 기술, 심지어 핵심 코드까지 다시 작성하려고 노력하고 있습니다. DBMS 그냥 미친 짓이야. 공급자와 협력적인 태도를 취하는 대신 데이터웨어 하우스 오랫동안 SAP는 "그들이 가장 잘 아는" 접근 방식을 따랐습니다. 이러한 태도는 SAP가 다음 분야에서 성공할 수 있는 데 걸림돌이 됩니다. 데이터웨어 하우스.
SAP는 외부 공급업체가 자신의 서비스에 신속하고 적절하게 액세스하는 것을 거부했습니다. 주기. 사용의 본질은 데이터웨어 하우스 접근이 용이하다 주기. SAP의 모든 역사는 접근을 어렵게 만드는 데 기반을 두고 있습니다. 주기.
SAP의 대량 처리 경험 부족 주기; 분야에서 데이터웨어 하우스 많은 양의 주기 SAP에서는 본 적이 없으며 이러한 대량의 데이터를 관리하기 위해 주기 적합한 기술이 필요합니다. SAP는 분명히 이 분야에 진입하는 데 존재하는 기술적 장벽을 인식하지 못하고 있는 것 같습니다. 데이터웨어 하우스.
SAP의 기업 문화: SAP는 주기 시스템에서. 하지만 그러기 위해서는 다른 사고방식을 가져야 합니다. 전통적으로 데이터를 특정 환경으로 가져오는 데 능숙한 소프트웨어 회사는 데이터를 다른 방향으로 가져오는 데 능숙하지 않았습니다. SAP가 이러한 유형의 전환을 성공한다면 SAP는 그렇게 하는 최초의 회사가 될 것입니다.

한마디로 기업이 SAP를 공급업체로 선택해야 하는지 의문이다. 데이터웨어 하우스. 한편으로는 매우 심각한 위험이 있고 다른 한편으로는 보상이 거의 없습니다. 하지만 SAP를 공급업체로 선택하지 못하게 만드는 또 다른 이유가 있습니다. 데이터웨어 하우스. 모든 회사가 동일해야 하기 때문에 데이터웨어 하우스 다른 회사들 다요? 그만큼 데이터웨어 하우스 이는 경쟁 우위의 핵심입니다. 모든 회사가 동일하게 채택한다면 데이터웨어 하우스 불가능하지는 않더라도 경쟁 우위를 달성하는 것은 어려울 것입니다. SAP는 다음과 같이 생각하는 것 같습니다. 데이터웨어 하우스 이는 쿠키로 볼 수 있으며 이는 애플리케이션의 "데이터 가져오기" 사고방식을 나타내는 추가 신호입니다.

SAP만큼 지배적인 ERP 공급업체는 없습니다. 분명 SAP의 길을 따라갈 기업이 있을 것입니다. 데이터웨어 하우스 하지만 아마도 이것들은 데이터웨어 하우스 SAP는 생성하는 데 규모가 크고 비용이 많이 들고 시간이 많이 걸립니다.

이러한 환경에는 은행원 처리, 항공사 예약 프로세스, 보험 청구 프로세스 등과 같은 활동이 포함됩니다. 트랜잭션 시스템의 성능이 향상될수록 운영 프로세스와 DSS(의사결정 지원 시스템) 간의 분리 필요성이 더욱 분명해졌습니다. 그러나 HR 및 인사 시스템을 사용하면 대량의 거래에 결코 직면하지 않습니다. 그리고 물론, 사람이 회사에 채용되거나 퇴사할 때 이는 거래 기록입니다. 그러나 다른 시스템에 비해 HR 및 인사 시스템에는 트랜잭션이 많지 않습니다. 따라서 HR 및 인사 시스템에서는 DataWarehouse의 필요성이 완전히 명확하지 않습니다. 여러 면에서 이러한 시스템은 DSS 시스템의 통합을 나타냅니다.

그러나 데이터 웨어하우스와 PeopleSoft를 다루는 경우 고려해야 할 또 다른 요소가 있습니다. 나는 많은 환경에서 주기 인적 자원과 개인 자원은 회사의 주요 사업에 비해 부차적입니다. 대부분의 회사는 제조, 판매, 서비스 제공 등에 종사합니다. 인적 자원 및 인사 시스템은 일반적으로 회사의 주요 사업 부문에 부차적(또는 지원)입니다. 그러므로 모호하고 불편하다. 데이터웨어 하우스 인적자원과 인사지원은 별도로 구분됩니다.

PeopleSoft는 이 점에서 SAP와 매우 다릅니다. SAP에서는 다음이 필수입니다. 데이터웨어 하우스. PeopleSoft에서는 그렇게 명확하지 않습니다. PeopleSoft에서는 데이터 웨어하우스가 선택 사항입니다.

나에게 할 수 있는 가장 좋은 말은 주기 PeopleSoft는 데이터웨어 하우스 i를 보관하기 위해 사용할 수 있습니다. 주기 오래된 인적 및 개인적 자원과 관련됩니다. 회사가 다음을 사용하려는 두 번째 이유 데이터웨어 하우스 a

PeopleSoft 환경에 해를 끼치는 것은 분석 도구에 대한 액세스와 무료 액세스를 허용하는 것입니다. 주기 피플소프트에서. 그러나 이러한 이유 외에도 데이터 웨어하우스를 보유하지 않는 것이 바람직한 경우가 있을 수 있습니다. 주기 피플소프트.

요약해서 말하자면

건물 건설에 관해 많은 아이디어가 있습니다. 데이터웨어 하우스 ERP 소프트웨어 내에서.
이들 중 일부는 다음과 같습니다:

  • ▪ 다음을 갖는 것이 합리적입니다. 데이터웨어 하우스 그건 업계의 다른 어떤 것과도 같나요?
  • ▪ ERP의 유연성 데이터웨어 하우스 소프트웨어?
  • ▪ ERP 데이터웨어 하우스 소프트웨어는 주기 이는데이터웨어 하우스 투기장"?
  • ▪ 시간적, 비용적 측면에서 쉽고 저렴한 ERP 벤더가 하는 추적기록은 무엇인가? 주기? (저렴하고 제 시간에 쉽게 액세스할 수 있는 데이터를 제공한 ERP 공급업체의 실적은 무엇입니까?)
  • ▪ DSS 아키텍처와 기업 정보 공장에 대한 ERP 공급업체의 이해는 무엇입니까?
  • ▪ ERP 공급업체는 달성 방법을 이해하고 있습니다. 주기 환경 내에서 내보내는 방법도 알고 계시나요?
  • ▪ ERP 공급업체는 데이터 웨어하우징 도구에 얼마나 개방적입니까?
    어디에 배치할지 결정할 때 이러한 모든 고려 사항을 고려해야 합니다. 데이터웨어 하우스 내가 호스팅할 곳 주기 ERP 등의 주기. 일반적으로 달리 수행해야 할 강력한 이유가 없는 한 건물을 짓는 것이 좋습니다. 데이터웨어 하우스 ERP 공급업체 환경 외부. 캐피톨로 1 BI 조직 요점 개요:
    정보 저장소는 비즈니스 인텔리전스(BI) 아키텍처와 반대로 작동합니다.
    기업 문화와 IT는 BI 조직 구축의 성공을 제한할 수 있습니다.

기술은 더 이상 BI 조직의 제한 요소가 아닙니다. 건축가와 프로젝트 기획자의 질문은 기술이 존재하는지 여부가 아니라 사용 가능한 기술을 효과적으로 구현할 수 있는지 여부입니다.

많은 기업의 경우 데이터웨어 하우스 그것은 분배하는 수동적 예금에 지나지 않습니다. 주기 필요한 사용자에게. 그만큼 주기 소스 시스템에서 추출되어 대상 구조에 채워집니다. 데이터웨어 하우스. 주기 운이 좋으면 청소할 수도 있습니다. 그러나 추가적인 가치는 다음에 의해 추가되거나 수집되지 않습니다. 주기 이 과정에서.

본질적으로 패시브 Dw는 기껏해야 i만 제공합니다. 주기 사용자 협회에 대해 깨끗하고 운영 가능합니다. 정보 생성 및 분석적 이해는 전적으로 사용자에게 달려 있습니다. DW(데이터웨어 하우스) 성공은 주관적입니다. 성공 여부를 효율적인 수집, 통합, 정리 능력으로 판단한다면 주기 그렇다면 DW는 성공입니다. 반면에 조직 전체의 정보 수집, 통합 및 활용을 살펴보면 DW는 실패입니다. DW는 정보 가치를 거의 또는 전혀 제공하지 않습니다. 결과적으로 사용자는 조치를 취해야 하므로 정보 사일로가 생성됩니다. 이 장에서는 회사의 BI(Business Intelligence) 아키텍처를 요약하는 포괄적인 보기를 제공합니다. BI에 대한 설명부터 시작하여 단순히 정보를 제공하는 것이 아닌 정보 디자인 및 개발에 대한 논의로 넘어갑니다. 주기 사용자에게. 그런 다음 BI 노력의 가치를 계산하는 데 중점을 두고 토론합니다. IBM이 조직의 BI 아키텍처 요구사항을 해결하는 방법을 정의하는 것으로 결론을 내립니다.

아키텍처에 대한 설명 BI 조직

강력한 거래 중심 정보 시스템은 이제 모든 대기업에서 보편화되어 전 세계 기업의 경쟁의 장을 효과적으로 평준화합니다.

그러나 이제 경쟁력을 유지하려면 이미 보유하고 있는 정보를 재발견하고 사용하는 회사의 능력을 혁신할 수 있는 분석 지향 시스템이 필요합니다. 이러한 분석 시스템은 다음의 풍부함을 이해하는 데서 비롯됩니다. 주기 사용 가능. BI는 기업 전체의 성능을 향상시킬 수 있습니다. 기업은 고객-공급업체 관계를 개선하고, 제품과 서비스의 수익성을 개선하고, 새롭고 더 나은 제안을 생성하고, 위험을 제어하고, 무엇보다도 비용을 획기적으로 절감할 수 있는 이점을 누릴 수 있습니다. BI를 사용하면 회사는 마침내 시장 목표를 가진 애플리케이션 덕분에 고객 정보를 경쟁력 있는 자산으로 사용하기 시작합니다.

올바른 비즈니스 도구를 갖는다는 것은 다음과 같은 주요 질문에 대한 명확한 답을 얻는 것을 의미합니다.

  • ▪ 우리 중 어느 것 고객 우리가 더 많이 벌게 합니까, 아니면 돈을 잃게 합니까?
  • ▪ 우리가 가장 잘 사는 곳 고객 관련하여 가게/ 그들이 자주 가는 창고는?
  • ▪ 우리의 제품과 서비스 중 어떤 것이 가장 효과적으로 누구에게 판매될 수 있습니까?
  • ▪ 가장 효과적으로 판매할 수 있는 제품은 무엇이며 누구에게 판매됩니까?
  • ▪ 가장 성공적인 판매 캠페인은 무엇이며 그 이유는 무엇입니까?
  • ▪ 어떤 판매 채널이 어떤 제품에 가장 효과적인가?
  • ▪ 최고의 사람들과의 관계를 개선할 수 있는 방법 고객? 대부분의 회사는 주기 이러한 질문에 답하는 대략적인 방법.
    운영 시스템은 대량의 제품, 고객 및 주기 판매 시점, 예약, 고객 서비스 및 기술 지원 시스템을 통해 시장에 진출합니다. 문제는 이 정보를 추출하고 활용하는 것입니다. 많은 기업은 자사의 작은 부분에서만 이익을 얻습니다. 주기 전략적 분석을 위해.
    I 주기 남은, 종종 i와 합류 주기 정부 보고서, 기타 구매 정보 등 외부 소스에서 파생된 정보는 이제 막 탐험을 기다리는 금광이며, 주기 조직의 정보 맥락 내에서 개선하면 됩니다.

이러한 지식은 전반적인 기업 전략 설계부터 콜센터, 송장 발행, 공급업체와의 개별 커뮤니케이션에 이르기까지 다양한 방법으로 적용될 수 있습니다. 인터넷 그리고 다른 점들. 오늘날의 비즈니스 환경에서는 DW 및 관련 BI 솔루션이 기존 비즈니스 구조를 뛰어넘어 발전할 것을 요구하고 있습니다. 주기 나는 어느 주기 원자 수준 및 "스타/큐브 팜"에서 정규화되었습니다.

경쟁력을 유지하기 위해 필요한 것은 광범위한 분석 환경을 지원하기 위한 노력의 일환으로 전통 기술과 첨단 기술을 융합하는 것입니다.
결론적으로, 일반적인 환경은 회사 전체에 대한 지식을 향상시켜 수행된 분석의 결과로 취해진 조치가 모두에게 이익이 되도록 유용하도록 보장해야 합니다.

예를 들어, 당신이 당신의 것을 분류한다고 가정 해 봅시다. 고객 위험도가 높거나 낮은 범주로 분류됩니다.
이 정보가 모델 마이닝이나 기타 수단을 통해 생성된 경우 DW에 넣어야 하며 정적 보고서, 스프레드시트, 테이블 또는 온라인 분석 처리(OLAP)와 같은 액세스 도구를 통해 누구나 액세스할 수 있어야 합니다.

그러나 현재 이러한 유형의 정보 중 상당수는 사일로에 남아 있습니다. 주기 분석을 생성하는 개인 또는 부서의 정보입니다. 조직 전체는 이해를 위한 가시성이 거의 또는 전혀 없습니다. 이러한 유형의 정보 콘텐츠를 기업 ​​DW에 혼합해야만 정보 사일로를 제거하고 DW 환경을 향상시킬 수 있습니다.
BI 조직을 개발하는 데에는 두 가지 주요 장애물이 있습니다.
첫째, 조직 자체와 규율에 문제가 있습니다.
조직의 정책 변경에 도움을 드릴 수는 없지만 조직의 BI 구성 요소, 아키텍처, IBM 기술이 개발을 촉진하는 방법을 이해하는 데 도움을 드릴 수 있습니다.
극복해야 할 두 번째 장벽은 단지 작은 구성 요소가 아닌 전체 BI 공간을 다루는 방법에 대한 통합 기술과 지식이 부족하다는 것입니다.

IBM은 통합 기술의 변화에 ​​대처하고 있습니다. 사려 깊은 디자인을 제공하는 것은 귀하의 책임입니다. 이 아키텍처는 무제한 통합을 위해 선택된 기술 또는 최소한 개방형 표준을 준수하는 기술을 사용하여 개발되어야 합니다. 또한 회사 경영진은 BI 작업이 계획에 따라 수행되고 이기적인 안건이나 목표로 인해 발생하는 정보 사일로의 개발을 허용하지 않도록 해야 합니다.
이는 BI 환경이 다양한 사용자의 다양한 요구 사항에 반응하는 데 민감하지 않다는 의미는 아닙니다. 대신, 이는 전체 BI 조직의 이익을 위해 개별 요구 사항과 요구 사항의 구현이 수행된다는 것을 의미합니다.
BI 조직의 아키텍처에 대한 설명은 그림 9의 1.1페이지에서 볼 수 있습니다. 아키텍처는 다양한 기술과 기법의 조합을 보여줍니다.
전통적인 관점에서 볼 때 아키텍처에는 다음과 같은 창고 구성 요소가 포함됩니다.

원자층.

이것이 전체 DW의 기초이자 핵심이며 따라서 전략적 보고의 핵심입니다.
I 주기 여기에 저장되면 역사적 무결성과 관계가 유지됩니다. 주기 파생된 메트릭을 포함할 뿐만 아니라 모델 추출을 사용하여 정리, 통합 및 저장됩니다.
이후의 모든 사용 주기 관련 정보는 이 구조에서 파생됩니다. 이것은 채굴을 위한 훌륭한 소스입니다. 주기 구조화된 SQL 쿼리가 포함된 보고서의 경우

운영 창고 주기 또는 다음을 기반으로 보고합니다. 주기(운영 데이터 저장소(ODS) 또는 보고 데이터베이스.)

이것은 다음과 같은 구조이다. 주기 기술 보고를 위해 특별히 설계되었습니다.

I 주기 이러한 구조 위에 저장되고 보고된 정보는 전략적 신호 전달에 사용될 수 있는 준비 영역을 통해 최종적으로 창고로 전파될 수 있습니다.

준비 영역.

대부분의 첫 번째 정류장 주기 창고 환경을 위한 조직 구역입니다.
여기 내가 주기 그들은 통합되고, 청소되고, 변환됩니다. 주기 창고 구조를 채울 이익

데이터 마트.

아키텍처의 이 부분은 다음의 구조를 나타냅니다. 주기 OLAP에 특별히 사용됩니다. 데이터마트의 존재, 만약 내가 주기 겹치는 스타 스키마에 저장됩니다. 주기 관계형 환경이나 파일에서 다차원적으로 주기 DB2 OLAP Server와 같은 특정 OLAP 기술에서 사용되는 기밀은 관련이 없습니다.

유일한 제약은 아키텍처가 다음의 사용을 용이하게 한다는 것입니다. 주기 다차원.
또한 아키텍처에는 다음과 같은 중요한 Bi 기술과 기술이 포함되어 있습니다.

공간분석

공간은 분석가에게 정보의 횡재이며 문제 해결을 완료하는 데 매우 중요합니다. 공간은 특정 위치에 살고 있는 사람들에 대한 정보뿐만 아니라 해당 위치가 나머지 세계와 물리적으로 상대적인 위치에 대한 정보를 나타낼 수 있습니다.

이 분석을 수행하려면 먼저 정보를 위도 및 경도 좌표에 연결해야 합니다. 이를 "지오코딩"이라고 하며 창고의 원자 수준에서 ETL(추출, 변환 및 로드) 프로세스의 일부여야 합니다.

데이터 수집.

추출 주기 우리 회사의 수를 늘릴 수 있습니다 고객, 판매 동향을 예측하고 고객과의 관계를 관리할 수 있습니다. 고객 (CRM) 등의 BI 이니셔티브가 있습니다.

추출 주기 그러므로 그것은 다음의 구조와 통합되어야 한다. 주기 관련 기술과 기술의 효과적이고 효율적인 사용을 보장하기 위해 Dwhouse의 창고 프로세스를 지원합니다.

BI 아키텍처에서 알 수 있듯이 Dwhouse와 데이터마트의 원자 수준은 주기 추출을 위해. 또한 가장 광범위한 청중이 이용할 수 있도록 하려면 동일한 시설이 추출 결과를 수신해야 합니다.

자치령 대표.

회사의 운영 체제 및 dw 자체와 같은 모든 사항에 대해 클라이언트를 검사하는 다양한 "에이전트"가 있습니다. 이러한 에이전트는 판매 프로모션을 기반으로 한 미래 제품 수요, 데이터 일련의 상황 또는 "최고 경영진"에게 예외를 보고하는 단순한 대리인도 있습니다. 이러한 프로세스는 일반적으로 실시간으로 발생하므로 이동과 밀접하게 결합되어야 합니다. 주기. 이 모든 구조는 주기, 기술 및 기술은 BI 조직을 생성하는 데 밤을 보내지 않도록 보장합니다.

이 활동은 작은 포인트에 대해 점진적인 단계로 개발됩니다.
각 단계는 독립적인 프로젝트 작업이며 DW 또는 BI 이니셔티브에서는 반복이라고 합니다. 반복에는 새로운 기술 구현, 새로운 기술로 시작, 새로운 구조 추가가 포함될 수 있습니다. 주기 , 로드 중 주기 추가로 또는 환경 분석을 확장합니다. 이 단락은 3장에서 더 자세히 논의됩니다.

전통적인 DW 구조 및 BI 도구 외에도 다음과 같이 설계해야 하는 BI 조직의 다른 기능이 있습니다.

고객 접점(Customer touch 포인트들).

모든 현대 조직에는 긍정적인 경험을 제공하는 방법을 알려주는 고객 접점이 많이 있습니다. 고객. 소매업체, 교환원, 다이렉트 메일, 멀티미디어 및 인쇄 광고와 같은 전통적인 채널뿐만 아니라 이메일, 웹과 같은 최신 채널도 있습니다. 주기 어느 정도 접촉점이 있는 제품을 구입, 운송, 세척, 처리한 후 시설에 채워야 합니다. 주기 BI의.

기본 주기 운영 및 사용자 연관(운영

데이터베이스 및 사용자 커뮤니티).
접점의 끝부분에는 고객 의 기초가 발견되었습니다 주기 회사의 애플리케이션 및 사용자 커뮤니티. 그만큼 주기 기존은 주기 전통적인 것을 모아서 통합해야 합니다. 주기 필요한 정보를 충족시키기 위해 접점에서 흘러나오는 정보입니다.

분석가. (분석가)

BI 환경의 주요 수혜자는 분석가입니다. 현재의 추출로 이익을 얻는 사람은 바로 그 사람입니다. 주기 다양한 소스와 통합되어 운영 가능 주기 , 지리적 분석(지오코딩)과 같은 기능으로 강화되었으며 추출, OLAP, 고급 SQL 보고 및 지리적 분석을 가능하게 하는 BI 기술로 제공됩니다. 보고 환경의 기본 분석가 인터페이스는 BI 포털입니다.

그러나 분석가만이 BI 아키텍처의 혜택을 받는 유일한 사람은 아닙니다.
관리자, 대규모 사용자 협회, 심지어 회원, 공급업체 및 고객 기업 BI에서 이점을 찾아야 합니다.

백피드 루프.

BI 아키텍처는 학습 환경입니다. 개발의 특징적인 원칙은 지속적인 구조를 허용하는 것입니다. 주기 사용된 BI 기술과 사용자가 취한 조치에 따라 업데이트됩니다. 예를 들어 고객 점수 매기기가 있습니다.

영업 부서가 새로운 서비스를 사용하기 위해 고객 점수를 모델링하는 경우, 영업 부서가 서비스의 혜택을 받는 유일한 그룹이 되어서는 안 됩니다.

대신, 모델 추출은 기업 내 데이터 흐름의 자연스러운 부분으로 수행되어야 하며 고객 점수는 모든 사용자가 볼 수 있는 창고 정보 컨텍스트의 통합된 부분이 되어야 합니다. DB2 UDB, DB2 OLAP Server를 포함하는 Bi-bI 중심 IBM 제품군에는 그림 1.1에 정의된 대부분의 주요 기술 구성요소가 포함되어 있습니다.

우리는 책의 이 그림에 나오는 아키텍처를 사용하여 연속성 수준을 제공하고 각 IBM 제품이 전체 BI 체계에 어떻게 적용되는지 보여줍니다.

정보 콘텐츠 제공(제공 정보 내용)

BI 환경을 설계, 개발 및 구현하는 것은 어려운 작업입니다. 디자인은 현재와 미래의 비즈니스 요구 사항을 모두 수용해야 합니다. 건축 도면은 설계 단계에서 발견된 모든 결론을 포함하도록 완전해야 합니다. 실행은 단 하나의 목적, 즉 디자인에 공식적으로 제시되고 비즈니스 요구 사항에 기초하여 BI 아키텍처를 개발하는 데 전념해야 합니다.

규율이 상대적인 성공을 보장한다고 주장하는 것은 특히 어렵습니다.
BI 환경을 한꺼번에 개발하는 것이 아니라 시간이 지남에 따라 작은 단계로 진행하기 때문에 이는 간단합니다.

그러나 아키텍처의 BI 구성 요소를 식별하는 것은 두 가지 이유로 중요합니다. 이후의 모든 기술 아키텍처 결정을 안내하게 됩니다.
몇 달 동안 해당 기술이 필요한 일이 반복되지 않더라도 특정 기술 사용을 의식적으로 계획할 수 있습니다.

비즈니스 요구 사항을 충분히 이해하면 아키텍처에 대해 구입하는 제품 유형에 영향을 미칩니다.
아키텍처를 설계하고 개발하면 창고가

무작위 사건이 아니라 신중하게 구성된 "잘 고안된" 사건입니다. 운영 혼합 기술의 모자이크로서의 예술.

정보 콘텐츠 디자인

모든 초기 설계는 현재와 미래의 전체 환경에 필요할 주요 BI 구성 요소에 초점을 맞추고 이를 식별해야 합니다.
비즈니스 요구 사항을 아는 것이 중요합니다.

정식 설계가 시작되기 전에도 프로젝트 기획자는 한두 개의 구성 요소를 즉시 식별할 수 있는 경우가 많습니다.
그러나 아키텍처에 필요할 수 있는 구성 요소의 균형을 쉽게 찾을 수 없습니다. 설계 단계에서 아키텍처의 주요 부분은 비즈니스 요구 사항을 식별하기 위해 애플리케이션 개발(JAD) 세션을 연결합니다.

때로는 이러한 요구 사항을 쿼리 및 보고 도구에 맡길 수도 있습니다.
예를 들어, 사용자는 현재 보고서를 자동화하려면 두 개의 현재 보고서를 통합하고 두 가지의 조합에서 파생된 계산을 추가하여 수동으로 생성해야 한다고 말합니다. 주기.
이 요구 사항은 간단하지만 조직을 위해 보고 도구를 구매할 때 포함해야 하는 특정 기능을 정의합니다.

또한 디자이너는 완전한 그림을 얻기 위해 추가적인 요구 사항도 추구해야 합니다. 사용자가 이 보고서를 구독하기를 원합니까?
보고서 하위 집합이 생성되어 다양한 사용자에게 이메일로 전송됩니까? 회사 포털에서 이 보고서를 보고 싶어 합니까? 이러한 모든 요구 사항은 사용자의 요청에 따라 수동 보고서를 교체해야 하는 간단한 요구 사항의 일부입니다. 이러한 유형의 요구 사항의 이점은 사용자와 디자이너를 비롯한 모든 사람이 보고서 개념을 이해할 수 있다는 것입니다.

그러나 우리가 계획해야 할 다른 유형의 사업도 있습니다. 비즈니스 요구 사항이 전략적 비즈니스 질문의 형태로 명시되면 전문 설계자가 측정/사실 및 차원 요구 사항을 쉽게 식별할 수 있습니다.

JAD 사용자가 비즈니스 문제의 형태로 요구 사항을 기술하는 방법을 모르는 경우 디자이너는 종종 요구 사항 수집 세션을 시작하기 위한 예를 제공합니다.
전문 디자이너는 사용자가 전략적 거래뿐만 아니라 이를 구성하는 방법을 이해하도록 도울 수 있습니다.
요구사항 수집 접근 방식은 3장에서 논의됩니다. 지금은 모든 유형의 BI 요구 사항에 맞게 설계해야 한다는 점만 지적하고 싶습니다.

전략적 비즈니스 문제는 비즈니스 요구사항일 뿐만 아니라 디자인 단서이기도 합니다. 다차원적인 질문에 대답해야 한다면 다음을 외워야 합니다. 주기 차원을 저장해야 하는 경우 주기 다차원적인 경우에는 어떤 유형의 기술이나 기법을 사용할지 결정해야 합니다.

예약된 큐브 스타 스키마를 구현합니까, 아니면 둘 다 구현합니까? 보시다시피 단순한 비즈니스 문제라도 디자인에 큰 영향을 미칠 수 있습니다. 그러나 이러한 유형의 비즈니스 요구 사항은 일반적이며 적어도 프로젝트 경험이 있는 설계자와 기획자에게는 이해됩니다.

OLAP 기술과 지원에 대한 충분한 논의가 있었고, 다양한 솔루션이 나와 있습니다. 지금까지 우리는 간단한 보고와 비즈니스 차원 요구 사항을 결합해야 할 필요성과 이러한 요구 사항이 기술 아키텍처 결정에 어떻게 영향을 미치는지 언급했습니다.

그런데 사용자나 Dw팀이 쉽게 이해하지 못하는 요구사항은 무엇일까요? 공간 분석이 필요한 적이 있습니까?
추출 모델 주기 그것이 당신의 미래에 꼭 필요한 부분이 될까요? 누가 알아?

이러한 유형의 기술은 일반 사용자 커뮤니티와 Dw 팀 구성원에게 잘 알려져 있지 않다는 점에 유의하는 것이 중요합니다. 이는 부분적으로 이러한 기술이 일반적으로 일부 내부 또는 타사 기술 전문가에 의해 처리되기 때문일 수 있습니다. 이러한 유형의 기술이 생성하는 문제의 극단적인 경우입니다. 사용자가 비즈니스 요구 사항을 설명할 수 없거나 디자이너에게 지침을 제공하는 방식으로 구성할 수 없으면 눈에 띄지 않거나 더 나쁘게는 무시될 수 있습니다.

설계자와 개발자가 이러한 고급이지만 중요한 기술 중 하나의 적용을 인식할 수 없을 때 더욱 문제가 됩니다.
우리는 종종 디자이너들이 다음과 같이 말하는 것을 들었습니다. “글쎄, 다른 것을 얻을 때까지 그것을 제쳐두는 것이 어떨까요? “그들은 정말로 우선순위에 관심이 있습니까, 아니면 단순히 이해하지 못하는 요구사항을 회피하고 있습니까? 마지막 가설일 가능성이 높습니다. 그림 1.3에 설명된 것처럼 영업 팀이 비즈니스 요구 사항을 전달했다고 가정해 보겠습니다. 요구 사항은 비즈니스 문제의 형태로 구성되어 있습니다. 이 문제와 일반적인 차원 문제의 차이점은 거리입니다. 이 경우 영업팀에서는 제품, 창고 및 제품의 총 매출을 월 단위로 알고 싶어합니다. 고객 구매한 창고로부터 5마일 이내에 거주하는 사람.

안타깝게도 디자이너나 건축가는 “우리에게는 고객, 제품 및 제품이 있습니다. 주기 보증금의. 다음 반복까지 거리를 유지해 보겠습니다.

"잘못된 답변. 이러한 유형의 비즈니스 문제는 모두 BI에 관한 것입니다. 이는 당사 비즈니스에 대한 더 깊은 이해와 분석가를 위한 강력한 분석 공간을 나타냅니다. BI는 단순한 쿼리나 표준 보고, 심지어 OLAP 그 이상입니다. 이는 이러한 기술이 BI에 중요하지 않다는 의미는 아니지만, 그 기술만으로는 BI 환경을 대표하지 않습니다.

정보 맥락을 위한 디자인 (정보 콘텐츠 디자인)

이제 다양한 기본 구성 요소를 구별하는 비즈니스 요구 사항을 식별했으므로 전체 아키텍처 설계에 이를 포함해야 합니다. BI 구성 요소 중 일부는 초기 노력의 일부이지만 일부는 몇 달 동안 구현되지 않을 것입니다.

그러나 알려진 모든 요구 사항은 설계에 반영되므로 특정 기술을 구현해야 할 경우 그렇게 할 준비가 되어 있습니다. 프로젝트의 일부는 전통적인 사고를 반영할 것입니다.

이 세트는 주기 이후의 사용을 지원하는 데 사용됩니다. 주기 차원은 우리가 식별한 비즈니스 문제에 따라 결정됩니다. 디자인 개발 등 추가 문서가 생성됨에 따라 주기, 우리는 내가 어떻게 해야 하는지 공식화하기 시작할 것입니다. 주기 그들은 환경에 퍼집니다. 우리는 나를 대표할 필요성을 확인했습니다 주기 차원적인 방식으로 (특정 요구 사항에 따라) 데이터 마트로 나눕니다.

대답해야 할 다음 질문은 이러한 데이터 마트를 어떻게 구축할 것인가입니다.
큐브를 지지하기 위해 별을 만들까요, 아니면 큐브만 만들까요, 아니면 별만 만들까요? (또는 오른쪽 큐브 또는 오른쪽 별). 모든 항목에 대해 원자 계층이 필요한 종속 데이터 마트용 아키텍처 생성 주기 획득? 독립적인 데이터 마트가 i를 획득하도록 허용 주기 운영 체제에서 직접?

어떤 큐브 기술을 표준화하려고 하시나요?

당신은 엄청난 양의 주기 차원 분석에 필요합니까, 아니면 전국 영업 인력으로부터 매주 큐브가 필요합니까, 아니면 둘 다 필요합니까? 재무를 위한 DB2 OLAP Server나 영업 조직을 위한 Cognos PowerPlay 큐브 또는 둘 다를 구축하는 강력한 제품을 구축하고 계십니까? 이는 앞으로 BI 환경에 영향을 미칠 큰 아키텍처 설계 결정입니다. 예, 귀하는 OLAP에 대한 필요성을 확립했습니다. 이제 그러한 기술과 기술을 어떻게 수행할 것인가?

가장 발전된 기술 중 일부가 디자인에 어떤 영향을 미치나요? 조직에서 필요한 공간을 파악했다고 가정해 보겠습니다. 이제 몇 달 동안 공간 구성 요소를 만들 계획이 없더라도 건축 도면 버전을 기억해야 합니다. 건축가는 오늘날 필요한 것을 바탕으로 설계해야 합니다. 액세스를 생성, 저장, 수행 및 제공하는 공간 분석의 필요성을 예측합니다. 주기 공간. 이는 결국 현재 고려할 수 있는 소프트웨어 기술 유형 및 플랫폼 사양에 대한 제약으로 작용해야 합니다. 예를 들어, 행정 시스템 데이터베이스 원자 계층에 대해 수행하는 관계형 계층(RDBMS)에는 강력한 공간 범위를 사용할 수 있어야 합니다. 이렇게 하면 분석 응용 프로그램에서 형상 및 공간 개체를 사용할 때 최대 성능이 보장됩니다. RDBMS가 처리할 수 없는 경우 주기 (공간 중심) 내부적으로 데이터베이스 (공간 중심) 외부. 이로 인해 문제 관리가 복잡해지고 전반적인 성능이 저하될 뿐만 아니라 DBA가 DBA의 기본 사항에 대해 최소한의 이해만 갖고 있기 때문에 발생하는 추가 문제는 말할 것도 없습니다. 주기 공간도 그렇고. 반면, RDMBS 엔진이 모든 공간 구성 요소를 처리하고 해당 최적화 프로그램이 공간 개체의 특별한 요구 사항(예: 인덱싱)을 인식하는 경우 DBA가 문제 관리를 쉽게 처리할 수 있으며 성능을 최대화할 수 있습니다.

또한 주소 정리를 포함하도록 준비 영역과 원자 환경 계층을 조정해야 합니다(

공간 분석의 핵심 요소) 및 후속 공간 객체 저장이 가능합니다. 우리가 명확한 방향이라는 개념을 도입한 이후에도 일련의 드로잉 에디션이 계속되고 있습니다. 우선, 이 애플리케이션은 ETL 작업에 필요한 소프트웨어 유형을 결정합니다.

깨끗한 주소를 제공하기 위해 Trillium과 같은 제품이 필요합니까, 아니면 해당 기능을 제공하기 위해 선택한 ETL 공급업체가 필요합니까?
지금은 창고 구현을 시작하기 전에 완료해야 하는 설계 수준을 이해하는 것이 중요합니다. 위의 예는 특정 비즈니스 요구 사항의 식별을 따라야 하는 다양한 설계 결정을 보여줍니다. 이러한 설계 결정이 올바르게 이루어지면 환경의 물리적 구조, 사용되는 기술 선택, 정보 콘텐츠 전파 흐름 간의 상호 의존성이 촉진됩니다. 이러한 기존 BI 아키텍처가 없으면 조직은 기껏해야 겉보기 안정성을 제공하기 위해 느슨하게 결합된 기존 기술의 혼란스러운 혼합에 노출될 것입니다.

정보 콘텐츠 유지

정보의 가치를 조직에 전달하는 것은 매우 어려운 작업입니다. 충분한 이해와 경험, 적절한 계획과 설계가 없으면 최고의 팀이라도 실패할 것입니다. 반면에 직관력이 뛰어나고 세부적인 계획이 있지만 실행에 대한 규율이 ​​없다면 노력은 실패할 것이기 때문에 돈과 시간을 낭비한 것입니다. 메시지는 명확해야 합니다. 이러한 기술, 이해/경험, 계획/설계 또는 구현 규율 중 하나 이상이 부족하면 BI 조직의 구축이 손상되거나 파괴될 것입니다.

당신의 팀은 충분히 준비되어 있나요? BI 팀에는 BI 환경에서 사용할 수 있는 광범위한 분석 환경과 해당 환경을 유지하는 데 필요한 기술 및 기술을 이해하고 있는 사람이 있습니까? 귀하의 팀에는 고급 응용 프로그램과 응용 프로그램의 차이점을 인식할 수 있는 사람이 있습니까?

정적 보고와 OLAP, 아니면 ROLAP과 OLAP의 차이점은 무엇인가요? 팀 구성원 중 한 명이 추출 방법과 그것이 창고에 어떤 영향을 미칠 수 있는지 또는 창고가 추출 성능을 어떻게 지원할 수 있는지 명확하게 인식하고 있습니까? 팀원은 다음의 가치를 이해합니다. 주기 우주 또는 에이전트 기반 기술? ETL 도구와 메시지 브로커 기술의 고유한 적용을 높이 평가하는 사람이 있습니까? 가지고 있지 않다면 하나 구입하십시오. BI는 정규화된 원자 계층, OLAP, 스타 스키마 및 ODS보다 훨씬 더 큽니다.

BI 요구 사항과 해당 솔루션을 인식할 수 있는 이해와 경험을 갖는 것은 사용자 요구 사항을 적절하게 공식화하고 해당 솔루션을 설계 및 구현하는 능력에 필수적입니다. 사용자 커뮤니티가 요구 사항을 설명하는 데 어려움을 겪는 경우 그러한 이해를 제공하는 것이 웨어하우스 팀의 임무입니다. 하지만 창고팀이라면

데이터 마이닝과 같은 특정 BI 애플리케이션을 인식하지 못하는 경우 BI 환경이 수동적 저장소로 제한되는 경우가 많습니다. 그러나 이러한 기술을 무시한다고 해서 해당 기술의 중요성과 해당 기술이 조직의 비즈니스 인텔리전스 기능 출현 및 육성하려는 정보 환경에 미치는 영향이 줄어들지는 않습니다.

계획에는 그림의 개념이 포함되어야 하며 두 가지 모두 유능한 개인이 필요합니다. 또한 설계에는 팀 창고 철학과 표준 준수가 필요합니다. 예를 들어, 회사에서 표준 플랫폼을 확립했거나 플랫폼 전반에 걸쳐 표준화하려는 특정 RDBMS를 식별한 경우 해당 표준을 준수해야 하는 책임은 팀의 모든 사람에게 있습니다. 일반적으로 팀은 표준화의 필요성을 사용자 커뮤니티에 공개하지만 팀 자체는 회사의 다른 영역이나 유사한 회사에서 확립된 표준을 준수하는 것을 꺼립니다. 이는 위선적일 뿐만 아니라 회사가 기존 자원과 투자를 활용할 수 없다는 사실을 입증합니다. 이는 표준화되지 않은 플랫폼이나 기술을 보증하는 상황이 없다는 의미는 아닙니다. 그러나 창고 노력

그들은 비즈니스 요구 사항에 따라 다르게 지시될 때까지 기업의 표준을 열심히 지켜야 합니다.

BI 조직을 구축하는 데 필요한 세 번째 핵심 구성 요소는 규율입니다.
전체적으로는 개인과 환경에 따라 달라집니다. 프로젝트 기획자, 후원자, 설계자 및 사용자는 회사의 정보 환경을 구축하는 데 필요한 규율을 높이 평가해야 합니다. 디자이너는 사회에서 필요한 다른 노력을 보완하는 방식으로 자신의 디자인 노력을 지휘해야 합니다.

예를 들어 회사에서 창고 구성 요소가 포함된 ERP 애플리케이션을 구축한다고 가정해 보겠습니다.
따라서 이미 시작된 작업을 경쟁하거나 중복하지 않도록 창고 환경팀과 협력하는 것은 ERP 설계자의 책임입니다.

규율 역시 조직 전체가 다뤄야 할 주제로, 대개 임원급에 확립되어 위임된다.
관리자는 설계된 접근 방식을 기꺼이 고수할 의향이 있습니까? 궁극적으로 기업의 모든 영역에 가치를 제공할 정보 콘텐츠를 만들겠다고 약속하지만 개인이나 부서의 안건을 타협할 수도 있는 접근 방식입니까? “한 가지만 생각하는 것보다 모든 것을 생각하는 것이 더 중요하다”는 말을 기억하세요. 이 말은 BI 조직에 해당됩니다.

불행하게도 많은 창고에서는 조직 전체를 거의 고려하지 않고 특정 부서나 특정 사용자를 목표로 삼고 가치를 제공하는 데 노력을 집중하고 있습니다. 경영진이 창고 팀에 도움을 요청한다고 가정해 보겠습니다. 팀은 관리자가 정의한 알림 요구 사항을 전달할 뿐만 아니라 모든 주기 베이스는 제안된 큐브 기술에 도입되기 전에 원자 수준에서 혼합됩니다.
이러한 엔지니어링 추가로 인해 창고 기업은 다음과 같은 이점을 누릴 수 있습니다. 주기 관리자에게 꼭 필요합니다.
그러나 그 임원은 4주 이내에 배송되는 유사한 신청서를 제안한 외부 컨설팅 회사와 이야기를 나눴습니다.

내부 창고 팀이 유능하다고 가정하면 경영진은 선택권을 갖습니다. 정보 자산 기업을 육성하는 데 필요한 추가 엔지니어링 원칙을 지원할 수 있는 사람이나 자체 솔루션을 신속하게 구축할 수 있는 사람은 누구입니까? 마지막 것은 너무 자주 선택되는 것으로 보이며 소수 또는 개인에게만 이익이 되는 정보 컨테이너를 만드는 역할만 합니다.

단기 및 장기 목표

설계자와 프로젝트 디자이너는 전체 아키텍처에 대한 장기적인 비전과 BI 조직의 성장 계획을 공식화해야 합니다. 단기적 이익과 장기 계획의 조합은 BI 노력의 양면을 나타냅니다. 단기 이익은 웨어하우스의 반복과 관련된 BI의 측면입니다.

이는 기획자, 건축가 및 후원자가 특정 상업적 요구 사항을 충족하는 데 중점을 두는 곳입니다. 물리적 구조가 구축되고, 기술이 구매되고, 기술이 구현되는 곳이 바로 이 수준입니다. 특정 사용자 커뮤니티에서 정의한 특정 요구 사항을 해결하기 위해 만들어진 것은 아닙니다. 특정 커뮤니티에서 정의한 특정 요구 사항을 해결하기 위해 모든 작업이 수행됩니다.
그러나 장기 계획은 BI의 또 다른 측면입니다. 여기서는 물리적 구조가 구축되도록 계획과 설계를 하고, 기업을 염두에 두고 선택한 기술과 구현된 기술을 보장합니다. 발견된 단기 이익에서 비즈니스 이익이 발생하도록 보장하는 데 필요한 응집력을 제공하는 것은 장기 계획입니다.

BI 노력을 정당화하세요

Un 데이터웨어 하우스 그 자체로는 고유한 가치가 없습니다. 즉, 창고 기술과 구현 기술 사이에는 고유한 가치가 없습니다.

창고 노력의 가치는 창고 환경과 시간이 지남에 따라 축적된 정보 콘텐츠의 결과로 수행되는 작업에서 발견됩니다. 이는 모든 창고 계획의 가치를 추정하기 전에 이해해야 할 중요한 사항입니다.

실제로 가치는 창고와 잘 확보된 정보에 의해 긍정적인 영향을 받는 비즈니스 프로세스에 기반을 두고 있는데도 건축가와 설계자는 창고의 물리적, 기술적 구성 요소에 가치를 적용하려고 시도하는 경우가 너무 많습니다.

BI 구축의 과제는 다음과 같습니다. 투자를 어떻게 정당화합니까? 창고 자체에 본질적인 가치가 없는 경우 프로젝트 설계자는 특정 비즈니스 프로세스나 보호된 정보의 가치 또는 둘 다를 개선하기 위해 창고를 사용하는 개인이 얻을 수 있는 이점을 조사, 정의 및 공식화해야 합니다.

설상가상으로, 창고 작업으로 인해 영향을 받는 모든 비즈니스 프로세스는 "상당한" 또는 "약간의" 이점을 제공할 수 있습니다. 상당한 이점은 투자 수익률(ROI)을 측정하는 실질적인 지표를 제공합니다. 예를 들어 특정 기간 동안 재고 회전 시간을 늘리거나 배송당 운송 비용을 낮추는 등의 이점이 있습니다. 정보에 대한 접근성 향상과 같은 미묘한 이점을 유형의 가치 측면에서 정의하기는 더 어렵습니다.

프로젝트를 연결하여 다음에 대해 알아보세요. 비즈니스 요청

프로젝트 기획자는 창고 가치를 무정형 기업 목표와 연결하려고 시도하는 경우가 너무 많습니다. "창고의 가치는 전략적 요구를 충족시키는 능력에 달려 있다"고 선언함으로써 우리는 즐거운 방식으로 토론을 시작했습니다. 그러나 그것만으로는 재고에 투자하는 것이 합당한지 여부를 결정하는 데 충분하지 않습니다. 웨어하우스 반복을 알려진 특정 비즈니스 요구 사항과 연결하는 것이 가장 좋습니다.

ROI 측정

창고 환경에서 ROI를 계산하는 것은 특히 어려울 수 있습니다. 장점이라면 특히 어렵다.

특정 반복의 원리는 눈에 보이지 않거나 측정하기 쉽지 않은 것입니다. 한 연구에 따르면 사용자는 BI 이니셔티브의 두 가지 주요 이점을 인식하고 있습니다.

  • ▪ 의사결정 능력을 키우세요.
  • ▪ 정보에 대한 액세스 생성
    이러한 혜택은 부드러운(또는 가벼운) 혜택입니다. 운송 비용 절감과 같은 확실한(또는 주요) 이점을 기반으로 ROI를 계산하는 방법은 쉽습니다. 하지만 더 나은 결정을 내릴 수 있는 능력은 어떻게 측정합니까?
    이는 회사가 특정 창고 노력에 투자하도록 설득하려는 프로젝트 기획자에게 확실히 어려운 일입니다. 매출 증대나 비용 절감은 더 이상 BI 환경을 이끄는 핵심 주제가 아닙니다.
    대신, 특정 부서가 더 빠른 결정을 내릴 수 있도록 정보에 대한 더 나은 액세스에 대한 비즈니스 요청을 검토하고 있습니다. 이는 기업에 똑같이 중요하지만 실질적인 지표로 특성화하기가 더 모호하고 어려운 전략적 동인입니다. 이 경우 ROI 계산은 관련성이 없지는 않더라도 오해의 소지가 있을 수 있습니다.
    프로젝트 기획자는 경영진이 특정 반복에 대한 투자가 그만한 가치가 있는지 결정할 수 있도록 실질적인 가치를 보여줄 수 있어야 합니다. 그러나 우리는 ROI를 계산하는 새로운 방법을 제안하지 않을 것이며 이에 대해 어떠한 찬반 주장도 하지 않을 것입니다.
    ROI 계산의 기본 사항을 논의하는 기사와 책이 많이 있습니다. Gartner와 같은 그룹에서 제공하는 투자 가치(VOI)와 같이 조사할 수 있는 특별한 가치 제안이 있습니다. 대신, 고려해야 할 ROI 또는 기타 가치 제안의 핵심 측면에 중점을 둘 것입니다. ROI 적용 BI 노력과 관련된 "하드" 이점과 "부드러운" 이점에 대한 논쟁 외에도 ROI를 적용할 때 고려해야 할 다른 문제가 있습니다. 예를 들어:

어차피 발생할 DW 노력에 너무 많은 비용 절감 효과가 있다고 생각함
귀하의 회사가 메인프레임 아키텍처에서 분산 UNIX 환경으로 전환했다고 가정해 보겠습니다. 따라서 그러한 노력을 통해 실현될 수 있는(또는 실현될 수 없는) 비용 절감이 창고에만 국한되어서는 안 됩니다(?).

모든 것을 설명하지 않는 것은 비용이 많이 듭니다. 그리고 고려해야 할 사항이 많습니다. 다음 목록을 고려하십시오.

  • ▪ 타당성을 포함한 초기 비용.
  • ▪ 관련 스토리지 및 통신을 갖춘 전용 하드웨어 비용
  • ▪ 관리를 포함한 소프트웨어 비용 주기 클라이언트/서버 확장, ETL 소프트웨어, DSS 기술, 시각화 도구, 일정 관리 및 작업 흐름 애플리케이션, 모니터링 소프트웨어 등이 있습니다.
  • ▪ 구조설계비용 주기, 생성 및 최적화와 함께
  • ▪ BI 노력과 직접적으로 관련된 소프트웨어 개발 비용
  • ▪ 소프트웨어 버전 관리 및 도움말 운영을 포함한 성능 최적화를 포함한 현장 지원 비용 "빅뱅" ROI를 적용하세요. 단일의 거대한 노력으로 창고를 구축하는 것은 실패할 운명이므로 대기업 계획에 대한 ROI를 계산하는 것조차도 놀라운 제안이며 기획자는 전체 노력의 가치를 추정하기 위해 계속해서 미약한 시도를 합니다. 특정 반복을 추정하는 것이 어렵다는 것이 널리 알려져 있고 받아들여지고 있는데 기획자는 왜 비즈니스 이니셔티브에 금전적 가치를 부여하려고 할까요? 그게 어떻게 가능해? 몇 가지 예외를 제외하고는 불가능합니다. 하지 마세요. 이제 ROI를 계산할 때 하지 말아야 할 사항을 설정했으므로 BI 노력의 가치를 추정하기 위한 신뢰할 수 있는 프로세스를 설정하는 데 도움이 되는 몇 가지 사항은 다음과 같습니다.

ROI 합의를 얻습니다. BI 노력의 가치를 평가하기 위해 선택한 기술에 관계없이 프로젝트 디자이너, 후원자, 비즈니스 임원을 포함한 모든 당사자의 동의가 있어야 합니다.

ROI를 식별 가능한 부분으로 줄입니다. ROI를 합리적으로 계산하는 데 필요한 단계는 해당 계산을 특정 프로젝트에 집중하는 것입니다. 그러면 충족되는 특정 비즈니스 요구 사항을 기반으로 가치를 추정할 수 있습니다.

비용을 정의합니다. 언급한 바와 같이, 수많은 비용을 고려해야 합니다. 또한 비용에는 단일 반복과 관련된 비용뿐만 아니라 기업 표준 준수 보장과 관련된 비용도 포함되어야 합니다.

혜택을 정의하세요. ROI를 특정 비즈니스 요구 사항과 명확하게 연결함으로써 요구 사항 충족으로 이어질 이점을 식별할 수 있어야 합니다.

임박한 이익을 위해 비용과 이점을 줄입니다. 이는 미래 수익의 미래 가치를 예측하는 대신 순현재가치(NPV)를 기준으로 가치를 평가하는 가장 좋은 방법입니다.

ROI를 분할하는 시기를 최소한으로 유지하세요. 이는 ROI에 사용된 오랜 기간 동안 잘 문서화되어 있습니다.

두 개 이상의 ROI 공식을 사용하세요. ROI를 예측하는 방법에는 여러 가지가 있으며 순현재가치, 내부수익률(IRR), 투자 회수 등 그 중 하나 이상을 사용할지 여부를 계획해야 합니다.

반복 가능한 프로세스를 정의합니다. 이는 장기적인 가치를 계산하는 데 매우 중요합니다. 이후의 모든 프로젝트 하위 순서에 대해 반복 가능한 단일 프로세스를 문서화해야 합니다.

나열된 문제는 창고 환경 전문가가 정의한 가장 일반적인 문제입니다. "빅뱅" ROI 제공에 대한 경영진의 주장은 매우 혼란스럽습니다. 모든 ROI 계산을 식별 가능하고 유형적인 부분으로 나누어 시작하면 정확한 ROI 등급을 추정할 가능성이 높습니다.

ROI 혜택에 관한 질문

귀하의 혜택이 소프트든 하드든 상관없이 몇 가지 기본적인 질문을 사용하여 그 가치를 결정할 수 있습니다. 예를 들어 1에서 10까지의 간단한 척도 시스템을 사용하면 다음 질문을 사용하여 모든 노력의 영향을 측정할 수 있습니다.

  • 이해도를 어떻게 평가하시겠습니까? 주기 당신 회사의 이 프로젝트를 따르시나요?
  • 이 프로젝트의 결과로 프로세스 개선이 어떻게 이루어졌을 것으로 예상하십니까?
  • 이번 반복을 통해 현재 제공되는 새로운 통찰력과 추론의 영향을 어떻게 측정하시겠습니까?
  • 학습된 내용의 결과로 새롭고 성능이 뛰어난 컴퓨팅 환경은 어떤 영향을 미쳤습니까? 이러한 질문에 대한 답변이 적다면 회사가 투자할 가치가 없을 가능성이 있습니다. 높은 점수를 받는 질문은 상당한 가치 이득을 가리키며 추가 조사를 위한 지침 역할을 해야 합니다. 예를 들어 프로세스 개선에 대한 높은 점수는 설계자가 프로세스가 어떻게 개선되었는지 검토하도록 유도해야 합니다. 얻은 이익 중 일부 또는 전부가 유형이므로 금전적 가치를 쉽게 적용할 수 있다는 것을 알 수 있습니다. 첫 번째 반복을 최대한 활용하기 창고 기업 노력의 가장 큰 결과는 처음 몇 번의 반복에서 나타나는 경우가 많습니다. 이러한 초기 노력은 전통적으로 대중에게 가장 유용한 정보 콘텐츠를 구축하고 후속 BI 애플리케이션을 위한 기술 기반을 구축하는 데 도움이 됩니다. 일반적으로 모든 후속 하위 시퀀스 주기 창고 프로젝트가 기업 전체에 가져오는 부가 가치가 점점 줄어들고 있습니다. 반복이 새로운 주제를 추가하지 않거나 새로운 사용자 커뮤니티의 요구 사항을 충족하지 못하는 경우 특히 그렇습니다.

이 저장 기능은 증가하는 스택에도 적용됩니다. 주기 역사가. 후속 노력에는 더 많은 것이 필요하기 때문에 주기 그리고 얼마나 더 주기 시간이 지남에 따라 대부분의 물품이 창고에 부어집니다. 주기 사용된 분석과 관련성이 낮아집니다. 이것들 주기 그들은 종종 불린다 주기 휴면 상태이며 거의 사용되지 않기 때문에 유지하는 데 항상 비용이 많이 듭니다.

이는 프로젝트 후원자에게 무엇을 의미합니까? 본질적으로 초기 후원자는 투자 비용보다 더 많은 것을 공유합니다. 이는 창고의 광범위한 기술과 유기농을 포함한 자원 환경 계층을 구축하는 원동력이기 때문에 일차적입니다.

그러나 이러한 첫 번째 단계는 가장 높은 가치를 가져오므로 프로젝트 설계자는 종종 투자의 정당성을 입증해야 합니다.
BI 이니셔티브 이후 수행된 프로젝트는 첫 번째 프로젝트에 비해 비용이 더 낮고 직접적일 수 있지만 회사에 가져오는 가치는 낮습니다.

그리고 조직 소유자는 축적된 것을 버리는 것을 고려하기 시작해야 합니다. 주기 관련성이 낮은 기술.

데이터 마이닝: 추출 주기

수많은 아키텍처 구성 요소에는 데이터 마이닝 기술 및 기법의 변형이 필요합니다.
예를 들어, 관심 지점을 조사하기 위한 다양한 "에이전트" 고객, 회사의 운영 체제 및 dw 자체에 대한 것입니다. 이러한 에이전트는 판매 프로모션을 기반으로 한 미래 제품 수요와 같은 POT 추세에 대해 훈련된 고급 신경망일 수 있습니다. 세트에 반응하는 규칙 기반 엔진 데이터 예를 들어 의료 진단 및 치료 권장 사항과 같은 상황 또는 최고 경영진에게 예외를 보고하는 역할을 하는 단순한 대리인도 있습니다. 일반적으로 이러한 추출 과정은 주기 si

실시간으로 확인; 그러므로 그들은 다음 운동과 완전히 결합되어야 한다. 주기 스테시.

온라인 분석 처리 처리

온라인 분석

슬라이스, 다이스, 롤, 드릴다운 및 분석 수행 기능
가상(what-if)은 IBM 기술 제품군의 초점인 범위 내에 있습니다. 예를 들어, DB2에는 소프트웨어 엔진에 차원 분석을 제공하는 OLAP(온라인 분석 처리) 기능이 있습니다. 데이터베이스 같은 .

이 함수는 DB2의 자연스러운 일부가 되는 모든 이점을 활용하면서 SQL에 차원적 유틸리티를 추가합니다. OLAP 통합의 또 다른 예는 추출 도구인 DB2 OLAP Server Analyser입니다. 이 기술을 사용하면 DB2 OLAP Server 큐브를 신속하고 자동으로 분석하여 값을 찾고 보고할 수 있습니다. 주기 비즈니스 분석가에게 큐브 전반에 걸쳐 특이하거나 예상치 못한 정보를 제공합니다. 마지막으로 DW 센터 기능은 설계자가 무엇보다도 ETL 프로세스의 자연스러운 부분으로 DB2 OLAP 서버 큐브의 프로필을 제어할 수 있는 수단을 제공합니다.

공간분석 공간분석

공간은 파노라마에 필요한 분석 앵커(리드)의 절반을 나타냅니다.
분석적 범위(시간이 나머지 절반을 나타냄). 그림 1.1에 묘사된 창고의 원자 수준에는 시간과 공간의 기본 사항이 모두 포함됩니다. 타임스탬프 앵커는 시간별 분석, 주소정보 앵커는 공간별 분석을 수행합니다. 타임스탬프는 시간별로 분석하고, 주소정보는 공간별로 분석한다. 다이어그램은 거리, 내부/외부 등의 개념을 분석에 사용할 수 있도록 주소를 지도의 지점이나 공간의 지점으로 변환하는 프로세스인 지오코딩을 원자 수준에서 수행하고, 공간 분석을 수행하는 방법을 보여줍니다. 분석가. IBM은 ESRI(Environmental System Research Institute)와 함께 개발한 공간 확장 기능을 제공합니다. 데이터베이스 DB2에서는 공간 객체를 정상적인 일부로 저장할 수 있도록 데이터베이스 관계형. DB2

Spatial Extender는 공간 분석을 활용하기 위한 모든 SQL 확장도 제공합니다. 예를 들어 쿼리할 SQL 확장은
주소 사이의 거리 또는 점이 정의된 다각형 영역 내부에 있는지 외부에 있는지 여부는 Spatial Extender의 분석 표준입니다. 자세한 내용은 16장을 참조하세요.

데이터베이스- 상주 도구 도구 데이터베이스-거주자

DB2에는 분석 작업을 지원하는 많은 BI 상주 SQL 기능이 있습니다. 여기에는 다음이 포함됩니다.

  • "가능한 모든 비행 경로 찾기"와 같은 분석을 수행하는 재귀 기능 샌프란시스코 a 뉴욕".
  • 일반적으로 OLAP 기술에서만 발생하는 작업을 용이하게 하기 위한 순위 지정, 누적 함수, 큐브 및 롤업을 위한 분석 기능이 이제 엔진의 자연스러운 일부입니다. 데이터베이스
  • 결과를 포함하는 테이블을 생성하는 기능
    판매자 데이터베이스 리더들은 더 많은 BI 기능을 비즈니스에 결합합니다. 데이터베이스 같은.
    주요 공급업체 데이터베이스 그들은 더 많은 BI 기능을 데이터베이스 같은.
    이는 BI 솔루션에 더 나은 성능과 더 많은 실행 옵션을 제공합니다.
    DB2 V8의 특징과 기능은 다음 장에서 자세히 설명됩니다.
    기술 아키텍처 및 데이터 관리 기초(5장)
  • DB2 BI 기초(6장)
  • DB2 구체화된 쿼리 테이블(7장)
  • DB2 OLAP 함수(13장)
  • DB2 향상된 BI 특징 및 기능(15장) 단순화된 데이터 전달 시스템 배송시스템 주기 쉽게 한

그림 1.1에 묘사된 아키텍처에는 다양한 구조가 포함되어 있습니다. 주기 물리적. 하나는 창고 주기 운영. 일반적으로 ODS는 주제 지향적이고 통합된 최신 개체입니다. 예를 들어 영업 사무소를 지원하기 위해 ODS를 구축할 수 있습니다. ODS 판매로 보충할 것 주기 수많은 다른 시스템에서 수집되지만 예를 들어 오늘의 거래만 유지됩니다. ODS는 하루에 여러 번 업데이트될 수도 있습니다. 동시에 프로세스는 주기 다른 응용 프로그램에 통합되었습니다. 이 구조는 통합하기 위해 특별히 설계되었습니다. 주기 현재의 동적이며 서비스 에이전트에 제공하는 것과 같은 실시간 분석을 지원할 가능성이 높은 후보입니다. 고객 창고 자체에서 판매 동향 정보를 추출하여 고객의 현재 판매 정보를 제공합니다. 그림 1.1에 표시된 또 다른 구조는 dw의 형식적 상태입니다. 이곳은 필요한 통합을 실행하는 장소일 뿐만 아니라 주기, 그리고 변환의 주기 들어오는 창고의, 그러나 또한을 위한 믿을 수 있는 임시 저장 지역입니다 주기 실시간 분석에 사용할 수 있는 복제물입니다. ODS 또는 준비 영역을 사용하기로 결정한 경우 이러한 구조를 채우기 위한 최고의 도구 중 하나 주기 서로 다른 운영 소스를 사용하는 것은 DB2의 이기종 분산 쿼리입니다. 이 기능은 DB2 Relational Connect(쿼리 전용)라는 선택적 DB2 기능과 DB2 DataJoiner(이기종 분산 RDBMS에 쿼리, 삽입, 업데이트 및 삭제 기능을 제공하는 별도의 제품)를 통해 제공됩니다.

이 기술을 통해 건축가는 주기 묶다 주기 분석 프로세스를 통한 생산. 이 기술은 실시간 분석으로 인해 발생할 수 있는 거의 모든 복제 요구 사항에 적응할 수 있을 뿐만 아니라 다양한 데이터베이스에 연결할 수도 있습니다. 주기 DB2, Oracle, Sybase, SQL Server, Informix 등을 포함하여 가장 널리 사용됩니다. DB2 DataJoiner를 사용하여 구조를 채울 수 있습니다. 주기 즉각적인 업데이트의 빠른 복구 또는 판매용으로 설계된 창고에 표시되는 ODS 또는 영구 테이블로 공식적으로 사용됩니다. 물론 똑같은 구조지만 주기 다음을 사용하여 채울 수 있습니다.

복제를 위해 설계된 또 다른 중요한 기술 주기, IBM DataPropagator 관계형. (DataPropagator는 중앙 시스템을 위한 별도의 제품입니다. DB2 UNIX, Linux, Windows 및 OS/2에는 데이터 복제 서비스가 포함되어 있습니다. 주기 표준 기능으로).
또 다른 이동 방법 주기 기업 주변에서 운영되는 기업 애플리케이션 통합업체는 메시지 브로커라고도 알려져 있습니다. 이 고유한 기술을 통해 타겟팅 및 이동에 대한 탁월한 제어가 가능합니다. 주기 회사 주변. IBM은 가장 널리 사용되는 메시지 브로커인 MQSeries 또는 다음 요구 사항을 포함하는 제품 변형을 보유하고 있습니다. 전자 상거래, IBM WebSphere MQ.
Per più discussione su come sfruttare MQ per sostenere un magazzino e un ambiente BI, visitare 웹 사이트 del libro. Per ora, è sufficiente dire che questa tecnologia è un mezzo eccellente per catturare e trasformare (utilizzando MQSeries Integrator) 주기 BI 솔루션을 위한 중심(타겟) 운영자를 모집합니다. MQ 기술이 UDB V8에 통합 및 패키지되었습니다. 즉, 이제 메시지 큐를 DB2 테이블인 것처럼 관리할 수 있습니다. 대기 중인 메시지를 용접하는 개념과 세계 데이터베이스 관계형 헤드는 강력한 전달 환경을 지향합니다. 주기.

제로 레이턴시 제로 레이턴시

IBM의 궁극적인 전략적 목표는 지연 시간 없는 분석입니다. 에 의해 정의됨
BI 시스템인 Gartner는 필요에 따라 정보를 추론하고 동화하여 분석가에게 제공할 수 있어야 합니다. 물론 문제는 어떻게 혼합하느냐이다. 주기 i와 같은 필요한 과거 정보가 포함된 최신 및 실시간 정보 주기 관련 패턴/트렌드 또는 고객 프로파일링과 같은 이해 추출.

이러한 정보에는 예를 들어 다음과 같은 신원 정보가 포함됩니다. 고객 위험도가 높거나 낮거나 어떤 제품이 나인지 고객 장바구니에 이미 치즈가 있으면 구매할 가능성이 가장 높습니다.

제로 레이턴시를 달성하는 것은 실제로 두 가지 기본 메커니즘에 달려 있습니다.

  • 완전한 결합 주기 BI가 만들어낸 확립된 기술과 도구로 분석됩니다.
  • 배송 시스템 주기 실시간 분석을 실제로 사용할 수 있도록 효율적으로 대기 시간 제로를 위한 이러한 전제 조건은 IBM이 설정하고 위에서 설명한 두 가지 목표와 다르지 않습니다. 긴밀한 교배 주기 이는 IBM의 원활한 통합 프로그램의 일부입니다. 그리고 배송 시스템을 구축하세요. 주기 효율성은 전달 프로세스를 단순화하는 사용 가능한 기술에 전적으로 달려 있습니다. 주기. 결과적으로, IBM의 세 가지 목표 중 두 가지는 세 번째 목표를 실현하는 데 매우 중요합니다. IBM은 웨어하우스 노력에 있어 대기 시간 제로가 현실이 되도록 의식적으로 기술을 발전시키고 있습니다. 요약 / 종합 BI 조직은 환경 구축을 위한 로드맵을 제공합니다.
    반복적으로. 이는 현재와 미래의 비즈니스 요구 사항을 반영하도록 조정되어야 합니다. 광범위한 아키텍처 비전이 없으면 창고 반복은 광범위하고 정보가 풍부한 기업을 만드는 데 거의 도움이 되지 않는 중앙 창고의 무질서한 구현에 지나지 않습니다. 프로젝트 관리자의 첫 번째 장애물은 BI 조직을 개발하는 데 필요한 투자를 정당화하는 방법입니다. ROI 계산은 창고 구현의 주요 요소로 남아 있지만 정확하게 예측하는 것은 점점 더 어려워지고 있습니다. 이로 인해 귀하가 돈의 가치를 얻고 있는지 여부를 결정하는 다른 방법이 생겼습니다. 예를 들어 투자 가치2(VOI)가 솔루션으로 홍보됩니다. 이는 건축가의 몫이다. 주기 및 프로젝트 기획자는 단순히 서비스를 제공하는 것이 아니라 의도적으로 정보를 생성하여 사용자 협회에 제공합니다. 주기. 둘 사이에는 큰 차이가 있습니다. 정보는 의사 결정과 효율성에 차이를 만드는 것입니다. 상대적으로 나는 주기 이는 해당 정보를 도출하기 위한 구성 요소입니다.

비록 출처에 대해 비판적이긴 하지만 주기 비즈니스 요청을 처리하려면 BI 환경이 정보 콘텐츠 생성에서 더 큰 역할을 수행해야 합니다. 우리는 사용자가 조치를 취할 수 있는 정보 콘텐츠를 정리, 통합, 변환 또는 생성하기 위한 추가 단계를 수행해야 하며, 합리적인 경우 그러한 조치와 결정이 BI 환경에 반영되도록 해야 합니다. 창고를 다음 서비스에만 맡길 경우 주기, 사용자 연관이 조치를 취하는 데 필요한 정보 콘텐츠를 생성한다는 것이 보장됩니다. 이를 통해 커뮤니티는 더 나은 결정을 내릴 수 있지만 기업은 사용한 지식이 부족하여 어려움을 겪고 있습니다. 다토 설계자와 프로젝트 기획자는 BI 환경에서 특정 프로젝트를 시작하면서 기업 전체에 대한 책임을 지게 됩니다. BI 반복의 양면 특성에 대한 간단한 예는 소스에서 찾을 수 있습니다. 주기. 모든 주기 특정 비즈니스 요청에 대해 수신된 정보는 첫 번째 원자 계층에 채워져야 합니다. 이를 통해 기업 정보 자산의 개발은 물론 반복에 정의된 특정 사용자 요청을 관리하고 처리할 수 있습니다.

데이터웨어하우스란 무엇인가요?

데이터웨어 하우스 1990년 이후 정보 시스템 아키텍처의 핵심이었으며 견고한 통합 플랫폼을 제공하여 정보 프로세스를 지원합니다. 주기 후속 분석의 기초로 사용되는 과거 데이터. 그만큼 데이터웨어 하우스 호환되지 않는 응용 프로그램 시스템의 세계에서 통합이 용이합니다. 데이터웨어 하우스 트렌드로 발전했습니다. 데이터웨어 하우스 정리하고 저장해 주기 오랜 역사적 시간적 관점을 기반으로 한 정보 및 분석 프로세스에 필요합니다. 이 모든 것에는 건설 및 유지 관리에 대한 상당하고 지속적인 헌신이 수반됩니다. 데이터웨어 하우스.

그럼 데이터웨어 하우스? 데이터웨어 하우스 이다:

  • ▪ 주제 중심
  • ▪ 통합 시스템
  • ▪ 변형 시간
  • ▪ 비휘발성(삭제할 수 없음)

컬렉션 주기 프로세스 구현 시 경영 결정을 지원하는 데 사용됩니다.
I 주기 삽입 데이터웨어 하우스 대부분의 경우 운영 환경에서 파생됩니다. 그만큼 데이터웨어 하우스 이는 시스템의 나머지 부분과 물리적으로 분리된 저장 장치에 의해 생성됩니다. 주기 이전에는 운영 환경에서 파생된 정보를 기반으로 작동하는 애플리케이션에 의해 변환되었습니다.

a의 문자 그대로의 정의 데이터웨어 하우스 창고의 특성을 설명하는 중요한 동기와 근본적인 의미가 있기 때문에 심층적 인 설명이 필요합니다.

과목 오리엔테이션 오리엔테이션 어간 형성 모음

A의 첫 번째 특징은 데이터웨어 하우스 회사의 주요 구성원을 지향한다는 것입니다. 재판을 통한 안내 주기 이는 프로세스와 기능에 대한 응용 프로그램의 방향을 포함하는 보다 고전적인 방법과 대조되며, 이는 대부분의 최신 관리 시스템에서 주로 공유되는 방법입니다.

운영 세계는 금융 기관의 대출, 저축, 은행 카드 및 신탁과 같은 애플리케이션 및 기능을 중심으로 설계되었습니다. dw의 세계는 고객, 판매자, 제품, 활동 등 주요 주제를 중심으로 구성됩니다. 주제에 대한 정렬은 디자인 및 구현에 영향을 미칩니다. 주기 dw에서 찾았습니다. 더 중요한 것은 기본 주제가 키 구조의 가장 중요한 부분에 영향을 미친다는 것입니다.

애플리케이션의 세계는 데이터베이스 설계와 프로세스 설계 모두에 의해 영향을 받습니다. dw의 세계는 모델링에만 집중되어 있습니다. 주기 그리고 디자인에 관해서는 데이터베이스. 프로세스 디자인(고전적인 형태)은 dw 환경의 일부가 아닙니다.

프로세스/기능 적용 선택과 주제 선택의 차이는 내용의 차이로도 드러난다. 주기 세부적인 수준에서. 그만큼 주기 dw에는 내가 포함되지 않습니다. 주기 신청하는 동안 DSS 프로세스에 사용되지 않습니다.

운영 지향적 주기 내가 포함 주기 DSS 분석가에게 사용되거나 사용되지 않을 수 있는 기능/처리 요구 사항을 즉시 충족합니다.
운영 지향 애플리케이션을 구현하는 또 다른 중요한 방식 주기 와 다르다 주기 dw의 내용은 dei 보고서에 있습니다. 주기. 주기 운영은 활성화된 비즈니스 규칙을 기반으로 둘 이상의 테이블 간의 지속적인 관계를 유지합니다. 그만큼 주기 dw는 시간의 스펙트럼을 교차하며 dw에서 발견되는 관계는 많습니다. 많은 거래 규칙(그리고 그에 따른 많은 관계) 주기 )는 창고에 표시됩니다. 주기 두 개 이상의 테이블 사이.

(두 사람 사이의 관계가 어떻게 이루어지는지에 대한 자세한 설명은 다음과 같습니다. 주기 DW에서 처리되는 경우 해당 문제에 대한 기술 항목을 참조하세요.)
기능/프로세스 애플리케이션 선택과 주제 선택 사이의 근본적인 차이 외에는 운영 체제와 주제 사이에 더 큰 차이가 있습니까? 주기 그리고 DW.

통합 통합

dw 환경의 가장 중요한 측면은 내가 주기 dw 내에서 쉽게 통합됩니다. 언제나. 예외 없이. dw 환경의 본질은 내가 주기 창고 한도 내에 포함된 것이 통합됩니다.

통합은 일관되게 식별된 관례, 일관적인 변수 측정, 일관되게 코딩된 구조, 물리적 특성 등 다양한 방식으로 나타납니다. 주기 일관성 등이 있습니다.

수년에 걸쳐 다양한 애플리케이션 설계자들은 애플리케이션 개발 방법에 대해 많은 결정을 내려왔습니다. 디자이너 애플리케이션의 스타일과 개별화된 디자인 결정은 코딩, 키 구조, 물리적 특성, 식별 규칙 등의 차이 등 수백 가지 방식으로 드러납니다. 일관되지 않은 애플리케이션을 만드는 많은 애플리케이션 디자이너의 집단적 능력은 전설적입니다. 그림 3은 애플리케이션 설계 방식의 가장 중요한 차이점 중 일부를 보여줍니다.

인코딩: 인코딩:

애플리케이션 설계자는 다양한 방식으로 성별 분야의 인코딩을 선택했습니다. 디자이너는 섹스를 “m”과 “f”로 표현합니다. 또 다른 디자이너는 성별을 '1'과 '0'으로 표현합니다. 또 다른 디자이너는 섹스를 “x”와 “y”로 표현합니다. 또 다른 디자이너는 성을 '남성'과 '여성'으로 표현합니다. 성별이 DW에 어떻게 들어가는지는 중요하지 않습니다. "M"과 "F"는 아마도 전체 연극만큼 좋을 것입니다.

중요한 것은 성별 필드가 파생되는 출처가 무엇이든 해당 필드가 일관된 통합 상태로 DW에 도착한다는 것입니다. 결과적으로 해당 필드가 "M" 및 "F" 형식으로 표현된 응용 프로그램에서 DW로 로드되면 주기 DW 형식으로 변환해야 합니다.

속성 측정: 측정 속성:

애플리케이션 설계자는 수년에 걸쳐 다양한 방법으로 파이프라인을 측정하기로 결정했습니다. 디자이너가 저장하는 주기 파이프라인의 길이(센티미터)입니다. 다른 애플리케이션 디자이너는 주기 파이프라인의 인치 단위. 다른 애플리케이션 디자이너는 주기 초당 백만 입방피트 단위의 파이프라인 규모. 또 다른 설계자는 파이프라인 정보를 야드 단위로 저장합니다. 소스가 무엇이든 파이프라인 정보가 DW에 도착하면 동일한 방식으로 측정되어야 합니다.

그림 3의 표시에 따르면 통합 문제는 프로젝트의 거의 모든 측면, 즉 물리적 특성에 영향을 미칩니다. 주기, 둘 이상의 소스를 갖는 딜레마 주기, 일관되지 않은 식별 샘플 문제, 형식 주기 일관성이 없다 등등.

디자인 주제가 무엇이든 결과는 동일합니다 – i 주기 기본 운영 체제가 DW를 다르게 저장하는 경우에도 단일하고 전역적으로 허용되는 방식으로 DW에 저장되어야 합니다. 주기.

DSS 분석가가 DW를 볼 때 분석가의 목표는 DW를 활용하는 것이어야 합니다. 주기 창고에 있는 것들,

신뢰성이나 일관성에 대해 궁금해하기보다는 주기.

시간 변동성

모두 주기 DW에서는 특정 시점까지 정확합니다. 이 기본 특성은 주기 DW에서는 DW와 매우 다릅니다 주기 운영 환경에서 발견됩니다. 그만큼 주기 운영 환경의 정보는 액세스하는 순간만큼 정확합니다. 즉, 드라이브에 접근할 때의 운영 환경에서 주기, 접속 당시의 정확한 값이 반영될 것으로 예상됩니다. 왜냐면 난 주기 DW에서는 특정 시점(즉, "지금"이 아님)이 정확하다고 말합니다. 주기 DW에서 발견된 것은 "시간 변동"입니다.
시간 차이 주기 by DW는 여러 가지 방법으로 언급됩니다.
가장 간단한 방법은 내가 주기 DW 표현 주기 장기간(5~10년)에 걸쳐. 운영 환경에 대해 표시되는 시간 범위는 최대 690까지 오늘날의 현재 값보다 훨씬 짧습니다.
잘 작동해야 하고 트랜잭션 처리에 사용 가능해야 하는 애플리케이션은 최소 금액을 전달해야 합니다. 주기 어느 정도의 유연성을 허용한다면 말이죠. 따라서 운영 애플리케이션은 오디오 애플리케이션 디자인 주제와 같이 짧은 시간 범위를 갖습니다.
DW에서 '시간 변동'이 나타나는 두 번째 방식은 키 구조에 있습니다. DW의 각 키 구조에는 일, 주, 월 등과 같은 시간 요소가 암시적으로 또는 명시적으로 포함됩니다. 시간 요소는 거의 항상 DW에 있는 연결된 키의 맨 아래에 있습니다. 이러한 경우 월말이나 분기말에 전체 파일이 복제되는 경우와 같이 시간 요소가 암시적으로 존재합니다.
시간 차이가 표시되는 세 번째 방법은 다음과 같습니다. 주기 DW는 올바르게 등록되면 업데이트할 수 없습니다. 그만큼 주기 DW의 모든 실제적인 목적을 위해 긴 일련의 스냅샷이 있습니다. 물론 스냅샷이 잘못 촬영된 경우 스냅샷을 수정할 수 있습니다. 그러나 스냅샷이 올바르게 촬영되었다고 가정하면 촬영되자마자 수정되지 않습니다. 일부에서는

어떤 경우에는 DW의 스냅샷을 수정하는 것이 비윤리적이거나 유효하지 않을 수도 있습니다. 그만큼 주기 작동 가능하며 액세스 시점에 정확하므로 필요에 따라 업데이트될 수 있습니다.

비휘발성

DW의 네 번째 중요한 특성은 비휘발성이라는 것입니다.
업데이트, 삽입, 삭제 및 수정은 기록별로 운영 환경에 대해 정기적으로 이루어집니다. 하지만 기본적인 조작은 주기 DW에 필요한 것은 훨씬 간단합니다. DW에서는 두 가지 종류의 작업만 수행됩니다. 주기 그리고 접근 주기. 업데이트가 없습니다. 주기 (일반적인 업데이트 의미에서) DW에서 일반적인 처리 작업으로 수행됩니다. 운영 처리와 DW 처리 간의 이러한 기본적인 차이로 인해 몇 가지 매우 강력한 결과가 발생합니다. 설계 수준에서 비정상적인 업데이트에 대해 주의해야 할 필요성은 DW의 요소가 아닙니다. 주기 수행되지 않습니다. 이는 물리적 설계 수준에서 자유롭게 접근을 최적화할 수 있음을 의미합니다. 주기, 특히 물리적 정규화 및 비정규화 주제를 다루는 경우에 그렇습니다. DW 운영의 단순성의 또 다른 결과는 DW 환경을 실행하는 데 사용되는 기본 기술에 있습니다. 인라인 레코드별 업데이트를 지원하려면(운영 처리의 경우와 마찬가지로) 기술이 명백히 단순하면서도 매우 복잡한 기반을 갖추어야 합니다.
백업 및 복구, 트랜잭션 및 무결성을 지원하는 기술 주기 교착 상태의 감지 및 해결은 매우 복잡하며 DW 처리에는 필요하지 않습니다. DW의 특징, 디자인 지향성, 통합성 주기 DW 내에서 시변성과 관리 용이성 주기, 이 모든 것이 기존 운영 환경과 매우 다른 환경으로 이어집니다. 거의 모든 소스 주기 DW의 운영 환경은 다음과 같습니다. 엄청난 중복이 있다고 생각하기 쉽습니다. 주기 두 환경 사이.
실제로 많은 사람들이 느끼는 첫인상은 '중복감이 크다'이다. 주기 운영 환경과 운영 환경 사이

DW. 그러한 해석은 피상적이며 DW에서 일어나는 일에 대한 이해가 부족함을 보여줍니다.
실제로 최소한의 중복성이 있습니다. 주기 운영 환경과 나 사이 주기 DW의. 다음을 고려하십시오. 주기 그들은 필터링되었습니다 데이터 운영 환경에서 DW 환경으로 전환합니다. 많은 주기 작동 환경 외부로 절대 전달되지 않습니다. 그거 빼곤 난 주기 DSS 처리에 필요한 것은 환경에서 방향을 찾습니다.

▪ 시간 범위 주기 환경마다 매우 다릅니다. 그만큼 주기 운영 환경에서는 매우 멋지다. 그만큼 주기 DW에서는 훨씬 나이가 많습니다. 시간 범위 관점에서만 운영 환경과 DW 간에 겹치는 부분이 거의 없습니다.

▪ DW에는 다음이 포함됩니다. 주기 환경에서는 절대 찾을 수 없는 요약

▪ 나 주기 그림 3으로 전환하면서 근본적인 변화를 겪게 됩니다. 주기 선택되어 DW로 이동된 경우 크게 수정됩니다. 다르게 말하면 대부분의 주기 DW로 이동함에 따라 물리적으로나 근본적으로 변경됩니다. 통합 관점에서 보면 둘은 동일하지 않습니다. 주기 운영 환경에 상주하는 것입니다. 이러한 요인을 고려하여 중복성은 주기 두 환경 간의 중복은 거의 발생하지 않으며 두 환경 간의 중복성은 1% 미만입니다. 창고의 구조 DW는 독특한 구조를 가지고 있습니다. DW를 구분하는 다양한 수준의 요약 및 세부 정보가 있습니다.
DW의 다양한 구성요소는 다음과 같습니다.

  • 메타 데이터
  • 주기 현재 세부정보
  • 주기 오래된 세부 사항
  • 주기 약간 요약됨
  • 주기 고도로 요약된

지금까지 가장 큰 관심사는 다음과 같습니다. 주기 현재 세부 사항. 이는 다음과 같은 이유로 주요 관심사입니다.

  • I 주기 현재 세부 정보는 항상 큰 관심을 끌고 있는 최신 이벤트를 반영합니다.
  • i 주기 현재 세부 정보는 가장 낮은 수준의 세분성으로 저장되므로 방대합니다.
  • i 주기 현재 세부 정보는 거의 항상 디스크 메모리에 저장되어 액세스가 빠르지만 비용이 많이 들고 사용이 복잡합니다. 주기 자세히 보면 나이가 들수록 주기 어떤 메모리에 저장되어 있는 것 마사. 산발적으로 액세스되며 다음과 호환되는 세부 수준으로 저장됩니다. 주기 현재 세부 사항. 대체 저장 매체에 저장하는 것이 필수는 아니지만, 용량이 크기 때문에 주기 산발적인 액세스와 결합됨 주기, 메모리 지원 주기 오래된 세부 데이터는 일반적으로 디스크에 저장되지 않습니다. 그만큼 주기 약간 요약하면 주기 발견된 낮은 세부 수준에서 현재 세부 수준까지 증류됩니다. 이 수준의 DW는 거의 항상 디스크 스토리지에 저장됩니다. 건축가가 직면한 디자인 문제 주기 이 수준의 DW 구성에는 다음이 포함됩니다.
  • 위에서 작성한 요약은 시간 단위는 무엇입니까?
  • 어떤 콘텐츠, 속성이 콘텐츠를 약간 요약합니까? 주기 다음 레벨 주기 DW에서 발견된 것은 주기 고도로 요약되었습니다. 그만큼 주기 고도로 요약되어 있어 컴팩트하고 쉽게 접근할 수 있습니다. 그만큼 주기 고도로 요약된 정보는 DW 환경에서 발견되기도 하고 다른 경우에는 i 주기 고도로 요약된 내용은 DW를 수용하는 기술의 직접적인 벽 밖에서 발견됩니다. (어쨌든 나는 주기 고도로 요약된 내용은 내가 어디에 있든 DW의 일부입니다. 주기 물리적으로 수용됩니다). DW의 마지막 구성요소는 메타데이터입니다. 여러 측면에서 메타데이터는 다른 메타데이터와는 다른 차원에 위치합니다. 주기 메타데이터에는 어떤 내용도 포함되어 있지 않기 때문에 DW의 데이터 운영 환경에서 직접 가져옵니다. 메타데이터는 DW에서 특별하고 매우 중요한 역할을 합니다. 메타데이터는 다음과 같이 사용됩니다.
  • DSS 분석가가 DW의 내용을 찾는 데 도움이 되는 디렉토리,
  • 매핑 가이드 주기 내가 어떻게 주기 운영환경에서 DW 환경으로 전환되었으며,
  • 사이의 요약에 사용되는 알고리즘에 대한 가이드 주기 현재 세부정보 ei 주기 약간 요약하자면, 나는 주기 요약하자면, 메타데이터는 운영 환경에서보다 DW 환경에서 훨씬 더 큰 역할을 합니다. 오래된 세부 저장 매체 자기 테이프를 사용하여 이러한 종류의 정보를 저장할 수 있습니다. 주기. 실제로 오래된 저장 장치로 고려해야 할 저장 매체는 매우 다양합니다. 주기 세부적으로. 볼륨에 따라 주기, 액세스 빈도, 도구 비용 및 액세스 유형을 고려하면 다른 도구에는 DW의 이전 수준의 세부 정보가 필요할 가능성이 높습니다. 데이터의 흐름 정상적이고 예측 가능한 흐름이 있습니다. 주기 DW 내부.
    I 주기 운영 환경에서 DW로 들어갑니다. (참고: 이 규칙에는 몇 가지 매우 흥미로운 예외가 있습니다. 그러나 거의 모든 주기 운영 환경에서 DW를 입력합니다). 다토 나는 주기 운영환경에서 DW로 진입하면 앞에서 설명한 바와 같이 변환된다. DW에 들어가는 조건으로, 나는 주기 표시된 대로 현재 세부정보 수준을 입력합니다. 해당 위치에 상주하며 다음 세 가지 이벤트 중 하나가 발생할 때까지 사용됩니다.
  • 정화되고,
  • 요약 및/또는 ▪è DW 내에서 더 이상 사용되지 않는 프로세스가 i를 이동합니다. 주기 현재 세부정보 주기 연령을 기준으로 한 오래된 세부정보 주기. 과정

요약은 세부 정보를 사용합니다. 주기 내가 계산하기 위해 주기 약간 요약된 수준과 크게 요약된 수준 주기. 표시된 흐름에는 몇 가지 예외가 있습니다(나중에 설명함). 그러나 일반적으로 대부분의 경우 주기 DW 내에서 발견된 흐름은 주기 그것은 묘사된 대로이다.

데이터웨어하우스 사용

놀랄 것도 없이 다양한 수준의 주기 DW 내에서는 다양한 수준의 사용이 제공되지 않습니다. 원칙적으로 요약 수준이 높을수록 주기 그들은 사용됩니다.
많은 용도가 발생합니다 주기 고도로 요약된 반면, 오래된 것들은 주기 세부적인 내용은 거의 사용되지 않습니다. 조직을 자원 활용 패러다임으로 전환하는 데는 그럴 만한 이유가 있습니다. 더 요약하면 나 주기, 목적지에 도달하는 것이 더 빠르고 효율적입니다. 주기. 만약 가게 DW의 세부 수준에서 많은 프로세스를 수행하면 그에 상응하는 많은 양의 시스템 리소스가 소비된다는 사실을 발견했습니다. 가능한 한 빨리 높은 수준의 요약을 처리하는 것이 모든 사람에게 가장 큰 이익이 됩니다.

많은 매장에서 DW 이전 환경의 DSS 분석가는 주기 세부 수준에서. 여러 면에서 도착은 주기 자세한 요약은 다른 수준의 요약을 사용할 수 있는 경우에도 보안 담요와 유사합니다. 건축가의 활동 중 하나 주기 DSS 사용자가 지속적으로 DSS를 사용하지 못하도록 하는 것입니다. 주기 가장 낮은 세부 수준에서. 건축가에게는 두 가지 동기가 있습니다. 주기:

  • 최종 사용자가 소비한 리소스에 대해 비용을 지불하고
  • 이는 i로 동작할 때 매우 좋은 응답 시간을 얻을 수 있음을 나타냅니다. 주기 요약 수준이 높은 반면 응답 시간이 느린 것은 주기 낮은 수준에서 기타 고려 사항 다른 DW 구축 및 관리 고려사항도 있습니다.
    첫 번째 고려 사항은 인덱스에 대한 것입니다. 그만큼 주기 더 높은 수준의 요약에서는 자유롭게 색인을 생성할 수 있습니다. 주기

더 낮은 수준의 세부사항에서는 너무 부피가 커서 검소하게 색인을 생성할 수 있습니다. 동일한 토큰에서 나는 주기 높은 수준의 세부사항에서는 상대적으로 쉽게 재구성될 수 있지만, 주기 낮은 수준에서는 너무 커서 내가 주기 쉽게 개조할 수 없습니다. 결과적으로, 모델은 주기 그리고 디자인에 의해 수행된 공식적인 작업은 현재 세부 수준에서 거의 독점적으로 적용되는 DW의 토대를 마련합니다. 즉, 모델 활동을 주기 거의 모든 경우에 요약 수준에는 적용되지 않습니다. 또 다른 구조적 고려 사항은 주기 DW로.

파티션은 두 가지 수준에서 수행될 수 있습니다. DBMS 그리고 애플리케이션 수준에서. 레벨의 부서에서 DBMS, DBMS 부서에 대한 정보를 제공받고 이에 따라 관리합니다. 애플리케이션 수준에서 분할하는 경우 프로그래머에게만 분할에 대한 정보가 제공되며 해당 관리에 대한 책임은 프로그래머에게 있습니다.

수준 이하 DBMS, 많은 작업이 자동으로 수행됩니다. 자동으로 부서를 관리하는 데에는 많은 유연성이 없습니다. 응용프로그램 수준에서 분할된 경우 주기데이터웨어 하우스, 많은 작업이 프로그래머에게 부담이 되지만 최종 결과는 관리의 유연성입니다. 주기 nel 데이터웨어 하우스

또 다른 이상현상

반면에 데이터웨어 하우스 그들은 거의 모든 것에 대해 설명된 대로 작동합니다. 주기, 논의해야 할 몇 가지 유용한 예외가 있습니다. 예외는 주기 공개 요약 데이터. 이것들은 주기 에서 계산된 요약 데이터웨어 하우스 그러나 그들은 사회에서 사용됩니다. 그만큼 주기 공개 요약은 데이터웨어 하우스, 이전에 언급했듯이 계산됩니다. 회계사는 이러한 분기별 보고서를 작성하기 위해 노력합니다. 주기 예를 들어 수입, 분기별 비용, 분기별 이익 등이 있습니다. 회계사가 수행하는 업무는 외부 업무입니다. 데이터웨어 하우스. 그러나 나는 주기 회사 내에서 "내부적으로" 사용됩니다. 마케팅, 판매 등 논의되지 않은 또 다른 예외는 다음과 같습니다. 주기 외부.

또 다른 예외적인 종류의 주기 그것은에서 찾을 수 있습니다 데이터웨어 하우스 영구 세부 데이터의 데이터입니다. 이로 인해 영구적으로 저장해야 하는 필요성이 발생합니다. 주기 윤리적 또는 법적 이유로 상세한 수준에서. 회사가 근로자를 위험 물질에 노출시키는 경우에는 다음과 같은 조치가 필요합니다. 주기 상세하고 영구적입니다. 비행기 부품 등 공공의 안전과 관련된 제품을 생산하는 경우에는 다음 사항을 준수해야 합니다. 주기 영구적인 세부 정보는 물론 회사가 위험한 계약을 체결한 경우에도 마찬가지입니다.

향후 몇 년간 소송, 리콜, 공사 결함 논란 등이 발생할 경우 회사는 세부 사항을 간과할 수 없다. 회사의 노출이 클 수 있습니다. 그 결과 독특한 종류의 주기 영구 세부 데이터로 알려져 있습니다.

요약

Un 데이터웨어 하우스 객체지향적이고, 통합적이며, 시간에 따라 변화하는 집합체입니다. 주기 행정부의 의사결정 요구를 지원하기 위해 비휘발성입니다. 각각의 두드러진 기능은 데이터웨어 하우스 그 의미가 있습니다. 게다가 4가지 레벨이 있는데 주기데이터웨어 하우스:

  • 오래된 세부 사항
  • 현재 세부정보
  • 주기 약간 요약됨
  • 주기 고도로 요약된 메타데이터도 데이터웨어 하우스. 추상적인 저장의 개념 주기 최근 많은 주목을 받으며 90년대 트렌드로 자리 잡았습니다. 데이터웨어 하우스 의사결정지원시스템(DSS), 경영정보시스템(EIS) 등 경영지원시스템의 한계를 극복하기 위해 컨셉이라고 해도 데이터웨어 하우스 유망해 보입니다. 구현해 보세요. 데이터웨어 하우스 대규모 창고 프로세스로 인해 문제가 발생할 수 있습니다. 창고 프로젝트의 복잡성에도 불구하고 주기, 재고를 보유하고 있는 많은 공급업체 및 컨설턴트 주기 그들은 저장을 주장한다 주기 현재는 아무런 문제를 일으키지 않습니다. 그러나 본 연구 프로젝트 초기에는 독립적이고 엄격하며 체계적인 연구가 거의 이루어지지 않았습니다. 결과적으로, 제품이 만들어질 때 업계에서 실제로 무슨 일이 일어나는지 말하기는 어렵습니다. 데이터웨어 하우스. 이번 연구에서는 창고관리 관행을 탐구했다. 주기 호주 관행에 대한 보다 풍부한 이해를 개발하는 것을 목표로 하는 동시대인. 문헌 검토는 실증적 연구의 맥락과 기초를 제공했습니다. 이 연구에는 여러 가지 결과가 있습니다. 첫째, 본 연구에서는 개발 과정에서 발생한 활동을 밝혔다. 데이터웨어 하우스. 나는 여러 분야에서 주기 수집되어 문헌에 보고된 관행이 확인되었습니다. 둘째, 개발에 영향을 미칠 수 있는 문제와 문제점 데이터웨어 하우스 이번 연구를 통해 확인됐다. 마지막으로, 호주 조직이 사용과 관련하여 얻은 이점은 다음과 같습니다. 데이터웨어 하우스 공개되었습니다.

1 장

연구 맥락

데이터 웨어하우징의 개념은 90년대에 널리 알려졌으며 새로운 추세가 되었습니다(McFadden 1996, TDWI 1996, Shah 및 Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman 및 Oates 2000). 이는 업계 간행물에서 데이터 웨어하우징에 관한 기사 수가 증가하는 것에서 볼 수 있습니다(Little and Gibson 1999). 많은 기사(예: Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett and King 1996, Graham et al. 1996, Sakaguchi and Frolick 1996, Alvarez 1997, Brousell 1997, Clarke 1997, McCarthy 1997, O' Donnell 1997, Edwards 1998, TDWI 1999)는 i를 구현하는 조직에서 얻을 수 있는 상당한 이점을 보고했습니다. 데이터웨어 하우스. 그들은 성공적인 구현, 높은 투자 수익률(ROI) 수치에 대한 일화적인 증거를 통해 자신의 이론을 뒷받침했으며, 또한 개발을 위한 지침이나 방법론을 제공했습니다. 데이터웨어 하우스

(Shanks 외. 1997, Seddon 및 Benjamin 1998, Little 및 Gibson 1999). 극단적인 경우 Graham et al. (1996)은 401년 투자의 평균 수익률이 XNUMX%라고 보고했습니다.

그러나 현재 문헌의 대부분은 그러한 프로젝트 수행과 관련된 복잡성을 간과했습니다. 프로젝트 데이터웨어 하우스 일반적으로 복잡하고 규모가 크므로 주의 깊게 제어하지 않으면 실패할 확률이 높습니다(Shah and Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs and Clymer 1998, Rao 1998). 이를 구축하려면 막대한 양의 인적, 재정적 자원과 시간과 노력이 필요합니다(Hill 1998, Crofts 1998). 필요한 일반적인 시간과 재정적 수단은 각각 약 1995년과 1997만~1998만 달러입니다(Braly 1999, Foley 1995b, Bort 1998, Humphries et al. XNUMX). 데이터 웨어하우징의 다양한 측면을 제어하고 통합하려면 이러한 시간과 재정적 수단이 필요합니다(Cafasso XNUMX, Hill XNUMX). 하드웨어 및 소프트웨어 고려 사항과 함께 추출에 따라 달라지는 기타 기능도 있습니다. 주기 로딩 과정에 주기, 업데이트 및 메타를 관리하기 위한 메모리 용량 주기 사용자 교육을 위해 고려해야 합니다.

이 연구 프로젝트가 시작될 당시 특히 호주에서는 데이터 웨어하우징 분야에서 수행되는 학술 연구가 거의 없었습니다. 이는 당시 저널이나 기타 학술 저작물에서 데이터 웨어하우징에 관해 출판된 기사가 부족하다는 사실에서 분명해졌습니다. 이용 가능한 많은 학술 저작물은 미국의 경험을 설명했습니다. 데이터 웨어하우징 분야에 대한 학문적 연구의 부족으로 인해 엄격한 연구와 실증적 연구가 요구되었습니다(McFadden 1996, Shanks et al. 1997, Little and Gibson 1999). 특히, 이행과정에 관한 연구는 데이터웨어 하우스 구현에 관한 일반적인 지식을 확장하기 위해 수행되어야 합니다. 데이터웨어 하우스 그리고 향후 연구 연구의 기초가 될 것입니다(Shanks et al. 1997, Little and Gibson 1999).

따라서 본 연구의 목적은 조직이 i를 수행하고 사용할 때 실제로 어떤 일이 발생하는지 연구하는 것입니다. 데이터웨어 하우스 호주에서. 구체적으로, 본 연구에서는 전체 개발 프로세스에 대한 분석을 포함할 것입니다. 데이터웨어 하우스, 시작 및 계획부터 시작하여 설계 및 구현을 거쳐 호주 조직 내에서 후속 사용을 수행합니다. 또한, 이 연구는 관행을 더욱 개선하고 비효율성과 위험을 최소화하거나 피할 수 있는 영역을 식별함으로써 현재의 관행에 기여할 것입니다. 또한, 이는 다른 연구의 기초가 될 것이다. 데이터웨어 하우스 호주에서 현재 문헌에 존재하는 격차를 메울 것입니다.

연구 질문

이 연구의 목적은 다음과 같은 구현과 관련된 활동을 연구하는 것입니다. 데이터웨어 하우스 호주 조직의 사용. 특히, 프로젝트 기획, 개발, 운영, 활용 및 관련 위험에 관한 요소를 연구합니다. 따라서 본 연구의 질문은 다음과 같다.

“현재의 관행은 무엇입니까? 데이터웨어 하우스 호주에서?"

이 질문에 효과적으로 대답하려면 여러 가지 하위 연구 질문이 필요합니다. 특히, 이 연구 프로젝트를 안내하기 위해 2장에 제시된 문헌에서 세 가지 하위 질문이 확인되었습니다. 데이터웨어 하우스 호주 조직에서? 어떤 문제가 발생했나요?

경험한 이점은 무엇입니까?
이러한 질문에 답하기 위해 설문조사를 활용한 탐색적 연구 설계가 사용되었습니다. 탐색적 연구로서 위 질문에 대한 답변은 완전하지 않습니다(Shanks et al. 1993, Denscombe 1998). 이 경우 이러한 질문에 대한 답을 개선하기 위해 삼각측량이 필요합니다. 그러나 조사는 이러한 질문을 조사하는 향후 작업을 위한 견고한 기반을 제공할 것입니다. 연구 방법의 정당성과 설계에 대한 자세한 논의는 3장에서 제시된다.

연구 프로젝트의 구조

이 연구 프로젝트는 데이터 웨어하우징 개념에 대한 맥락적 연구와 실증적 연구(그림 1.1 참조)의 두 부분으로 나누어지며, 각 부분은 아래에서 논의됩니다.

1부: 상황별 연구

연구의 첫 번째 부분은 의사결정 지원 시스템(DSS), 경영진 정보 시스템(EIS), 사례 연구를 포함한 다양한 유형의 데이터 웨어하우징에 관한 최신 문헌을 검토하는 것으로 구성되었습니다. 데이터웨어 하우스 그리고 개념 데이터웨어 하우스. 또한, 포럼 결과 데이터웨어 하우스 Monash DSS 연구팀이 이끄는 전문가 및 실무자 회의 그룹은 다음과 같은 실무에 대한 통찰력을 얻기 위한 연구의 이 단계에 기여했습니다. 데이터웨어 하우스 채택과 관련된 위험을 식별합니다. 이 맥락적 연구 기간 동안 문제 영역에 대한 이해가 확립되어 후속 실증적 조사를 위한 배경 지식을 제공했습니다. 그러나 이는 연구 조사가 진행되는 동안 계속 진행된 과정이었습니다.

2부: 실증적 연구

특히 호주에서는 상대적으로 새로운 데이터 웨어하우징 개념으로 인해 사용자 경험에 대한 폭넓은 그림을 얻기 위한 설문 조사의 필요성이 생겼습니다. 이 부분은 광범위한 문헌 검토를 통해 문제 영역이 확립된 후에 수행되었습니다. 맥락적 연구 단계에서 형성된 데이터 웨어하우징 개념은 본 연구의 초기 설문지 입력으로 사용되었습니다. 이후 설문지를 검토하였다. 당신은 전문가입니다 데이터웨어 하우스 테스트에 참여했습니다. 초기 설문지 테스트의 목적은 질문의 완전성과 정확성을 확인하는 것이었습니다. 테스트 결과를 바탕으로 설문지를 수정하여 설문조사 참가자들에게 수정된 버전을 발송하였습니다. 그런 다음 반환된 설문지를 다음에 대해 분석했습니다. 주기 표, 다이어그램 및 기타 형식으로 제공됩니다. 그만큼

분석 결과 주기 이는 호주의 데이터 웨어하우징 관행에 대한 스냅샷을 형성합니다.

데이터 웨어하우징 개요

데이터 웨어하우징의 개념은 컴퓨터 기술의 발전과 함께 발전해 왔습니다.
이는 의사결정 지원 시스템(DSS), 임원 정보 시스템(EIS) 등 애플리케이션 지원 그룹이 직면한 문제를 극복하는 것을 목표로 합니다.

과거에 이러한 애플리케이션의 가장 큰 장애물은 이러한 애플리케이션이 데이터베이스 분석에 필요합니다.
이는 주로 경영진 업무의 성격으로 인해 발생합니다. 회사 경영진의 관심은 다루는 영역에 따라 끊임없이 달라집니다. 그러므로, 나는 주기 이러한 응용 분야의 기본은 처리할 부분에 따라 빠르게 변경될 수 있어야 합니다.
이것은 내가 주기 요청된 분석에 적합한 형식으로 제공되어야 합니다. 실제로 과거에는 애플리케이션 지원 그룹에서 수집하고 통합하는 것이 매우 어려웠습니다. 주기 복잡하고 다양한 소스에서.

이 섹션의 나머지 부분에서는 데이터 웨어하우징 개념에 대한 개요를 제시하고 데이터 웨어하우징 방법에 대해 논의합니다. 데이터웨어 하우스 지원그룹의 문제점을 극복할 수 있습니다.
용어 "데이터웨어 하우스”는 1990년 William Inmon에 의해 대중화되었습니다. 그의 자주 인용되는 정의는 다음과 같습니다. 데이터웨어 하우스 의 컬렉션으로 주기 관리 결정을 지원하기 위해 주제 지향적이고 통합적이며 비휘발성이며 시간이 지남에 따라 가변적입니다.

이 정의를 사용하여 Inmon은 다음을 강조합니다. 주기 에 거주 데이터웨어 하우스 다음 4가지 특성을 갖추어야 합니다.

  • ▪ 주제 중심
  • ▪ 통합
  • ▪ 비휘발성
  • ▪ 시간에 따라 변한다. 주제 중심의 인몬은 i를 의미한다. 주기 nel 데이터웨어 하우스 지금까지 가장 큰 조직 영역에서

모델에 정의됨 주기. 예를 들어 모두 주기 에 관한 고객 주제 영역에 포함되어 있습니다. 고객에. 마찬가지로 모두 주기 제품과 관련된 내용은 PRODUCTS 주제 영역에 포함되어 있습니다.

통합 인몬(Integrated Inmon)이란 다음을 의미합니다. 주기 다양한 플랫폼에서 나온 시스템과 위치가 결합되어 한 곳에 저장됩니다. 결과적으로 주기 유사한 것들은 쉽게 추가하고 비교할 수 있도록 일관된 형식으로 변환되어야 합니다.
예를 들어 남성과 여성의 성별은 한 시스템에서는 문자 M과 F로 표시되고 다른 시스템에서는 1과 0으로 표시됩니다. 이를 올바르게 통합하려면 두 형식이 동일하도록 형식 중 하나 또는 둘 다를 변환해야 합니다. 이 경우 M을 1로, F를 0으로 또는 그 반대로 변경할 수 있습니다. 주제 지향 및 통합은 다음을 나타냅니다. 데이터웨어 하우스 기능적이고 횡단적인 비전을 제공하도록 설계되었습니다. 주기 회사에서.

비휘발성이란 그가 의미하는 바는 다음과 같습니다. 주기 nel 데이터웨어 하우스 일관성을 유지하고 주기 그건 꼭 필요 하진 않아. 대신에 모든 변경 사항은 주기 원본이 추가됩니다 데이터베이스데이터웨어 하우스. 이는 역사적 신을 의미한다. 주기 에 포함되어 있습니다 데이터웨어 하우스.

시간이 있는 변수의 경우 Inmon은 i를 나타냅니다. 주기 nel 데이터웨어 하우스 항상 시간 표시기를 포함하고 있으며 주기 그들은 일반적으로 특정 시간 범위를 넘습니다. 예를 들어
데이터웨어 하우스 5년간의 역사적 가치를 포함할 수 있습니다. 고객 1993년부터 1997년까지. 주기 추세를 분석할 수 있습니다.

Un 데이터웨어 하우스 그는 자신의 것을 수집할 수 있다 주기 OLTP 시스템에서, 소스에서 주기 조직 외부 및/또는 기타 특수 포집 시스템 프로젝트에 의해 주기.
I 주기 추출물은 세척 과정을 거칠 수 있습니다. 이 경우에는 주기 저장되기 전에 변환되고 통합됩니다. 데이터베이스데이터웨어 하우스. 그럼 내가 주기

내의 주민 데이터베이스데이터웨어 하우스 최종 사용자 로그인 및 복구 도구에서 사용할 수 있습니다. 이러한 도구를 사용하여 최종 사용자는 조직의 통합 보기에 액세스할 수 있습니다. 주기.

I 주기 내의 주민 데이터베이스데이터웨어 하우스 자세한 내용과 요약 형식으로 저장됩니다.
요약 수준은 내용의 성격에 따라 달라질 수 있습니다. 주기. 주기 상세한 내용은 다음과 같이 구성될 수 있습니다. 주기 현재 및 주기 역사가
I 주기 로열티는 포함되지 않습니다. 데이터웨어 하우스 내가 ~ 할 때까지 주기 nel 데이터웨어 하우스 업데이트됩니다.
저장하는 것 외에도 주기 그들 자신, 데이터웨어 하우스 또한 다른 유형의 정보를 저장할 수도 있습니다. 데이터 설명하는 METADATA라고 합니다. 주기 그의 주민들 데이터베이스.
메타데이터에는 개발 메타데이터와 분석 메타데이터라는 두 가지 유형이 있습니다.
개발 메타데이터는 데이터의 추출, 정리, 매핑 및 로드 프로세스를 관리하고 자동화하는 데 사용됩니다. 주기 nel 데이터웨어 하우스.
개발 메타데이터에 포함된 정보에는 운영 체제의 세부 정보, 추출할 요소의 세부 정보, 모델이 포함될 수 있습니다. 주기데이터웨어 하우스 및 변환을 위한 비즈니스 규칙 주기.

분석 메타데이터로 알려진 두 번째 유형의 메타데이터를 사용하면 최종 사용자가 데이터웨어 하우스 찾기 위해 주기 명확하고 비기술적인 용어로 사용 가능하며 그 의미도 알 수 있습니다.

따라서 분석 메타데이터는 데이터웨어 하우스 최종 사용자 애플리케이션. 이 메타데이터에는 비즈니스 모델, 설명이 포함될 수 있습니다. 주기 해당 비즈니스 모델, 사전 정의된 쿼리 및 보고서, 사용자 접속 정보 및 인덱스를 제공합니다.

제대로 작동하려면 분석 및 개발 메타데이터가 단일 통합 포함 메타데이터로 결합되어야 합니다.

불행하게도 기존 도구 중 다수에는 자체 메타데이터가 있으며 현재 이에 대한 기존 표준이 없습니다.

데이터 웨어하우징 도구가 이 메타데이터를 통합할 수 있도록 허용합니다. 이러한 상황을 해결하기 위해 주요 데이터 웨어하우징 도구를 거래하는 많은 거래자들이 나중에 메타데이터 연합이 된 메타데이터 위원회를 구성했습니다.

이 연합의 목표는 다양한 데이터 웨어하우징 도구를 사용하여 메타데이터를 변환할 수 있는 표준 메타데이터 세트를 구축하는 것입니다.
이들의 노력으로 Microsoft 아카이브와 관련 MDIS 파일 간의 정보 교환을 가능하게 하는 MDIS(메타 데이터 교환 사양)가 탄생했습니다.

존재 주기 요약/색인화 및 상세 정보 모두 사용자에게 DRILL DROWN(드릴링)을 수행할 수 있는 가능성을 제공합니다. 주기 세부 항목으로 색인화되고 그 반대도 마찬가지입니다. 존재 주기 상세한 기록을 통해 시간 경과에 따른 추세 분석을 생성할 수 있습니다. 또한 분석 메타데이터는 다음의 디렉터리로 사용될 수 있습니다. 데이터베이스데이터웨어 하우스 최종 사용자가 주기 필요한.

OLTP 시스템과 비교하여 다음 분석을 지원하는 능력이 있습니다. 주기 그리고 보고, 데이터웨어 하우스 질의 작성 및 응답, 보고서 작성과 같은 정보 프로세스에 더 적합한 시스템으로 간주됩니다. 다음 섹션에서는 두 시스템의 차이점을 자세히 설명합니다.

데이터웨어 하우스 OLTP 시스템에 반대

조직 내의 많은 정보 시스템은 일상적인 운영을 지원하기 위한 것입니다. OLTP 시스템으로 알려진 이러한 시스템은 지속적으로 업데이트되는 일일 트랜잭션을 캡처합니다.

I 주기 이러한 시스템 내에서는 종종 수정, 추가 또는 삭제됩니다. 예를 들어, 고객이 한 장소에서 다른 장소로 이동함에 따라 고객의 주소가 변경됩니다. 이 경우 주소 필드를 수정하여 새 주소가 등록됩니다. 데이터베이스. 이러한 시스템의 주요 목적은 거래 비용을 줄이는 동시에 처리 시간을 줄이는 것입니다. OLTP 시스템의 예로는 주문 입력, 급여, 송장, 제조, 고객 서비스와 같은 중요한 작업이 포함됩니다. 고객.

트랜잭션 및 이벤트 기반 프로세스를 위해 만들어진 OLTP 시스템과 달리 데이터웨어 하우스 분석 기반 프로세스에 대한 지원을 제공하기 위해 만들어졌습니다. 주기 그리고 의사결정 과정.

이는 일반적으로 i를 통합하여 달성됩니다. 주기 다양한 OLTP 및 외부 시스템의 단일 "컨테이너" 주기, 이전 섹션에서 논의한 바와 같습니다.

Monash 데이터 웨어하우징 프로세스 모델

프로세스 모델 데이터웨어 하우스 Monash는 Monash DSS Research Group의 연구자에 의해 개발되었으며 다음 문헌을 기반으로 합니다. 데이터웨어 하우스, 시스템 분야 개발 지원 경험, 애플리케이션 공급업체와의 논의 데이터웨어 하우스, 사용 전문가 그룹에 대해 데이터웨어 하우스.

단계는 시작, 계획, 개발, 운영 및 설명입니다. 다이어그램은 개발의 반복적이거나 진화적인 성격을 설명합니다. 데이터웨어 하우스 여러 단계 사이에 배치된 양방향 화살표를 사용하여 프로세스를 진행합니다. 이러한 맥락에서 "반복적" 및 "진화적"은 프로세스의 각 단계에서 구현 활동이 항상 이전 단계를 향해 뒤로 전파될 수 있음을 의미합니다. 이는 프로젝트의 특성상 데이터웨어 하우스 최종 사용자의 추가 요청이 언제든지 발생합니다. 예를 들어 프로세스의 개발 단계에서 데이터웨어 하우스, 최종 사용자가 원래 계획의 일부가 아닌 새로운 차원 또는 주제 영역을 요청한 경우 이를 시스템에 추가해야 합니다. 이로 인해 프로젝트가 변경됩니다. 결과적으로 설계팀은 설계 단계에서 지금까지 작성된 문서의 요구 사항을 변경해야 합니다. 대부분의 경우 프로젝트의 현재 상태는 새로운 요구 사항을 추가하고 문서화해야 하는 설계 단계로 돌아가야 합니다. 최종 사용자는 검토된 특정 문서와 개발 단계에서 변경된 내용을 볼 수 있어야 합니다. 이 개발 주기가 끝나면 프로젝트는 개발 팀과 사용자 팀 모두로부터 우수한 피드백을 받아야 합니다. 그런 다음 피드백은 향후 프로젝트 개선을 위해 재사용됩니다.

용량 계획
Dw는 크기가 매우 크고 매우 빠르게 성장하는 경향이 있습니다(Best 1995, Rudin 1997a). 주기 그들이 지속 기간 동안 유지하는 역사. 성장은 다음으로 인해 발생할 수도 있습니다. 주기 가치를 높이기 위해 사용자가 요청한 추가 사항 주기 이미 가지고 있는 것입니다. 따라서 저장 요구 사항은 다음과 같습니다. 주기 크게 향상될 수 있습니다(Eckerson 1997). 따라서 용량 계획을 수행함으로써 구축 중인 시스템이 요구 사항 증가에 따라 확장될 수 있도록 보장하는 것이 중요합니다(Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
데이터베이스 확장성을 계획할 때 웨어하우스 크기의 예상 증가, 쿼리 유형, 지원되는 최종 사용자 수를 알아야 합니다(Best 1995, Rudin 1997b, Foley 1997a). 확장 가능한 애플리케이션을 구축하려면 확장 가능한 서버 기술과 확장 가능한 애플리케이션 설계 기술의 조합이 필요합니다(Best 1995, Rudin 1997b. 둘 다 확장성이 뛰어난 애플리케이션을 구축하는 데 필요합니다. 확장 가능한 서버 기술을 사용하면 성능 저하 없이 스토리지, 메모리 및 CPU를 쉽고 유리하게 추가할 수 있습니다. 성능(Lang 1997, Telephony 1997).

확장 가능한 서버 기술에는 SMP(대칭 다중 처리)와 MPP(대규모 병렬 처리)라는 두 가지 주요 확장 가능한 서버 기술이 있습니다(IDC 1997, Humphries et al. 1999). SMP 서버에는 일반적으로 메모리, 시스템 버스 및 기타 리소스를 공유하는 여러 프로세서가 있습니다(IDC 1997, Humphries et al. 1999). 추가 프로세서를 추가하여 성능을 높일 수 있습니다. 포 텐차 계산적. 수치를 높이는 또 다른 방법 포 텐차 SMP 서버의 핵심은 수많은 SMP 시스템을 통합하는 것입니다. 이 기술은 클러스터링(Humphries et al. 1999)으로 알려져 있습니다. 반면 MPP 서버에는 각각 자체 메모리, 버스 시스템 및 기타 리소스를 갖춘 여러 프로세서가 있습니다(IDC 1997, Humphries et al. 1999). 각 프로세서를 노드라고 합니다. 증가 포 텐차 계산적으로 달성 가능

MPP 서버에 노드를 추가합니다(Humphries et al. 1999).

SMP 서버의 약점은 너무 많은 입출력(I/O) 작업이 시스템 버스를 정체시킬 수 있다는 것입니다(IDC 1997). 각 프로세서에는 자체 버스 시스템이 있으므로 MPP 서버 내에서는 이 문제가 발생하지 않습니다. 그러나 각 노드 간의 상호 연결은 일반적으로 SMP 버스 시스템보다 훨씬 느립니다. 또한 MPP 서버는 애플리케이션 개발자에게 추가적인 복잡성 수준을 더할 수 있습니다(IDC 1997). 따라서 SMP와 MPP 서버 사이의 선택은 애플리케이션의 복잡성, 가격/성능 비율, 필요한 처리 용량, 방지된 dw 애플리케이션 및 서버 크기 증가를 포함한 여러 요인의 영향을 받을 수 있습니다. 데이터베이스 dw 및 최종 사용자 수.

용량 계획에는 확장 가능한 다양한 애플리케이션 설계 기술을 사용할 수 있습니다. 일, 주, 월, 년 등 다양한 알림 기간을 사용합니다. 다양한 공지기간을 갖고 있으며, 데이터베이스 이는 관리하기 쉽게 그룹화된 조각으로 나눌 수 있습니다(Inmon et al. 1997). 또 다른 기술은 다음을 요약하여 구성된 요약 테이블을 사용하는 것입니다. 주기 da 주기 상세한. 그래서 나는 주기 요약된 내용은 세부적인 내용보다 더 간결하므로 메모리 공간이 덜 필요합니다. 그래서 주기 세부적인 내용은 더 저렴한 저장 장치에 저장할 수 있어 더 많은 저장 공간을 절약할 수 있습니다. 요약 테이블을 사용하면 메모리 공간을 절약할 수 있지만 비즈니스 요구 사항에 맞게 최신 상태를 유지하려면 많은 노력이 필요합니다. 그러나 이 기법은 널리 사용되며 종종 이전 기법과 결합하여 사용되기도 한다(Best 1995, Inmon 1996a, Chauduri and Dayal)
1997).

정의 데이터웨어 하우스 기술 아키텍처 dw 아키텍처 기술의 정의

데이터 웨어하우징의 얼리 어답터들은 주로 DW의 중앙 집중식 구현을 구상했습니다. 주기, 나를 포함해 주기 외부는 단일로 통합되었습니다.
물리적 저장(Inmon 1996a, Bresnahan 1996, Peacock 1998).

이 접근 방식의 가장 큰 장점은 최종 사용자가 전사적 관점에 액세스할 수 있다는 것입니다. 주기 조직적(Ovum 1998). 또 다른 장점은 표준화된 서비스를 제공한다는 것입니다. 주기 이는 조직을 통해 dw 저장소(메타데이터)에 사용되는 각 용어에 대해 단 하나의 버전 또는 정의가 있음을 의미합니다(Flanagan 및 Safdie 1997, Ovum 1998). 반면에 이 접근법의 단점은 비용이 많이 들고 구성하기 어렵다는 것입니다(Flanagan and Safdie 1997, Ovum 1998, Inmon et al. 1998). 스토리지 아키텍처가 나온 지 얼마 지나지 않아 주기 중앙 집중화가 대중화되면서 진화된 개체의 더 작은 하위 집합을 추출하는 개념이 등장했습니다. 주기 특정 응용 프로그램의 요구 사항을 지원합니다(Varney 1996, IDC 1997, Berson 및 Smith 1997, Peacock 1998). 이러한 작은 시스템은 더 큰 시스템의 파생물입니다. 데이터웨어 하우스 중앙 집중식. 그들은 이름이 지정됩니다 데이터웨어 하우스 종속 부서 또는 종속 데이터 마트. 종속 데이터 마트 아키텍처는 첫 번째 계층이 다음으로 구성되는 3계층 아키텍처로 알려져 있습니다. 데이터웨어 하우스 중앙 집중식, 두 번째는 예금으로 구성됩니다. 주기 부서별, 세 번째는 다음에 대한 액세스로 구성됩니다. 주기 그리고 분석 도구에 의한 것입니다(Demarest 1994, Inmon et al. 1997).

데이터 마트는 일반적으로 이후에 구축됩니다. 데이터웨어 하우스 중앙 집중식은 특정 단위의 요구를 충족시키기 위해 구축되었습니다(White 1995, Varney 1996).
데이터 마트에는 다음과 같은 정보가 저장됩니다. 주기 특정 단위와 관련하여 매우 관련성이 높습니다(Inmon et al. 1997, Inmon et al. 1998, IA 1998).

이 방법의 장점은 문제가 발생하지 않는다는 것입니다. 데이터 통합되지 않았고 내가 주기 데이터 마트 내에서 덜 중복될 것입니다. 주기 그들은 창고에서 왔어요 주기 통합. 또 다른 장점은 각 데이터 마트와 해당 소스 간의 연결이 거의 없다는 것입니다. 주기 왜냐하면 각 데이터 마트에는 단 하나의 소스만 있기 때문입니다. 주기. 또한 이 아키텍처를 사용하면 최종 사용자는 계속해서 개요에 액세스할 수 있습니다. 주기

기업 조직. 이 방법은 하향식 방법으로 알려져 있으며, 데이터 마트는 이후에 구축됩니다. 데이터웨어 하우스 (공작 1998, Goff 1998).
결과를 조기에 표시해야 할 필요성이 증가함에 따라 일부 조직에서는 독립적인 데이터 마트를 구축하기 시작했습니다(Flanagan 및 Safdie 1997, White 2000). 이 경우 데이터 마트는 자체적으로 주기 바로 기본부터 주기 중앙 집중식 통합 창고가 아닌 OLTP를 사용하므로 현장에 중앙 창고를 둘 필요가 없습니다.

각 데이터 마트에는 해당 소스에 대한 링크가 하나 이상 필요합니다. 주기. 각 데이터 마트에 대해 여러 연결을 갖는 단점은 이전 두 아키텍처에 비해 데이터가 너무 많다는 것입니다. 주기 크게 증가합니다.

각 데이터 마트는 모든 데이터를 저장해야 합니다. 주기 OLTP 시스템에 영향을 주지 않으려면 로컬로 필요합니다. 이로 인해 나는 주기 그것들은 서로 다른 데이터 마트에 저장됩니다(Inmon et al. 1997). 이 아키텍처의 또 다른 단점은 데이터 마트와 해당 데이터 소스 간에 복잡한 상호 연결이 생성된다는 것입니다. 주기 이는 실행 및 통제가 어렵다(Inmon et al. 1997).

또 다른 단점은 최종 사용자가 회사 정보의 개요에 액세스할 수 없다는 것입니다. 주기 다양한 데이터 마트가 통합되지 않았습니다(Ovum 1998).
또 다른 단점은 데이터 마트에서 사용되는 각 용어에 대해 둘 이상의 정의가 있어 불일치가 발생할 수 있다는 것입니다. 주기 조직에서 (Ovum 1998).
위에서 논의한 단점에도 불구하고 독립 데이터 마트는 여전히 많은 조직의 관심을 끌고 있습니다(IDC 1997). 이를 매력적으로 만드는 한 가지 요소는 개발이 더 빠르고 시간과 자원이 덜 필요하다는 것입니다(Bresnahan 1996, Berson and Smith 1997, Ovum 1998). 결과적으로 그들은 주로 프로젝트의 이점 및/또는 불완전성을 신속하게 식별하는 데 사용할 수 있는 테스트 프로젝트 역할을 합니다(Parsaye 1995, Braly 1995, Newing 1996). 이 경우 파일럿 프로젝트에서 구현될 부분은 작지만 조직에 중요해야 합니다(Newing 1996, Mansell-Lewis 1996).

프로토타입을 검토함으로써 최종 사용자와 관리자는 프로젝트를 계속할지 아니면 중단할지 결정할 수 있습니다(Flanagan and Safdie 1997).
계속해서 결정을 내리려면 다른 산업을 위한 데이터 마트를 하나씩 구축해야 합니다. 독립적인 데이터 매트릭스를 구축하는 데 필요한 요구 사항에 따라 최종 사용자를 위한 두 가지 옵션이 있습니다: 통합/연합 및 비통합(Ovum 1998)

첫 번째 방법에서는 각각의 새로운 데이터 마트가 현재의 데이터 마트와 모델을 기반으로 구축되어야 합니다. 주기 회사에서 사용합니다(Varney 1996, Berson 및 Smith 1997, Peacock 1998). 모델 사용의 필요성 주기 회사의 의미는 데이터 마트 전반에 걸쳐 사용되는 각 용어에 대해 하나의 정의만 있어야 한다는 것을 의미하며, 이는 또한 다양한 데이터 마트를 결합하여 회사 정보의 개요를 제공할 수 있음을 보장하는 것입니다(Bresnahan 1996). 이 방법은 상향식이라고 불리며 재정적 수단과 시간에 제약이 있을 때 가장 좋습니다(Flanagan and Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). 두 번째 방법에서는 구성된 데이터 마트는 특정 단위의 요구만 충족할 수 있습니다. 연합 데이터 마트의 변형은 데이터웨어 하우스 배포된 데이터베이스 Hub 서버 미들웨어는 많은 데이터 마트를 단일 저장소로 병합하는 데 사용됩니다. 주기 배포됨(White 1995). 이 경우, 나는 주기 회사는 여러 데이터 마트에 분산되어 있습니다. 최종 사용자 요청은 다음으로 전달됩니다. 데이터베이스 모든 정보를 추출하는 서버 허브 미들웨어 주기 데이터 마트에서 요청하고 결과를 최종 사용자 애플리케이션에 반환합니다. 이 방법은 최종 사용자에게 비즈니스 정보를 제공합니다. 그러나 독립 데이터 마트의 문제점은 아직까지 해소되지 않았습니다. 사용할 수 있는 또 다른 아키텍처가 있습니다. 데이터웨어 하우스 가상(화이트 1995). 그러나 그림 2.9에 설명된 이 아키텍처는 데이터 스토리지 아키텍처가 아닙니다. 주기 OLTP 시스템에서 다른 시스템으로 로딩을 이동하지 않으므로 실제입니다. 데이터웨어 하우스 (데마레스트 1994).

실제로 요청사항은 주기 최종 사용자의 정보는 사용자 요청을 처리한 후 결과를 반환하는 OLTP 시스템으로 전달됩니다. 이 아키텍처를 통해 최종 사용자는 보고서를 생성하고 요청할 수 있지만

주기 회사 정보의 역사 및 개요 주기 다른 OLTP 시스템의 시스템은 통합되지 않습니다. 따라서 이 아키텍처는 다음의 분석을 만족시킬 수 없습니다. 주기 예측과 같은 복잡한.

액세스 및 복구 애플리케이션 선택 주기

건물을 짓는 목적 데이터웨어 하우스 최종 사용자에게 정보를 전달하는 것입니다(Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998). 하나 이상의 액세스 및 복구 애플리케이션 주기 제공되어야 합니다. 현재까지 사용자가 선택할 수 있는 다양한 응용 프로그램이 있습니다(Hammergren 1998, Humphries et al. 1999). 선택한 애플리케이션에 따라 창고 관리 노력의 성공 여부가 결정됩니다. 주기 애플리케이션은 조직에서 가장 눈에 띄는 부분이기 때문에 데이터웨어 하우스 최종 사용자에게(Inmon et al. 1997, Poe 1996) 성공하려면 데이터웨어 하우스, 분석 활동을 지원할 수 있어야 합니다. 주기 최종 사용자의 정보(Poe 1996, Seddon 및 Benjamin 1998, Eckerson 1999). 따라서 최종 사용자가 원하는 "수준"이 식별되어야 합니다(Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

일반적으로 최종 사용자는 경영진 사용자, 비즈니스 분석가 및 고급 사용자의 세 가지 범주로 그룹화될 수 있습니다(Poe 1996, Humphries et al. 1999). 경영진 사용자는 미리 정의된 보고서 세트에 쉽게 액세스할 수 있어야 합니다(Humphries et al. 1999). 이러한 비율은 메뉴 탐색을 통해 쉽게 접근할 수 있습니다(Poe 1996). 또한, 보고서는 정보를 신속하게 전달하기 위해 표 및 템플릿과 같은 그래픽 표현을 사용하여 정보를 제시해야 합니다(Humphries et al. 1999). 자체적으로 처음부터 보고서를 개발할 수 있는 기술적 능력이 없는 비즈니스 분석가는 특정 요구 사항에 맞게 현재 보고서를 수정할 수 있어야 합니다(Poe 1996, Humphries et al. 1999). 반면 고급 사용자는 처음부터 요청과 보고서를 생성하고 작성할 수 있는 최종 사용자 유형입니다(Poe 1996, Humphries et al. 1999). 그들은 바로 그 사람들이다.

그들은 다른 유형의 사용자를 위한 보고서를 개발합니다(Poe 1996, Humphries et al. 1999).

최종 사용자 요구 사항이 결정되면 액세스 및 복구 애플리케이션을 선택해야 합니다. 주기 이용 가능한 모든 것 중에서 (Poe 1996, Inmon et al. 1997).
액세스 주기 검색 도구는 OLAP 도구, EIS/DSS 도구, 쿼리 및 보고 도구, 데이터 마이닝 도구의 4가지 유형으로 분류할 수 있습니다.

OLAP 도구를 사용하면 사용자는 임시 쿼리는 물론 데이터베이스데이터웨어 하우스. 또한 이러한 제품을 사용하면 사용자는 다음에서 드릴다운할 수 있습니다. 주기 일반적인 것부터 상세한 것까지.

EIS/DSS 도구는 "가상" 분석과 같은 실행 보고와 메뉴 기반 보고서에 대한 액세스를 제공합니다. 보다 쉬운 탐색을 위해 보고서는 사전 정의되고 메뉴와 병합되어야 합니다.
쿼리 및 보고 도구를 사용하면 사용자는 미리 정의된 특정 보고서를 생성할 수 있습니다.

데이터 마이닝 도구는 잊혀진 작업에 대한 새로운 시각을 밝힐 수 있는 관계를 식별하는 데 사용됩니다. 주기 데이터 웨어하우스의.

각 유형의 사용자 요구 사항을 최적화하는 동시에 선택되는 도구는 직관적이고 효율적이며 사용하기 쉬워야 합니다. 또한 아키텍처의 다른 부분과도 호환되어야 하며 기존 시스템과 함께 작동할 수 있어야 합니다. 또한 합리적인 가격과 성능을 갖춘 데이터 액세스 및 검색 도구를 선택하는 것이 좋습니다. 고려해야 할 다른 기준에는 제품 지원에 대한 도구 공급업체의 약속과 향후 릴리스에서 해당 제품이 어떻게 개발될 것인지가 포함됩니다. 데이터 웨어하우스 사용에 대한 사용자 참여를 보장하기 위해 개발 팀은 도구 선택 프로세스에 사용자를 참여시킵니다. 이 경우 실제적인 사용자 평가가 수행되어야 합니다.

데이터 웨어하우스의 가치를 향상시키기 위해 개발 팀은 데이터 웨어하우스에 대한 웹 액세스를 제공할 수도 있습니다. 웹 기반 데이터 웨어하우스를 통해 사용자는 주기 먼 곳에서 또는 여행 중에. 게다가 정보는

교육비 절감을 통해 보다 저렴한 비용으로 제공받을 수 있습니다.

2.4.3 데이터웨어 하우스 운영 단계

이 단계는 데이터 새로 고침 전략 정의, 데이터 웨어하우스 활동 제어, 데이터 웨어하우스 보안 관리의 세 가지 활동으로 구성됩니다.

데이터 새로 고침 전략의 정의

초기 로딩 후, 주기 nel 데이터베이스 데이터 웨어하우스의 변경 사항을 재현하려면 정기적으로 새로 고쳐야 합니다. 주기 원본. 따라서 새로 고침 시기, 새로 고침 예약 빈도, 데이터 새로 고침 방법을 결정해야 합니다. 주기. 새로고침하는 것이 좋습니다. 주기 시스템을 오프라인으로 전환할 수 있는 경우. 새로 고침 빈도는 사용자 요구 사항에 따라 개발 팀에서 결정합니다. 데이터 웨어하우스를 새로 고치는 방법에는 전체 새로 고침과 지속적인 변경 사항 로드라는 두 가지 접근 방식이 있습니다.

첫 번째 접근 방식인 전체 새로 고침은 모든 항목을 다시 로드해야 합니다. 주기 기스로부터. 이는 모든 주기 필요한 항목은 각 새로 고침에 추출, 정리, 변환 및 통합되어야 합니다. 이 접근 방식은 많은 시간과 자원이 필요하므로 가능한 한 피해야 합니다.

또 다른 접근 방식은 변경 사항을 지속적으로 업로드하는 것입니다. 이것은 내가 추가한다 주기 마지막 데이터 웨어하우스 새로 고침 주기 이후 변경된 사항입니다. 새로운 기록이나 수정된 ​​기록을 식별하면 기록의 양이 크게 줄어듭니다. 주기 이는 업데이트할 때마다 데이터 웨어하우스에 전파되어야 합니다. 주기 에 추가됩니다 데이터베이스 데이터 웨어하우스의.

i를 철회하는 데 사용할 수 있는 접근 방식은 최소한 5가지가 있습니다. 주기 새롭거나 수정되었습니다. 효율적인 데이터 새로 고침 전략을 얻으려면 주기 시스템의 모든 변경 사항을 포착하는 이러한 접근 방식을 혼합하는 것이 유용할 수 있습니다.

타임스탬프를 사용하는 첫 번째 접근 방식은 모든 항목이 할당되었다고 가정합니다. 주기 모든 것을 쉽게 식별할 수 있도록 타임스탬프를 편집하고 업데이트했습니다. 주기 수정되고 새로워졌습니다. 그러나 이 접근 방식은 오늘날 대부분의 운영 체제에서 널리 사용되지 않습니다.
두 번째 접근 방식은 애플리케이션에서 생성한 변경 사항만 포함하는 델타 파일을 사용하는 것입니다. 주기. 이 파일을 사용하면 업데이트 주기도 증폭됩니다. 그러나 이 방법조차 많은 응용 분야에서 사용되지 않았습니다.
세 번째 접근 방식은 기본적으로 델타 파일과 유사한 정보가 포함된 로그 파일을 검사하는 것입니다. 유일한 차이점은 복구 프로세스를 위해 로그 파일이 생성되어 이해하기 어려울 수 있다는 것입니다.
네 번째 접근 방식은 애플리케이션 코드를 수정하는 것입니다. 그러나 대부분의 애플리케이션 코드는 오래되고 취약합니다. 그러므로 이 기술은 피해야 합니다.
마지막 접근법은 비교이다. 주기 기본 dei 파일이 있는 소스 주기.

데이터 웨어하우스 활동 제어

데이터 웨어하우스가 사용자에게 공개되면 시간이 지남에 따라 모니터링되어야 합니다. 이 경우 데이터 웨어하우스 관리자는 하나 이상의 관리 및 제어 도구를 사용하여 데이터 웨어하우스 사용을 모니터링할 수 있습니다. 특히, 데이터 웨어하우스에 접근하는 사람과 시간에 대한 정보를 수집할 수 있습니다. 어서 해봐요 주기 수집된 작업에 대한 프로필이 생성되어 사용자의 지불 거절 구현에 대한 입력으로 사용될 수 있습니다. 지불 거절을 통해 사용자는 데이터 웨어하우스 처리 비용에 대한 정보를 받을 수 있습니다.

또한 데이터 웨어하우스 감사를 사용하여 쿼리 유형, 크기, 일일 쿼리 수, 쿼리 반응 시간, 도달한 섹터 및 양을 식별할 수도 있습니다. 주기 처리됨. 데이터 웨어하우스 감사를 수행하는 또 다른 목적은 주기 사용되지 않는 것입니다. 이것들 주기 시간을 단축하기 위해 데이터 웨어하우스에서 제거할 수 있습니다.

쿼리 실행 응답의 증가를 모니터링하고 주기 내에 거주하는 데이터베이스 데이터 웨어하우스의.

데이터 웨어하우스 보안 관리

데이터 웨어하우스에는 다음이 포함됩니다. 주기 쉽게 접근할 수 있는 통합적이고 중요하며 민감합니다. 이러한 이유로 승인되지 않은 사용자로부터 보호되어야 합니다. 보안을 구현하는 한 가지 방법은 del 함수를 사용하는 것입니다. DBMS 다양한 유형의 사용자에게 다양한 권한을 할당합니다. 이러한 방식으로 각 사용자 유형에 대한 액세스 프로필을 유지해야 합니다. 데이터 웨어하우스를 보호하는 또 다른 방법은 다음과 같이 암호화하는 것입니다. 데이터베이스 데이터 웨어하우스의. 액세스 주기 검색 도구는 주기 사용자에게 결과를 제공하기 전에.

2.4.4 데이터웨어 하우스 배포 단계

이는 데이터 웨어하우스 구현 주기의 마지막 단계입니다. 이 단계에서 수행할 활동에는 사용자에게 데이터 웨어하우스 사용 방법을 교육하고 데이터 웨어하우스를 검토하는 작업이 포함됩니다.

사용자 교육

액세스하기 전에 사용자 교육을 완료해야 합니다. 주기 데이터 웨어하우스의 사용 및 검색 도구의 사용. 일반적으로 세션은 스토리지 개념에 대한 소개로 시작되어야 합니다. 주기, 데이터 웨어하우스의 내용, 메타 주기 그리고 도구의 기본 기능. 그런 다음 고급 사용자는 데이터 액세스 및 검색 도구의 실제 테이블과 사용자 기능을 연구할 수도 있습니다.

사용자 교육을 수행하는 방법에는 여러 가지가 있습니다. 그 중 하나는 리더십과 의사소통 기술을 기반으로 일련의 사용자 중에서 선택된 많은 사용자 또는 분석가를 선택하는 것입니다. 그들은 시스템에 익숙해지기 위해 알아야 할 모든 것에 대해 개인적으로 교육을 받았습니다. 교육이 끝나면 업무로 돌아가 다른 사용자에게 시스템 사용 방법을 가르치기 시작합니다. 에

배운 내용을 바탕으로 다른 사용자는 데이터 웨어하우스 탐색을 시작할 수 있습니다.
또 다른 접근 방식은 마치 강의실 과정을 수강하는 것처럼 동시에 많은 사용자를 교육하는 것입니다. 이 방법은 동시에 교육이 필요한 사용자가 많은 경우에 적합합니다. 또 다른 방법은 각 사용자를 하나씩 개별적으로 교육하는 것입니다. 이 방법은 사용자가 적을 때 적합합니다.

사용자 교육의 목적은 사용자가 주기 검색 도구는 물론 데이터 웨어하우스의 콘텐츠도 포함됩니다. 그러나 일부 사용자는 교육 세션 중에 제공되는 정보의 양에 압도당할 수 있습니다. 따라서 지속적인 지원과 특정 질문에 대한 답을 얻기 위해 일정 횟수의 재교육 세션을 수행해야 합니다. 어떤 경우에는 이러한 유형의 지원을 제공하기 위해 사용자 그룹이 형성됩니다.

피드백 수집

데이터 웨어하우스가 출시되면 사용자는 다음을 사용할 수 있습니다. 주기 다양한 목적으로 데이터 웨어하우스에 상주하는 데이터입니다. 대부분 분석가나 사용자는 i를 사용합니다. 주기 다음을 위한 데이터 웨어하우스에서:

  1. 1 기업 동향 파악
  2. 2 구매 프로필을 분석합니다. 고객
  3. 3 나누기 i 고객
  4. 4 최고의 서비스를 제공합니다 고객 – 맞춤형 서비스
  5. 5 전략 수립 마케팅
  6. 6 비용 분석을 위한 경쟁력 있는 견적 제공 및 관리 지원
  7. 7 전략적 의사결정 지원
  8. 8 눈에 띌 수 있는 기회를 파악하세요
  9. 9 현재 비즈니스 프로세스의 품질을 향상시킵니다.
  10. 10 수익을 확인하세요

데이터 웨어하우스의 개발 방향에 따라 시스템에 대한 일련의 검토를 수행하여 피드백을 얻을 수 있습니다.

개발팀과 최종 사용자 커뮤니티 모두로부터.
얻은 결과는 다음 개발 주기에 고려될 수 있습니다.

데이터 웨어하우스는 점진적인 접근 방식을 갖고 있기 때문에 이전 개발의 성공과 실수로부터 배우는 것이 중요합니다.

2.5 요약

이 장에서는 문헌에 제시된 접근 방식이 논의되었습니다. 섹션 1에서는 데이터 웨어하우스의 개념과 의사결정 과학에서의 역할에 대해 논의했습니다. 섹션 2에서는 데이터 웨어하우스와 OLTP 시스템 간의 주요 차이점을 설명했습니다. 섹션 3에서는 데이터 웨어하우스 개발 프로세스와 관련된 활동을 설명하기 위해 섹션 4에서 사용된 Monash 데이터 웨어하우스 모델에 대해 논의했지만 이러한 논문은 엄격한 연구를 기반으로 한 것이 아닙니다. 실제로 일어나는 일은 문헌에 보고된 것과 매우 다를 수 있지만 이러한 결과는 이 연구를 위한 데이터 웨어하우스의 개념을 강조하는 기본 배경을 만드는 데 사용될 수 있습니다.

3 장

연구 및 설계 방법

이 장에서는 본 연구를 위한 연구 및 설계 방법을 다룬다. 첫 번째 부분에서는 정보 검색에 사용할 수 있는 연구 방법에 대한 일반적인 관점을 보여주고, 더 나아가 특정 연구에 가장 적합한 방법을 선택하는 기준에 대해 논의합니다. 섹션 2에서는 방금 노출된 기준을 사용하여 선택한 두 가지 방법을 논의합니다. 이 중 하나가 선택되어 다른 기준을 제외하는 이유가 설명되어 있는 섹션 3에 설명된 이유에 따라 채택됩니다. 섹션 4에서는 연구 설계를 제시하고 섹션 5에서는 결론을 제시합니다.

3.1 정보시스템 연구

정보 시스템에 대한 연구는 단순히 기술적 영역에만 국한되지 않고 행동 및 조직적 목적을 포함하도록 확장되어야 합니다.
우리는 이것을 사회과학에서 자연과학에 이르는 다양한 학문 분야의 논문에 빚지고 있습니다. 이로 인해 정보 시스템에 사용될 양적 및 질적 방법을 포함하는 특정 범위의 연구 방법이 필요합니다.
이용 가능한 모든 연구 방법이 중요하며 실제로 Jenkins(1985), Nunamaker et al. (1991) 및 Galliers(1992)는 정보 시스템의 다양한 분야에서 연구를 수행하는 데 특정한 보편적인 방법이 없다고 주장합니다. 실제로 어떤 방법은 특정 연구에는 적합하지만 다른 연구에는 적합하지 않을 수 있습니다. 이는 우리의 특정 연구 프로젝트에 적합한 방법을 선택해야 할 필요성을 가져옵니다. 이 선택을 위해 Benbasat et al. (1987)은 연구의 성격과 목적이 고려되어야 한다고 명시하고 있습니다.

3.1.1 연구의 성격

연구의 성격에 따른 다양한 방법은 정보과학에서 널리 알려진 세 가지 전통, 즉 실증주의적 연구, 해석적 연구, 비판적 연구로 분류될 수 있습니다.

3.1.1.1 실증주의 연구

실증주의 연구는 과학적 또는 경험적 연구라고도 알려져 있습니다. 그것은 "사회 세계를 구성하는 요소들 사이의 규칙성과 인과 관계를 살펴봄으로써 사회 세계에서 무슨 일이 일어날지 설명하고 예측"하는 것을 추구합니다(Shanks et al 1993).

실증주의 연구는 또한 반복성, 단순화 및 반박을 특징으로 합니다. 더욱이 실증주의 연구는 연구된 현상들 사이에 선험적 관계가 존재함을 인정합니다.
Galliers(1992)에 따르면 분류학은 실증주의 패러다임에 포함되는 연구 방법이지만 이에 국한되지 않고 실제로 실험실 실험, 현장 실험, 사례 연구, 정리 시연, 예측 및 시뮬레이션이 있습니다. 연구자들은 이러한 방법을 사용함으로써 연구된 현상을 객관적이고 엄격하게 관찰할 수 있음을 인정합니다.

3.1.1.2 해석적 연구

종종 현상학 또는 반실증주의라고 불리는 해석적 연구는 Neuman(1994)에 의해 “이해와 이해에 도달하기 위해 자연 상황에서 사람들을 직접적이고 세밀하게 관찰하여 행동의 사회적 의미를 체계적으로 분석하는 것”이라고 설명합니다. 사람들이 자신의 사회적 세계를 어떻게 창조하고 유지하는지에 대한 해석에 달려 있습니다.” 해석적 연구는 관찰된 현상이 객관적으로 관찰될 수 있다는 가정을 거부합니다. 사실 주관적인 해석을 바탕으로 작성되었습니다. 게다가 해석적 연구자들은 그들이 연구하는 현상에 선험적인 의미를 부여하지 않습니다.

이 방법에는 주관적/논증적 연구, 행동 연구, 서술적/해석적 연구, 미래 연구 및 역할극이 포함됩니다. 이러한 설문 조사와 사례 연구 외에도 복잡한 실제 상황에 있는 개인이나 조직에 대한 연구와 관련되므로 이 접근 방식에 포함될 수 있습니다.

3.1.1.3 비판적 연구

비판적 탐구는 사회과학에서 가장 잘 알려지지 않은 접근법이지만 최근 정보 시스템 연구자들의 관심을 받고 있습니다. 사회적 현실은 역사적으로 사람과 사회 시스템의 행동과 상호 작용에 의해 생산되고 재생산된다는 철학적 가정입니다. 그러나 그들의 능력은 다양한 사회적, 문화적, 정치적 고려사항에 의해 조정됩니다.

해석적 연구와 마찬가지로 비판적 연구는 실증주의적 연구가 사회적 맥락과 아무 관련이 없으며 인간 행동에 미치는 영향을 무시한다고 주장합니다.
반면에 비판적 연구는 해석적 연구가 너무 주관적이며 사람들의 삶을 개선하는 데 도움을 주는 것을 목표로 하지 않는다는 이유로 비판합니다. 비판적 연구와 다른 두 접근 방식의 가장 큰 차이점은 평가 차원입니다. 실증주의와 해석적 전통의 객관성은 현 상태나 사회적 현실을 예측하거나 설명하는 것이지만, 비판적 연구는 연구 중인 사회적 현실을 비판적으로 평가하고 변화시키는 것을 목표로 합니다.

비판적인 연구자들은 일반적으로 사회적 차이를 제거하고 사회적 조건을 개선하기 위해 현상 유지에 반대합니다. 비판적 연구는 관심 현상에 대한 과정적 관점을 추구하므로 일반적으로 종단적입니다. 연구 방법의 예로는 장기 역사 연구와 민족지 연구 등이 있습니다. 그러나 비판적 연구는 정보 시스템 연구에서 널리 사용되지 않았습니다.

3.1.2 연구의 목적

연구의 성격과 함께, 그 목적은 연구자가 특정 연구 방법을 선택하도록 안내하는 데 사용될 수 있습니다. 연구 프로젝트의 목적은 이론 구축, 이론 테스트, 이론 개선의 세 단계로 구성된 연구 주기와 관련하여 연구의 위치와 밀접하게 관련되어 있습니다. 따라서 연구 주기의 시기에 따라 연구 프로젝트는 설명, 기술, 탐색 또는 예측 목적을 가질 수 있습니다.

3.1.2.1 탐색적 연구

탐색적 연구는 완전히 새로운 주제를 조사하고 향후 연구를 위한 질문과 가설을 세우는 것을 목표로 합니다. 이러한 유형의 연구는 새로운 영역에서 초기 참고 자료를 얻기 위해 이론을 구축하는 데 사용됩니다. 일반적으로 사례 연구나 현상학적 연구와 같은 질적 연구 방법이 사용됩니다.

그러나 탐색적 조사나 실험과 같은 정량적 기법을 사용하는 것도 가능합니다.

3.1.3.3 서술적 연구

서술적 연구는 특정 조직 상황이나 관행을 아주 자세하게 분석하고 기술하는 것을 목표로 합니다. 이는 이론을 구축하는 데 적합하며 가설을 확인하거나 이의를 제기하는 데에도 사용할 수 있습니다. 기술 연구에는 일반적으로 측정값과 표본의 사용이 포함됩니다. 가장 적합한 연구 방법으로는 설문 조사와 선행 분석이 있습니다.

3.1.2.3 설명적 연구

설명적 연구는 일이 일어나는 이유를 설명하려고 합니다. 이는 이미 연구된 사실을 토대로 작성되었으며 이러한 사실에 대한 이유를 찾으려고 노력합니다.
따라서 설명적 연구는 일반적으로 탐색적 또는 기술적 연구를 기반으로 하며 이론을 테스트하고 개선하는 데 부수적입니다. 설명적 연구는 일반적으로 사례 연구나 설문 조사 기반 연구 방법을 사용합니다.

3.1.2.4 예방 연구

예방 연구는 연구 중인 관찰 중인 사건과 행동을 예측하는 것을 목표로 합니다(Marshall and Rossman 1995). 예측은 진실에 대한 표준적인 과학적 테스트입니다. 이러한 유형의 연구는 일반적으로 설문조사나 분석을 사용합니다. 주기 역사가. (인 1989)

위의 논의는 특정 연구에 사용될 수 있는 다양한 연구 방법이 있음을 보여줍니다. 그러나 특정 유형의 연구 프로젝트에는 다른 방법보다 더 적합한 특정 방법이 하나 있어야 합니다. (갤리어스 1987, Yin 1989, De Vaus 1991). 따라서 각 연구자는 연구 프로젝트에 가장 적합하고 양립할 수 있는 연구 방법을 채택하기 위해 다양한 방법의 장단점을 신중하게 평가해야 합니다. (Jenkins 1985, Pervan 및 Klass 1992, Bonomia 1985, Yin 1989, Himilton 및 Ives 1992).

3.2. 가능한 연구 방법

이 프로젝트의 목적은 i와 함께 호주 조직에서의 경험을 연구하는 것이었습니다. 주기 개발과 함께 저장됨 데이터웨어 하우스. 다토 현재 호주에서는 데이터 웨어하우징 분야에 대한 연구가 부족하므로 이 연구 프로젝트는 아직 연구 주기의 이론적인 단계에 있으며 탐구적인 목적을 가지고 있습니다. 데이터 웨어하우징을 채택한 호주 조직의 경험을 탐색하려면 실제 사회에 대한 해석이 필요합니다. 결과적으로, 연구 프로젝트의 기초가 되는 철학적 가정은 전통적인 해석을 따릅니다.

이용 가능한 방법을 엄격하게 조사한 후 탐색적 연구에 사용할 수 있는 설문조사와 사례 연구라는 두 가지 가능한 연구 방법이 확인되었습니다(Shanks et al. 1993). Galliers(1992)는 그의 수정된 분류법에서 이 두 가지 방법이 이론 구축에 적합하다고 말함으로써 이 특정 연구에 대한 적합성을 주장합니다. 다음 두 하위 섹션에서는 각 방법을 자세히 설명합니다.

3.2.1 설문 조사 방법

측량 조사 방법은 고대 인구 조사 방법에서 유래합니다. 인구 조사는 전체 인구로부터 정보를 수집하는 것으로 구성됩니다. 이 방법은 비용이 많이 들고 비실용적이며, 특히 인구가 많은 경우에는 더욱 그렇습니다. 따라서 인구조사와 비교하여 설문조사는 일반적으로 인구를 대표하는 소수 또는 표본에 대한 정보 수집에 중점을 둡니다(Fowler 1988, Neuman 1994). 표본은 표본 구조, 크기 및 사용된 선택 방법에 따라 다양한 정확도 수준으로 추출된 모집단을 반영합니다(Fowler 1988, Babbie 1982, Neuman 1994).

설문 조사 방법은 "설문지나 인터뷰를 사용하여 수행된 특정 시점의 관행, 상황 또는 견해에 대한 스냅샷으로 정의되며, 이로부터 추론이 가능합니다.
만들어졌다”(Galliers 1992:153) [추론이 이루어질 수 있는 설문지나 인터뷰를 사용하여 수행된 특정 시점의 관행, 상황 또는 견해의 스냅샷]. 설문조사는 질문을 통해 특정 수의 참가자로부터 연구의 특정 측면에 대한 정보를 수집하는 작업을 다룹니다(Fowler 1988). 대면 전화 인터뷰와 구조화된 인터뷰를 포함하는 이러한 설문지와 인터뷰 역시 정보 수집 기법이다. 주기 조사에 가장 일반적으로 사용되는 방법(Blalock 1970, Nachmias 및 Nachmias 1976, Fowler 1988), 관찰 및 분석이 사용될 수 있습니다(Gable 1994). 이 모든 수집 방법 중에서 주기, 설문지를 사용하는 것이 가장 널리 사용되는 기술입니다. 주기

수집된 정보는 구조화되고 형식화되어 정보 분류를 용이하게 합니다(Hwang 1987, de Vaus 1991).

나 분석할 때 주기, 조사 전략은 통계 분석과 같은 정량적 기법을 사용하는 경우가 많지만 정성적 기법도 사용할 수 있습니다(Galliers 1992, Pervan)

및 Klass 1992, Gable 1994). 평소에는 나는 주기 수집된 데이터는 연관성의 분포와 패턴을 분석하는 데 사용됩니다(Fowler 1988).

설문조사는 일반적으로 '무엇?'이라는 질문을 다루는 연구에 적합하지만 (무엇) 또는 그것으로부터 파생되는 '얼마나', '얼마나 많은' 등은 '왜'라는 질문을 통해 질문될 수 있습니다(Sonquist and Dunkelberg 1977, Yin 1989). Sonquist와 Dunkelberg(1977)에 따르면 탐구 연구는 가설에 도전하고, 프로그램을 평가하고, 인구를 설명하고, 인간 행동 모델을 개발하는 것을 목표로 합니다. 더욱이, 설문조사는 특정 인구 집단의 의견, 조건, 의견, 특성, 기대, 과거 또는 현재 행동까지 연구하는 데 사용될 수 있습니다(Neuman 1994).

설문조사를 통해 연구자는 모집단 간의 관계를 발견할 수 있으며 결과는 일반적으로 다른 방법보다 더 일반적입니다(Sonquist 및 Dunkelberg 1977, Gable 1994). 설문조사를 통해 연구자들은 더 넓은 지역을 포괄하고 많은 응답자에게 접근할 수 있습니다(Blalock 1970, Sonquist 및 Dunkelberg 1977, Hwang 및 Lin 1987, Gable 1994, Neuman 1994). 마지막으로, 설문조사는 다른 곳에서는 얻을 수 없거나 분석에 필요한 형식으로 제공되지 않는 정보를 제공할 수 있습니다(Fowler 1988).

그러나 설문조사를 수행하는 데에는 몇 가지 제한 사항이 있습니다. 단점은 연구자가 연구 대상에 대해 많은 정보를 얻을 수 없다는 것입니다. 이는 설문조사가 특정 시점에만 진행되기 때문에 연구자가 조사할 수 있는 변수와 인원이 제한되어 있기 때문입니다.

연구(Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). 또 다른 단점은 설문 조사를 수행하는 데 시간과 자원 측면에서 비용이 많이 들 수 있다는 것입니다. 특히 대면 인터뷰가 포함된 경우에는 더욱 그렇습니다(Fowler 1988).

3.2.2. 문의 조사 방법

탐구 연구 방법은 연구자의 개입 없이 일정 기간 동안 실제 상황 내에서 특정 상황을 심층적으로 연구하는 것입니다(Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). 주로 이 방법은 특정 상황에서 연구되는 변수 간의 관계를 설명하는 데 사용됩니다(Galliers 1992). 조사에는 분석된 현상에 따라 단일 또는 다중 사례가 포함될 수 있습니다(Franz and Robey 1987, Eisenhardt 1989, Yin 1989).

탐구연구 방법은 “사람, 집단, 조직 등 하나 이상의 실체로부터 수집된 다양한 출처를 이용하여 동시대 현상을 실제 맥락 내에서 연구하는 실증적 탐구”로 정의된다(Yin 1989). 현상과 그 맥락 사이에는 명확한 분리가 없으며 변수에 대한 실험적 제어나 조작도 없습니다(Yin 1989, Benbasat et al. 1987).

수집기술은 다양하다. 주기 직접관찰, 기록검토, 설문조사, 문서검토, 구조화된 인터뷰 등을 포함하는 질의방법에 활용될 수 있다. 다양한 수확기술 보유 주기, 조사를 통해 연구자들은 두 가지 모두를 다룰 수 있습니다. 주기 질적인 동시에 양적인 것입니다(Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). 설문조사 방법과 마찬가지로 설문조사 연구원은 연구 대상 조직에 적극적으로 참여하는 것이 아니라 관찰자 또는 연구원의 역할을 합니다.

Benbasat et al.(1987)은 탐구 방법이 연구 질문에서 시작하여 교육으로 이어지는 연구 이론을 구축하는 데 특히 적합하다고 주장합니다.

수집 과정에서의 이론 주기. 무대에도 어울리는

이론 구축에 있어서 Franz와 Robey(1987)는 탐구 방법이 복잡한 이론 단계에도 사용될 수 있다고 제안합니다. 이 경우 수집된 증거를 바탕으로 특정 이론이나 가설을 검증하거나 반박합니다. 또한, 이 설문조사는 '어떻게' 또는 '왜' 질문을 다루는 연구에도 적합합니다(Yin 1989).

다른 방법에 비해 설문조사를 통해 연구자는 필수 정보를 더 자세히 파악할 수 있습니다(Galliers 1992, Shanks et al. 1993). 더욱이, 설문 조사를 통해 연구자는 연구된 프로세스의 성격과 복잡성을 이해할 수 있습니다(Benbasat et al. 1987).

조사 방법에는 네 가지 주요 단점이 있습니다. 첫 번째는 통제된 공제의 부족입니다. 연구자의 주관성은 연구의 결과와 결론을 바꿀 수 있습니다(Yin 1989). 두 번째 단점은 통제된 관찰이 부족하다는 것입니다. 실험 방법과 달리 탐구 연구자는 연구된 현상을 자연스러운 맥락에서 조사할 때 통제할 수 없습니다(Gable 1994). 세 번째 단점은 복제 가능성이 부족하다는 것입니다. 이는 연구자가 동일한 사건을 관찰할 가능성이 낮고, 특정 연구의 결과를 검증할 수 없기 때문이다(Lee 1989). 마지막으로, 복제 불가능성으로 인해 하나 이상의 조사에서 얻은 결과를 일반화하기가 어렵습니다(Galliers 1992, Shanks et al 1993). 그러나 이러한 모든 문제는 극복할 수 없는 것이 아니며 실제로 연구자가 적절한 조치를 취함으로써 최소화할 수 있습니다(Lee 1989).

3.3. 연구 방법론의 정당화 채택 된

본 연구에서는 두 가지 연구방법 중 설문조사 방법이 가장 적합하다고 판단된다. 해당 조사는 관련 사항을 신중하게 고려한 후 폐기되었습니다.

장점과 약점. 본 연구를 위한 각 방법의 적절성 또는 부적절성은 아래에서 논의됩니다.

3.3.1. 연구방법의 부적절성 조사의

조사 방법은 일정 기간 동안 하나 이상의 조직 내의 특정 상황에 대한 심층적인 연구가 필요합니다(Eisenhardt 1989). 이 경우 기간은 본 연구에서 정한 기간을 초과할 수 있다. 조사방법을 채택하지 않는 또 다른 이유는 결과의 엄격성이 부족하기 때문이다(Yin 1989). 연구자의 주관성이 결과와 결론에 영향을 미칠 수 있습니다. 또 다른 이유는 이 방법이 '어떻게' 또는 '왜' 유형의 질문에 대한 연구에 더 적합한 반면(Yin 1989), 본 연구의 연구 질문은 '무엇' 유형에 속하기 때문입니다. 마지막으로, 한두 번의 조사 결과를 일반화하기는 어렵습니다(Galliers 1992, Shanks et al. 1993). 이러한 근거를 토대로 설문 조사 방법은 본 연구에 적합하지 않아 선택하지 않았다.

3.3.2. 검색방법의 편리성 조사

이 연구가 수행되었을 당시에는 호주 조직에서 데이터 웨어하우징 관행을 널리 채택하지 않았습니다. 따라서 호주 조직 내에서 구현에 관한 정보가 많지 않았습니다. 사용 가능한 정보는 다음을 구현했거나 사용한 조직에서 얻은 것입니다. 데이터웨어 하우스. 이 경우, 다른 곳에서는 얻을 수 없는 정보나 분석에 필요한 형태로 정보를 얻을 수 있다는 점에서 설문 조사 방법이 가장 적합하다(Fowler 1988). 또한, 설문조사 연구 방법을 통해 연구자는 특정 시점의 관행, 상황 또는 견해에 대한 좋은 통찰력을 얻을 수 있습니다(Galliers 1992, Denscombe 1998). 호주 데이터 웨어하우징 경험에 대한 지식을 늘리려면 개요가 필요했습니다.

또한 Sonquist와 Dunkelberg(1977)는 조사 연구 결과가 다른 방법보다 더 일반적이라고 말합니다.

3.4. 설문조사 연구 설계

데이터 웨어하우징 관행에 대한 조사는 1999년에 수행되었습니다. 대상 인구는 데이터 웨어하우징 연구에 관심이 있는 호주 조직으로 구성되었습니다. 주기 따라서 이 연구에 유용한 정보를 제공할 수 있습니다. 대상 인구는 데이터 웨어하우징 연구소(Tdwi-aap)의 모든 호주 회원을 대상으로 한 초기 조사를 통해 확인되었습니다. 이 섹션에서는 본 연구의 실증적 연구 단계 설계에 대해 논의합니다.

3.4.1. 수확 기술 주기

설문조사 연구에서 일반적으로 사용되는 세 가지 기법(예: 메일 설문지, 전화 인터뷰, 개인 인터뷰)(Nachmias 1976, Fowler 1988, de Vaus 1991) 중에서 메일 설문지를 본 연구에 채택했습니다. 후자를 채택하는 첫 번째 이유는 지리적으로 분산된 인구에 도달할 수 있다는 것입니다(Blalock 1970, Nachmias 및 Nachmias 1976, Hwang 및 Lin 1987, de Vaus 1991, Gable 1994). 둘째, 우편 설문지는 교육 수준이 높은 참가자에게 적합합니다(Fowler 1988). 본 연구의 메일 설문지는 데이터 웨어하우징 프로젝트 후원자, 이사 및/또는 프로젝트 관리자에게 발송되었습니다. 셋째, 메일 설문지는 안전한 메일링 리스트가 가능할 때 적합합니다(Salant and Dilman 1994). TDWI의 경우 신뢰할 수 있는 데이터 웨어하우징 협회가 호주 회원의 메일링 목록을 제공했습니다. 전화 설문지나 개인 인터뷰에 비해 메일 설문지의 또 다른 장점은 특히 응답자가 메모를 참조하거나 다른 사람과 질문에 대해 논의해야 할 때 응답자가 보다 정확하게 응답할 수 있다는 것입니다(Fowler 1988).

잠재적인 단점은 우편으로 설문지를 수행하는 데 시간이 걸린다는 점입니다. 일반적으로 우편 조사는 우편 편지, 응답 대기, 확인 전송의 순서로 수행됩니다(Fowler 1988, Bainbridge 1989). 따라서 개별면접이나 전화면접에 소요되는 시간보다 총 시간이 더 길어질 수 있습니다. 그러나 총 시간은 미리 알 수 있습니다(Fowler 1988, Denscombe 1998). 개인 인터뷰에 소요되는 시간은 인터뷰마다 다르기 때문에 미리 알 수 없습니다(Fowler 1988). 전화 인터뷰는 우편 설문지나 개인 인터뷰보다 빠를 수 있지만 일부 사람들의 부재로 인해 무응답률이 높을 수 있습니다(Fowler 1988). 또한 전화 인터뷰는 일반적으로 상대적으로 짧은 질문 목록으로 제한됩니다(Bainbridge 1989).

메일 설문지의 또 다른 약점은 높은 무응답률입니다(Fowler 1988, Bainbridge 1989, Neuman 1994). 그러나 이 연구를 신뢰할 수 있는 데이터 보관 기관(예: TDWI)과 연결하여 대응 조치를 취했으며(Bainbridge 1989, Neuman 1994), 비응답자에게 두 개의 알림 편지를 보내고(Fowler 1988, Neuman 1994) 추가 편지도 포함합니다. 연구의 목적을 설명합니다(Neuman 1994).

3.4.2. 분석단위

본 연구의 목적은 호주 조직 내에서 데이터 웨어하우징 구현 및 사용에 대한 정보를 얻는 것입니다. 대상 인구는 다음을 구현했거나 구현 중인 모든 호주 조직으로 구성됩니다. 데이터웨어 하우스. 그러면 개별 조직이 해당 이름으로 등록됩니다. 설문지는 입양에 관심이 있는 기관에 우편으로 발송되었습니다. 데이터웨어 하우스. 이 방법을 사용하면 수집된 정보는 각 참여 조직의 가장 적합한 리소스에서 제공됩니다.

3.4.3. 설문조사 샘플

설문조사 참가자의 "메일링 리스트"는 TDWI에서 얻었습니다. 이 목록에서 3000개의 호주 조직이 샘플링 기반으로 선택되었습니다. 설문조사의 프로젝트와 목적을 설명하는 추가 편지와 응답 시트 및 완성된 설문지를 반송하기 위한 선불 봉투가 샘플로 발송되었습니다. 3000개 조직 중 198개 조직이 연구에 참여하기로 동의했습니다. 이렇게 적은 수의 응답이 예상되었습니다. 데이터 당시 조직 내에서 데이터 웨어하우징 전략을 채택했거나 채택하고 있던 수많은 호주 조직. 따라서 본 연구의 대상 모집단은 198개 조직으로만 구성된다.

3.4.4. 설문지의 내용

설문지의 구조는 Monash 데이터 웨어하우징 모델(이전에 2.3부에서 논의됨)을 기반으로 했습니다. 설문지의 내용은 2장에 제시된 문헌 분석을 기반으로 했습니다. 설문조사 참가자에게 보낸 설문지 사본은 부록 B에서 확인할 수 있습니다. 설문지는 다루는 모델의 단계를 따르는 XNUMX개 섹션으로 구성됩니다. 다음 XNUMX개 단락은 각 섹션의 내용을 간략하게 요약합니다.

섹션 A: 조직에 대한 기본 정보
이 섹션에는 참여 기관의 프로필과 관련된 질문이 포함되어 있습니다. 또한 일부 질문은 참가자의 데이터 웨어하우징 프로젝트 상태와 관련이 있습니다. 조사분석에서는 기관명 등의 기밀정보가 노출되지 않았다.

섹션 B: 시작
이 섹션의 질문은 데이터 웨어하우징 시작 작업과 관련이 있습니다. 프로젝트 개시자, 보증인, 필요한 기술 및 지식, 데이터 웨어하우징 개발 목표 및 최종 사용자 기대에 관해 질문을 받았습니다.

섹션 C: 디자인
이 섹션에는 활동 계획과 관련된 질문이 포함되어 있습니다. 데이터웨어 하우스. 특히, 실행 범위, 프로젝트 기간, 프로젝트 비용, 비용/편익 분석에 대한 질문이 있었습니다.

섹션 D: 개발
개발 섹션에는 개발 활동과 관련된 질문이 있습니다. 데이터웨어 하우스: 최종 사용자 요구사항 수집, 소스 주기, 논리 모델 주기, 프로토타입, 용량 계획, 기술 아키텍처 및 데이터 웨어하우징 개발 도구 선택.

섹션 E: 작동
운영 및 확장성과 관련된 운영 질문 데이터웨어 하우스, 다음 개발 단계에서 어떻게 발전하는지. 거기 데이터 품질, 새로 고침 전략 주기, 세분성 주기, 확장성 데이터웨어 하우스 그리고 보안 문제는 데이터웨어 하우스 질문 유형 중 하나였습니다.

섹션 F: 개발
이 섹션에는 사용과 관련된 질문이 포함되어 있습니다. 데이터웨어 하우스 최종 사용자에 의해. 연구자는 이 연구의 목적과 유용성에 관심이 있었습니다. 데이터웨어 하우스, 채택된 검토 및 훈련 전략과 통제 전략 데이터웨어 하우스 채택 된.

3.4.5. 응답률

메일 설문조사는 응답률이 낮다는 비판을 받고 있지만, 응답률을 높이기 위한 조치가 취해졌습니다(앞서 3.4.1절에서 논의한 대로). '응답률'이라는 용어는 설문지에 응답한 특정 조사 표본의 사람들의 비율을 나타냅니다(Denscombe 1998). 본 연구의 응답률을 계산하기 위해 다음 공식이 사용되었습니다.

응답한 사람 수
응답률 = ——————————————————————————– X 100 총 설문지 발송 건수

3.4.6. 파일럿 테스트

설문지를 표본으로 보내기 전 Luck and Rubin(1987), Jackson(1988), de Vaus(1991)의 제안에 따라 파일럿 테스트를 수행하여 질문을 검토하였다. 파일럿 테스트의 목적은 해석하기 어려운 어색하고 모호한 표현과 질문을 밝히고, 사용된 정의와 용어를 명확히 하며, 설문지를 완료하는 데 필요한 대략적인 시간을 확인하는 것입니다(Warwick and Lininger 1975, Jackson 1988, Salant 그리고 Dilman 1994). 파일럿 테스트는 Davis e가 제안한 대로 최종 피험자와 유사한 특성을 가진 피험자를 선택하여 수행되었습니다. 코센 (1993). 본 연구에서는 데이터 웨어하우징 전문가 XNUMX명을 시범 대상자로 선정하였다. 각 파일럿 테스트 후에 필요한 수정이 이루어졌습니다. 수행된 파일럿 테스트를 통해 참가자들은 설문지의 최종 버전을 재구성하고 재설정하는 데 기여했습니다.

3.4.7. 분석 방법 기준 주기

I 주기 폐쇄형 설문지에서 수집된 설문조사 중 일부를 SPSS라는 통계 프로그램 패키지를 사용하여 분석했습니다. 많은 응답이 기술 통계를 사용하여 분석되었습니다. 다수의 설문지가 불완전하게 반환되었습니다. 이것들은 내가 주기 누락은 데이터 입력 오류로 인한 것이 아니라 질문이 등록자에게 적합하지 않았거나 등록자가 하나 이상의 특정 질문에 답변하지 않기로 결정했기 때문입니다. 이러한 누락된 응답은 분석 중에 무시되었습니다. 주기 분석 과정에서 제외되도록 '-9'로 코딩했습니다.

설문지를 작성할 때 각 항목에 번호를 부여하여 폐쇄형 질문을 미리 코딩하였다. 그 번호는 다음을 준비하는 데 사용되었습니다. 주기 분석하는 동안(Denscombe 1998, Sapsford 및 Jupp 1996). 예를 들어, 섹션 B의 질문 1에는 이사회, 고위 임원, IT 부서, 사업부, 컨설턴트 등 XNUMX가지 옵션이 나열되어 있습니다. 파일에는 주기 SPSS에서는 '프로젝트 개시자'를 나타내는 변수가 생성되었으며, '이사회'는 '1', '고위 임원'은 '2' 등 1개의 값 레이블이 있습니다. 일부 폐쇄형 질문에 Likertin 척도를 사용하면 SPSS에 입력된 해당 수치를 사용하여 쉽게 식별할 수 있습니다. 상호 배타적이지 않고 포괄적이지 않은 답변이 포함된 질문의 경우 각 옵션은 '표시됨'의 경우 '2', '표시되지 않음'의 경우 'XNUMX'라는 두 개의 값 레이블이 있는 단일 변수로 처리되었습니다.

개방형 질문은 폐쇄형 질문과 다르게 처리되었습니다. 이 질문에 대한 답변은 SPSS에 입력되지 않았습니다. 대신 손으로 분석했습니다. 이러한 유형의 질문을 사용하면 응답자의 자유롭게 표현된 아이디어와 개인적인 경험에 대한 정보를 얻을 수 있습니다(Bainbridge 1989, Denscombe 1998). 가능한 경우 응답을 분류했습니다.

분석을 위해 주기에서는 반응빈도, 평균, 표준편차, 중앙값 등의 간단한 통계분석 방법을 사용한다(Argyrous 1996, Denscombe 1998).
감마 테스트는 다음과 같은 연관성을 정량적으로 측정하는 데 효과적이었습니다. 주기 서수(Norusis 1983, Argyrous 1996). 사용된 순서 척도에는 범주가 많지 않고 표에 표시될 수 있기 때문에 이러한 테스트는 적절했습니다(Norusis 1983).

3.5 요약

본 장에서는 본 연구를 위해 채택된 연구 방법론과 설계에 대해 논의하였다.

특정 연구에 가장 적합한 연구 방법을 선택하는 것은 다음을 고려합니다.
연구의 성격과 유형, 가능한 각 방법의 장점과 약점을 포함한 여러 규칙 고려(Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987, yin 1989, Hamilton and ives 1992, Galliers 1992, 노이만 1994). 호주의 데이터 웨어하우징 채택에 관한 기존 지식과 이론이 부족하다는 점을 감안할 때, 이 연구 조사에는 호주 조직의 경험을 탐색할 수 있는 탐색적 능력을 갖춘 해석적 연구 방법이 필요합니다. 선택된 연구 방법은 호주 조직의 데이터 웨어하우징 개념 채택에 관한 정보를 수집하기 위해 선택되었습니다. 수집기법은 우편설문지를 선택하였다. 주기. 연구방법 및 수집기법의 정당성 주기 선택한 내용은 이 장에서 제공됩니다. 또한, 분석단위, 사용된 표본, 응답비율, 설문지의 내용, 설문지의 사전검사 및 분석방법에 대한 논의가 제시되었다. 주기.

디자인 데이터웨어 하우스:

엔터티 관계와 차원 모델링 결합

추상
저장 i 주기 많은 조직의 주요 현안입니다. 컴퓨터 저장장치 개발의 핵심 이슈 주기 그것은 그의 디자인이다.
디자인은 개념의 탐지를 지원해야 합니다. 데이터웨어 하우스 레거시 시스템 및 기타 소스에 주기 구현에 있어서도 쉽게 이해하고 효율성을 높일 수 있습니다. 데이터웨어 하우스.
저장 문헌의 대부분은 주기 디자인을 표현하기 위해 엔터티 관계 모델링 또는 차원 모델링을 사용할 것을 권장합니다. 데이터웨어 하우스.
이 문서에서는 두 표현을 하나의 드로잉 접근 방식으로 결합하는 방법을 보여줍니다. 데이터웨어 하우스. 사용된 접근 방식은 체계적입니다.

사례 연구에서 조사되었으며 실무자와 관련된 여러 가지 중요한 의미가 확인되었습니다.

데이터 웨어하우징

Un 데이터웨어 하우스 이는 일반적으로 "경영진의 결정을 지원하는 주제 지향적이고 통합적이며 시변적이며 비휘발성인 데이터 모음"으로 정의됩니다(Inmon and Hackathorn, 1994). 주제 지향적이고 통합되어 있음을 나타냅니다. 데이터웨어 하우스 Legaci 시스템의 기능적 경계를 넘어 통합된 관점을 제공하도록 설계되었습니다. 주기.
시간 변화는 역사적 또는 시계열적 특성에 영향을 미칩니다. 주기 ~ 안에 데이터웨어 하우스, 추세를 분석할 수 있습니다. 비휘발성은 다음을 나타냅니다. 데이터웨어 하우스 처럼 지속적으로 업데이트되지는 않습니다. 데이터베이스 OLTP의 오히려 정기적으로 업데이트됩니다. 주기 내부 및 외부 소스에서 발생합니다. 그만큼 데이터웨어 하우스 이는 무결성 및 운영 성능 업데이트보다는 검색을 위해 특별히 설계되었습니다.
i를 저장하는 아이디어 주기 새로운 것은 아니지만, 의 관리 목적 중 하나였습니다. 주기 1982년대 이후(The Martin, XNUMX).
I 데이터웨어 하우스 그들은 인프라를 제공합니다 주기 경영지원 시스템을 위한 것입니다. 경영지원시스템에는 의사결정지원시스템(DSS)과 경영정보시스템(EIS)이 포함됩니다. DSS는 인간의 의사결정을 개선하도록 설계된 컴퓨터 기반 정보 시스템입니다. EIS는 일반적으로 다음을 전달하는 시스템입니다. 주기 비즈니스 리더가 쉽게 액세스할 수 있도록 지원합니다. 주기.
일반적인 아키텍처 데이터웨어 하우스 의 역할을 강조한다 데이터웨어 하우스 경영지원에 있습니다. 인프라를 제공할 뿐만 아니라 주기 EIS 및 DSS의 경우 데이터웨어 하우스 쿼리를 통해 직접 액세스할 수 있습니다. 그만큼 주기 에 포함됨 데이터웨어 하우스 이는 관리 정보 요구 사항 분석을 기반으로 하며 내부 레거시 시스템, 특수 목적 데이터 캡처 시스템 및 외부 데이터 소스의 세 가지 소스에서 얻습니다. 그만큼 주기 내부 레거시 시스템에서는 중복되고 일관성이 없으며 품질이 낮은 경우가 많으며 다양한 형식으로 저장되므로 시스템에 로드하기 전에 조정하고 정리해야 합니다.

데이터웨어 하우스 (인먼, 1992; 맥파든, 1996). 그만큼 주기 스토리지 시스템에서 가져옴 주기 임시 및 소스에서 주기 외부는 종종 i를 확장(업데이트, 교체)하는 데 사용됩니다. 주기 레거시 시스템에서.

개발해야 하는 많은 이유가 있습니다. 데이터웨어 하우스여기에는 더 많은 정보의 효과적인 사용을 통한 향상된 의사 결정(Ives 1995), 전체 거래에 대한 초점 지원(Graham 1996), 주기 EIS와 DSS의 경우(Graham 1996, McFadden 1996).

최근 실증적 연구에 따르면 평균적으로 투자 수익이 데이터웨어 하우스 401년 후 1996% 증가(Graham, XNUMX). 그러나 다른 실증적 연구에서는 데이터웨어 하우스 혜택 측정 및 할당의 어려움, 명확한 목적 부족, 혜택 저장 프로세스의 목적과 복잡성을 과소평가하는 등 심각한 문제를 발견했습니다. 주기, 특히 원산지와 청결도에 관해 주기. 저장 중 주기 관리 문제에 대한 해결책으로 간주될 수 있음 주기 조직 간. 조작 주기 사회적 자원으로서 그것은 수년 동안 전 세계의 정보 시스템을 관리하는 데 있어 주요 문제 중 하나로 남아 있었습니다(Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

관리에 대한 대중적인 접근 방식 주기 80년대에는 모델이 개발되었습니다. 주기 사회의. 모델 주기 social은 새로운 응용 시스템 개발을 위한 안정적인 기반을 제공하도록 설계되었으며 데이터베이스 레거시 시스템의 재구성 및 통합(Brancheau et al.

1989, Goodhueet al. 1988:1992, 김과 에베레스트 1994). 그러나 이 접근 방식에는 많은 문제가 있습니다. 특히 각 작업의 복잡성과 비용, 가시적인 결과를 생성하는 데 필요한 오랜 시간이 있습니다(Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997). ).

Il 데이터웨어 하우스 레거시 데이터베이스를 교체하는 것이 아니라 공존하는 별도의 데이터베이스입니다. 따라서 귀하가 관리를 지시할 수 있습니다. 주기 레거시 시스템의 비용이 많이 드는 재구성을 방지합니다.

데이터 설계에 대한 기존 접근 방식

창고

건물을 짓고 완성하는 과정 데이터웨어 하우스 이는 전통적인 시스템의 개발 수명 주기라기보다는 진화 과정으로 더 이해되어야 합니다(Desio, 1995, Shanks, O'Donnell 및 Arnott 1997a). 프로젝트에는 많은 프로세스가 관련되어 있습니다. 데이터웨어 하우스 초기화, 계획 등; 회사 관리자에게 요청한 요구 사항에서 얻은 정보 소스, 변환, 정리 주기 레거시 시스템 및 기타 소스로부터의 동기화 주기; 개발 중인 전달 시스템; 모니터링 데이터웨어 하우스; 그리고 진화 과정과 구조의 무의미함 데이터웨어 하우스 (Stinchi, O'Donnell 및 Arnott 1997b). 이 일지에서는 그림을 그리는 방법에 중점을 둡니다. 주기 이러한 다른 프로세스의 컨텍스트에 저장됩니다. 아키텍처에 대해 여러 가지 제안된 접근 방식이 있습니다. 데이터웨어 하우스 문학에서 (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). 이러한 각 방법론에는 강점과 약점에 대한 분석과 함께 간략한 검토가 포함되어 있습니다.

Inmon(1994)의 접근 방식 데이터웨어 하우스 디자인

Inmon(1994)은 설계를 위한 XNUMX가지 반복 단계를 제안했습니다. 데이터웨어 하우스 (그림 2 참조) 첫 번째 단계는 템플릿을 디자인하는 것입니다. 주기 내가 어떻게 지내는지 이해하기 위해 사회적으로 주기 조직 내 기능 영역을 분할하여 통합할 수 있습니다. 주기 지역에 보관하십시오. 모델 주기 보관용으로 만들어졌네요 주기 다음을 포함하여 의사결정과 관련된 주기 역사가 포함 주기 추론하고 집계했습니다. 두 번째 단계는 구현을 위한 주제 영역을 식별하는 것입니다. 이는 특정 조직이 결정한 우선순위를 기반으로 합니다. 세 번째 단계에서는 그림을 그리는 작업이 포함됩니다. 데이터베이스 주제 영역의 경우 적절한 수준의 세분화를 포함하는 데 특히 주의를 기울이십시오. Inmon은 엔터티 및 관계 모델을 사용할 것을 권장합니다. 네 번째 단계는 소스 시스템을 식별하는 것입니다. 주기 i를 캡처, 정리 및 포맷하기 위해 필요한 변환 프로세스를 개발합니다. 주기.

Inmon의 접근 방식의 강점은 모델이 주기 소셜은 통합의 기반을 제공합니다. 주기 반복적인 개발을 위한 지원 조직 및 계획 내에서 데이터웨어 하우스. 단점은 모델 설계의 어려움과 비용입니다. 주기 사회적, 두 모델 모두에서 사용되는 개체 및 관계 모델을 이해하는 데 어려움이 있습니다. 주기 사회적 그리고 그것의 주기 주제 영역별로 저장되며, 그 적합성 주기 그림의 데이터웨어 하우스 실현을 위해 데이터베이스 관계형이지만 대상이 아닌 데이터베이스 다차원.

Ives(1995)의 접근 방식 데이터웨어 하우스 디자인

Ives(1995)는 정보 시스템 설계에 적용할 수 있다고 믿는 XNUMX단계 접근 방식을 제안합니다. 데이터웨어 하우스 (그림 3 참조) 이 접근 방식은 정보 시스템 개발을 위한 정보 공학에 기반을 두고 있습니다(Martin 1990). 첫 번째 단계는 목표, 중요 요인, 성공 요인, 핵심 성과 지표를 결정하는 것입니다. 주요 비즈니스 프로세스와 필요한 정보를 모델링하여 모델로 이끌어줍니다. 주기 사회의. 두 번째 단계에는 정의 아키텍처를 개발하는 작업이 포함됩니다. 주기 영역별로 저장하고, 데이터베이스 di 데이터웨어 하우스, 필요한 기술 구성 요소, 구현 및 운영에 필요한 조직 지원 세트 데이터웨어 하우스. 세 번째 단계에는 필요한 소프트웨어 패키지와 도구를 선택하는 작업이 포함됩니다. 네 번째 단계는 세부 설계 및 시공이다. 데이터웨어 하우스. Ives는 다음과 같은 내용을 보관하고 있습니다. 주기 이는 제한된 반복 프로세스입니다.

Ives 접근 방식의 강점은 정보 요구 사항을 결정하기 위한 특정 기술의 사용, 통합을 지원하기 위한 구조화된 프로세스의 사용입니다. 데이터웨어 하우스, 적절한 하드웨어 및 소프트웨어 선택, 다양한 표현 기술의 사용 데이터웨어 하우스. 그 결함은 복잡성에 내재되어 있습니다. 다른 것에는 여러 수준의 발달 장애가 포함됩니다. 데이터베이스 all'interno del 데이터웨어 하우스 합리적인 시간과 비용으로.

Kimball(1994)의 접근 방식 데이터웨어 하우스 디자인

Kimball(1994)은 설계를 위한 XNUMX가지 반복 단계를 제안했습니다. 데이터웨어 하우스 (그림 4 참조) 그의 접근 방식은 특히 솔로 디자인에 전념하고 있습니다. 데이터웨어 하우스 엔터티 및 관계 모델보다 우선적으로 차원 모델을 사용하는 방법에 대해 설명합니다. Kimball이 이러한 차원 모델을 분석하는 이유는 비즈니스 리더가 비즈니스를 더 쉽게 이해할 수 있고, 복잡한 상담을 처리할 때 더 효율적이며, 데이터베이스 육체적인 것이 더 효율적이다(Kimball 1994). Kimball은 데이터웨어 하우스 그것은 반복적이며, 데이터웨어 하우스 별도의 테이블을 공통 차원의 테이블로 나누어 통합할 수 있습니다.

첫 번째 단계는 완성해야 할 특정 주제 영역을 식별하는 것입니다. 두 번째와 세 번째 단계는 차원 모델링과 관련이 있습니다. 두 번째 단계에서는 측정값이 주제 영역의 관심 사항을 식별하고 사실 테이블로 그룹화합니다. 예를 들어, 판매 주제 영역에서 관심 측정값에는 판매된 품목 금액과 판매 통화인 달러가 포함될 수 있습니다. 세 번째 단계는 사실을 그룹화할 수 있는 방식인 차원을 식별하는 것입니다. 판매 주제 영역에서 관련 차원에는 품목, 위치 및 기간이 포함될 수 있습니다. 팩트 테이블에는 각 차원 테이블에 연결하기 위한 다중 부분 키가 있으며 일반적으로 매우 많은 수의 팩트를 포함합니다. 이와 대조적으로 차원 테이블에는 팩트를 그룹화하는 데 사용할 수 있는 차원 및 기타 속성에 대한 설명 정보가 포함되어 있습니다. 연관된 제안된 팩트 및 차원 테이블은 모양 때문에 스타 스키마라고 불리는 것을 형성합니다. 네 번째 단계는 다음을 구축하는 것입니다. 데이터베이스 별 패턴을 완벽하게 만들기 위해 다차원적입니다. 마지막 단계는 소스 시스템을 식별하는 것입니다. 주기 i를 캡처, 정리 및 포맷하기 위해 필요한 변환 프로세스를 개발합니다. 주기.

Kimball의 접근 방식의 강점은 차원 모델을 사용하여 주기 저장하여 이해하기 쉽고 효율적인 물리적 설계로 이어집니다. 두 시스템을 모두 쉽게 사용하는 차원 모델 데이터베이스 관계형은 완벽할 수도 있고 시스템일 수도 있습니다. 데이터베이스 다차원. 그 결함에는 계획 내에서 많은 별 패턴의 통합 또는 계획을 용이하게 하는 일부 기술이 부족하다는 것이 포함됩니다. 데이터웨어 하우스 극단적인 비정규화된 구조를 차원 모델로 설계하는 데 어려움이 있습니다. 주기 레거시 시스템에서.

McFadden(1996)의 데이터 접근 방식 창고 디자인

McFadden(1996)은 디자인에 대한 XNUMX단계 접근 방식을 제안합니다. 데이터웨어 하우스 (그림 5 참조)
그의 접근 방식은 문헌의 아이디어를 종합하는 데 기반을 두고 있으며 단일 디자인에 중점을 두고 있습니다. 데이터웨어 하우스. 첫 번째 단계에는 요구사항 분석이 포함됩니다. 기술 사양이 규정되어 있지는 않지만 McFadden의 메모는 해당 엔터티를 식별합니다. 주기 사양 및 해당 속성을 참조하고 요구 사항 캡처에 대해서는 독자 Watson 및 Frolick(1993)을 참조합니다.
두 번째 단계에서는 엔터티 관계 모델이 설계되었습니다. 데이터웨어 하우스 그런 다음 비즈니스 리더의 검증을 받습니다. 세 번째 단계에는 레거시 시스템과 외부 소스로부터 매핑을 결정하는 작업이 포함됩니다. 데이터웨어 하우스. 네 번째 단계에는 개발, 배포 및 동기화 프로세스가 포함됩니다. 주기 nel 데이터웨어 하우스. 마지막 단계에서는 사용자 인터페이스에 특히 중점을 두고 시스템 제공이 개발됩니다. McFadden은 그리기 프로세스가 일반적으로 반복적이라고 지적합니다.

McFadden 접근 방식의 강점은 요구 사항과 자원의 중요성을 결정하는 데 비즈니스 리더가 참여한다는 점입니다. 주기, 청소 및 수집. 단점은 대규모 프로젝트를 세분화하는 프로세스가 부족하다는 것입니다. 데이터웨어 하우스 많은 통합 단계에서

디자인에 사용된 엔터티 및 관계 모델을 이해하는 데 어려움이 있습니다. 데이터웨어 하우스.

우리를 선택하는 것은 우리와 가까운 사람들 만이 아닙니다.

    0/5 (0 리뷰)
    0/5 (0 리뷰)
    0/5 (0 리뷰)

    온라인 웹 에이전시에 대해 자세히 알아보세요.

    이메일로 최신 기사를 받으려면 구독하세요.

    작성자 아바타
    관리자 대표이사
    👍온라인 웹 에이전시 | 디지털 마케팅 및 SEO 분야의 웹 에이전시 전문가입니다. 웹 에이전시 온라인은 웹 에이전시입니다. Agenzia Web Online의 디지털 혁신 성공은 Iron SEO 버전 3의 기반을 기반으로 합니다. 전문 분야: 시스템 통합, 엔터프라이즈 애플리케이션 통합, 서비스 지향 아키텍처, 클라우드 컴퓨팅, 데이터 웨어하우스, 비즈니스 인텔리전스, 빅 데이터, 포털, 인트라넷, 웹 애플리케이션 관계형 및 다차원 데이터베이스의 설계 및 관리 디지털 미디어용 인터페이스 설계: 유용성 및 그래픽. 온라인 웹 에이전시는 회사에 다음 서비스를 제공합니다: -Google, Amazon, Bing, Yandex의 SEO; -웹 분석: Google Analytics, Google 태그 관리자, Yandex Metrica; -사용자 전환: Google Analytics, Microsoft Clarity, Yandex Metrica; -Google, Bing, Amazon 광고의 SEM; -소셜 미디어 마케팅(Facebook, Linkedin, Youtube, Instagram).
    나의 애자일 프라이버시
    이 사이트는 기술 및 프로파일링 쿠키를 사용합니다. 동의를 클릭하면 모든 프로파일링 쿠키를 승인하는 것입니다. 거부 또는 X를 클릭하면 모든 프로파일링 쿠키가 거부됩니다. 사용자 지정을 클릭하면 활성화할 프로파일링 쿠키를 선택할 수 있습니다.
    이 사이트는 개인 데이터 보호 및 데이터의 자유로운 이동과 관련된 데이터 보호법(LPD), 25년 2020월 2016일자 스위스 연방법, GDPR, EU 규정 679/XNUMX를 준수합니다.