fbpx

데이터웨어 하우스 및 ERP | 중앙 데이터 아카이브 : 역사와 진화

아키 비오 데이터 중앙: 역사와 진화


90년대 기업 기술의 두 가지 지배적인 주제는 다음과 같습니다.
나는 말한다 데이터웨어 하우스 그리고 ERP. 오랫동안 이 두 강력한
현재는 기업 IT의 일부였습니다.
교차로. 마치 물질이면서 반물질인 것 같았습니다. 하지만
두 현상의 성장은 필연적으로 하나의 현상으로 이어졌습니다.
그들의 교차점. 오늘날 기업들은 다음과 같은 문제에 직면해 있습니다.
ERP e로 무엇을 해야 할까요? 데이터웨어 하우스. 이 기사에서는 설명합니다.
문제가 무엇인지, 기업에서는 이를 어떻게 해결하는지.
처음에는…
처음에는 데이터웨어 하우스. 데이터웨어 하우스 위해 태어났다
거래처리 응용시스템에 대응한다.
초기에는 암기하는 것이 주기 그럴 예정이었어.
컴퓨터 처리 응용 프로그램에 대한 대위법
업무. 하지만 요즘에는 훨씬 더 정교한 견해가 있습니다.
무슨 데이터웨어 하우스. 오늘날의 세계에서는
데이터웨어 하우스 이는 다음과 같은 구조 내에 삽입됩니다.
기업정보공장이라고 합니다.
기업 정보 공장
(CIF)
Corporate Information Factory에는 아키텍처 구성 요소가 있습니다.
표준: 코드 변환 및 통합 수준
i를 통합하는 것 주기 나 동안 주기 그들은 환경에서 움직인다
환경에 대한 적용 데이터웨어 하우스 회사의; ㅏ
데이터웨어 하우스 그 회사의 주기
상세하고 통합된 이력. 그만큼 데이터웨어 하우스 회사의 역할
다른 모든 부분을 구축할 수 있는 기초
환경의 데이터웨어 하우스; 운영 데이터 저장소(ODS).
ODS는 데이터의 일부 측면을 포함하는 하이브리드 구조입니다.
OLTP 환경의 창고 및 기타 측면 데이터 마트, 내가 있는 곳
부서마다 고유한 버전의 데이터가 있을 수 있습니다.
창고; ㅏ 데이터웨어 하우스 내가 탐험하는 곳
회사의 "철학자"는 질문을 제출할 수 있습니다.
72시간 동안 유해한 영향을 미치지 않음 데이터웨어 하우스; 그리고 추억
가까운 선, 어디 주기 오래되고 주기 대량 세부사항은 일 수 있습니다
저렴하게 보관했습니다.
ERP가 LA와 합류하는 곳
기업 정보 공장
ERP는 두 곳에서 Corporate Information Factory와 통합됩니다.
먼저 i를 제공하는 기본 애플리케이션(기준)으로
주기 신청의 데이터웨어 하우스. 이 경우 주기,
거래 과정의 부산물로 생성되며,
통합되어 로드됩니다. 데이터웨어 하우스 회사의. 그만큼
ERP와 CIF 및 ODS 간의 두 번째 결합 지점입니다. 실제로 많은
환경에서는 ERP가 전통적인 ODS로 사용됩니다.
ERP를 핵심 애플리케이션으로 사용하는 경우
동일한 ERP를 CIF에서 ODS로 사용할 수도 있습니다. ~ 안에
어쨌든 ERP를 두 역할 모두에 사용하려면
두 개체 사이에는 명확한 구별이 있어야 합니다. 다시 말해서,
ERP가 핵심 애플리케이션과 ODS 역할을 할 때,
두 개의 아키텍처 엔터티는 서로 달라야 합니다. 싱글이라면
ERP를 구현하면 두 가지 역할을 모두 수행하려고 합니다.
동시에 필연적으로 문제가 발생할 것입니다.
이 구조의 설계 및 구현.
별도의 ODS 및 기본 애플리케이션
구성요소 분할로 이어지는 여러 가지 이유가 있습니다.
건축. 아마도 분리를 위한 가장 설득력 있는 질문은
아키텍처의 서로 다른 구성 요소는 각 구성 요소가
건축에는 자신만의 관점이 있다. 기본 애플리케이션은 다음과 같은 역할을 합니다.
ODS와는 다른 목적으로 사용됩니다. 겹쳐 보세요
ODS 세계에 대한 기본 애플리케이션 보기 또는 그 반대
그것은 올바른 일하는 방식이 아닙니다.
결과적으로 CIF에서 ERP의 첫 번째 문제는
기준선과 애플리케이션 간에 차이가 있는지 확인
SDGs.
기업의 데이터 모델
정보공장
서로 다른 구성 요소 간의 응집력을 달성하려면
CIF 아키텍처에는 다음과 같은 모델이 있어야 합니다. 주기.
모델 주기 다양한 구성요소 간의 연결 역할을 합니다.
기본 애플리케이션 및 ODS와 같은 아키텍처의 그만큼
모델 주기 '지적 로드맵'이 되다
CIF의 다양한 아키텍처 구성 요소에서 올바른 의미를 찾을 수 있습니다.
이 개념과 병행하여, 다음과 같은 아이디어가 있어야 합니다.
위대하고 독특한 모델이 되십시오. 주기. 물론 그는 그래야만 한다
롤모델이 되다 주기 각 구성 요소에 대해 그리고 거기에도
서로 다른 모델을 연결하는 합리적인 경로여야 합니다.
아키텍처의 각 구성 요소 – ODS, 기본 애플리케이션,
데이터웨어 하우스 회사 등.. – 자체가 필요합니다.
의 모델 주기. 그러므로 이에 대한 정확한 정의가 있어야 한다.
이 모델들처럼 주기 그들은 서로 인터페이스합니다.
무브 I 데이터 데이터의 ERP
창고
원산지라면, 주기 기준 애플리케이션 및/또는 ODS인 경우
ERP는 i를 삽입합니다 주기 nel 데이터웨어 하우스, 이 삽입은 반드시
가장 낮은 수준의 "세분성"에서 발생합니다. 요약하거나
단순히 i를 집계 주기 그들이 나올 때
ERP 기본 애플리케이션이나 ERP ODS는
옳은 일. 그만큼 주기 데이터에 세부정보가 필요합니다.
DSS 프로세스의 기초를 형성하는 창고입니다. 그런 주기
데이터 마트와 탐색을 통해 다양한 방식으로 재구성될 것입니다.
데이터웨어 하우스.
변위 주기 기본 애플리케이션 환경에서
ERP의 환경에 데이터웨어 하우스 회사의 형태는 다음과 같습니다.
적당히 여유로운 태도. 그 변화는 그 이후에 일어납니다
ERP 업데이트 또는 생성 후 약 24시간. 사실
"게으른" 움직임을 보인다 주기 nel 데이터웨어 하우스
회사의 허용 주기 ERP에서 "예금"으로 옵니다.
전에 저는 주기 기본 애플리케이션에 저장됩니다.
그러면 안전하게 이동할 수 있습니다 주기 ERP의
사업에서. 움직임을 통해 달성할 수 있는 또 다른 목표
"게으른" 신들 주기 운영 프로세스와
DSS. "빠른" 움직임으로 주기 구분선
DSS와 운영 간의 관계는 여전히 모호합니다.
운동 주기 ERP ODS부터 데이터웨어 하우스
회사의 업무는 정기적으로 수행됩니다. 일반적으로
매주 또는 매월. 이 경우의 움직임은
주기 그것은 오래된 것을 "청소"해야 할 필요성에 기초합니다. 주기 역사가.
물론 ODS에는 i가 포함되어 있습니다. 주기 훨씬 더 최근의 것입니다
비교 된 주기 역사학자들이 발견한 데이터웨어 하우스.
변위 주기 nel 데이터웨어 하우스 거의 끝나지 않았어
"도매"(도매업자 방식). 테이블 복사
ERP 환경부터 데이터웨어 하우스 그것은 이해가되지 않습니다. 하나의 접근 방식
훨씬 더 현실적인 것은 선택된 유닛의 움직임입니다. 주기.
나만 주기 데이터의 마지막 업데이트 이후 변경된 사항
웨어하우스는 데이터로 이동해야 하는 웨어하우스입니다.
창고. 어떤 것을 아는 한 가지 방법 주기 그들은 수정되었습니다
마지막 업데이트는 주기
ERP 환경에서 찾을 수 있습니다. 디자이너가 모든 변경 사항을 선택합니다.
마지막 업데이트 이후에 나타난 것입니다. 또 다른 접근법
변경 획득 기술을 사용하는 것입니다. 주기. 과
이러한 기술은 로그와 저널 테이프를 분석하여 다음을 수행합니다.
어느 것을 결정 주기 ERP 환경에서 다른 환경으로 이동해야 합니다.
그것의 데이터웨어 하우스. 이러한 기술은 다음과 같은 경우에 가장 좋습니다.
ERP 파일에서 읽을 수 있는 로그 및 저널 테이프의 양
다른 ERP 리소스에 추가 영향을 주지 않습니다.
기타 합병증
CIF에서 ERP의 문제점 중 하나는 다른 사람들에게 무슨 일이 일어나는가입니다.
애플리케이션 소스 또는 AI 주기 기여해야 하는 ODS
데이터웨어 하우스 그러나 ERP 환경의 일부는 아닙니다. 주어진
ERP, 특히 SAP의 폐쇄적 성격을 통합하려는 시도
외부 소스의 키 주기 나와 함께 주기 ERP에서
나 움직일 시간이야 주기 nel 데이터웨어 하우스, 그것은 큰 도전입니다.
그리고 내가 할 확률은 정확히 얼마인가? 주기 응용 프로그램 또는
ERP 환경 외부의 ODS는 데이터에 통합됩니다.
창고? 실제로 확률은 매우 높습니다.
찾다 데이터 ERP의 역사
나에게 또 다른 문제가 있다 주기 ERP의 결과는 다음과 같습니다.
가지고 있어야 한다는 것에서 주기 내부의 역사가들 데이터웨어 하우스.
일반적으로 데이터웨어 하우스 그는 필요하다. 주기 역사가. 그리고
ERP 기술은 일반적으로 이러한 정보를 저장하지 않습니다. 주기
역사적, 적어도 데이터에 필요한 지점까지는 아님
창고. 양이 많을 때 주기 역사가들은 시작한다
ERP 환경에 추가하려면 해당 환경을
청소했다. 예를 들어, 데이터웨어 하우스 절대로 필요한 것
XNUMX년의 시간을 짊어지다 주기 ERP가 기록을 유지하는 동안
이 중 최대 XNUMX개월 주기. 회사가 만족하는 한
세트를 모으다 주기 역사가들은 시간이 지나면서
ERP를 소스로 사용하는데 문제가 없습니다.
데이터웨어 하우스. 그러나 언제 데이터웨어 하우스 가야 해
시간을 거슬러 올라가서 신들을 데려가세요 주기 그렇지 않은 역사가들
이전에는 ERP에서 수집하여 저장한 다음 ERP 환경에서
비효율적이 됩니다.
ERP와 메타데이터
ERP e에 관해 고려해야 할 또 다른 고려사항 데이터웨어 하우스 그게
ERP 환경의 기존 메타데이터에 대해 메타데이터도 그렇고
ERP 환경에서 IT 환경으로 전환 데이터웨어 하우스
메타데이터도 같은 방식으로 이동해야 합니다. 게다가 나는
메타데이터는 형식과 구조로 변환되어야 합니다.
인프라에 필요한 데이터웨어 하우스. 큰 게 있어요
운영 메타데이터와 DSS 메타데이터의 차이점 메타데이터
운영은 주로 개발자와
프로그램 제작자. DSS 메타데이터는 주로 사용자를 위한 것입니다.
마지막. ERP 애플리케이션 또는 ODS의 기존 메타데이터
변환되어야 하며 이 변환이 항상 쉬운 것은 아닙니다.
그리고 직접.
ERP 데이터 소싱
ERP를 공급자로 사용하는 경우 주기 IL 당 데이터웨어 하우스 ci
나를 움직이게 하는 견고한 인터페이스가 필요합니다. 주기 환경으로부터
환경을 생각하는 ERP 데이터웨어 하우스. 인터페이스는 다음을 충족해야 합니다.
▪ 사용하기 쉬울 것
▪ 다음 항목에 대한 액세스를 허용합니다. 주기 ERP의
▪ 의미를 취하다 주기 곧 이사할 것
nel 데이터웨어 하우스
▪ 발생할 수 있는 ERP의 한계를 알고 있습니다.
주기 ERP의:
▪ 참조 무결성
▪ 계층적 관계
▪ 암묵적인 논리적 관계
▪ 지원 관례
▪ 모든 구조 주기 ERP 등에서 지원됩니다.
▪ 접근이 효율적이어야 합니다. 주기, 를 제공함으로써:
▪ 직접적인 움직임 주기
▪ 변화의 획득 주기
▪ 시기적절한 액세스를 지원합니다. 주기
▪ 형식을 이해합니다. 주기, 등등…
SAP와의 인터페이스
인터페이스는 자체 개발 또는 상용의 두 가지 유형이 있습니다.
주요 거래 인터페이스 중 일부는 다음과 같습니다:
▪ SAS
▪ 프림스솔루션
▪ D2k 등…
다양한 ERP 기술
ERP 환경을 하나의 기술처럼 취급하는 것은
큰 실수. 많은 ERP 기술이 있으며 각각 고유한 특성을 가지고 있습니다.
강점. 시장에서 가장 잘 알려진 공급업체는 다음과 같습니다.
▪ SAP
▪ 오라클 파이낸셜스
▪ 피플소프트
▪ JD 에드워즈
▪ 반
SAP
SAP는 가장 크고 가장 완벽한 ERP 소프트웨어입니다. 응용 프로그램
SAP에는 다양한 영역에 다양한 유형의 애플리케이션이 포함되어 있습니다. SAP는
명성:
▪ 매우 크다
▪ 구현하기가 매우 어렵고 비용이 많이 듭니다.
▪ 이를 위해서는 많은 사람과 컨설턴트가 필요합니다.
구현
▪ 구현을 위해서는 전문 인력이 필요합니다.
▪ 구현하는 데 오랜 시간이 걸림
또한 SAP는 자체 저장 방식으로 유명합니다. 주기 몰토
조심스럽게 접근하기 어렵게 만듭니다.
SAP 영역 외부의 사람. SAP의 강점은 존재입니다.
많은 양의 데이터를 캡처하고 저장할 수 있습니다. 주기.
최근 SAP는
그 응용 프로그램 데이터웨어 하우스. 장점과 단점이 많다
SAP를 공급업체로 사용함에 있어 데이터웨어 하우스.
장점은 SAP가 이미 설치되어 있고 대부분의
컨설턴트는 이미 SAP를 알고 있습니다.
SAP를 공급업체로 사용하는 경우의 단점 데이터웨어 하우스 sono
다수: SAP는 다음과 같은 분야에 경험이 없습니다. 데이터웨어 하우스
SAP가 공급업체인 경우 데이터웨어 하우스, "테이크 아웃"이 필요합니다
i 주기 SAP에서 데이터웨어 하우스. 다토 SAP의 실적
폐쇄형 시스템에서는 SAP에서 내부로 가져오는 것이 쉽지 않을 것입니다.
그것 (???). SAP를 지원하는 많은 레거시 환경이 있습니다.
IMS, VSAM, ADABAS, ORACLE, DB2 등이 있습니다.
SAP는 "여기에서 발명되지 않은" 접근 방식을 고집합니다. SAP는 그것을 원하지 않습니다
다른 공급업체와 협력하여 데이터웨어 하우스.
SAP는 모든 소프트웨어 자체를 생성해야 한다고 주장합니다.
SAP는 크고 강력한 회사임에도 불구하고
ELT, OLAP, 관리 기술을 다시 쓰려는 시도
시스템과 핵심 코드까지 DBMS 그냥 미친 짓이야.
공급업체와 협력적인 태도를 취하는 대신
di 데이터웨어 하우스 오랫동안 SAP는 다음과 같은 접근 방식을 따랐습니다.
그들은 "더 잘 알고 있습니다". 이런 태도는 성공을 늦춘다
SAP는 다음 영역에 있을 수 있습니다. 데이터웨어 하우스.
외부 공급업체의 액세스 허용을 거부하는 SAP
신속하고 우아하게 그들에게 주기. 사용의 본질
un 데이터웨어 하우스 접근이 용이하다 주기. SAP의 전체 이야기는 다음과 같습니다.
접근하기 어렵게 만드는 것을 기반으로 주기.
SAP의 대량 처리 경험 부족 주기;
분야에서 데이터웨어 하우스 많은 양의 주기 그 이후로 본 적이 없다
SAP 및 이러한 대량의 데이터를 관리하기 위해 주기 너는 하나 가지고 있어야 해
적합한 기술. SAP는 이 사실을 전혀 알지 못한 것 같습니다.
데이터 분야 진입에 존재하는 기술적 장벽
창고.
SAP의 기업 문화: SAP는 비즈니스를 창조했습니다.
나를 얻는 데 있어서 주기 시스템에서. 하지만 이렇게 하려면 다음이 있어야 합니다.
다른 사고방식. 전통적으로 소프트웨어 회사들은
데이터를 환경으로 가져오는 데 능숙함
데이터를 다른 방향으로 가져오는 중입니다. SAP가 이런 일을 할 수 있다면
스위치는 그렇게 하는 첫 번째 회사가 될 것입니다.
한마디로 기업이 선택해야 할지 의문이다.
공급업체로서의 SAP 데이터웨어 하우스. 매우 심각한 위험이 있습니다
한편으로는 보상이 거의 없습니다. 그러나 또 다른 것이 있습니다
SAP를 데이터 공급업체로 선택하는 것을 방해하는 이유
창고. 모든 회사의 날짜가 동일해야 하기 때문에
다른 회사 창고는요? 그만큼 데이터웨어 하우스 그것은 마음이다
경쟁 우위의. 모든 회사가 동일하게 채택한다면
데이터웨어 하우스 불가능하지는 않더라도 어려울 것이다.
경쟁 우위를 확보합니다. SAP는 다음과 같이 생각하는 것 같습니다.
데이터웨어 하우스 쿠키로 볼 수 있으며 이는
"데이터 가져오기" 애플리케이션 사고방식에 대한 추가 신호
에".
SAP만큼 지배적인 ERP 공급업체는 없습니다.
분명 SAP의 길을 따르는 기업이 있을 것입니다.
그들의 것을 위해 데이터웨어 하우스 하지만 아마도 이 날짜인 것 같아
SAP 창고는 규모가 크고 비용이 많이 들고 까다롭습니다.
그들의 창조 시간.
이러한 환경에는 은행원 처리,
항공사 예약 절차, 불만 처리 절차
보험 등등. 거래 시스템의 성능이 향상되었으며,
운영과 프로세스를 분리해야 할 필요성이 더욱 분명해졌습니다.
DSS(의사결정 지원 시스템). 그러나 자원 시스템에서는
인간적이든 개인적이든, 당신은 결코 많은 양의 문제에 직면하지 않을 것입니다.
업무. 그리고 물론 사람을 고용할 때도
또는 회사를 떠나는 것은 거래 기록입니다.
하지만 다른 시스템에 비해 인사 시스템과
개인은 거래가 많지 않습니다. 따라서
인적 자원과 인사 시스템이 완전히 명확하지 않습니다.
DataWarehouse가 필요합니다. 여러 면에서 이러한 시스템은
DSS 시스템의 병합을 나타냅니다.
하지만 꼭 해야 한다면 고려해야 할 또 다른 요소가 있습니다.
데이터 웨어하우스 및 PeopleSoft와 관련이 있습니다. 나는 많은 환경에서 주기
인적 및 개인 자원은 비즈니스에 부차적입니다.
회사의 머리. 대부분의 회사가 실시합니다.
제조, 판매, 서비스 제공 등. 그만큼
HR 및 인사 시스템은 일반적으로 부차적입니다(또는
지원)을 회사의 주요 사업 분야에 적용합니다. 그러므로 그것은
모호하고 불편하다 데이터웨어 하우스 에 대해 별도로
인적 및 개인적 자원에 대한 지원.
PeopleSoft는 이 점에서 SAP와 매우 다릅니다. SAP를 사용하면
의무적으로 데이터웨어 하우스. PeopleSoft에서는 그렇지 않습니다.
그러면 아주 분명해. PeopleSoft에서는 데이터 웨어하우스가 선택 사항입니다.
나에게 할 수 있는 가장 좋은 말은 주기 피플소프트가 바로 그 데이터다
보관을 위해 창고를 사용할 수 있습니다. 주기 ...에 관해서
오래된 인적, 개인적 자원. 두 번째 이유
회사에서 어떤 것을 사용하고 싶은지 데이터웨어 하우스 a
PeopleSoft 환경에 해를 끼치는 것은 액세스를 허용하고
분석 도구인 AI에 대한 무료 액세스 주기 피플소프트에서. 하지만
이러한 이유 외에도, 하지 않는 것이 바람직한 경우가 있을 수 있습니다.
데이터 웨어하우스를 보유하고 있습니다. 주기 피플소프트.
요약해서 말하자면
데이터 구축에 관한 많은 아이디어가 있습니다.
ERP 소프트웨어 내부의 창고.
이들 중 일부는 다음과 같습니다:
▪ 다음을 갖는 것이 합리적입니다. 데이터웨어 하우스 어느 것과 비슷하다
또 업계에서?
▪ ERP의 유연성 데이터웨어 하우스 소프트웨어?
▪ ERP 데이터웨어 하우스 소프트웨어는
주기 이는데이터웨어 하우스 투기장"?
▪ ERP 공급업체가 수행하는 추적 로깅은 무엇입니까?
시간적으로 쉽고 저렴한 AI에 직면 주기? (무엇
저렴한 가격으로 ERP 공급업체를 납품한 실적은 다음과 같습니다.
시간, 데이터에 접근하기 쉬운가?)
▪ DSS 아키텍처와 DSS 아키텍처에 대해 어떻게 이해하고 있습니까?
ERP 공급업체의 "기업 정보 공장"?
▪ ERP 공급업체는 달성 방법을 이해하고 있습니다. 주기 all'interno
환경에 대한 이해뿐 아니라 이를 내보내는 방법도 알고 계시나요?
▪ ERP 공급업체의 최신 도구는 얼마나 개방적입니까?
창고?
결정을 내릴 때 이러한 모든 고려 사항을 고려해야 합니다.
어디에 둘까? 데이터웨어 하우스 내가 호스팅할 곳 주기 ERP 등의
주기. 일반적으로 특별한 사유가 없는 한
그렇지 않으면 빌드하는 것이 좋습니다. 데이터웨어 하우스 밖으로
ERP 벤더 환경에서.
캐피톨로 1
BI 조직 개요
푼티 치아베:
정보 저장소는 그 반대 방향으로 작동합니다.
비즈니스 인텔리전스(BI) 아키텍처:
기업 문화와 IT는 성공을 제한할 수 있습니다.
BI 조직 구축.
기술은 더 이상 BI 조직의 제한 요소가 아닙니다. 그만큼
건축가와 프로젝트 기획자의 문제는
기술이 존재하지만 이를 효과적으로 구현할 수 있다면
사용 가능한 기술.
많은 기업의 경우 데이터웨어 하우스 창고에 불과해요
i를 분배하는 수동적 주기 필요한 사용자에게. 그만큼 주기
소스 시스템에서 추출되어 대상 구조에 채워집니다.
di 데이터웨어 하우스. 주기 그들은 또한 모든 것을 사용하여 청소할 수 있습니다
행운. 그러나 추가 값도 추가되지 않습니다.
에 의해 수집됨 주기 이 과정에서.
기본적으로 패시브 Dw는 기껏해야 다음을 제공합니다.
오직 나만이 주기 사용자 협회에 대해 깨끗하고 운영 가능합니다. 거기
정보 생성과 분석적 이해가 좌우됩니다.
전적으로 사용자에 의한 것입니다. DW(데이터웨어 하우스) 수
성공은 주관적이다. 성공을 판단한다면
i를 효율적으로 수집, 통합 및 정리하는 능력 주기
그렇다면 DW는 성공입니다.
반면에 수집, 통합 및 Lo를 살펴보면
조직 전체의 정보 활용
DW는 실패했습니다. DW는 가치를 거의 또는 전혀 제공하지 않습니다.
정보. 결과적으로 사용자는 다음과 같은 조치를 취해야 합니다.
따라서 정보 사일로가 생성됩니다. 이 장에서는
BI(Business)의 아키텍처를 요약하는 완전한 비전
Intelligence) 회사의 정보입니다. BI e에 대한 설명부터 시작하겠습니다.
그런 다음 디자인과
단순히 정보를 제공하는 것이 아니라 정보를 개발하는 것입니다. 주기
사용자에게. 그런 다음 토론은 다음 계산에 중점을 둡니다.
귀하의 BI 노력의 가치. 우리는 IBM이 어떻게
조직의 BI 아키텍처 요구 사항을 해결합니다.
아키텍처에 대한 설명
BI 조직
강력한 거래 지향 정보 시스템은 이제
모든 대규모 사업에서 흔히 볼 수 있는 일입니다.
사실상 전 세계 기업의 경쟁의 장입니다.
그러나 경쟁력을 유지하려면 이제 분석적인 시스템이 필요합니다.
교육의 재발견을 통해 기업의 역량을 혁신할 수 있는 방향을 지향합니다.
이미 가지고 있는 정보를 사용합니다. 이들 시스템
분석은 데이터의 풍부함을 이해하는 데서 비롯됩니다. 주기
사용 가능. BI는 모든 정보 전반에 걸쳐 성능을 향상시킬 수 있습니다.
회사의. 기업은 고객 대 고객 관계를 개선할 수 있습니다.
공급 업체, 제품 및 서비스의 이익 개선,
새롭고 더 나은 제안, 위험 관리 및 기타 여러 가지
수익은 비용을 극적으로 절감합니다. BI로 당신의 것
회사가 마침내 고객 정보를 사용하기 시작했습니다.
다음과 같은 목적을 가진 응용 프로그램 덕분에 경쟁력 있는 상품으로
시장.
올바른 비즈니스를 갖는다는 것은 다음에 대한 확실한 답을 갖는 것을 의미합니다.
다음과 같은 주요 질문:
▪ 우리 중 어느 것 고객 그것들이 우리를 더 많이 벌게 하거나, 아니면
그들은 손해를 보나요?
▪ 우리가 가장 잘 사는 곳 고객 관련하여 가게/
그들이 자주 가는 창고?
▪ 우리의 제품과 서비스 중 어떤 것이 더 많이 팔릴 수 있나요?
효과적으로 누구에게?
▪ 가장 효과적으로 판매할 수 있는 제품은 무엇이며 누구에게 판매됩니까?
▪ 가장 성공적인 판매 캠페인은 무엇이며 그 이유는 무엇입니까?
▪ 어떤 판매 채널이 어떤 제품에 가장 효과적인가?
▪ 최고의 사람들과의 관계를 개선할 수 있는 방법 고객?
대부분의 회사는 주기 대답하기가 거칠다
이 질문들.
운영 시스템은 대량의 제품을 생성합니다.
고객과 주기 판매 시점부터 시장, 예약,
고객 서비스 및 기술 지원 시스템을 통해. 도전은
이 정보를 추출하고 활용합니다.
많은 기업은 자사의 작은 부분에서만 이익을 얻습니다. 주기
전략적 분석을 위해.
I 주기 남은, 종종 i와 합류 주기 등의 외부 소스로 인해 발생하는
"정부 보고서" 및 기타 구매 정보는 하나입니다.
탐험을 기다리는 금광, 에이 주기 데 보노
귀하의 정보 맥락에서만 정제될 수 있습니다.
조직.
이 지식은 다양한 방식으로 적용될 수 있습니다.
전반적인 기업 전략 설계부터
콜센터를 통한 공급업체와의 개인적인 커뮤니케이션,
송장 발행, 인터넷 그리고 다른 점들. 오늘날의 비즈니스 환경은
DW 및 관련 BI 솔루션이 그 이상으로 진화한다는 것
전통적인 구조의 실행 주기 나는 어느 주기 정규화
원자 수준 및 "스타/큐브 팜".
경쟁력을 유지하기 위해 필요한 것은 다음과 같은 융합입니다.
전통적이고 진보된 기술을 지원하기 위해 노력하고 있습니다.
광대한 분석 환경.
결론적으로, 일반적인 환경은 지식을 향상시켜야 합니다.
회사 전체의 조치가 취해졌는지 확인합니다.
수행된 분석의 결과는 모든 사람이 할 수 있도록 유용합니다.
혜택.
예를 들어, 당신이 당신의 것을 분류한다고 가정 해 봅시다. 고객 카테고리에서
높거나 낮은 위험.
이 정보가 추출 모델에서 생성되거나
다른 수단은 Dw에 배치되어야 하며 다음에서 액세스할 수 있어야 합니다.
i와 같은 액세스 도구를 통해 누구나
정적 보고서, 스프레드시트, 테이블 또는 분석 처리
라인(OLAP).
그러나 현재 이러한 유형의 정보가 많이 있습니다.
사일로에 남아 주기 그들이 생성한 개인이나 부서의
분석. 조직 전체는 가시성이 거의 또는 전혀 없습니다.
이해를 위해. 이런 내용을 섞기만 하면
회사 DW의 정보 사일로를 제거할 수 있습니다.
정보를 제공하고 DW 환경을 향상시킵니다.
조직을 발전시키는 데에는 두 가지 주요 장애물이 있습니다.
BI의.
첫째, 조직 자체의 문제이다.
관련 학문의.
정책 변경에 도움을 드릴 수 없더라도
조직의 구성 요소를 이해하는 데 도움을 줄 수 있습니다.
BI 조직, 아키텍처 및 방법
IBM 기술은 개발을 촉진합니다.
두 번째 극복해야 할 장벽은 기술 부족이다.
통합되어 공간 전체를 불러내는 방법에 대한 지식
단지 작은 구성 요소가 아닌 BI의 구성 요소입니다.
IBM은 기술 변화에 적응하고 있습니다.
통합의. 디자인을 제공하는 것은 귀하의 책임입니다
자의식. 이 아키텍처는 다음을 사용하여 개발되어야 합니다.
제약 없이 또는 최소한 통합을 위해 선택된 기술
개방형 표준을 준수하는 기술입니다. 게다가 당신의
회사 경영진은 Bi 기업이 다음과 같은지 확인해야 합니다.
프로그램에 따라 수행되었으며 이를 허용하지 않음
이기적인 서비스로 인한 정보 사일로의 개발
의제 또는 목표.
이는 BI 환경이 다음 사항에 민감하지 않다는 의미는 아닙니다.
다양한 사용자의 다양한 필요와 요구 사항에 대응합니다. 대신에 그 뜻은
그러한 개인의 필요와 요구 사항을 구현하는 것은
전체 BI 조직의 이익을 위해 수행되었습니다.
BI 조직 아키텍처에 대한 설명은 다음과 같습니다.
그림 9의 1.1페이지에서 찾을 수 있습니다. 아키텍처는
기술과 기술의 풍부한 조화.
전통적인 관점에서 볼 때 아키텍처에는 다음 구성 요소가 포함됩니다.
창고의
원자층.
이것이 전체 Dw의 기초이자 핵심입니다.
전략적 보고.
I 주기 여기에 저장되면 역사적 무결성과 관계가 유지됩니다.
주기 파생된 측정항목을 포함하고 정리할 수 있습니다.
추출 모델을 사용하여 통합하고 저장합니다.
이후의 모든 사용 주기 그리고 관련 정보는
이 구조에서 파생되었습니다. 이것은 훌륭한 소스입니다.
추출 주기 구조화된 SQL 쿼리가 포함된 보고서의 경우
운영 창고 주기 또는 다음을 기반으로 보고합니다.
주기(운영 데이터 저장소(ODS) 또는 보고
데이터베이스.)
이것은 다음과 같은 구조이다. 주기 특별히 설계된
기술보고.
I 주기 이러한 구조에 대해 저장되고 보고되면 최종적으로
조직 영역(스테이징)을 통해 창고로 전파
영역), 전략적 신호에 사용될 수 있습니다.
준비 영역.
대부분의 첫 번째 정류장 주기 환경을 위한
창고는 조직 영역입니다.
여기 내가 주기 그들은 통합되고, 청소되고, 변환됩니다. 주기 유용하다
창고 구조를 채울 것입니다
데이터 마트.
아키텍처의 이 부분은 다음의 구조를 나타냅니다. 주기 익숙한
특히 OLAP용입니다. 데이터마트의 존재, 만약 내가 주기 sono
겹치는 스타 스키마에 저장됨 주기
관계형 환경이나 파일 캐비닛의 다차원적
di 주기 다음과 같은 특정 OLAP 기술에서 사용되는 기밀입니다.
DB2 OLAP 서버는 관련이 없습니다.
유일한 제약은 아키텍처가 다음의 사용을 용이하게 한다는 것입니다. 주기
다차원.
아키텍처에는 중요한 BI 기술 및 기법도 포함되어 있습니다.
이는 다음과 같이 구별됩니다.
공간분석
공간은 분석가에게 정보의 횡재이며
문제를 완전히 해결하는 데 매우 중요합니다. 스페이스 캔
특정 장소에 사는 사람들에 대한 정보를 나타냅니다.
위치 및 해당 위치에 대한 정보
다른 세계와 물리적으로 비교했을 때.
이 분석을 수행하려면 자신만의 연결을 시작해야 합니다.
위도와 경도 좌표에 대한 정보입니다. 무슨 뜻
"지오코딩"이라고 하며 추출의 일부여야 합니다.
레벨에서의 변환 및 로딩 프로세스(ETL)
창고의 원자.
데이터 수집.
추출 주기 우리 회사가 성장할 수 있도록
고객, 판매 동향을 예측하고
나와의 관계 관리 고객 (CRM), 기타 이니셔티브 중
BI.
추출 주기 그러므로 그것은 다음의 구조와 통합되어야 한다.
주기 Dwhouse의 창고 프로세스를 통해 지원됩니다.
기술의 효과적이고 효율적인 사용을 보장하고
관련 기술.
BI 아키텍처에 명시된 바와 같이 원자 수준의
Dwhouse와 데이터마트는 훌륭한 정보원입니다. 주기
추출을 위해. 동일한 구조도 있어야 합니다.
가용성을 보장하기 위해 추출 결과 수신자
가장 많은 청중.(가장 광범위한 청중).
자치령 대표.
다음과 같은 모든 사항에 대해 고객을 조사하는 다양한 "대리인"이 있습니다.
회사 운영 체제와 동일한 dw. 이들 에이전트는 다음을 수행할 수 있습니다.
학습하도록 훈련된 고급 신경망이어야 합니다.
제품의 향후 수요 등 각 포인트별 동향을 기반으로
판매 프로모션, 규칙 기반 엔진에 반응
un 데이터 일련의 상황 또는 단순한 에이전트
그들은 "최고 경영진"에게 예외를 보고합니다. 이러한 과정은 그렇습니다
일반적으로 실시간으로 존재하므로 반드시
그들의 움직임과 밀접하게 연관되어 있다 주기.
이 모든 구조는 주기, 기술 및 기술 보증
당신은 조직을 만드는 데 밤을 보내지 않을 것입니다
당신의 BI.
이 활동은 점진적이고 작은 단계로 개발됩니다.
점.
각 단계는 독립적인 프로젝트 노력이며 보고됩니다.
DW 또는 BI 이니셔티브의 반복으로. 반복
새로운 기술의 구현이 포함될 수 있습니다.
새로운 기술로 시작하고 새로운 구조를 추가합니다. 주기 ,
나 로딩 중 주기 보충 또는 분석 확장
당신의 환경. 이 단락은 더 자세히 논의됩니다
3장에서 자세히 다룬다.
DW 및 BI 도구의 전통적인 구조 외에도 다른 도구가 있습니다.
반드시 수행해야 하는 BI 조직의 기능
다음과 같은 디자인:
고객 접점(Customer touch
포인트들).
모든 현대 조직과 마찬가지로 여러 가지 조직이 있습니다.
경험 방법을 알려주는 고객 터치포인트
당신에게 긍정적인 고객. i와 같은 전통적인 채널이 있습니다.
상인, 교환원, 다이렉트 메일, 멀티미디어 및 인쇄
광고는 물론 이메일, 웹 등 최신 채널까지 주기
어느 정도 터치 포인트가 있는 제품을 확보해야 하며,
운송, 세척, 처리된 후 시설로 옮겨집니다. 주기
BI.
기본 주기 운영 및 사용자 연관(운영
데이터베이스 및 사용자 커뮤니티).
접점의 끝부분에는 고객 의 기초가 발견되었습니다 주기
회사의 애플리케이션 및 사용자 커뮤니티. 그만큼 주기 기존의
sono 주기 전통적인 것을 모아서 통합해야 합니다. 주기
필요한 것을 만족시키기 위해 접점에서 흐름
정보.
분석가. (분석가)
BI 환경의 주요 수혜자는 분석가입니다. 그 사람이 바로 그 사람이야
현재 추출의 이점 주기 운영, 통합
다양한 소스 주기 , 분석과 같은 기능으로 강화됨
지리적(지오코딩) 및 BI 기술에 제시된
추출, OLAP, 고급 SQL 보고 및 분석이 가능합니다.
지리적. 다음 환경에 대한 분석가를 위한 기본 인터페이스
보고는 BI 포털입니다.
그러나 분석가는 아키텍처의 혜택을 받는 유일한 사람이 아닙니다.
BI.
관리자, 대규모 사용자 협회, 심지어 회원, 공급업체 및
고객 기업 BI에서 이점을 찾아야 합니다.
백피드 루프.
BI 아키텍처는 학습 환경입니다. 원칙
발달의 특징은 지속적인 구조를 허용하는 것이다. 주기
사용된 BI 기술과 조치를 통해 업데이트
사용자 사업. 그 예로 평가가 있다.
고객(고객 점수).
영업부서가 마이닝 모델을 수행하는 경우
새로운 서비스 이용에 대한 고객의 점수를 바탕으로
영업부서만이 유일한 수혜자가 되어서는 안 됩니다.
서비스의.
대신 추출모델을 일부로 수행해야 한다.
회사 내 자연스러운 데이터 흐름과 고객의 점수
정보 맥락의 통합된 부분이 되어야 한다.
모든 사용자가 볼 수 있는 창고입니다. Bi-bI 중심 IBM 제품군
DB2 UDB를 포함하여 DB2 OLAP Server에는 대부분의
그림에 정의된 중요한 기술 구성 요소의 일부
1.1.
우리는 책의 그림에 나오는 아키텍처를 사용하여
연속성 수준을 제공하고 각 제품이 어떻게 작동하는지 보여줍니다.
IBM의 제품은 BI의 일반적인 패턴에 맞습니다.
정보 콘텐츠 제공(제공
정보 내용)
BI 환경을 설계, 개발 및 구현하는 것은
힘든 작전. 디자인은 두 가지 모두를 포괄해야 합니다.
현재 및 미래의 비즈니스 요구 사항. 건축의 디자인
발견된 모든 결론을 포함하려면 완전해야 합니다.
디자인 단계에서. 처형은 남아있어야 한다
단일 목적에 전념: BI 아키텍처 개발
공식적으로 도면에 제시된 대로 그리고 요구 사항에 따라
business.
규율이 다음을 보장할 것이라고 주장하는 것은 특히 어렵습니다.
상대적인 성공
전체 BI 환경을 개발하지 않기 때문에 이는 간단합니다.
갑자기 발생하지만 시간이 지나면서 작은 단계로 진행됩니다.
그러나 아키텍처의 BI 구성 요소를 식별하는 것은
두 가지 이유로 중요합니다. 모든 후속 결정을 안내할 것입니다.
건축 기술.
특정 기술 사용을 의식적으로 계획할 수 있습니다.
필요한 반복을 얻지 못할 수도 있지만
몇 달 동안의 기술.
비즈니스 요구 사항을 충분히 이해하면 유형에 영향을 미칩니다.
귀하의 아키텍처를 위해 구입하게 될 제품의 목록입니다.
아키텍처의 설계 및 개발은 다음을 보장합니다.
네 창고는
우연한 사건이 아니라 오히려 "잘 생각한"사건,
신중하게 구성된 광고 운영 모자이크 같은 예술
혼합 기술.
정보 콘텐츠 디자인
모든 초기 계획은 다음에 초점을 맞추고 식별해야 합니다.
환경에 필요한 주요 BI 구성 요소
현재와 ​​미래의 일반.
비즈니스 요구 사항을 아는 것이 중요합니다.
모든 기존 계획이 시작되기 전에도
프로젝트 기획자는 종종 한두 가지를 식별할 수 있습니다.
즉시 구성 요소.
필요한 구성 요소의 균형
그러나 귀하의 아키텍처는 쉽게 찾을 수 없습니다.
설계 단계에서 아키텍처의 주요 부분은
애플리케이션 개발(JAD) 세션을 검색에 연결합니다.
비즈니스 요구 사항을 식별합니다.
때로는 이러한 요구 사항을 도구에 맡길 수도 있습니다.
쿼리 및 보고.
예를 들어, 사용자는 자동화를 원한다고 말합니다.
현재 보고서는 통합하여 수동으로 생성해야 합니다.
두 개의 현재 비율과 다음에서 파생된 계산을 추가합니다.
의 조합 주기.
이 요구 사항은 간단하지만 특정 사항을 정의합니다.
다음과 같은 경우에 포함해야 하는 기능의 기능
조직을 위한 보고 도구를 구입하세요.
설계자는 또한 다음에 대한 추가 요구 사항을 추구해야 합니다.
완전한 그림을 얻으십시오. 구독을 원하는 사용자
이 보고서?
보고서의 하위 집합이 생성되어 이메일을 통해 다양한 부서로 전송됩니다.
사용자? 회사 포털에서 이 보고서를 보고 싶어 합니까?
이러한 모든 요구 사항은 다음과 같은 간단한 요구 사항의 일부입니다.
사용자의 요청에 따라 수동 보고서를 교체합니다. 이점
이러한 유형의 요구 사항 중 하나는 사용자와 디자이너 모두가
보고서의 개념을 이해합니다.
그러나 우리가 계획해야 할 다른 유형의 사업도 있습니다.
비즈니스 요구 사항이 다음과 같은 형식으로 기술된 경우
비즈니스 전략 질문, 전문 디자이너에게는 쉽습니다
측정값/사실 및 치수 요구 사항을 파악합니다.
그림 1.2는 측정 및 치수 구성 요소를 보여줍니다.
비즈니스 문제.
JAD 사용자가 요구사항을 어떻게 기술해야 할지 모르는 경우
비즈니스 문제의 형태로 디자이너는 종종
컬렉션 세션을 건너뛰고 시작하는 몇 가지 예
요구 사항.
전문 디자이너는 사용자가
전략적 무역뿐만 아니라 그것을 형성하는 방법.
요구사항 수집 접근 방식은 3장에서 논의됩니다. 을 위한
이제 우리는 모두를 위한 디자인의 필요성을 지적하고 싶습니다.
BI 요구사항 유형
전략적 비즈니스 문제는 단순한 요구사항이 아닙니다.
비즈니스뿐만 아니라 디자인 단서이기도 합니다. 대답해야 한다면
다차원적인 질문에 대해서는 외워야 합니다.
나 선물 주기 차원을 저장해야 하는 경우
주기 다차원적으로 어떤 종류의 기술을 사용할지, 아니면 어떤 종류의 기술을 사용할지 결정해야 합니다.
당신이 사용할 기술.
예약된 큐브 스타 스키마를 구현합니까, 아니면 둘 다 구현합니까?
보시다시피 간단한 비즈니스 문제라도
디자인에 큰 영향을 미칠 수 있습니다. 하지만
이러한 유형의 비즈니스 요구 사항은 최소한 평범하고 이해할 수 있습니다.
프로젝트 경험이 풍부한 디자이너, 기획자가 진행합니다.
기술과 지원에 대해서는 충분히 논의되어 왔습니다.
OLAP 등 다양한 솔루션을 사용할 수 있습니다. 지금까지
우리는 간단한 보고 기능을 통합해야 한다고 언급했습니다.
비즈니스 차원 요구사항 및 이러한 요구사항이 어떻게 이루어지는지
기술적인 아키텍처 결정에 영향을 미칩니다.
그러나 쉽게 이해되지 않는 요구 사항은 무엇입니까?
사용자에 의해 또는 DW 팀에 의해? 분석이 필요한 경우가 있나요?
공간(분석 공간)?
추출 모델 주기 그것은 당신의 꼭 필요한 부분이 될 것입니다
미래? 누가 알아?
이러한 유형의 기술은 그다지 중요하지 않다는 점에 유의하는 것이 중요합니다.
일반 사용자 및 팀원 커뮤니티에서 알려진
Dw, 부분적으로는 일반적으로 이러한 일이 발생할 수 있습니다.
일부 내부 또는 타사 기술 전문가가 처리합니다. 그것은
이러한 유형의 기술이 생성하는 문제의 극단적인 경우입니다. 본인
사용자는 비즈니스 요구 사항을 설명하거나 구성할 수 없습니다.
디자이너에게 지침을 제공하기 위해
눈에 띄지 않거나 더 나쁘게는 단순히 무시됩니다.
디자이너와 개발자가 서로 협력하지 않을 때 더 문제가 됩니다.
이러한 고급 기술 중 하나의 적용을 인식할 수 있지만
중요한 기술.
우리는 종종 디자이너들이 다음과 같이 말하는 것을 들었습니다.
다른 것을 얻을 때까지 그것을 옆으로 치워두지 않겠습니까?
“그들은 정말로 우선순위에 관심이 있는 걸까요, 아니면 그냥 회피하는 걸까요?
그들이 이해하지 못하는 요구 사항? 마지막 가설일 가능성이 높습니다.
영업팀이 요구사항을 전달했다고 가정해 보겠습니다.
그림 1.3에서 볼 수 있듯이 비즈니스의
요구사항은 비즈니스 문제의 형태로 구성됩니다. 거기
이 문제와 일반적인 차원 문제의 차이점은 다음과 같습니다.
거리. 이 경우 영업팀에서 알고 싶어하는 사항은 다음과 같습니다.
월별 제품, 창고 및 매장의 총 매출
고객 창고에서 5마일 이내에 거주하는 사람
그들이 산다.
안타깝게도 디자이너나 건축가는 단순히
“우리에게는 고객이 있습니다.
제품과 나 주기 보증금의. 그때까지 거리를 두자
또 다른 반복.
"잘못된 답변. 이러한 유형의 비즈니스 문제는
BI 전체. 이는 에 대한 더 깊은 이해를 나타냅니다.
우리의 비즈니스와 분석가를 위한 강력한 분석 공간을 제공합니다.
BI는 단순한 쿼리나 표준 보고 그 이상입니다.
심지어 OLAP. 이러한 기술이 그렇지 않다는 말은 아니다.
이는 BI에 중요하지만 그 자체로는 BI를 나타내지 않습니다.
BI 환경.
정보 맥락을 위한 디자인
(정보 콘텐츠 디자인)
이제 우리는 눈에 띄는 비즈니스 요구 사항을 확인했습니다.
다양한 기본 구성요소가 도면에 포함되어야 합니다.
일반 건축. BI의 일부 구성 요소는 다음과 같습니다.
초기 노력 중 일부는 구현되지 않을 예정입니다.
몇 달.
그러나 알려진 모든 요구 사항이 설계에 반영되어
특정 기술을 구현해야 할 때 우리는
그것을 할 준비를 하십시오. 프로젝트에 관한 어떤 것이 생각을 반영할 것입니다.
전통적인.
예를 들어, 이 장의 시작 부분에 있는 그림 1.1에는 데이터가 나와 있습니다.
나를 지켜주는 마트 주기 차원.
이 세트는 주기 이후의 사용을 지원하는 데 사용됩니다.
주기 비즈니스 문제로 인해 발생하는 차원적 차원
우리는 확인했습니다. 추가 서류로는
디자인 개발과 같은 생성된 주기우리
내가 어떻게 해야 하는지 공식화하기 시작할 거야 주기 그들은 환경에 퍼집니다.
우리는 나를 대표할 필요성을 확인했습니다 주기 그래서
차원적, 세분화(특정 요구에 따라)
결정) 데이터 마트에서.
대답해야 할 다음 질문은 어떻게 구축될 것인가입니다.
이 데이터 마트?
큐브를 지지하기 위해 별을 만들까요, 아니면 큐브만 만들까요, 아니면 별만 만들까요?
(또는 오른쪽 큐브 또는 오른쪽 별). 데이터 아키텍처 생성
모든 것에 원자층이 필요한 종속 마트 주기
획득? 독립적인 데이터 마트가 i를 획득하도록 허용 주기
운영 체제에서 직접?
어떤 큐브 기술을 표준화하려고 하시나요?
당신은 엄청난 양의 주기 차원분석에 필요한
또는 전국 영업 인력 큐브가 하나 필요합니다.
매주 또는 둘 다? 강력한 아이템을 구축하세요
재무용 DB2 OLAP Server 또는 Cognos 큐브 등
판매 조직을 위한 PowerPlay입니까, 아니면 둘 다를 위한 것입니까?
이것은 큰 건축 설계 결정입니다.
지금부터 BI 환경에 영향을 미칠 것입니다. 예,
OLAP에 대한 필요성이 확립되었습니다. 이제 그 일을 어떻게 수행할 것인가?
기술과 기술의 종류?
가장 진보된 기술 중 일부가 귀하의 기술에 미치는 영향
그림? 우리는 귀하가 필요성을 확인했다고 가정합니다.
조직의 공간. 이제 기억해야 할 것은
계획되지 않은 경우에도 건축 도면 문제
몇 달 동안 우주 구성요소를 수행합니다. 건축가는 반드시
필요한 것을 기반으로 오늘 디자인하십시오. 필요성을 예측해 보세요.
생성, 저장, 수행, 제공하는 공간분석
액세스 주기 공간. 이것은 차례로 다음과 같은 역할을 해야 합니다.
기술 및 사양 유형에 대한 제약
현재 고려할 수 있는 소프트웨어 플랫폼입니다. 을 위한
예를 들어, 행정 시스템 데이터베이스 관계형
원자 계층에 대해 수행하는 (RDBMS)에는 다음이 있어야 합니다.
강력한 공간 확장이 가능합니다. 이것은
기하학과 객체를 사용할 때 최대 성능
분석 애플리케이션의 공간. RDBMS가 그렇지 않은 경우
내가 감당할 수 있어 주기 (공간 중심) 내부적으로는 다음을 수행해야 합니다.
안정되어 있다 데이터베이스 (공간 중심) 외부. 이는 다음을 복잡하게 만든다.
문제 관리를 방해하고 전반적인 성과를 저하시킵니다.
귀하에게 발생한 추가 문제는 말할 것도 없습니다.
DBA는 아마도 최소한의 이해만을 갖고 있을 것이기 때문입니다.
기지의 주기 공간도 그렇고. 반면에 엔진의 경우
RDMBS는 모든 공간 구성요소와 관련 항목을 처리합니다.
옵티마이저는 특별한 요구 사항을 인식합니다(예:
인덱싱)하면 DBA가 이를 처리할 수 있습니다.
문제를 신속하게 관리하고 문제를 높일 수 있습니다.
공연.
또한 준비 영역과 레이어를 조정해야 합니다.
주소 정리를 포함하는 원자적 환경(a
공간 분석의 핵심 요소) 및 다음
공간 개체를 저장합니다. 의 연속판
청소라는 개념을 도입한 후에도 그리기는 계속됩니다.
주소. 우선, 이 애플리케이션은 다음 유형을 지정합니다.
ETL 작업에 필요한 소프트웨어입니다.
주소를 제공하려면 Trillium과 같은 제품이 필요합니다.
clean 또는 귀하가 제공하기로 선택한 ETL 제공업체
기능?
지금은 디자인 수준을 평가하는 것이 중요합니다.
수행을 시작하기 전에 완료해야 합니다.
환경(창고). 위의 예는
따라야 할 다양한 디자인 결정을 보여줍니다.
특정 비즈니스 요구 사항 식별. 완료되면
정확하게, 이러한 디자인 결정은 발전합니다.
환경의 물리적 구조 간의 상호의존성,
사용되는 기술의 선택과 전파 흐름
정보 내용. 이러한 기존 아키텍처가 없으면
BI의 경우 귀하의 조직은 혼합된 영향을 받게 됩니다.
기껏해야 어떤 방식으로든 통합된 기존 기술의 혼란
겉보기 안정성을 제공하기에는 정확하지 않습니다.
정보 콘텐츠 유지
정보의 가치를 조직에 전달하는 것은
매우 어려운 작업입니다. 충분한 이해 없이
경험이나 적절한 계획과 도면, 심지어
더 나은 팀은 실패할 것이다. 반면에 규모가 큰 경우
직관과 세부적인 계획이 있지만 규율은 없습니다.
처형, 넌 돈과 시간을 낭비했을 뿐이야
왜냐하면 당신의 노력은 실패할 운명이기 때문입니다. 메시지는 다음과 같습니다
명확하게 하십시오. 다음 중 하나 이상이 누락된 경우
기술, 이해/경험 또는 계획/그림 또는
실행 규율을 위반하면 마비되거나
BI 조직의 건물을 파괴하십시오.
당신의 팀은 충분히 준비되어 있나요? 당신 편에 누군가가 있어요
사용 가능한 광범위한 분석 환경을 이해하는 BI 팀
BI 환경에서 필요한 기술과 기술에
그 풍경을 구현하려고? 당신의 팀에 누군가가 있습니다
고급 간의 응용 차이를 인식할 수 있는
정적 보고와 OLAP, 아니면 ROLAP과 OLAP의 차이점은 무엇인가요? 중 하나
당신의 팀원들은 어떻게 해야 하는지 명확하게 인식하고 있습니다.
추출 및 그것이 창고에 어떤 영향을 미칠 수 있는지 또는 어떻게
창고가 채굴 성능을 유지할 수 있습니까? 회원
팀의 가치를 이해하고 있습니다. 주기 공간이나 기술
에이전트 기반? 독특한 응용 프로그램을 높이 평가하는 사람이 있습니까?
ETL 도구와 브로커 기술의 비교
메시지? 가지고 있지 않다면 하나 구입하십시오. BI는 훨씬 더
OLAP의 표준화된 원자 계층 중 큰 구성표
별과 ODS.
요구사항을 인식할 수 있는 이해와 경험을 보유하고 있습니다.
BI와 그 솔루션을 이해하는 것은 귀하의 능력에 필수적입니다.
사용자 요구 사항과 디자인을 올바르게 공식화
솔루션을 구현합니다. 귀하의 사용자 커뮤니티에
요구 사항을 설명하는 것이 어렵습니다. 이는 팀의 임무입니다.
창고는 그 이해를 제공합니다. 하지만 만약 그 팀이
창고
BI의 특정 애플리케이션(예: 데이터)을 인식하지 못합니다.
채굴- 그러면 BI 환경이 하는 최선의 일은 아닙니다
종종 수동적 예금으로 제한됩니다. 그러나 이러한 내용은 무시하십시오.
기술은 그 중요성과 그 효과를 감소시키지 않습니다.
귀하의 비즈니스 인텔리전스 가능성의 출현에 대해
조직뿐만 아니라 귀하가 설계한 정보 구조도
홍보.
계획에는 그림의 개념이 포함되어야 합니다.
둘 다 유능한 개인이 필요합니다. 게다가 기획은
팀 창고 철학과 관찰이 필요합니다
표준의. 예를 들어, 귀하의 회사가
표준 플랫폼이거나 귀하가 사용하는 특정 RDBMS를 식별했습니다.
플랫폼 전반에 걸쳐 표준화하고 싶다면
팀의 모든 구성원이 이러한 표준을 준수합니다. 일반적으로 하나
팀은 정규화의 필요성을 노출합니다(사용자에게
커뮤니티) 그러나 팀 자체는 참여를 꺼려합니다.
표준은 회사의 다른 영역이나 심지어 회사에서도 확립되었습니다.
비슷한 회사. 이는 위선일 뿐만 아니라 회사가
기존 자원과 투자를 활용할 수 있습니다. 그것은 의미하지 않는다
플랫폼이나 서비스를 보장하는 상황이 없다는 것입니다.
표준화되지 않은 기술; 그러나 창고 노력
그들은 기업의 표준을 최대한 보호해야 합니다.
비즈니스 요구 사항에 따라 다르게 지정되지는 않습니다.
BI 구축에 필요한 세 번째 핵심 구성 요소
조직은 규율이다.
전체적으로는 개인과 환경에 따라 달라집니다.
프로젝트 기획자, 후원자, 건축가 및 사용자는
회사의 정보 구조를 구축하는 데 필요한 규율.
디자이너는 자신의 디자인 노력을 다음과 같은 방식으로 지시해야 합니다.
사회에서 필요한 기타 노력을 완료합니다.
예를 들어, 귀하의 회사에서
창고 구성 요소가 있는 ERP 애플리케이션입니다.
따라서 ERP 설계자는 ERP 설계자의 책임입니다.
경쟁하지 않도록 창고 환경 팀 또는
이미 시작된 작업을 복제합니다.
징계도 다뤄야 할 문제다.
조직 전체에 의해 일반적으로 설립되어 다음 기관에 위탁됩니다.
임원 수준.
관리자는 설계된 접근 방식을 기꺼이 고수할 의향이 있습니까? ㅏ
정보 콘텐츠를 생성할 것을 약속하는 접근 방식
끝은 비즈니스의 모든 영역에 가치를 가져다 줄 것입니다.
개인 또는 부서의 의제를 손상시키는가? 그 말을 기억하세요
“한 가지만 생각하는 것보다 모든 것을 생각하는 것이 더 중요합니다.”
이 말은 BI 조직에 해당됩니다.
불행히도 많은 창고가 노력을 집중하고 있습니다.
특정 부서를 목표로 삼아 가치를 창출하려고 노력하거나
특정 사용자는 조직과 거의 관련이 없습니다.
일반적인. 관리자가 팀에 도움을 요청한다고 가정해 보겠습니다.
창고. 팀은 90일 동안 지속된 작업으로 응답합니다.
여기에는 다음에 의해 정의된 통지 요구 사항의 전달뿐만 아니라
관리자는 모든 것을 보장합니다 주기 베이스가 레이어에 혼합되어 있습니다.
큐브 기술에 도입되기 전 원자
신청.
이 엔지니어링 추가는 다음의 사업을 보장합니다.
창고는 혜택을 받을 것이다 주기 관리자에게 꼭 필요합니다.
그러나 그 임원은 외부 컨설팅 회사와 이야기를 나눴습니다.
4분 이내에 배송되는 유사한 애플리케이션을 제안했습니다.
주.
내부 창고팀이 유능하다고 가정하면,
관리자는 선택권이 있습니다. 누가 규율을 지지할 수 있는가?
자산을 늘리는 데 필요한 추가 엔지니어링
유익한 비즈니스를 만들거나 직접 만들 수도 있습니다.
빨리 해결하세요. 마지막이 정말 선택된 것 같습니다.
너무 자주 발생하며 정보 컨테이너를 만드는 데만 사용됩니다.
이는 소수 또는 개인에게만 이익이 됩니다.
단기 및 장기 목표
건축가와 프로젝트 디자이너는 다음을 공식화해야 합니다.
전반적인 아키텍처와 계획에 대한 장기적인 비전
BI 조직에서 성장하세요. 이 조합은
단기 이익과 장기 계획
BI 노력의 양면을 대표합니다. 단기 이익
마감일은 작업의 반복과 관련된 BI의 측면입니다.
당신의 창고.
기획자, 건축가, 스폰서가 집중하는 곳입니다.
특정 비즈니스 요구 사항을 충족합니다. 이 수준에서
물리적 구조물이 건설되고, 기술이 구입되며,
기술이 구현됩니다. 그들은 전혀 다루도록 만들어지지 않았습니다
특정 사용자 커뮤니티에서 정의한 특정 요구 사항.
구체적으로 정의된 요구 사항을 해결하기 위해 모든 작업이 수행됩니다.
특정 커뮤니티에서.
그러나 장기 계획은 또 다른 측면입니다.
BI의. 이곳은 계획과 프로젝트가 보장된 곳입니다.
물리적 구조, 선택된 기술 및
기업을 바라보는 눈으로 만든 기술. 그리고
응집력을 제공하는 장기 계획
모든 사람에게 비즈니스 이익이 발생하도록 보장하는 데 필요합니다.
단기 이익이 발견되었습니다.
BI 노력을 정당화하세요
Un 데이터웨어 하우스 그 자체로는 고유한 가치가 없습니다. 다른 곳에서는
즉, 기술에는 고유한 가치가 없습니다.
창고 및 구현 기술.
창고 노력의 가치는 행동에서 발견됩니다
창고 환경과 내용에 따라 수행
시간이 지남에 따라 유익한 정보가 재배되었습니다. 이해하는데 중요한 포인트입니다
어떤 계획의 가치를 추정하려고 시도하기 전에
집.
건축가와 디자이너는 너무 자주 가치를 적용하려고 시도합니다.
실제로 가치가 다음과 같은 경우 창고의 물리적, 기술적 구성요소
긍정적인 영향을 받는 비즈니스 프로세스를 기반으로 합니다.
창고와 잘 습득된 정보.
여기에 BI 구축의 과제가 있습니다. 투자를 어떻게 정당화할 것인가?
만약 집 자체가 본질적인 가치가 없다면,
프로젝트는 이점을 조사, 정의 및 공식화해야 합니다.
창고를 사용할 개인이 달성한
특정 비즈니스 프로세스나 가치를 개선합니다.
보호된 정보 또는 둘 다.
문제를 복잡하게 만드는 모든 비즈니스 프로세스
창고 노력의 영향을 받아 이익을 얻을 수 있습니다.
"상당한" 또는 "약간의". 상당한 이점은
투자수익률(ROI)을 측정하기 위한 실질적인 지표 – 예:
예를 들어 특정 기간 동안 재고를 추가로 회전하는 경우
구체적이거나 배송당 운송 비용을 낮추기 위한 것입니다. 그것은 더 많은 것입니다
접근성 향상과 같은 약간의 이점을 정의하기는 어렵습니다.
실질적인 가치 측면에서 정보.
프로젝트를 연결하여 다음에 대해 알아보세요.
비즈니스 요청
프로젝트 디자이너는 가치를 연결하려고 시도하는 경우가 너무 많습니다.
무정형 회사 목표를 가진 창고의. 다음과 같이 선언
“창고의 가치는 우리의 능력에 달려 있습니다.
전략적 요청을 충족시키다”를 오픈합니다.
연설. 그러나 그것만으로는 여부를 판단하기에는 충분하지 않습니다.
창고에 투자하는 것이 합리적입니다. 반복을 연결하는 것이 좋습니다
특정하고 알려진 비즈니스 요청이 있는 창고.
ROI 측정
창고 환경에서 ROI를 계산하는 것은 다음과 같습니다.
특히 어렵다. 이점이 특히 어려운 경우
특정 반복의 원리는 무형이거나
측정하기 쉽습니다. 한 연구에 따르면 사용자가 인식하는 것으로 나타났습니다.
BI 이니셔티브의 두 가지 주요 이점은 다음과 같습니다.
▪ 의사결정 능력을 키우세요.
▪ 정보에 대한 액세스 생성
이러한 혜택은 부드러운(또는 가벼운) 혜택입니다. 보기 쉽습니다
확실한 리드(또는
더 큰) 운송 비용 절감과 같은 것, 그러나 어떻게
더 나은 결정을 내리는 능력을 측정합니까?
이는 프로젝트 디자이너에게 확실히 어려운 일입니다.
그들은 회사가 특정 회사에 투자하도록 설득하려고 노력하고 있습니다.
창고 노력. 매출 증대 또는 비용 절감
이는 더 이상 BI 환경을 주도하는 중심 테마가 아닙니다.
대신에 액세스에 대한 비즈니스 요청을 보고 있습니다.
특정 부서가 할 수 있도록 정보를 제공하는 것이 가장 좋습니다.
더 빠른 결정을 내립니다. 이들은 전략적 동인입니다.
이는 비즈니스에도 똑같이 중요하지만
더 모호하고 실질적인 측정항목으로 특성화하기가 더 어렵습니다.
이 경우 ROI 계산은 관련성이 없지는 않더라도 오해의 소지가 있을 수 있습니다.
프로젝트 디자이너는 가치를 입증할 수 있어야 합니다.
관리자가 투자 여부를 결정할 수 있도록 가시적인 정보를 제공합니다.
특정 반복이 적용됩니다. 그러나 우리는 새로운 것을 제안하지 않을 것입니다
ROI를 계산하는 방법에 대해서는 어떠한 주장도 하지 않습니다.
그것에 반대합니다.
기초적인 내용을 다루는 많은 기사와 책이 있습니다.
ROI를 계산합니다. 가치로서 특별한 가치 제안이 있습니다.
Gartner와 같은 그룹에서 제공하는 on Investing(VOI)
연구하다. 대신, 우리는 모든 것의 핵심 측면에 중점을 둘 것입니다.
고려해야 할 ROI 또는 기타 가치 제안.
ROI 적용
"하드" 혜택 대 "소프트" 혜택 논쟁을 넘어서
BI 노력과 관련하여 고려해야 할 다른 문제가 있습니다.
ROI를 적용할 때 예를 들어:
앞으로 발생할 DW 노력에 너무 많은 비용 절감 효과가 있다고 생각함
어쨌든
귀하의 회사가 다음 아키텍처에서 출발했다고 가정해 보겠습니다.
메인프레임을 분산 UNIX 환경으로 전환합니다. 그래서 어떤
그러한 노력으로 실현될 수도 있고 실현되지 않을 수도 있는 절감액
전혀(?) 에만 국한되어서는 안 됩니다.
창고.
모든 것을 설명하지 않는 것은 비용이 많이 듭니다. 그리고 할 일도 많아요
고려하십시오. 다음 목록을 고려하십시오.
▪ 타당성을 포함한 초기 비용.
▪ 관련 스토리지를 갖춘 전용 하드웨어 비용 e
통신
▪ 관리를 포함한 소프트웨어 비용 주기 및 확장
클라이언트/서버, ETL 소프트웨어, DSS 기술, 도구
시각화, 프로그래밍 및 흐름 애플리케이션
작업 및 모니터링 소프트웨어, .
▪ 구조설계비용 주기, 실현과 함께, 그리고
최적화
▪ 노력과 직접적으로 연관된 소프트웨어 개발 비용
BI
▪ 가정 지원 비용(최적화 포함)
소프트웨어 버전 제어 및
도움말 작업
"빅뱅" ROI를 적용하세요.
단일하고 거대한 노력으로 창고를 만드는 것
실패할 수밖에 없으므로 이니셔티브에 대한 ROI도 계산하십시오.
대기업의 제안은 놀랍고 디자이너는
전체의 가치를 추정하려는 미약한 시도를 계속합니다.
노력.
디자이너들은 금전적인 가치를 부여하려고 하기 때문에
널리 알려져 있고 받아들여지고 있는 경우 비즈니스 이니셔티브에 대해
특정 담당자를 추정하는 것이 어려운가요? 그게 어떻게 가능해? 그렇지 않다
몇 가지 예외를 제외하고는 가능합니다. 하지 마세요.
이제 계산할 때 하지 말아야 할 것을 설정했습니다.
ROI를 정의하는 데 도움이 되는 몇 가지 사항이 있습니다.
BI 노력의 가치를 평가하기 위한 신뢰할 수 있는 프로세스입니다.
ROI 합의를 얻습니다. 당신의 것과 상관없이
BI 노력의 가치를 추정하기 위한 기술 선택은 다음과 같습니다.
프로젝트 디자이너를 포함한 모든 당사자의 동의를 얻어야 합니다.
스폰서 및 회사 임원.
ROI를 식별 가능한 부분으로 줄입니다. 향해 필요한 단계
ROI에 대한 합리적인 계산은 해당 계산에 초점을 맞추는 것입니다.
특정 프로젝트. 그러면 값을 추정할 수 있습니다.
충족되는 특정 비즈니스 요구 사항을 기반으로
비용을 정의합니다. 언급한 바와 같이 많은 비용이 발생해야 합니다.
존경받는. 또한 비용에는 관련 비용뿐만 아니라 관련 비용도 포함되어야 합니다.
단일 반복뿐만 아니라 관련 비용에도 적용됩니다.
회사 표준 준수를 보장합니다.
혜택을 정의하세요. ROI를 요구 사항에 명확하게 연결
특정 사업체를 식별할 수 있어야 합니다.
요구 사항을 충족시키는 데 도움이 되는 이점.
임박한 이익을 위해 비용과 이점을 줄입니다. 그것은 방법이다
순현재가치를 기준으로 평가하는 것이 가장 좋습니다.
(NPV) 미래 가치를 예측하려는 시도와는 반대로
미래 수익.
ROI를 분할하는 시기를 최소한으로 유지하세요. 그리고'
귀하의 시스템에서 사용된 오랜 기간 동안 잘 문서화되어 있습니다.
ROI
두 개 이상의 ROI 공식을 사용하세요. 방법에는 여러 가지가 있습니다.
ROI를 예측하고 다음 중 하나를 사용할지 계획을 세워야 합니다.
더하기, 순 현재 가치를 포함한 내부 수익률 속도
(IRR) 및 회복.
반복 가능한 프로세스를 정의합니다. 이는 계산에 매우 중요합니다.
장기적인 가치. 문서화되어야합니다
모든 프로젝트 하위 시퀀스에 대해 반복 가능한 단일 프로세스
따르다.
나열된 문제는 전문가가 정의한 가장 일반적인 문제입니다.
창고 환경의. 경영진 측의 주장
"빅뱅" ROI를 제공하는 것은 매우 혼란스럽습니다. 모두 시작하면
ROI 계산을 식별 가능하고 유형적인 부분으로 줄여서
정확한 ROI 가치를 추정할 수 있는 좋은 기회입니다.
ROI 혜택에 관한 질문
장점이 무엇이든, 부드럽든 단단하든 상관없이 사용할 수 있습니다.
가치를 결정하기 위한 몇 가지 기본적인 질문입니다. 에게
1부터 10까지의 간단한 스케일링 시스템을 사용하는 예를 들면
다음을 사용하여 모든 노력의 영향을 추적할 수 있습니다.
질문 :
▪ 이해도를 어떻게 평가하시겠습니까? 주기 이에 따라
당신 회사의 프로젝트?
▪ 결과적으로 프로세스 개선을 어떻게 추정할 수 있습니까?
이 프로젝트?
▪ 현재 새로운 통찰과 추론의 영향을 어떻게 측정하시겠습니까?
이 반복으로 사용할 수 있게 되었습니다.
▪ 새로운 컴퓨터 환경이 미치는 영향은 무엇입니까?
배운 것의 결과로 수행하는가?
이러한 질문에 대한 답변이 적다면 다음이 가능합니다.
회사는 투자할 가치가 없습니다. 높은 질문
상당한 가치 이득을 얻으려면 점수를 매겨야 하며
추가 조사를 위한 가이드 역할을 합니다.
예를 들어 프로세스 개선에 대한 높은 점수
디자이너가 프로세스가 어떤 것인지 조사하도록 유도해야 합니다.
개선되었습니다. 귀하는 귀하가 얻는 이익의 일부 또는 전부를 확인할 수 있습니다.
이는 유형적이므로 금전적 가치를 쉽게 얻을 수 있습니다.
적용된.
첫 번째 반복을 최대한 활용하기
창고
귀하의 비즈니스 노력의 가장 큰 결과는 종종
처음 몇 번의 반복. 이러한 첫 번째 노력은 전통적으로
대중에게 가장 유용한 정보 콘텐츠를 구축하고
후속 기술 기반 지원 구축
BI 애플리케이션.
일반적으로 모든 후속 하위 시퀀스 주기 프로젝트의
창고는 회사에 점점 더 적은 부가 가치를 가져다 줍니다.
일반적인. 반복하지 않는 경우 특히 그렇습니다.
새로운 주제를 추가하거나 새로운 주제의 요구 사항을 충족하지 않습니다.
사용자 커뮤니티.
이 저장 기능은 배터리에도 적용됩니다.
성장하다 주기 역사가. 후속 노력에는 더 많은 것이 필요하기 때문에
주기 그리고 얼마나 더 주기 시간이 지남에 따라 대부분의 물품이 창고에 부어집니다.
주기 사용된 분석과 관련성이 낮아집니다. 이것들 주기 sono
자주 불린다 주기 휴면 상태이므로 유지하는 데 항상 비용이 많이 듭니다.
거의 사용되지 않습니다.
이는 프로젝트 후원자에게 무엇을 의미합니까? 본질적으로 나는
첫 번째 후원자는 투자 비용보다 더 많은 것을 공유합니다.
이는 레이어 설립의 원동력이기 때문에 기본입니다.
광범위한 기술 환경 및 창고 자원,
유기농 포함.
그러나 이러한 첫 번째 단계는 최고의 가치를 가져오므로 디자이너는
프로젝트의 투자를 정당화해야 하는 경우가 많습니다.
BI 이니셔티브 이후 수행된 프로젝트에는 비용이 발생할 수 있습니다.
(첫 번째에 비해) 열등하고 직접적이지만 가치가 떨어집니다.
회사에.
그리고 조직 소유자는 다음을 고려하기 시작해야 합니다.
쌓인 것을 버려라 주기 관련성이 낮은 기술.
데이터 마이닝: 추출 주기
다양한 아키텍처 구성 요소에는 다양한 변형이 필요합니다.
데이터 마이닝 기술 및 기법 -
예를 들어, 관심 지점을 조사하기 위한 다양한 "에이전트"
고객, 회사의 운영 체제 및 dw 자체에 대한 것입니다. 이것들
에이전트는 다음과 같이 훈련된 고급 신경망이 될 수 있습니다.
미래 제품 수요와 같은 냄비 동향
판매 프로모션; 규칙 기반 엔진
세트에 반응하다 데이터 상황의 예를 들어 진단
의료 및 치료 권장 사항; 또는 심지어 간단한 에이전트
고위 관리자에게 예외 사항을 보고하는 역할(상위)
임원). 일반적으로 이러한 추출 과정은 주기 si
실시간으로 확인; 그러므로 그들은 연합해야 한다
완전히 움직임으로 주기 스테시.
온라인 분석 처리 처리
온라인 분석
슬라이스, 다이스, 롤, 드릴다운 능력
분석을 수행하고
만약에, 제품군의 목표 범위 내에 있는 경우
IBM 기술. 예를 들어, 분석 처리 기능
DB2에는 온라인(OLAP)이 존재하여 차원 분석을
엔진 데이터베이스 같은 .
함수는 SQL에 차원적 유용성을 추가하는 동시에
이는 DB2의 자연스러운 일부가 되는 모든 이점을 활용합니다. 또 다른
OLAP 통합의 예로는 추출 도구인 DB2가 있습니다.
OLAP 서버 분석기. 이 기술을 사용하면 큐브를 만들 수 있습니다.
DB2 OLAP 서버는 신속하고 자동으로
가치를 식별하고 보고하기 위해 분석되었습니다. 주기 특이하거나 예상치 못한
전체 큐브에 대해 상업 분석가에게 전달됩니다. 그리고 마지막으로,
DW 센터는 건축가가 확인할 수 있는 수단을 제공합니다.
다른 것들은 DB2 OLAP 서버 큐브의 프로파일을 일부로
ETL 프로세스의 자연스러운 특성.
공간분석 공간분석
공간은 분석 앵커(리드)의 절반을 나타냅니다.
파노라마에 꼭 필요한
광범위한 분석(시간이 나머지 절반을 나타냄). 원자 수준
그림 1.1에 표시된 창고의 (원자 수준),
시간과 공간 모두에 대한 기초를 포함합니다. 녹음
시간 및 주소 정보에 대한 타임 앵커 분석
앵커는 우주에서 분석합니다. 타임스탬프
적시에 분석을 수행하고 방향 정보가 리드됩니다.
공간별 분석. 다이어그램은 지오코딩 프로세스를 보여줍니다.
주소를 지도 위의 점이나 공간의 점으로 변환
거리, 내부/외부 등의 개념이 가능하도록
분석에 사용 – 원자 수준 및 공간 분석에서 수행
분석가에게 제공됩니다. IBM은 확장 기능을 제공합니다.
환경시스템연구소(ESRI)와 함께 개발한 우주공간,
al 데이터베이스 공간 객체가 가능하도록 DB2
정상적인 부분으로 저장됨 데이터베이스 관계형. DB2
Spatial Extender는 다음에 대한 모든 SQL 확장도 제공합니다.
공간 분석을 활용하세요. 예를 들어 다음의 SQL 확장은
에 대한 질문
주소 간 거리 또는 지점이 영역 내부에 있는지 외부에 있는지 여부
정의된 다각형은 Spatial을 사용한 분석 표준입니다.
익스텐더. 자세한 내용은 16장을 참조하세요.
데이터베이스- 상주 도구 도구 데이터베이스-
주민
DB2에는 다음을 지원하는 많은 BI 상주 SQL 기능이 있습니다.
분석 작업에서 여기에는 다음이 포함됩니다.
▪ "찾기"와 같은 분석을 수행하는 재귀 함수
가능한 모든 비행 경로 샌프란시스코 a 뉴욕".
▪ 순위, 누적 함수, 큐브 등의 분석 함수
일반적으로 발생하는 작업을 용이하게 하는 롤업
OLAP 기술을 통해서만 이제는 자연스럽게
엔진 데이터베이스
▪ 결과를 포함하는 테이블을 생성하는 기능
판매자 데이터베이스 리더들은 BI 기능 이상의 것을 혼합합니다.
nel 데이터베이스 같은.
주요 공급업체 데이터베이스 그들은 그 이상을 섞고 있어요
BI 기능 데이터베이스 같은.
이는 더 나은 성능과 더 많은 실행 옵션을 제공합니다.
BI 솔루션.
DB2 V8의 특징과 기능에 대해 논의합니다.
다음 장에서 자세히 설명합니다.
기술 아키텍처 및 데이터 관리 기반
(5 장)
▪ DB2 BI 기본 사항(6장)
▪ DB2 구체화된 쿼리 테이블
표)(7장)
▪ DB2 OLAP 기능(13장)
▪ DB2 Enhanced BI 특징 및 기능(Enhanced BI
특징 및 기능) (15장)
단순화된 데이터 전달 시스템
배송시스템 주기 쉽게 한
그림 1.1에 표시된 아키텍처에는 다양한 항목이 포함되어 있습니다.
구조 주기 물리적. 하나는 창고 주기 운영.
일반적으로 ODS는 객체 지향적입니다.
통합 및 현재. 예를 들어 지원할 ODS를 구축하시겠습니까?
예를 들어 영업소. ODS 판매로 보충할 것 주기
수많은 다른 시스템에서 왔지만 예를 들어 유지합니다.
예를 들어, 오늘의 거래. ODS를 업데이트할 수 있습니다.
하루에도 여러 번. 동시에, 프로세스
그들은 밀어 주기 다른 응용 프로그램에 통합되었습니다. 이 구조는
통합하도록 특별히 설계된 주기 현재 및 동적 전자
실시간 분석을 지원할 가능성이 높은 후보입니다.
서비스 에이전트 제공 방법 고객 판매정보
판매 동향 정보 추출을 통한 고객의 현재 동향
창고 자체에서. 그림 1.1에 표시된 또 다른 구조는 다음과 같습니다.
dw의 공식적인 지위. 이 곳은 뿐만 아니라
필요한 통합의 실행, 품질 주기, 그리고
변형의 주기 곧 재고가 들어올 예정이지만,
신뢰할 수 있는 임시 저장 공간 주기 대답해
실시간 분석에 사용될 수 있습니다. 당신이 결정한다면
ODS나 대기 장소를 사용하세요.
이러한 구조를 채우기 위한 최고의 도구 주기 사용
다른 운영 소스는 DB2의 이기종 분산 쿼리입니다.
이 기능은 DB2의 선택적 기능에 의해 제공됩니다.
DB2 Relational Connect(쿼리 전용)라고 하며 DB2를 통해
DataJoiner(애플리케이션을 전달하는 별도의 제품,
삽입, 업데이트 및 삭제 가능성
이기종 분산 RDBMS).
이 기술을 통해 건축가는 주기 묶다 주기 di
분석 프로세스를 통한 생산. 기술을 사용할 수 있을 뿐만 아니라
거의 모든 복제 요청에 적응
실시간 분석으로 표시될 수도 있지만
또한 다양한 베이스에 연결할 수도 있습니다. 주기
DB2, Oracle, Sybase, SQL Server 등 인기 있는
Informix 및 기타. DB2 DataJoiner를 사용하여 데이터를 채울 수 있습니다.
구조 주기 ODS나 테이블 같은 형식적인 것
복원을 위해 설계된 창고에 영구적으로 대표됨
즉각적인 업데이트나 판매가 가능합니다. 당연히,
이 같은 구조 주기 다음을 사용하여 채울 수 있습니다.
복제를 위해 설계된 또 다른 중요한 기술 주기, IBM
DataPropagator 관계형. (DataPropagator는 별도의 제품입니다.
중앙 시스템용. DB2 UNIX, Linux, Windows 및 OS/2에는 다음이 포함됩니다.
복제 서비스 주기 표준 기능으로).
또 다른 이동 방법 주기 주변에서 운영
그렇지 않으면 기업은 엔터프라이즈 애플리케이션 통합자입니다.
메시지 브로커로 알려져 있습니다.이것은
독특한 기술로 타의 추종을 불허하는 센터링 제어 가능
(타겟팅) 및 이동 주기 회사 주변. IBM에는 중재자가 있습니다.
가장 널리 사용되는 메시지인 MQSeries 또는 변형
요구 사항을 포함하는 제품의 전자 상거래, IBM
웹스피어 MQ.
MQ를 활용하여
magazzino e un ambiente BI, visitare 웹 사이트 del libro. Per ora, è
이 기술은 다음을 위한 훌륭한 수단이라고만 말하면 충분합니다.
캡처 및 변환(MQSeries Integrator 사용) 주기
BI 솔루션을 위한 중심(타겟) 운영자를 모집합니다. 거기
MQ 기술은 UDB V8에 통합되어 패키지되었습니다.
이는 이제 메시지 대기열을 관리할 수 있음을 의미합니다.
마치 DB2 테이블인 것처럼 말이죠. 용접의 개념
대기 중인 메시지와 우주 데이터베이스 관계형은 방향이 있다
강력한 전달 환경을 향해 주기.
제로 레이턴시 제로 레이턴시
IBM의 궁극적인 전략적 목표는 대기 시간 제로 분석입니다.
에 의해 정의됨
BI 시스템인 Gartner는 추론, 동화가 가능해야 합니다.
요청 시 분석가에게 정보를 제공합니다. 도전,
물론 섞는 방법에 따라 다르지만 주기 현재 및 실시간
다음과 같은 필요한 역사적 정보가 포함되어 있습니다. 주기 관련 모델.
경향, 또는 추출된 이해는
고객
이러한 정보에는 예를 들어 다음과 같은 신원 정보가 포함됩니다. 고객 ad
위험도가 높거나 낮거나 어떤 제품이 나인지 고객 그들은 많이 살 것이다
아마도 카트에 이미 치즈가 들어있다면
인수.
제로 레이턴시를 얻는 것은 실제로 두 가지에 달려 있습니다.
기본 메커니즘:
▪ 완전한 결합 주기 이는
BI가 만들어낸 확립된 기술과 도구
▪ 다음의 전달 시스템 주기 이를 보장하는 것이 효율적입니다.
실시간 분석이 실제로 가능합니다.
제로 레이턴시를 위한 전제 조건은 두 가지 전제 조건과 다르지 않습니다.
IBM이 설정하고 위에서 설명한 목표입니다.
긴밀한 결합 주기 의 일부입니다
IBM이 마련한 원활한 통합. 그리고 시스템을 만들어라
배달의 주기 효율성은 전적으로 다음에 달려 있습니다.
전달 과정을 단순화하는 기술
주기. 결과적으로 IBM의 세 가지 목표 중 두 가지는 매우 중요합니다.
세 번째를 만들려고. IBM은 의식적으로 자체 개발을 진행하고 있습니다.
제로 레이턴시를 보장하는 기술이 사용자에게 현실이 되었습니다.
창고 노력.
요약 / 종합
BI 조직은 다음에 대한 로드맵을 제공합니다.
당신의 환경을 만들어라
반복적으로. 의 필요를 반영하여 조정되어야 한다.
귀하의 비즈니스, 현재와 미래 모두. 건축학적 비전 없이
넓고 창고 반복은 다음과 같습니다.
거의 수행하지 않는 임의의 중앙 창고 구현
광범위하고 유익한 기업을 만듭니다.
프로젝트 관리자의 첫 번째 장애물은 프로젝트를 정당화하는 방법입니다.
BI 조직의 발전에 필요한 투자.
ROI 계산은 여전히 ​​주요 지원 수단으로 남아 있지만
창고 성과를 달성하는 것이 점점 더 어려워지고 있습니다.
정확하게 예측해 보세요. 이로 인해 다른 방법이 등장하게 되었습니다.
당신이 돈의 가치를 얻고 있는지 여부를 결정합니다. 그만큼
예를 들어 투자 가치2(VOI)가 확보됩니다.
해결책으로.
이는 건축가의 몫이다. 주기 및 프로젝트 기획자
의도적으로 정보를 생성하여 협회에 제공하는 행위
사용자에게 단순히 서비스를 제공하는 것이 아니라 주기. 이있다
둘 사이의 큰 차이. 정보는 사람이 하는 일이다
의사결정 과정과 효율성의 차이; 상대적으로 나는
주기 이는 해당 정보를 도출하기 위한 구성 요소입니다.
비록 출처에 대해 비판적이긴 하지만 주기 요청을 처리하기 위해
상업용 BI 환경은 더 큰 역할을 수행해야 합니다.
정보컨텐츠 제작에 우리는 가져가야 해
정리, 통합, 변형 또는
그렇지 않으면 정보 콘텐츠를 생성합니다.
사용자가 조치를 취할 수 있으므로 우리는 해당 조치가
합리적인 경우 행동과 결정이 지원됩니다.
BI 환경에서. 창고를 다음 서비스에만 맡길 경우 주기,
사용자 연결이 콘텐츠를 생성한다는 것이 보장됩니다.
조치를 취하는 데 필요한 정보. 이는 그들의
커뮤니티는 더 나은 결정을 내릴 수 있지만 회사는
그들은 그들이 사용한 지식이 부족하여 고통받습니다.
다토 건축가와 프로젝트 기획자가 프로젝트를 시작한다는 것
BI 환경과 관련하여 기업에 대한 책임은 그대로 유지됩니다.
대체로. 이 두 기능의 간단한 예
BI 반복의 면은 소스에서 발견됩니다. 주기. 모든
주기 특정 상업적 요청에 대해 접수된 내용은 다음과 같습니다.
첫 번째 원자층에 거주합니다. 이는 다음의 개발을 보장합니다.
기업정보의 자산을 관리, 지휘할 뿐만 아니라
반복에 정의된 사용자별 요청입니다.

데이터웨어하우스란 무엇입니까?
데이터웨어 하우스 정보 시스템 아키텍처의 핵심입니다.
1990년부터 견고한 서비스를 제공하여 정보 프로세스를 지원합니다.
통합 플랫폼 주기 역사가들은 후속 역사의 기초로 사용됩니다.
복수. 그만큼 데이터웨어 하우스 통합의 용이성을 제공합니다.
서로 호환되지 않는 응용 시스템의 세계. 날짜
창고가 트렌드로 발전했습니다. 데이터웨어 하우스
정리하고 저장해 주기 정보 처리에 필요한 e
오랜 역사적 시간적 관점에 기초한 분석. 모두
이는 건설에 대한 상당하고 지속적인 헌신을 수반하며,
유지 관리에 데이터웨어 하우스.
그럼 데이터웨어 하우스? 데이터웨어 하우스 이다:
▪ 주제 중심
▪ 통합 시스템
▪ 변형 시간
▪ 비휘발성(삭제할 수 없음)
컬렉션 주기 경영상의 의사결정을 지원하는 데 사용됩니다.
프로세스 구현.
I 주기 삽입 데이터웨어 하우스 대부분의 경우에 발생
운영 환경의 사례. 그만큼 데이터웨어 하우스 그것은 하나로 만들어진다
나머지 부분과 물리적으로 분리된 저장 장치
다음을 포함하는 시스템 주기 이전에 변환된
환경에서 파생된 정보를 기반으로 작동하는 애플리케이션
운영.
a의 문자 그대로의 정의 데이터웨어 하우스 깊이 있는 연구를 할 가치가 있다
설명에는 중요한 동기와 의미가 있기 때문에
창고의 특성을 설명하는 배경.
과목 오리엔테이션 오리엔테이션
어간 형성 모음
A의 첫 번째 특징은 데이터웨어 하우스 지향한다는 점이다.
회사의 주요 플레이어. 재판을 통한 안내
주기 이는 이것이 제공하는 보다 고전적인 방법과 대조됩니다.
프로세스와 기능을 향한 애플리케이션의 방향,
대부분이 공유하는 방법
오래된 관리 시스템.
운영 세계는 애플리케이션과 기능을 중심으로 설계되었습니다.
대출, 예금, 은행카드, 기관신탁 등
재정적인. dw의 세계는 주제를 중심으로 구성됩니다.
고객, 판매자, 제품, 사업 등의 주체.
주제를 중심으로 정렬하면 디자인과
실현에 관하여 주기 dw에서 찾았습니다. 더 중요한 것은,
주요 주제는 작품의 가장 중요한 부분에 영향을 미칩니다.
핵심 구조.
애플리케이션의 세계는 데이터 디자인의 영향을 받습니다.
프로세스 디자인을 기반으로 합니다. 세계
dw는 모델링에만 집중하고 있습니다. 주기 그리고
그림 데이터베이스. 프로세스 설계(형태)
클래식)은 dw 환경의 일부가 아닙니다.
프로세스/기능 선택과 적용 사이의 차이점
과목별 선택도 내용의 차이로 드러난다
주기 세부적인 수준에서. 그만큼 주기 dw에는 내가 포함되지 않습니다. 주기
신청하는 동안 DSS 프로세스에는 사용되지 않습니다.
운영 지향적 주기 내가 포함 주기 만족시키기 위해
즉시 수행할 수 있는 기능/처리 요구 사항
DSS 분석가에게는 더 이상 사용되지 않습니다.
운영 지향 애플리케이션의 또 다른 중요한 방식
ai 주기 와 다르다 주기 dw의 내용은 dei 보고서에 있습니다. 주기. 주기
운영 둘 이상의 테이블 간의 지속적인 관계를 유지합니다.
활성 비즈니스 규칙을 기반으로 합니다. 그만큼 주기 작성자: dw
그들은 시간의 스펙트럼을 넘나들며 dw에서 발견되는 관계는 다음과 같습니다.
많은. 많은 거래 규칙(그리고 이에 따라 많은
보고서 주기 )는 창고에 표시됩니다. 주기 두 오 사이
여러 테이블.
(두 사람 사이의 관계가 어떻게 이루어지는지에 대한 자세한 설명은 다음과 같습니다. 주기 sono
DW에서 처리되는 경우 해당 기술 항목을 참조합니다.
질문.)
다름 아닌 다른 관점에서
기능적/프로세스 적용 선택과
과목 선택에 따라 시스템 간의 차이가 더 커집니다.
운영진과 나 주기 그리고 DW.
통합 통합
dw 환경의 가장 중요한 측면은 내가 주기 설립하다
그들은 dw 내에 쉽게 통합됩니다. 언제나. 없이
예외. dw 환경의 본질은 내가 주기
창고 한도 내에 포함된 것이 통합됩니다.
통합은 관례를 통해 다양한 방식으로 드러납니다.
일관된 변수의 측정에서 일관성이 확인되었습니다.
물리적 속성으로 구성된 코드화된 구조 주기
일관성 등이 있습니다.
수년에 걸쳐 다양한 애플리케이션의 설계자들이 그렇게 해왔습니다.
애플리케이션이 어떻게 작성되어야 하는지에 대한 많은 결정을 가지고 있습니다.
개발될. 개별화된 스타일 및 디자인 결정
디자이너의 응용 프로그램은 수백 가지 방식으로 드러납니다.
코딩 차이, 키 구조, 물리적 특성,
컨벤션 식별 등. 다수의 집단적 역량
애플리케이션 디자이너는 일관되지 않은 애플리케이션을 만듭니다.
그것은 전설적이다. 그림 3에는 몇 가지 차이점이 나와 있습니다.
애플리케이션이 디자인되는 방식에 있어 중요합니다.
인코딩: 인코딩:
애플리케이션 설계자는 필드 코딩을 선택했습니다 –
섹스-다른 방식으로. 디자이너는 섹스를 다음과 같이 표현한다.
"m"과 "f". 또 다른 디자이너는 섹스를 “1”로 표현합니다.
그리고 "0". 또 다른 디자이너는 섹스를 “x”로 표현하고
"와이". 또 다른 디자이너는 성을 '남성'으로 표현하고
"여성". 성별이 DW에 어떻게 들어가는지는 중요하지 않습니다. 그들을"
그리고 "F"는 아마도 다른 모든 것만큼 좋을 것입니다.
대표.
중요한 것은 성의 분야가 어떤 기원에서 파생되든,
해당 필드는 일관된 통합 상태로 DW에 도착합니다. 에서
필드가 다음에서 DW로 로드될 때의 결과
형식으로 표현된 애플리케이션
"M"과 "F", 나는 주기 DW 형식으로 변환해야 합니다.
속성 측정: 측정
속성:
애플리케이션 설계자는 파이프라인을 측정하기로 결정했습니다.
코스에서 다양한 방법으로
몇년. 디자이너가 저장하는 주기 파이프라인의
센티미터. 다른 애플리케이션 디자이너는 주기
파이프라인의 인치 단위. 또 다른 디자이너
응용 프로그램 상점 나 주기 백만 입방피트 단위의 파이프라인
초당. 그리고 다른 디자이너는
야드 측면에서 파이프라인. 출처가 무엇이든 간에,
파이프라인 정보가 DW에 도착해야 합니다.
같은 방법으로 측정합니다.
그림 3의 표시에 따르면 통합 문제
프로젝트의 거의 모든 측면, 즉 기능에 영향을 미칩니다.
물리적인 신들 주기, 둘 이상의 소스를 갖는 딜레마 주기
일관되지 않게 식별된 샘플, 형식의 문제 주기
일관성이 없다 등등.
디자인 주제가 무엇이든 결과는 동일합니다.
i 주기 DW에 단일 e로 저장되어야 합니다.
운영 체제가
하단에는 다르게 저장됩니다. 주기.
DSS 분석가가 DW를 볼 때 분석가의 목표는
그것은 착취이어야한다 주기 창고에 있는 것들,
신뢰성이나 일관성에 대해 궁금해하기보다는
주기.
시간 변동성
모두 주기 DW에서는 특정 시점까지 정확합니다.
이 기본 특성은 주기 DW에서는 DW와 매우 다릅니다 주기
운영 환경에서 발견됩니다. 그만큼 주기 운영 환경은 다음과 같습니다.
접근하는 순간만큼 정확합니다. 다시 말해서,
드라이브에 액세스할 때 운영 환경에서 주기뿐만 아니라,
접속 당시의 정확한 값이 반영될 때까지 기다려주세요.
왜 내가 주기 DW의 특정 시점만큼 정확합니다.
시간(즉, "지금"이 아닌), 내가 주기 DW에서 발견
그것은 "시간 차이"입니다.
시간 차이 주기 by DW는 여러 가지 방법으로 언급됩니다.
가장 간단한 방법은 내가 주기 DW 표현 주기 그것의
장기간 – 5~10년. 지평선
운영 환경에 소요되는 시간이 훨씬 단축됩니다.
▪ 오늘의 현재 값에서 최대 690까지
잘 작동하고 있어야 하는 애플리케이션
거래 처리에 사용할 수 있는
최소 수량 주기 어느 정도 인정한다면
유연성. 따라서 운영 애플리케이션에는 지평선이 있습니다.
짧은 기간, 디자인 주제로
오디오 애플리케이션.
DW에 '시간 변동'이 나타나는 두 번째 방식은
핵심 구조. DW의 각 키 구조에는 다음이 포함됩니다.
암시적으로 또는 명시적으로, 다음과 같은 시간 요소
일, 주, 월 등 시간의 요소는 거의 항상 존재합니다.
DW에 있는 연결된 키의 맨 아래에 있습니다. 이것들 중에서
경우에 따라 시간의 요소는 우연처럼 암묵적으로 존재할 것입니다.
월말이나 분기말에 전체 파일이 복제됩니다.
시간 차이가 표시되는 세 번째 방법은 다음과 같습니다. 주기
DW는 제대로 등록되자마자
업데이트되었습니다. 그만큼 주기 DW의 모든 실제적인 목적을 위해 긴 것입니다.
일련의 스냅샷. 물론 스냅샷이라면
잘못 촬영된 경우 스냅샷이
수정되었습니다. 하지만 스냅샷을 찍었다고 가정하면
정확하게는 만들어지자마자 수정되지 않습니다. 일부에서는
경우에 따라 스냅샷이 비윤리적이거나 유효하지 않을 수도 있습니다.
DW가 수정되었습니다. 그만큼 주기 작동 가능하고 정확합니다.
로그인 순간 업데이트될 수 있습니다.
필요.
비휘발성
DW의 네 번째 중요한 특성은 비휘발성이라는 것입니다.
업데이트, 삽입, 삭제 및 수정이 이루어집니다.
기록별 운영 환경을 위해 정기적으로 하지만
기본적인 조작 주기 DW에 필요한 것은 훨씬 더 많습니다
단순한. 에서 발생하는 작업은 두 가지 종류뿐입니다.
DW – 초기 로딩 주기 그리고 접근 주기. 없기
업데이트가 없습니다 주기 (일반적인 의미로는
업데이트)를 DW에서 정상적인 처리 작업으로 수행합니다.
이 차이에는 몇 가지 매우 강력한 결과가 있습니다.
운영 처리와 DW 처리 사이의 기반. 수준에서
디자인, 업데이트에 주의할 필요
비정상적인 것은 DW의 요인이 아닙니다. 주기 그것은 아니다
수행. 이는 물리적 설계 수준에서
접근을 최적화하기 위해 자유가 취해질 수 있습니다. 주기,
특히 정규화와 관련된 주제를 다룰 때
물리적 비정규화. 단순함의 또 다른 결과
DW의 운영 중 가장 중요한 부분은 다음 작업에 사용되는 기본 기술입니다.
DW 환경을 실행합니다. 업데이트를 지원해야 함
레코드별로 인라인으로 기록합니다(종종
연산 처리) 기술이 필요합니다.
명백한 단순성 아래 매우 복잡한 기초.
백업 및 복구, 트랜잭션을 지원하는 기술
그리고 무결성 주기 교착 상태의 감지 및 해결 방법은 다음과 같습니다.
매우 복잡하며 DW 처리에는 필요하지 않습니다.
DW의 특징, 디자인 지향성,
통합 주기 DW 내에서 시변성과 단순성
관리의 주기, 모든 것이 매우 매우 좋은 환경으로 이어집니다.
기존 운영 환경과 다릅니다. 거의 모든 소스
주기 DW의 운영 환경은 다음과 같습니다. 생각만 해도 유혹적이다
엄청난 중복이 있다는 것입니다. 주기 두 환경 사이.
실제로 많은 사람들이 느끼는 첫인상은 ''이다.
엄청난 중복성 주기 운영 환경과 운영 환경 사이
DW. 그러한 해석은 피상적이며 다음 중 하나를 보여줍니다.
DW에서 무슨 일이 일어나는지 이해가 부족합니다.
실제로 최소한의 중복성이 있습니다. 주기 운영 환경 간
주기 DW의. 다음을 고려해 봅시다:
▪ 나는 주기 그들은 필터링되었습니다 데이터 운영 환경에서 전달되는 정보
DW 환경으로. 많은 주기 그들은 결코 밖으로 나가지 않는다
운영 환경에서. 그거 빼곤 난 주기 위해 필요한 것
DSS 처리는 환경에서 방향을 찾습니다.
▪ 시간 범위 주기 환경이랑 너무 다르네요
다른 사람에게. 그만큼 주기 운영 환경에서는 매우 멋지다. 그만큼 주기
DW에서는 훨씬 나이가 많습니다. 그냥 관점에서 보면
시간 범위가 겹치는 부분이 거의 없습니다.
운영 환경과 DW 사이.
▪ DW에는 다음이 포함됩니다. 주기 결코 발견되지 않은 요약
환경에서
▪ 나는 주기 근본적인 변화를 겪다
그림 3으로 전환하는 순간 대부분의
부분의 주기 상태가 크게 변경되었습니다.
선택되어 DW로 이동됩니다. 다르게 말하면,
대부분의 주기 물리적으로 변형되고
근본적으로 DW로 이동하는 방법입니다. 관점에서
통합의 의미는 동일하지 않습니다 주기 누가 거주하고 있는가
운영 환경에서.
이러한 요인을 고려하여 중복성은 주기 두 환경 사이에는
드문 이벤트로, 둘 사이의 중복성이 1% 미만으로 이어집니다.
환경.
창고의 구조
DW는 독특한 구조를 가지고 있습니다. 다양한 수준의 요약이 있으며
DW를 구분하는 세부 사항입니다.
DW의 다양한 구성요소는 다음과 같습니다.
▪ 메타데이터
주기 현재 세부정보
주기 오래된 세부 사항
주기 약간 요약됨
주기 고도로 요약된
지금까지 가장 큰 관심사는 다음과 같습니다. 주기 세부적인
전류. 이는 다음과 같은 이유로 주요 관심사입니다.
▪ 나는 주기 현재 세부정보는 가장 최근의 사건을 반영합니다.
항상 큰 관심을 끌고 있는
▪ 나 주기 현재 세부 사항 중 방대하기 때문에
가장 낮은 세분성 수준으로 저장됨 e
▪ 나 주기 현재 세부 정보는 거의 항상 저장됩니다.
접근이 빠르지만 비용이 많이 드는 디스크 스토리지
복잡한
I 주기 자세히 보면 나이가 들수록 주기 저장되어 있는 것
약간의 기억 마사. 간헐적으로 액세스할 수 있으며
다음과 호환되는 세부 수준으로 저장됩니다. 주기 상세한
전류. 매체에 저장하는 것이 필수는 아니지만
대용량으로 인해 대체 스토리지 주기 와 연합하다
간헐적인 접근 주기, 메모리 지원 주기 di
이전 세부정보는 일반적으로 디스크에 저장되지 않습니다.
I 주기 약간 요약하면 주기 바닥에서 증류되는 것
현재 세부 수준에서 발견된 세부 수준입니다. 이것
DW 레벨은 거의 항상 디스크 스토리지에 저장됩니다. 그만큼
건축가에게 발생하는 디자인 문제 주기
이 수준의 DW 구성에는 다음이 포함됩니다.
▪ 위에서 작성한 요약은 시간 단위는 무엇입니까?
▪ 어떤 내용, 속성이 내용을 약간 요약할 것인가?
의 내용 주기
다음 레벨 주기 DW에서 발견된 것은 주기 높게
요약. 그만큼 주기 고도로 요약된 내용은 간결하고 쉽게
얻기 쉬운. 그만큼 주기 고도로 요약된 내용이 가끔 발견됨
DW 환경과 다른 경우에는 i 주기 고도로 요약된 것은
DW를 수용하는 기술의 직접적인 벽 밖에서 발견되었습니다.
(어쨌든 나는 주기 고도로 요약된 내용은 DW의 일부입니다.
내가 어디에 있든 상관없이 주기 물리적으로 수용됩니다).
DW의 마지막 구성 요소는 메타데이터입니다. 여러 면에서
메타데이터는 다른 것과는 다른 차원에 위치합니다. 주기
메타데이터에는 어떤 내용도 포함되어 있지 않기 때문에 DW의 데이터 direttamente
운영 환경에서 가져왔습니다. 메타데이터에는 특별한 역할이 있습니다.
DW에서는 매우 중요합니다. 메타데이터는 다음과 같이 사용됩니다.
▪ DSS 분석가가 해당 항목을 찾는 데 도움이 되는 디렉토리
DW의 내용,
▪ 매핑 가이드 주기 내가 어떻게 주기 그들은
운영환경에서 DW환경으로 전환,
▪ 사이의 요약에 사용되는 알고리즘에 대한 가이드 주기 di
세부 전류와 나 주기 약간 요약하자면, 나는 주기 높게
요약,
메타데이터는 DW 환경에서 훨씬 더 중요한 역할을 합니다.
운영 환경에서 그 어느 때보다
오래된 세부 저장 매체
자기 테이프를 사용하여 이러한 종류의 정보를 저장할 수 있습니다.
주기. 실제로 다양한 저장 도구가 있습니다.
오래된 것의 보존을 위해 고려해야 한다 주기 di
세부 사항.
볼륨에 따라 주기, 액세스 빈도, 비용
도구와 액세스 유형에 따라 완전히 가능성이 높습니다.
다른 도구에는 이전 수준의 세부 정보가 필요함
DW에서.
데이터의 흐름
정상적이고 예측 가능한 흐름이 있습니다. 주기 DW 내부.
I 주기 운영 환경에서 DW를 입력합니다. (참고:
이 규칙에는 몇 가지 매우 흥미로운 예외가 있습니다. 그러나 거의
모든 주기 운영 환경에서 DW를 입력합니다). 다토 나는 주기
운영 환경에서 DW로 들어가면 원래대로 변환됩니다.
전에 설명했습니다. DW에 들어가는 조건으로, 나는 주기 그들은 들어갑니다
표시된 대로 현재 세부 수준입니다. 거기에 상주하고 사용됩니다.
세 가지 이벤트 중 하나가 발생할 때까지:
▪ 정화되고,
▪ 요약되어 있습니다. 및/또는
▪ 는
DW 내부의 오래된 프로세스가 i를 이동합니다. 주기 현재 세부정보
a 주기 연령을 기준으로 한 오래된 세부정보 주기. 과정
요약은 세부 정보를 사용합니다. 주기 내가 계산하기 위해 주기
약간 요약된 수준과 크게 요약된 수준 주기. 있습니다
표시된 흐름에 몇 가지 예외가 있습니다(나중에 설명함).
그러나 일반적으로 대부분의 경우 주기 설립하다
DW 내에서 주기 그것은 묘사된 대로이다.
데이터웨어하우스 사용
놀랄 것도 없이 다양한 수준의 주기 DW 내에서는
다양한 수준의 사용을 받습니다. 원칙적으로 레벨이 높을수록
요약, 플러스 나 주기 그들은 사용됩니다.
많은 용도가 발생합니다 주기 고도로 요약된 반면, 오래된 것들은
주기 세부적인 내용은 거의 사용되지 않습니다. 그럴만한 이유가 있어요
조직을 자원 사용 패러다임으로 이동시킵니다. 그 사람이 더 많이 가질수록
요약 나 주기, 목적지에 도달하는 것이 더 빠르고 효율적입니다. 주기. 그것
un 가게 DW 세부 수준에서 많은 처리를 수행한다는 사실을 발견했습니다.
그러면 그에 상응하는 많은 양의 시스템 리소스가
소비됩니다. 기소하는 것이 모두에게 최선의 이익입니다
가능한 한 빨리 높은 수준의 요약을 제공합니다.
많은 매장에서 DW 이전 환경의 DSS 분석가는
주기 세부 수준에서. 여러 면에서 도착은 주기 상세한
사용 가능한 경우에도 보안 담요와 유사합니다.
다른 수준의 요약. 건축가의 활동 중 하나 주기 è
DSS 사용자가 지속적으로 DSS를 사용하지 않도록 하세요. 주기 가장 높은 수준에서
낮은 디테일. 두 가지 이유가 있습니다.
건축가의 주기:
▪ 최종 사용자가 비용을 지불하는 지불 거절 시스템을 설치합니다.
소비된 자원 e
▪ 응답 시간이 매우 좋을 수 있음을 나타냅니다.
나와의 행동을 통해 얻은 주기 그것은 높은 수준에 있다
요약하자면, 응답 시간이 좋지 않은 것은
행동 주기 낮은 수준에서
기타 고려 사항
기타 건설 및 관리 고려사항이 있습니다.
D.W.
첫 번째 고려 사항은 인덱스에 대한 것입니다. 그만큼 주기 가장 높은 수준의
요약은 자유롭게 색인을 생성할 수 있지만 주기
더 낮은 수준의 세부 사항에서는 가능한 한 부피가 커집니다.
알뜰하게 색인이 되어있습니다. 동일한 토큰에서 나는 주기 높은 수준에서
세부적인 부분은 비교적 쉽게 개조할 수 있으며,
동안의 볼륨 주기 낮은 수준에서는 너무 커서 내가 주기 X
쉽게 개조할 수 있습니다. 이에 따라 모델은
주기 그리고 디자인이 수행하는 공식적인 작업은
거의 독점적으로 레벨에 적용되는 DW의 기반
세부 현재. 즉, 모델 활동을
주기 거의 모든 경우에 요약 수준에는 적용되지 않습니다.
또 다른 구조적 고려 사항은
주기 DW로.
파티션은 두 가지 수준에서 수행될 수 있습니다. DBMS 과에
응용 수준. 레벨의 부서에서 DBMS, DBMS è
부서에 대한 정보를 제공하고 그에 따라 모니터링합니다. 의 경우
애플리케이션 수준에서 분할하면 프로그래머만
부서와 해당 부서의 책임에 대한 정보 제공
행정은 그에게 맡겨져 있다
수준 이하 DBMS, 많은 작업이 자동으로 수행됩니다. 있다
자동 관리와 관련된 많은 경직성
부서. 응용프로그램 수준에서 분할된 경우 주기
데이터웨어 하우스, 많은 작업이 프로그래머에게 부담이 되지만
최종 결과는 관리의 유연성입니다. 주기 날짜에
창고
또 다른 이상현상
반면에 데이터웨어 하우스 설명된 대로 작동합니다.
거의 모든 사람에게 주기, 몇 가지 유용한 예외가 있습니다.
논의될 것입니다. 예외는 다음과 같습니다. 주기 공개 요약
(공개 요약 데이터). 이것들은 주기 요약
에서 계산 데이터웨어 하우스 그러나 그들은 사회에서 사용됩니다. 그만큼 주기
공개 요약은 데이터웨어 하우스,
이전에 언급했듯이 계산됩니다. 그만큼
회계사는 이러한 분기별 보고서를 작성하기 위해 노력합니다. 주기 ~처럼
소득, 분기별 비용, 분기별 이익 등이 있습니다. 작품
회계사가 외부에서 수행하는 작업 데이터웨어 하우스. 그러나 나는 주기 sono
회사 내에서 "내부적으로" 사용됨 – 마케팅, 판매 등
논의되지 않은 또 다른 예외는 다음과 같습니다. 주기 외부.
또 다른 예외적인 종류의 주기 주어진 것에서 찾을 수 있는 것
창고는 영구적인 세부 데이터의 창고입니다. 이로 인해
나를 영구적으로 저장해야 함 주기 한 수준에서
윤리적 또는 법적 이유로 자세히 설명되어 있습니다. 회사가 i를 전시하는 경우
근로자를 위험 물질과 연관시키는 것이 필요합니다. 주기
상세하고 영구적입니다. 회사에서 제품을 생산한다면
공공 안전과 관련이 있는지, 비행기의 어떤 부분이 있는지
에 대한 필요성 주기 상세한 영구 및 회사의 경우
위험한 계약을 맺게 됩니다.
사회는 세세한 부분을 간과할 여유가 없습니다.
향후 몇 년 동안 소송, 리콜,
공사 하자 논란 등 회사의 노출
그것은 클 수 있습니다. 그 결과 독특한 유형의 주기
영구 세부 데이터로 알려져 있습니다.
요약
Un 데이터웨어 하우스 객체 지향적이고 통합된 변형입니다.
시간, 모음 주기 비휘발성으로 다음 요구사항을 지원합니다.
행정결정. 각각의 주요 기능은
un 데이터웨어 하우스 그 의미가 있습니다. 게다가 4개나 있어
수준 주기데이터웨어 하우스:
▪ 이전 세부정보
▪ 현재 세부정보
주기 약간 요약됨
주기 고도로 요약된
메타데이터도 중요한 부분입니다. 데이터웨어 하우스.
추상적인
저장의 개념 주기 최근에 받은
많은 관심을 받으며 90년대 트렌드가 되었습니다.
A의 용량으로 인해 데이터웨어 하우스 그들을 극복하기 위해
i 등 행정지원시스템의 한계
의사결정 지원 시스템(DSS) 및 정보 시스템
임원 (EIS).
컨셉이라고 해도 데이터웨어 하우스 유망해 보이는데,
나 구현 데이터웨어 하우스 인해 문제가 될 수 있습니다.
대규모 창고 프로세스. 에도 불구하고
스토리지 프로젝트의 복잡성 주기, 많은 공급 업체
창고 컨설턴트 주기 그들은 주장한다
저장 주기 현재는 아무런 문제를 일으키지 않습니다.
그러나 본 연구 프로젝트 초기에는 거의
독립적이고 엄격하며 체계적인 연구가 수행되었습니다. 에서
결과적으로 실제로 무슨 일이 일어나는지 말하기가 어렵습니다.
산업계에서 건설될 때 데이터웨어 하우스.
이번 연구에서는 저장 방식을 탐구했습니다. 주기
보다 풍부한 이해를 발전시키는 것을 목표로 하는 동시대인
호주 관행. 문헌 분석은 다음을 제공했습니다.
경험적 연구의 맥락과 기초.
이 연구에는 여러 가지 결과가 있습니다. 첫 번째
장소, 이 연구에서 발생한 활동이 밝혀졌습니다.
개발하는 동안 데이터웨어 하우스. 나는 여러 분야에서 주기 모여
문헌에 보고된 관행을 확인했습니다. 둘째
사이트, 문제 및 문제에 영향을 미칠 수 있습니다.
개발 데이터웨어 하우스 이번 연구를 통해 확인됐다.
마지막으로, 호주와 관련된 조직으로부터 얻은 혜택은 다음과 같습니다.
사용 데이터웨어 하우스 공개되었습니다.
1 장
연구 맥락
데이터 웨어하우징의 개념은 널리 인식되었습니다.
노출되어 새로운 트렌드로 자리 잡았습니다.
90년대(McFadden 1996, TDWI 1996, Shah 및 Milstein 1997,
Shankset al. 1997, Eckerson 1998, Adelman 및 Oates 2000). 그건
데이터에 기사가 늘어나는 것을 보면 알 수 있습니다.
무역 출판물에서의 창고업(Little and Gibson 1999).
많은 기사(예를 들어 Fisher 1995, Hackathorn 1995,
Morris 1995a, Bramblett 및 King 1996, Graham 외. 1996년,
Sakaguchi와 Frolick 1996, Alvarez 1997, Brousell 1997, Clarke
1997년, 매카시 1997, 오도넬 1997, 에드워즈 1998, TDWI
1999)은 조직에서 파생된 상당한 이점을 보고했습니다.
내가 구현하는 것 데이터웨어 하우스. 그들은 그들의 이론을 지지했다
성공적인 구현에 대한 일화적인 증거를 통해 높은 수익을 얻을 수 있습니다.
투자 수치(ROI)에 대한 지침 제공
개발을 위한 참조 또는 방법론 데이터웨어 하우스
(Shanks 외. 1997, Seddon 및 Benjamin 1998, Little 및 Gibson
1999). 극단적인 경우 Graham et al. (1996)
401년 투자 평균 수익률은 XNUMX%라고 보고했습니다.
그러나 현재의 많은 문헌은 그 내용을 간과하고 있다.
그러한 프로젝트를 수행하는 데 수반되는 복잡성. 프로젝트
데이터웨어 하우스 일반적으로 복잡하고 대규모이며
따라서 그렇지 않으면 실패할 확률이 높다는 것을 의미합니다.
신중하게 통제됨(Shah 및 Milstein 1997, Eckerson 1997,
Foley 1997b, Zimmer 1997, Bort 1998, Gibbs 및 Clymer 1998, Rao
1998). 엄청난 양의 인적, 자원이 필요합니다.
이를 구축하기 위한 재정적, 시간 및 노력(Hill 1998, Crofts 1998). 그만큼
일반적인 시간과 필요한 재정적 수단은 각각
약 1995년 XNUMX~XNUMX만 달러(Braly XNUMX, Foley)
1997b, Bort 1998, Humphries et al. 1999). 이 시대와 수단
금융 기관은 여러 측면을 통제하고 통합해야 합니다.
데이터 웨어하우징의 차이점(Cafasso 1995, Hill 1998). 쪽
하드웨어 및 소프트웨어 고려 사항, 기타 기능
추출에서 주기 로딩 과정에 주기,에서
업데이트 및 메타데이터를 관리하는 메모리 용량 주기
사용자 교육을 위해 고려해야 합니다.
이 연구 프로젝트가 시작될 당시에는 거의 없었습니다.
데이터 웨어하우징 분야의 학술 연구,
특히 호주에서는요. 아이템이 부족하다는 사실이 이를 입증했다.
신문이나 기타 글을 통해 데이터 웨어하우징에 대해 게시됨
당시의 학자들. 학술 저서 다수
미국의 경험을 설명했습니다. 부족
SL 데이터 웨어하우징 분야의 학술 연구로 인해
엄격한 연구와 경험적 연구가 필요합니다(McFadden 1996,
Shankset al. 1997, 리틀과 깁슨 1999). 특히, 연구
구현 과정에 대한 연구 데이터웨어 하우스
지식을 확장하기 위해 수행해야 할 일
구현에 관한 일반 사항 데이터웨어 하우스 e
향후 연구 연구의 기초가 될 것입니다(Shanks ed).
다른 사람. 1997, 리틀과 깁슨 1999).
따라서 본 연구의 목적은 실제로 어떤 것이 있는지 연구하는 것이다.
조직이 데이터를 유지하고 사용할 때 발생합니다.
호주 창고. 구체적으로, 이 연구는
전체 개발 과정에 대한 분석 데이터웨어 하우스,
시작과 기획부터 디자인까지
조직 내 구현 및 후속 사용
오스트레일리아 사람. 또한, 이 연구는 현재의 관행에도 기여할 것입니다.
관행을 더욱 발전시킬 수 있는 영역을 식별
개선되고 비효율성과 위험이 최소화되거나
피하다. 또한, 이는 다른 연구의 기초가 될 것이다. 데이터웨어 하우스 in
호주는 현재 문헌에 존재하는 격차를 메울 것입니다.
연구 질문
이 연구의 목적은 관련된 활동을 연구하는 것입니다.
구현에 데이터웨어 하우스 그리고 그 사용
호주 조직. 특히 요소를 연구합니다.
프로젝트 기획, 개발,
작동, 사용 및 관련된 위험. 그래서 질문은
이 연구의 내용은 다음과 같습니다.
“현재의 관행은 무엇입니까? 데이터웨어 하우스 호주에서?"
이 문제에 효과적으로 대응하기 위해,
특정 수의 보조 연구 질문. 특히, 세
하위 질문은 문헌에서 확인되었습니다.
이 연구 프로젝트를 안내하기 위해 2장에 제시된 내용은 다음과 같습니다.
구현 방법 데이터웨어 하우스 조직별
오스트레일리아 사람? 어떤 문제가 발생했나요?
경험한 이점은 무엇입니까?
이 질문에 답하기 위해 그림을 사용했습니다.
설문조사를 사용하는 탐색적 연구. 내가 공부하는 방법
탐색적이므로 위 질문에 대한 답변이 완전하지 않습니다.
(Shanks et al. 1993, Denscombe 1998). 이 경우에는
이에 대한 대응을 개선하려면 삼각측량이 필요합니다.
요청. 그러나 조사를 통해 탄탄한 기반을 마련할 것입니다.
이러한 질문을 검토하는 향후 작업. 상세한 것
연구방법의 타당성과 설계에 대한 논의
3장에 제시되어 있다.
연구 프로젝트의 구조
이 연구 프로젝트는 두 부분으로 나누어집니다: 상황별 연구
데이터 웨어하우징 개념과 실증적 연구(참조:
그림 1.1), 각 내용은 아래에서 설명합니다.
1부: 상황별 연구
연구의 첫 번째 부분은 다음을 재검토하는 것으로 구성되었습니다.
i를 포함한 다양한 유형의 데이터 웨어하우징에 관한 최신 문헌
의사결정지원시스템(DSS), 정보시스템
Executive (EIS) 사례 연구 데이터웨어 하우스 그리고 날짜의 개념
창고. 또한, 포럼 결과 데이터웨어 하우스
전문가 및 전문가 그룹이 진행하는 회의 그룹
Monash DSS 연구는 연구의 이 단계에 기여했습니다.
데이터 실행에 관한 정보를 얻기 위한 것이었습니다.
창고 및 채택과 관련된 위험을 식별합니다.
이 상황적 학습 기간 동안,
문제 영역에 대한 지식을 제공하기 위해 설정되었습니다.
후속 실증적 조사의 기초. 그러나 이
연구가 진행되는 동안 진행 중인 프로세스였습니다.
연구.
2부: 실증적 연구
비교적 새로운 개념의 데이터 웨어하우징, 특히
호주에서는 이에 대한 조사를 수행해야 할 필요성이 생겼습니다.
사용 경험에 대한 폭넓은 그림을 얻으세요. 이것
부분은 문제 도메인이 완성된 후에 수행되었습니다.
광범위한 문헌 검토를 통해 확립되었습니다. 개념
상황별 연구 단계에서 형성된 데이터 웨어하우징의 규모는 다음과 같습니다.
이 연구의 초기 설문지의 입력으로 사용되었습니다.
이후 설문지를 검토하였다. 당신은 데이트 전문가입니다
창고가 테스트에 참여했습니다. 테스트의 목적
초기 설문지는 완전성과 정확성을 확인하기 위한 것이었습니다.
몇 가지 질문. 테스트 결과를 바탕으로 설문지는 다음과 같습니다.
수정되었으며 수정된 버전이 다음으로 전송되었습니다.
설문 조사 참가자. 그때 돌아온 설문지는 다음과 같았다.
나를 위해 분석했다 주기 표, 다이어그램 및 기타 형식으로 제공됩니다. 그만큼
분석 결과 주기 즉석 사진을 찍다
호주의 데이터 웨어하우징 관행.
데이터 웨어하우징 개요
데이터 웨어하우징의 개념은 개선과 함께 발전했습니다.
컴퓨터 기술의.
그룹이 직면한 문제를 극복하는 것을 목표로 합니다.
의사결정 지원 시스템(DSS)과 같은 애플리케이션 지원
EIS(경영진 정보 시스템).
과거에는 이러한 응용 프로그램의 주요 장애물은 다음과 같습니다.
이러한 애플리케이션이 다음을 제공할 수 없음 데이터베이스
분석에 필요합니다.
이는 주로 작업의 특성으로 인해 발생합니다.
관리. 회사 경영진의 이해관계는 다양하다
치료 부위에 따라 지속적으로. 그러므로, 나는 주기
이러한 애플리케이션의 기본은 다음을 수행할 수 있어야 합니다.
시술 부위에 따라 빠르게 변화합니다.
이것은 내가 주기 형태로 이용 가능해야 함
필요한 분석에 적합합니다. 실제로 지원그룹은
과거에는 애플리케이션에서 에드를 수집하는 것이 매우 어려웠습니다.
통합 주기 복잡하고 다양한 소스에서.
이 섹션의 나머지 부분에서는 개념에 대한 개요를 제공합니다.
데이터 웨어하우징 방법을 다루고 있습니다. 데이터웨어 하우스 극복할 수 있다
신청 지원 그룹 문제.
용어 "데이터웨어 하우스”은 1990년 William Inmon에 의해 발매되었습니다.
그의 자주 인용되는 정의는 데이터웨어 하우스 왔다
컬렉션 주기 주제 지향적, 통합적, 비휘발성, 가변적
시간이 지남에 따라 관리 결정을 지원합니다.
이 정의를 사용하여 Inmon은 다음을 강조합니다. 주기 레지던트
~ 안에 데이터웨어 하우스 다음 4가지를 갖추어야 합니다.
Caratteristiche :
▪ 주제 중심
▪ 통합
▪ 비휘발성
▪ 시간이 지남에 따라 가변적
주제 중심의 인몬이란 내가 주기 날짜에
가장 큰 조직 영역의 창고
모델에 정의됨 주기. 예를 들어 모두 주기 에 관한 고객
주제 영역에 포함되어 있습니다. 고객에. 마찬가지로 모두
주기 제품과 관련된 내용이 주제 영역에 포함되어 있습니다.
제품.
통합 인몬(Integrated Inmon)이란 다음을 의미합니다. 주기 다른 곳에서 오는
플랫폼, 시스템 및 위치가 결합되어 저장됩니다.
단일 장소. 결과적으로 주기 유사하게 변형되어야 함
추가하고 비교할 수 있도록 일관된 형식으로 유지
용이하게.
예를 들어 남성과 여성의 성별이 표시됩니다.
한 시스템에서는 문자 M과 F로 표시되고 다른 시스템에서는 1과 0으로 표시됩니다. 을 위한
올바른 방식으로 통합하려면 하나 또는 두 가지 형식 모두를 충족해야 합니다.
두 형식이 동일하도록 변환됩니다. 이에
이 경우 M을 1로, F를 0으로 또는 그 반대로 변경할 수 있습니다. 지향
주제 및 통합은 다음을 나타냅니다. 데이터웨어 하우스 그것은 위해 설계되었습니다
기능적이고 횡단적인 비전을 제공합니다. 주기 곁에
회사입니다.
비휘발성이란 그가 의미하는 바는 다음과 같습니다. 주기 nel 데이터웨어 하우스 그들은 남아있다
일관되고 업데이트되는 주기 그건 꼭 필요 하진 않아. 대신, 매
변화하다 주기 원본이 추가됩니다 데이터베이스 날짜의
창고. 이는 역사적 신을 의미한다. 주기 에 포함되어 있습니다
데이터웨어 하우스.
시간이 있는 변수의 경우 Inmon은 i를 나타냅니다. 주기 nel 데이터웨어 하우스
항상 시간 표시기를 포함하고 있으며 주기 일반적으로
특정 시간 지평선을 넘습니다. 예를 들어
데이터웨어 하우스 5년간의 역사적 가치를 포함할 수 있습니다. 고객
1993년부터 1997년까지. 이력 및 시계열의 가용성
주기 추세를 분석할 수 있습니다.
Un 데이터웨어 하우스 그는 자신의 것을 수집할 수 있다 주기 시스템에서
OLTP;원본에서 주기 조직 외부 및/또는 다른 전문가에 의해
시스템 프로젝트 캡처 주기.
I 주기 추출물은 세척 과정을 거칠 수 있습니다.
이 경우는 내가 주기 그들은 존재하기 전에 변형되고 통합됩니다.
에 저장됨 데이터베이스데이터웨어 하우스. 그럼 내가 주기
내의 주민 데이터베이스데이터웨어 하우스 사용할 수 있게 되었습니다
최종 사용자 액세스 및 복구 도구. 사용
최종 사용자가 통합 보기에 액세스할 수 있는 도구
조직의 주기.
I 주기 내의 주민 데이터베이스데이터웨어 하우스 sono
상세 형식과 요약 형식으로 저장됩니다.
요약 수준은 내용의 성격에 따라 달라질 수 있습니다. 주기. 주기
상세한 내용은 다음과 같이 구성될 수 있습니다. 주기 현재 및 주기 역사가
I 주기 로열티는 포함되지 않습니다. 데이터웨어 하우스 내가 ~ 할 때까지 주기
nel 데이터웨어 하우스 업데이트됩니다.
저장하는 것 외에도 주기 그들 자신, 데이터웨어 하우스 푸오 안체
다른 유형의 저장 데이터 METADATA라고 불리는 것은
나를 설명하다 주기 그의 주민들 데이터베이스.
메타데이터에는 개발 메타데이터와 개발 메타데이터라는 두 가지 유형이 있습니다.
복수.
개발 메타데이터는
추출, 청소, 매핑 및 로딩 프로세스 주기 nel
데이터웨어 하우스.
개발 메타데이터에 포함된 정보에는 다음이 포함될 수 있습니다.
운영 체제 세부 정보, 추출할 요소 세부 정보,
모델 주기데이터웨어 하우스 및 회사 규칙
변환 주기.
분석 메타데이터로 알려진 두 번째 유형의 메타데이터
최종 사용자가 데이터의 내용을 탐색할 수 있게 해줍니다.
창고를 찾기 위해 주기 사용 가능하며 해당 용어의 의미
명확하고 기술적이지 않습니다.
따라서 분석 메타데이터는 데이터 간의 브리지 역할을 합니다.
창고 및 최종 사용자 애플리케이션. 이 메타데이터는
비즈니스 모델, 설명 포함 주기 특파원
비즈니스 모델, 사전 정의된 쿼리 및 보고서,
사용자 로그인 및 인덱스에 대한 정보입니다.
분석 및 개발 메타데이터는 하나로 결합되어야 합니다.
제대로 작동하려면 통합된 메타데이터 억제가 필요합니다.
불행하게도 기존 도구 중 상당수는 고유한
메타데이터이며 현재 이를 뒷받침하는 기존 표준은 없습니다.
데이터 웨어하우징 도구를 통해 이러한 기능을 통합할 수 있습니다.
메타데이터. 이러한 상황을 해결하기 위해 많은 거래자들은
주요 데이터 웨어하우징 도구는 메타데이터를 형성했습니다.
나중에 Meta Data Coalition이 된 위원회입니다.
이 연합의 목적은 메타데이터 세트를 구축하는 것입니다.
다양한 데이터 웨어하우징 도구를 허용하는 표준
메타데이터 변환
그들의 노력은 메타(Meta)의 탄생으로 이어졌습니다.
교환을 허용하는 MDIS(데이터 교환 사양)
Microsoft 아카이브와 관련 MDIS 파일 간의 정보.
존재 주기 요약/색인화 및 세부 정보 제공
사용자가 DRILL DROWN을 수행할 수 있는 가능성
(드릴링) 어서 주기 세부 항목으로 색인화되고 그 반대도 마찬가지입니다.
존재 주기 상세한 기록을 통해 생성이 가능합니다.
시간 경과에 따른 추세 분석. 또한 분석 메타데이터는 다음을 수행할 수 있습니다.
다음의 디렉토리로 사용됩니다. 데이터베이스데이터웨어 하우스
최종 사용자가 나를 찾을 수 있도록 도와주세요 주기 필요한.
OLTP 시스템과 비교하여 지원 능력이 있습니다.
분석 주기 그리고 보고, 데이터웨어 하우스 시스템이라고 보면 된다
만들기와 같은 정보 프로세스에 더 적합합니다.
질의에 응답하고 보고서를 생성합니다. 다음 섹션
두 시스템의 차이점을 자세히 강조하겠습니다.
데이터웨어 하우스 OLTP 시스템에 반대
조직 내의 많은 정보 시스템
일상적인 작업을 지원하기 위한 것입니다. 이것들
OLTP 시스템으로 알려진 시스템은 트랜잭션을 캡처합니다.
매일 지속적으로 업데이트됩니다.
I 주기 이러한 시스템 내에서는 종종 수정, 추가 또는
삭제되었습니다. 예를 들어 고객의 주소는 거의 변하지 않습니다.
그는 한 곳에서 다른 곳으로 이동합니다. 이 경우 새 주소
의 주소 필드를 수정하여 등록됩니다. 데이터베이스.
이러한 시스템의 주요 목적은 비용을 절감하는 것입니다.
거래를 진행하는 동시에 처리 시간을 단축합니다.
OLTP 시스템의 예에는 쓰기와 같은 중요한 작업이 포함됩니다.
주문회계, 급여, 송장, 제조, AI 서비스 고객.
프로세스별로 생성되는 OLTP 시스템과 달리
거래 및 이벤트를 기반으로 데이터웨어 하우스 그들은 창조되었다
분석 기반 프로세스에 대한 지원을 제공합니다. 주기 및에
의사결정 과정.
이는 일반적으로 i를 통합하여 달성됩니다. 주기 다양한 시스템에서
단일 "컨테이너"의 OLTP 및 외부. 주기,논의
이전 섹션에서.
Monash 데이터 웨어하우징 프로세스 모델
프로세스 모델 데이터웨어 하우스 Monash는 다음에 의해 개발되었습니다.
Monash DSS 연구 그룹의 연구원들은 다음을 기반으로 합니다.
문학 데이터웨어 하우스, 지원 경험에 대해
시스템 분야 개발, 공급업체와의 논의 중
다음에 사용할 애플리케이션 데이터웨어 하우스, 전문가 그룹에서
사용 중 데이터웨어 하우스.
단계는 시작, 계획, 개발 및 운영입니다.
설명. 다이어그램은 반복적 특성을 설명합니다.
의 진화적 발전 데이터웨어 하우스 사용하여 프로세스
서로 다른 단계 사이에 배치된 양방향 화살표. 이에
"반복적" 및 "진화적" 맥락은 각각
프로세스 단계에서 구현 활동을 수행할 수 있습니다.
항상 이전 단계로 역방향으로 전파됩니다. 이것은
프로젝트의 특성상 데이터웨어 하우스 어느
추가 요청은 언제든지 발생
최종 사용자의. 예를 들어, 개발 단계에서
과정 데이터웨어 하우스, 최종 사용자가 하나를 요청합니다.
새로운 차원이나 주제 영역에 속하지 않은
원래 계획을 시스템에 추가해야 합니다. 이것
프로젝트에 변화를 가져옵니다. 그 결과 팀은
디자인은 지금까지 작성된 문서의 요구 사항을 변경해야 합니다.
디자인 단계에서. 많은 경우 현재의 상황은
프로젝트는 설계 단계로 돌아가야 합니다.
새로운 요청을 추가하고 문서화해야 합니다. 사용자
최종적으로는 검토된 특정 문서를 볼 수 있어야 합니다.
개발 단계에서 변경된 사항입니다. 끝에
이 개발 주기에서 프로젝트는 좋은 피드백을 받아야 합니다.
개발팀, 사용자팀 모두요. 그만큼
그런 다음 피드백은 재사용되어 향후 프로젝트를 개선합니다.
용량 계획
Dw는 크기가 매우 크고 커지는 경향이 있습니다.
매우 빠르게(Best 1995, Rudin 1997a)
금액 주기 그들이 지속 기간 동안 유지하는 역사. 거기
성장은 다음으로 인해 발생할 수도 있습니다. 주기 추가 요청 항목
사용자는 가치를 높이기 위해 주기 이미 가지고 있는 것입니다. 에서
결과적으로 스토리지 요구 사항은 다음과 같습니다. 주기 포 소노
크게 향상됩니다(Eckerson 1997). 그래서 그렇습니다
계획을 수행하여 보장하는 데 필수적입니다.
구축할 시스템이 성장할 수 있는 용량
요구의 성장(Best 1995, LaPlante 1996, Lang 1997,
Eckerson 1997, Rudin 1997a, Foley 1997a).
DW 확장성을 계획할 때 다음 사항을 알아야 합니다.
재고 규모, 질문 유형의 예상 증가
수행될 가능성이 높으며 지원되는 최종 사용자 수(최적
1995, 루딘 1997b, 폴리 1997a). 확장 가능한 애플리케이션 구축
확장 가능한 서버 기술과 기술의 조합이 필요합니다.
확장 가능한 애플리케이션 설계(Best 1995, Rudin 1997b.
응용 프로그램을 만들 때 둘 다 필요합니다.
확장성이 매우 뛰어납니다. 확장 가능한 서버 기술은
스토리지, 메모리 및
성능 저하가 없는 CPU(Lang 1997, Telephony 1997).
확장 가능한 두 가지 주요 서버 기술이 있습니다.
대칭 다중(SMP) 및 대규모 처리
평행(MPP))(IDC 1997, Humphries et al. 1999). 서버
SMP에는 일반적으로 하나의 메모리를 공유하는 여러 프로세서가 있습니다.
버스 시스템 및 기타 자원(IDC 1997, Humphries et al. 1999).
확장을 위해 추가 프로세서를 추가할 수 있습니다.
라 수아 포 텐차 계산적. 수치를 높이는 또 다른 방법
포 텐차 SMP 서버의 컴퓨팅 성능은 수많은
SMP 기계. 이 기술은 클러스터링(Humphries)으로 알려져 있습니다.
외. 1999). 반면 MPP 서버에는 각각 여러 개의 프로세서가 있습니다.
자체 메모리, 버스 시스템 및 기타 리소스를 갖추고 있음(IDC 1997,
Humphrieset al. 1999). 각 프로세서를 노드라고 합니다. ㅏ
증가 포 텐차 계산적으로 달성 가능
MPP 서버에 추가 노드 추가(Humphries et al.
1999).
SMP 서버의 약점은 입출력 작업이 너무 많다는 점입니다.
(I/O)는 버스 시스템을 정체시킬 수 있습니다(IDC 1997). 이것
MPP 서버 내에서는 문제가 발생하지 않습니다.
프로세서에는 자체 버스 시스템이 있습니다. 그러나 상호 연결은
각 노드 사이에서는 일반적으로 버스 시스템보다 훨씬 느립니다.
SMP의. 또한 MPP 서버는 레이어를 추가할 수 있습니다.
애플리케이션 개발자의 복잡성이 가중됨(IDC
1997). 따라서 SMP와 MPP 서버 간의 선택이 영향을 받을 수 있습니다.
질문의 복잡성, 관계를 포함한 여러 요인에 의해
가격/성능, 필요한 처리 용량,
dw 애플리케이션과 크기 증가를 방지했습니다. 데이터베이스
dw 및 최종 사용자 수.
다양한 확장 가능한 애플리케이션 설계 기술
용량 계획에 사용할 수 있습니다. 하나
일, 주, 월, 년 등 다양한 알림 기간을 사용합니다.
다양한 공지기간을 갖고 있으며, 데이터베이스 으로 나눌 수 있다
조각들은 쉽게 그룹화됩니다(Inmon et al. 1997). 다른 것
기술은 구성된 요약 테이블을 사용하는 것입니다.
합산 주기 da 주기 상세한. 그래서 나는 주기 요약이 더 많네요
상세보다 컴팩트하므로 메모리 공간이 덜 필요합니다.
그래서 주기 세부 정보는 드라이브에 저장할 수 있습니다.
더 저렴한 스토리지로 더 많은 스토리지를 절약할 수 있습니다.
요약 테이블을 사용하면 공간을 절약할 수 있지만
최신 상태로 유지하려면 많은 노력이 필요합니다.
상업적인 요구에 부응합니다. 그러나 이 기술은
널리 사용되며 종종 기술과 함께 사용됩니다.
이전(베스트 1995, 인몬 1996a, 차두리와 다얄
1997).
정의 데이터웨어 하우스 테크니컬
아키텍처 기술의 정의
dw 아키텍처
데이터 웨어하우징의 얼리 어답터가 주로 구상됨
모든 것이 dw의 중앙 집중식 구현입니다. 주기, 포함
i 주기 외부는 단일로 통합되었습니다.
물리적 저장(Inmon 1996a, Bresnahan 1996, Peacock 1998).
이 접근 방식의 가장 큰 장점은 최종 사용자가
나는 기업가적 차원의 관점에 접근할 수 있다
(전사적 관점) 데이 주기 조직적(Ovum 1998). 또 다른
표준화된 서비스를 제공한다는 장점이 있습니다. 주기 를 통해
즉, 버전이 하나만 있음을 의미합니다.
dw 예금에 사용되는 각 용어에 대한 정의
(저장소) 메타데이터(Flanagan 및 Safdie 1997, Ovum 1998). 그만큼
반면에 이 접근 방식의 단점은 비용이 많이 들고 어렵다는 것입니다.
건설될 예정입니다(Flanagan 및 Safdie 1997, Ovum 1998, Inmon et al.
1998). 스토리지 아키텍처가 나온 지 얼마 지나지 않아 주기
중앙 집중화가 대중화되면서 추출의 개념이 진화했습니다.
가장 작은 부분 집합 중 주기 의 요구를 지원하기 위해
특정 애플리케이션(Varney 1996, IDC 1997, Berson 및 Smith
1997, 공작 1998). 이러한 작은 시스템은 더 많은 것에서 파생됩니다.
데이터웨어 하우스 중앙 집중식. 데이트라고 부르는데
종속 부서별 창고 또는 종속 데이터 마트.
종속 데이터 마트 아키텍처는 다음과 같이 알려져 있습니다.
첫 번째 계층이 데이터로 구성되는 3계층 아키텍처
중앙 집중식 창고, 두 번째 창고는 창고로 구성됩니다. 주기
부서별, 세 번째는 다음에 대한 액세스로 구성됩니다. 주기 그리고 도구 중에서
분석(Demarest 1994, Inmon et al. 1997).
데이터 마트는 일반적으로 이후에 구축됩니다. 데이터웨어 하우스
중앙 집중식은 다음의 요구 사항을 충족하도록 구축되었습니다.
특정 단위(White 1995, Varney 1996).
데이터 마트에는 다음과 같은 정보가 저장됩니다. 주기 특정 사항과 매우 관련이 있음
화합(Inmon et al. 1997, Inmon et al. 1998, IA 1998).
이 방법의 장점은 문제가 발생하지 않는다는 것입니다. 데이터 X
통합되었고 나는 주기 데이터 내에서 덜 중복됩니다.
마트부터 주기 그들은 창고에서 왔어요 주기 통합.
또 다른 장점은 각각의 연결이 거의 없다는 것입니다.
데이터 마트 및 관련 소스 주기 각 데이터 마트에는
~의 근원 주기. 또한 이 아키텍처를 사용하면 사용자는
결승전에서는 계속해서 개요에 액세스할 수 있습니다. 주기
기업 조직. 이 방법은 다음과 같이 알려져 있습니다.
데이터 이후에 데이터 마트를 구축하는 하향식 방식
창고(peacock 1998, Goff 1998).
결과를 조기에 표시해야 할 필요성이 증가하고 일부
조직은 독립적인 데이터 마트를 구축하기 시작했습니다.
(Flanagan과 Safdie 1997, White 2000). 이 경우 데이터 마트
그들은 그들의 것을 가져간다 주기 바로 기본부터 주기 OLTP가 아닌
중앙 집중식 통합 스토리지로 인해 별도의 스토리지가 필요하지 않습니다.
현장에 중앙 저장소가 있습니다.
각 데이터 마트에는 해당 소스에 대한 링크가 하나 이상 필요합니다.
di 주기. 각 날짜에 대해 여러 링크를 갖는 것의 한 가지 단점
mart는 이전의 두 아키텍처와 비교하여
과잉 주기 크게 증가합니다.
각 데이터 마트는 모든 데이터를 저장해야 합니다. 주기 현지에서 요청한
OLTP 시스템에는 영향을 미치지 않습니다. 이로 인해 나는 주기
그것들은 서로 다른 데이터 마트에 저장됩니다(Inmon et al. 1997).
이 아키텍처의 또 다른 단점은
데이터 마트와 그 사이의 복잡한 상호 연결 생성
출처 주기 실행 및 통제가 어려운 것(Inmon ed)
다른 사람. 1997).
또 다른 단점은 최종 사용자가 전원을 공급할 수 없다는 것입니다.
다음과 같이 회사 정보 개요에 액세스합니다. 주기
다양한 데이터 마트가 통합되지 않았습니다(Ovum 1998).
또 다른 단점은 둘 이상이 있을 수 있다는 것입니다.
생성되는 데이터 마트에 사용되는 각 용어에 대한 정의
불일치 주기 조직에서 (Ovum 1998).
위에서 설명한 단점에도 불구하고 독립 데이터 마트
이는 여전히 많은 조직의 관심을 끌고 있습니다(IDC 1997).
그들을 매력적으로 만드는 한 가지 요인은 개발이 더 빠르다는 것입니다.
시간과 자원이 덜 필요합니다(Bresnahan 1996, Berson e
스미스 1997, Ovum 1998). 따라서 주로 서비스를 제공합니다.
식별하는 데 사용할 수 있는 테스트 프로젝트로
프로젝트의 이점 및/또는 불완전성을 신속하게 파악합니다(Parsaye
1995년, 브라이 1995년, 뉴잉 1996년). 이 경우,
파일럿 프로젝트에서 구현하는 것은 작지만 중요해야 합니다.
조직을 위해(Newing 1996, Mansell-Lewis 1996).
프로토타입을 검토함으로써 최종 사용자와 관리자는 다음을 수행할 수 있습니다.
프로젝트를 계속할지 중단할지 결정합니다(Flanagan 및 Safdie
1997).
계속 결정한다면 다른 분야의 데이터 마트
한 번에 하나씩 구축해야 합니다. 에는 두 가지 옵션이 있습니다.
데이터 구성에 대한 요구 사항을 기반으로 최종 사용자
독립형 매트릭스: 통합/연합 및 비통합(Ovum
1998)
첫 번째 방법에서는 각각의 새로운 데이터 마트를 구축해야 합니다.
현재 데이터 마트 및 모델을 기반으로 주기 사용
회사에 의해(Varney 1996, Berson 및 Smith 1997, Peacock 1998).
모델 사용의 필요성 주기 회사에서 필요하다고 해서
각 용어에 대해 하나의 정의만 있는지 확인하세요.
이는 데이터 마트를 통해 사용되며, 이는 또한 데이터가
여러 마트를 병합하여 개요를 제공할 수 있습니다.
기업 정보(Bresnahan 1996). 이 방법은
상향식이라고 하며 제약이 있을 때 가장 좋습니다.
재정적 수단과 시간(Flanagan and Safdie 1997, Ovum 1998,
공작 1998, Goff 1998). 두 번째 방법은 데이터 마트
구축된 제품은 특정 유닛의 요구 사항만 충족할 수 있습니다.
연합 데이터 마트의 변형은 데이터웨어 하우스 분산
어느 데이터베이스 허브 서버 미들웨어는 많은 서버에 참여하는 데 사용됩니다.
단일 저장소의 데이터 마트 주기 배포됨(White 1995). ~ 안에
이 경우는 내가 주기 회사는 여러 데이터 마트에 분산되어 있습니다.
최종 사용자 요청은 다음으로 전달됩니다. 데이터베이스
모든 정보를 추출하는 서버 허브 미들웨어 주기 데이터에서 요청한
마트를 실행하고 결과를 최종 사용자 애플리케이션에 반환합니다. 이것
방법은 최종 사용자에게 비즈니스 정보를 제공합니다. 하지만,
데이터 마트의 문제는 아직 해결되지 않았습니다.
독립적인. 사용할 수 있는 또 다른 아키텍처가 있습니다.
~을 부르다 데이터웨어 하우스 가상(화이트 1995). 그러나 이
그림 2.9에 설명된 아키텍처는 아키텍처가 아닙니다.
저장의 주기 실제 부하를 움직이지 않기 때문에
OLTP 시스템부터 데이터웨어 하우스 (데마레스트 1994).
실제로 요청사항은 주기 최종 사용자가 다음으로 전달했습니다.
처리 후 결과를 반환하는 OLTP 시스템
사용자 요청. 이 아키텍처는 사용자에게
보고서를 생성하고 요청을 공식화하기 위한 최종 결정은 i를 제공할 수 없습니다.
주기 회사 정보의 역사 및 개요 주기
다른 OLTP 시스템의 시스템은 통합되지 않습니다. 그래서 이것은
아키텍처는 분석을 만족시킬 수 없습니다. 주기 와 같은 복합체
예시 예측.
액세스 및 액세스 애플리케이션 선택
회복 주기
건물을 짓는 목적 데이터웨어 하우스 전송하는 것이다
최종 사용자에게 정보 제공(Inmon et al 1997, Poe 1996,
McFadden 1996, Shanks et al 1997, Hammergren 1998); 하나 또는
다중 액세스 및 복구 애플리케이션 주기 제공되어야 합니다. 에게
오늘날 사용자가 선택할 수 있는 다양한 애플리케이션이 있습니다.
선택하십시오(Hammergren 1998, Humphries et al. 1999). 그만큼
선택된 애플리케이션이 노력의 성공을 결정합니다
저장의 주기 조직에서는
애플리케이션은 가장 눈에 띄는 부분입니다. 데이터웨어 하우스 사용자에게
최종(Inmon et al. 1997, Poe 1996). 데이트에 성공하려면
창고는 분석 활동을 지원할 수 있어야 합니다. 주기
최종 사용자의 (Poe 1996, Seddon 및 Benjamin 1998, Eckerson
1999). 따라서 최종 사용자가 원하는 "수준"은 다음과 같아야 합니다.
확인됨(Poe 1996, Mattison 1996, Inmon et al 1997,
Humphries 등 1999).
일반적으로 최종 사용자는 세 가지로 분류할 수 있습니다.
범주: 경영진 사용자, 비즈니스 분석가 및 고급 사용자(Poe
1996, Humphries et al. 1999). 경영진 사용자에게 필요한 것
사전 정의된 보고서 세트에 쉽게 액세스(Humphries ed
기타 1999). 이러한 보고서는 다음을 통해 쉽게 얻을 수 있습니다.
메뉴 탐색(Poe 1996). 또한 보고서는
그래픽 표현을 사용하여 정보 제시
테이블과 템플릿 등을 빠르게 전송할 수 있습니다.
정보(Humphries et al. 1999). 그렇지 않은 비즈니스 분석가
그들은 관계를 발전시킬 수 있는 기술적인 가능성을 가질 수 있습니다.
0인 경우 현재 관계를 다음과 같이 수정할 수 있어야 합니다.
특정 요구 사항을 충족합니다(Poe 1996, Humphries et al
1999). 반면에 고급 사용자는 다음과 같은 최종 사용자 유형입니다.
요청과 보고서를 생성하고 작성할 수 있는 능력이 있어야 합니다.
1996(Poe 1999, Humphries et al. XNUMX). 그들은 바로 그 사람들이다.
다른 유형의 사용자를 위한 보고서 개발(Poe 1996, Humphries
및 기타 1999).
최종 사용자 요구 사항이 결정되면 완료되어야 합니다.
다양한 액세스 및 복구 애플리케이션 주기 그중에서
이용 가능한 것(Poe 1996, Inmon et al. 1997).
액세스 주기 검색 도구는 다음과 같습니다.
OLAP 도구, EIS/DSS 도구, 쿼리 도구, 4가지 유형으로 분류됩니다.
보고 및 데이터 마이닝 도구.
OLAP 도구를 사용하면 사용자는 임시 쿼리를 생성할 수 있을 뿐만 아니라
만든 것 데이터베이스데이터웨어 하우스. 게다가 이 제품들
사용자가 드릴다운할 수 있도록 허용 주기 그런 사람들에게는 일반적인
상세한.
EIS/DSS 도구는 "가상" 분석으로 경영진 보고를 제공합니다.
메뉴로 구성된 보고서에 액세스할 수 있습니다. 보고서는 다음과 같아야 합니다.
더 쉬운 탐색을 위해 사전 정의되고 메뉴와 병합되었습니다.
쿼리 및 보고 도구를 통해 사용자는 보고서를 생성할 수 있습니다.
미리 정의되고 구체적입니다.
데이터 마이닝 도구는 다음과 같은 관계를 식별하는 데 사용됩니다.
잊혀진 작전에 새로운 빛을 밝힐 수 있다 주기
데이터웨어 하우스.
각 유형의 사용자 요구 사항을 최적화하는 것 외에도
선택한 도구는 직관적이고 효율적이며 사용하기 쉬워야 합니다.
또한 아키텍처의 다른 부분과도 호환되어야 합니다.
기존 시스템과 함께 작업할 수 있습니다. 또한 다음과 같이 제안됩니다.
가격과 성능을 갖춘 데이터 액세스 및 검색 도구 선택
합리적인. 고려해야 할 다른 기준에는
제품 및 개발을 지원하는 도구 공급업체
향후 릴리스에서도 마찬가지입니다. 사용자 참여를 보장하기 위해
데이터 웨어하우스를 사용할 때 개발팀은 다음을 포함합니다.
도구 선택 과정에 있는 사용자. 이 경우
실질적인 사용자 평가가 수행되어야 합니다.
데이터 웨어하우스의 가치를 향상시키기 위해 개발팀은 다음을 수행할 수 있습니다.
또한 데이터 웨어하우스에 대한 웹 액세스를 제공합니다. ㅏ
웹 기반 데이터 웨어하우스를 통해 사용자는 주기
먼 곳에서 또는 여행 중에. 게다가 정보는
원가 절감을 통해 보다 저렴하게 제공됩니다.
디 훈련.
2.4.3 데이터웨어 하우스 운영 단계
이 단계는 세 가지 활동으로 구성됩니다. 날짜 전략 정의
새로 고침, 데이터 웨어하우스 활동 제어 및 관리
데이터 웨어하우스 보안.
데이터 새로 고침 전략의 정의
초기 로딩 후, 주기 nel 데이터베이스 데이터 웨어하우스의
재생하려면 주기적으로 새로 고쳐야 합니다.
변경사항 주기 원본. 그러므로 우리는 결정해야 합니다.
새로 고침 시기, 빈도
새로 고침 및 새로 고치는 방법 주기. 다음을 수행하는 것이 좋습니다.
새로 고침 데이 주기 시스템을 오프라인으로 전환할 수 있는 경우. 거기
재생률은 개발팀에서 결정합니다.
사용자 요구 사항에 따라. 새로 고치는 방법에는 두 가지가 있습니다.
데이터 웨어하우스: 전체 새로 고침 및 지속적인 로드
변화.
첫 번째 접근 방식인 전체 새로 고침에는 다시 로드가 필요합니다.
모든 주기 기스로부터. 이는 모든 주기 필수 필수
새로 고칠 때마다 추출, 정리, 변환 및 통합됩니다. 이것
접근은 가능한 한 피해야 한다.
많은 시간과 자원이 필요합니다.
또 다른 접근 방식은 i를 지속적으로 로드하는 것입니다.
변화. 이것은 내가 추가한다 주기 변경된 것
마지막 데이터 웨어하우스 새로 고침 주기 이후. 식별
새로운 기록이나 수정된 ​​기록으로 인해 기록의 양이 크게 줄어듭니다.
주기 이는 각각의 데이터 웨어하우스에 전파되어야 합니다.
이것만 업데이트 주기 에 추가됩니다 데이터베이스
데이터 웨어하우스의.
철회에 사용할 수 있는 접근 방식은 최소한 5가지가 있습니다.
i 주기 새롭거나 수정되었습니다. 효율적인 전략을 얻으려면
새로 고침 데이 주기 이러한 접근 방식을 혼합하면 유용할 수 있습니다.
시스템의 모든 변경 사항을 선택합니다.
타임스탬프를 사용하는 첫 번째 접근 방식은 다음과 같이 가정합니다.
모두에게 할당됨 주기 타임스탬프를 편집하고 업데이트했습니다.
모두 쉽게 알아볼 수 있도록 주기 수정되고 새로워졌습니다.
그러나 이 접근법은 대부분의 국가에서 널리 사용되지 않았습니다.
오늘날 운영 체제의 일부입니다.
두 번째 접근 방식은 다음에서 생성된 델타 파일을 사용하는 것입니다.
다음에 대한 변경 사항만 포함하는 응용 프로그램 주기.
이 파일을 사용하면 업데이트 주기도 증폭됩니다.
그러나 이 방법조차 많은 국가에서는 사용되지 않았다.
응용 프로그램.
세 번째 접근 방식은 로그 파일을 스캔하는 것입니다.
기본적으로 델타 파일과 유사한 정보가 포함되어 있습니다. 유일한 사람
차이점은 복구 프로세스에 대해 로그 파일이 생성된다는 점과
이해하기 어려울 수 있습니다.
네 번째 접근 방식은 애플리케이션 코드를 수정하는 것입니다.
그러나 대부분의 애플리케이션 코드는 오래되었으며
부서지기 쉬운; 그러므로 이 기술은 피해야 합니다.
마지막 접근법은 비교이다. 주기 파일이 있는 소스
주요 주기.
데이터 웨어하우스 활동 제어
데이터 웨어하우스가 사용자에게 공개되면
시간이 지남에 따라 모니터링하는 것이 필요합니다. 이 경우 관리자는
데이터 웨어하우스는 하나 이상의 관리 도구를 사용할 수 있으며
데이터 웨어하우스의 사용을 모니터링하는 제어입니다. 특히
사람과 날씨에 대한 정보를 수집할 수 있습니다.
데이터 웨어하우스에 액세스합니다. 어서 해봐요 주기 작물을 만들 수 있다
입력으로 사용할 수 있는 수행된 작업의 프로필
사용자 지불 거절을 구현하는 중입니다. 지불 거절
사용자에게 처리 비용에 대한 정보를 제공합니다.
데이터웨어 하우스.
또한 데이터 웨어하우스 제어를 다음 용도로 사용할 수도 있습니다.
쿼리 유형, 크기, 쿼리 수 식별
일, 쿼리에 대한 응답 시간, 도달한 섹터 및 수량
di 주기 처리됨. 점검을 하는 또 다른 목적
데이터 웨어하우스는 주기 사용되지 않는 것입니다. 이것들 주기
시간을 단축하기 위해 데이터 웨어하우스에서 제거할 수 있습니다.
쿼리 실행 응답의 증가를 모니터링하고
주기 내에 거주하는 데이터베이스 데이터 웨어하우스의.
데이터 웨어하우스 보안 관리
데이터 웨어하우스에는 다음이 포함됩니다. 주기 통합된, 중요한, 민감한
쉽게 도달할 수 있습니다. 이러한 이유로
승인되지 않은 사용자로부터 보호됩니다. 한 가지 방법은
보안 구현은 del 함수를 사용하는 것입니다. DBMS
다양한 유형의 사용자에게 다양한 권한을 할당합니다. 이에
즉, 각 유형의 사용자에 대해 프로필을 유지해야 합니다.
입장. 데이터 웨어하우스를 보호하는 또 다른 방법은 데이터 웨어하우스를 암호화하는 것입니다.
에 쓰여 있는 대로 데이터베이스 데이터 웨어하우스의. 액세스
주기 검색 도구는 주기 제출하기 전에 나는
사용자에게 결과를 제공합니다.
2.4.4 데이터웨어 하우스 배포 단계
이는 데이터 웨어하우스 구현 주기의 마지막 단계입니다. 그만큼
이 단계에서 수행할 활동에는 다음과 같은 교육이 포함됩니다.
사용자는 데이터 웨어하우스를 사용하고 리뷰를 작성합니다.
데이터 웨어하우스의.
사용자 교육
사용자 교육이 먼저 이루어져야 합니다
에 대한 액세스 주기 데이터 웨어하우스 및 도구 사용
검색. 일반적으로 세션은 다음으로 시작해야 합니다.
저장의 개념을 소개합니다. 주기
데이터 웨어하우스의 콘텐츠, AI 메타 주기 그리고 기본 기능
도구의. 그런 다음 고급 사용자도 연구할 수 있습니다.
데이터 액세스 및 도구의 물리적 테이블과 사용자 기능
검색.
사용자 교육을 수행하는 방법에는 여러 가지가 있습니다. 다음 중 하나
여기에는 특정 사용자 또는 분석가가 선택한 다수의 사용자 또는 분석가가 포함됩니다.
리더십과 능력을 기반으로 한 사용자 그룹
의사소통. 이들은 개인적인 능력으로 훈련을 받았습니다.
그들이 익숙해지기 위해 알아야 할 모든 것
체계. 훈련이 끝나면 다시 본업으로 돌아가서
그들은 다른 사용자에게 시스템 사용 방법을 가르치기 시작합니다. 에
배운 내용을 바탕으로 다른 사용자가 시작할 수 있습니다.
데이터 웨어하우스를 탐색해 보세요.
또 다른 접근 방식은 동일한 환경에서 많은 사용자를 교육하는 것입니다.
마치 교실 수업을 듣는 것처럼 시간이 걸립니다. 이 방법
교육이 필요한 사용자가 많을 때 적합합니다.
동시에. 또 다른 방법은 훈련이다.
각 사용자를 개별적으로 하나씩. 이 방법은
사용자가 적을 때 적합합니다.
사용자 교육의 목적은 사용자에게 익숙해지는 것입니다.
액세스할 수 있는 주기 검색 도구와 내용
데이터웨어 하우스. 그러나 일부 사용자는 압도당할 수 있습니다.
세션 중에 제공된 정보의 양에 따라
훈련. 그래서 특정 수의 작업을 수행해야 합니다.
대응을 위한 지속적인 지원 및 재교육 세션
구체적인 질문에. 어떤 경우에는 그룹이 형성됩니다.
사용자는 이러한 유형의 지원을 제공합니다.
피드백 수집
데이터 웨어하우스가 출시되면 사용자는 다음을 수행할 수 있습니다.
내가 사용 주기 다양한 목적으로 데이터 웨어하우스에 상주하는 데이터입니다.
대부분 분석가나 사용자는 i를 사용합니다. 주기 nel
다음을 위한 데이터 웨어하우스:
1 기업 동향 파악
2 구매 프로필을 분석합니다. 고객
3 나누기 i 고객
4 최고의 서비스를 제공합니다 고객 – 맞춤형 서비스
5 전략 수립 마케팅
6 비용 분석 및 도움을 위한 경쟁력 있는 견적 제공
제어
7 전략적 의사결정 지원
8 눈에 띌 수 있는 기회를 파악하세요
9 현재 비즈니스 프로세스의 품질을 향상시킵니다.
10 수익을 확인하세요
데이터 웨어하우스의 개발 방향에 따라
피드백을 얻기 위해 일련의 시스템 검토를 수행합니다.
개발팀과 커뮤니티 모두로부터
최종 사용자.
얻은 결과는 다음 사항에 고려될 수 있습니다.
다음 개발 주기.
데이터 웨어하우스는 증분 방식을 사용하므로
이전 사람들의 성공과 실수로부터 배우는 것이 중요합니다.
개발.
2.5 요약
이 장에서는 현재의 접근 방식이 논의되었습니다.
문학. 1부에서는 개념을 다루었습니다.
데이터 웨어하우스와 의사결정 과학에서의 역할. 에서
섹션 2 사이의 주요 차이점
데이터 웨어하우스 및 OLTP 시스템. 섹션 3에서 우리는 다음에 대해 논의했습니다.
사용된 Monash 데이터 웨어하우스 모델
섹션 4에서는 프로세스와 관련된 활동을 설명합니다.
데이터 웨어하우스 개발에 관한 이 논문은 다음을 기반으로 하지 않았습니다.
엄격한 연구. 현실에서 일어날 수 있는 일은
문헌에 보고된 것과는 매우 다르지만,
결과는 다음과 같은 기본 수하물을 만드는 데 사용될 수 있습니다.
본 연구에서는 데이터 웨어하우스의 개념을 강조합니다.
3 장
연구 및 설계 방법
이 장에서는 다음과 같은 연구와 설계 방법을 다룬다.
이 연구. 첫 번째 부분은 메소드의 일반적인 보기를 보여줍니다.
또한 정보 검색에 사용할 수 있는 연구의 수
가장 좋은 방법을 선택하는 기준이 논의됩니다.
특별한 공부. 두 가지 방법은 섹션 2에서 논의됩니다.
방금 설정한 기준에 따라 선택되었습니다. 이 중 선택될 것이며
섹션 3에 명시된 이유에 따라 채택되었습니다.
다른 기준을 제외하는 이유도 설명됩니다. 거기
섹션 4에서는 연구 설계를 제시하고 섹션 5에서는 이를 제시합니다.
결론.
3.1 정보시스템 연구
정보시스템 연구는 단순히 제한되지 않습니다
기술 분야로 확장되어야 하지만 다음을 포함하도록 확장되어야 합니다.
행동과 조직에 관한 목표.
우리는 이것을 다음과 같은 다양한 학문 분야의 논문에 빚지고 있습니다.
사회과학에서 자연과학까지; 이는 다음의 필요성으로 이어진다.
정량적 방법을 포함하는 특정 범위의 연구 방법
정보 시스템에 사용될 질적인 것.
사용 가능한 모든 연구 방법이 중요합니다. 실제로 여러 가지
Jenkins(1985), Nunamaker et al. (1991) 및 갤러리어스
(1992)은 특정한 보편적인 방법이 없다고 주장합니다.
정보 시스템의 다양한 분야에 대한 연구를 수행합니다. 물론
어떤 방법이 특정 연구에는 적합할 수도 있지만 그렇지 않을 수도 있습니다.
다른 사람들을 위해. 이로 인해 우리는 다음과 같은 방법을 선택해야 합니다.
우리의 특정 연구 프로젝트에 적합합니다.
선택 Benbasat et al. (1987)은 그것들이 고려되어야 한다고 말합니다.
연구의 성격과 목적.
3.1.1 연구의 성격
연구의 성격에 따라 다양한 방법이 가능
과학계에서 널리 알려진 세 가지 전통으로 분류됨
정보: 실증주의적, 해석적, 비판적 연구.
3.1.1.1 실증주의 연구
실증주의 연구는 과학적 연구 또는 과학적 연구라고도 알려져 있습니다.
경험적. 그것은 다음을 시도합니다: “세계에서 무슨 일이 일어날지 설명하고 예측합니다.
규칙성과 인과관계를 살펴봄으로써 사회 세계
그것을 구성하는 요소 중 하나입니다”(Shanks et al 1993).
실증주의 연구는 또한 반복성을 특징으로 합니다.
단순화와 반박. 게다가 실증주의 연구에서는 다음과 같이 인정합니다.
연구된 현상들 사이에 선험적 관계가 존재합니다.
Galliers(1992)에 따르면 분류학은 연구 방법입니다.
실증주의 패러다임에 포함되지만 이에 국한되지는 않습니다.
실제로 실험실 실험, 현장 실험,
사례 연구, 정리 증명, 예측 및 시뮬레이션.
연구자들은 이러한 방법을 사용하여 현상이 다음과 같다는 것을 인정합니다.
객관적이고 엄격하게 관찰할 수 있습니다.
3.1.1.2 해석적 연구
흔히 현상학 또는 현상학이라고 불리는 해석적 연구
반실증주의는 Neuman(1994)에 의해 “분석”으로 설명됩니다.
직접적이고 직접적인 방법을 통해 행위의 사회적 의미를 체계화하는 것
자연 상황에 있는 사람들을 자세히 관찰하기 위해
방법에 대한 이해와 해석에 도달한다.
사람들은 자신의 사회적 세계를 창조하고 유지한다." 연구
해석 방법은 관찰된 현상이 다음과 같은 가정을 거부합니다.
객관적으로 관찰할 수 있습니다. 실제로 그들은 기반
주관적인 해석에 대해 게다가 해석적 연구자들은 그렇지 않다.
그들은 자신이 연구하는 현상에 선험적 의미를 부여합니다.
이 방법에는 주관적/논증적 연구,
연구, 설명/해석 연구, 미래 연구 및 게임
역할. 이러한 조사 및 사례 연구 외에도
이 접근 방식에는 다음 연구와 관련이 있으므로 포함됩니다.
복잡한 상황에 처한 개인이나 조직
현실 세계의.
3.1.1.3 비판적 연구
비판적 탐구는 과학에서 가장 잘 알려지지 않은 접근 방식입니다.
사회적이지만 최근 연구자들로부터 주목을 받았습니다.
정보 시스템 분야에서. 철학적 가정은
사회적 현실은 역사적으로 사람들에 의해 생산되고 재생산되며,
행동과 상호 작용이 있는 사회 시스템도 마찬가지입니다. 그들의
그러나 능력은 어느 정도의 고려에 의해 조정됩니다.
사회적, 문화적, 정치적.
해석적 연구와 마찬가지로 비판적 연구도 다음과 같이 주장합니다.
실증주의 연구는 사회적 맥락과 아무 관련이 없으며 이를 무시합니다.
인간의 행동에 미치는 영향.
반면 비판적 연구는 해석적 연구를 비판한다.
너무 주관적이며 도움을 주려는 목적이 없기 때문에
사람들은 자신의 삶을 개선하기 위해 노력합니다. 와 가장 큰 차이점은
비판적 연구와 다른 두 가지 접근 방식은 평가 차원입니다.
실증주의와 해석적 전통의 객관성은 다음과 같다.
현 상태나 사회적 현실을 예측하거나 설명하는 비판적 연구
근본적인 사회 현실을 비판적으로 평가하고 변화시키는 것을 목표로 합니다.
사진관.
비판적인 연구자들은 일반적으로 현상 유지에 반대합니다.
사회적 차이를 제거하고 사회적 조건을 개선합니다. 거기
비판적 연구는 과정적 관점을 지향합니다.
관심 있는 현상이므로 일반적으로 종단적입니다.
연구 방법의 예로는 장기간의 역사 연구와
민족지학 연구. 그러나 비판적 연구는 이루어지지 않았다.
정보 시스템 연구에 널리 사용됨
3.1.2 연구의 목적
검색의 성격과 함께 그 목적도 사용될 수 있습니다.
연구자가 특정 방법을 선택하도록 안내하기 위해
연구. 연구 프로젝트의 목적은 밀접하게 관련되어 있습니다.
다음으로 구성된 검색 주기를 기준으로 검색 위치에
세 단계: 이론 구축, 이론 테스트, 이론 개선
이론. 따라서 검색 주기에 대한 모멘텀을 기반으로
연구 프로젝트는 설명적, 설명적, 목적을 가질 수 있습니다.
탐구적이거나 예측적이다.
3.1.2.1 탐색적 연구
탐색적 연구는 주제를 조사하는 것을 목표로 합니다.
완전히 새롭고 연구 질문과 가설을 공식화합니다.
미래. 이러한 유형의 연구는 다음을 구축하는 데 사용됩니다.
새로운 영역에서 초기 참조를 얻는 이론.
일반적으로 사례 등 질적 연구 방법을 사용합니다.
연구 또는 현상학적 연구.
그러나 다음과 같은 정량적 기법을 사용하는 것도 가능합니다.
탐색적 조사나 실험.
3.1.3.3 서술적 연구
서술적 연구는 많은 부분을 분석하고 기술하는 것을 목표로 합니다.
특정 상황이나 조직 관행을 자세히 설명합니다. 이것
이론 구축에 적합하며 다음 용도로도 사용할 수 있습니다.
가설을 확인하거나 이의를 제기합니다. 일반적으로 서술적 연구
측정 및 샘플 사용이 포함됩니다. 가장 적합한 연구 방법
선행 사건에 대한 조사와 분석이 포함됩니다.
3.1.2.3 설명적 연구
설명적 연구는 일이 일어나는 이유를 설명하려고 합니다.
이미 연구된 사실을 바탕으로 작성되었으며 이를 찾으려고 노력하고 있습니다.
이러한 사실의 이유.
따라서 설명적 연구는 일반적으로 연구를 기반으로 이루어집니다.
탐색적이거나 설명적이며 테스트 및 개선에 부수적입니다.
이론. 설명적 연구는 일반적으로 사례 연구를 사용합니다.
또는 설문 조사 기반 연구 방법.
3.1.2.4 예방 연구
예방 연구는 사건과 행동을 예측하는 것을 목표로 합니다.
연구 중인 관찰 중(Marshall과 Rossman)
1995). 예측은 진실에 대한 표준적인 과학적 테스트입니다.
이러한 유형의 연구는 일반적으로 설문조사나 분석을 사용합니다.
주기 역사가. (인 1989)
위의 논의는 여러 가지가 있음을 보여줍니다.
연구에 사용될 수 있는 가능한 연구 방법
특정한. 하지만 더 적합한 구체적인 방법이 있어야 합니다.
특정 유형의 연구 프로젝트에 대한 기타 정보. (갤리어스
1987, Yin 1989, De Vaus 1991). 그러므로 모든 연구자는
강점과 약점을 면밀히 평가해야 한다.
가장 적합한 연구 방법을 채택하기 위해 다양한 방법 e
연구 프로젝트와 호환됩니다. (Jenkins 1985, Pervan 및 Klass
1992, Bonomia 1985, Yin 1989, Himilton 및 Ives 1992).
3.2. 가능한 연구 방법
이 프로젝트의 목표는 다음과 같은 경험을 연구하는 것이었습니다.
나와 함께하는 호주 단체 주기 하나로 저장
개발 데이터웨어 하우스. 다토 현재 하나가 있습니다.
호주의 데이터 웨어하우징 분야에 대한 연구가 부족합니다.
이 연구 프로젝트는 아직 주기의 이론적인 단계에 있습니다.
연구하고 탐구 목적을 가지고 있습니다. 경험 탐구
데이터 웨어하우징을 채택한 호주 조직
현실 사회에 대한 해석이 필요하다. 결과적으로,
연구 프로젝트의 기초가 되는 철학적 가정은 다음과 같습니다.
전통적인 해석.
사용 가능한 방법을 엄격하게 조사한 후 확인되었습니다.
가능한 두 가지 연구 방법: 설문조사와 사례 연구
(사례 연구), 연구에 사용될 수 있음
탐색적이다(Shanks et al. 1993). Galliers(1992)는 다음과 같이 주장합니다.
이 특정 연구에 대한 이 두 가지 방법의 적합성
건축에 적합하다고 개정된 분류
이론적 인. 다음 두 하위 섹션에서는 각 방법에 대해 설명합니다.
세부 사항.
3.2.1 설문 조사 방법
측량 조사 방법은 고대의 방법에서 유래합니다.
인구 조사. 인구조사는 다음으로부터 정보를 수집하는 것으로 구성됩니다.
전체 인구. 이 방법은 비용이 많이 들고 비실용적입니다.
특히 인구가 많은 경우에는 더욱 그렇습니다. 그래서 비교하면
인구조사에서 설문조사는 일반적으로 다음 사항에 초점을 맞춥니다.
소수 또는 샘플에 대한 정보를 수집합니다.
인구의 대표자(Fowler 1988, Neuman 1994). ㅏ
표본은 표본이 추출된 모집단을 다양한 방식으로 반영합니다.
샘플 구조에 따라 정확도 수준은
사용된 크기와 선택 방법(Fowler 1988, Babbie
1982, 노이만 1994).
조사 방법은 "실천의 스냅샷,
특정 시점의 상황이나 견해를 사용하여 수행
추론이 가능한 설문지나 인터뷰
만든”(Galliers 1992:153) [실습의 즉석 사진,
특정 시점의 상황이나 견해를 사용하여 수행됨
추론을 할 수 있는 설문지나 인터뷰]. 그만큼
조사는 특정 측면에 대한 정보 수집을 다룹니다.
연구의 특정 수의 참가자에 의해
질문(Fowler 1988). 이런 설문조사와 인터뷰조차도
대면 전화 인터뷰와 구조화된 인터뷰를 포함하며,
수집기술이다. 주기 에서 가장 일반적으로 사용되는
조사 (Blalock 1970, Nachmias 및 Nachmias 1976, Fowler
1988) 관찰과 분석이 사용될 수 있다(Gable
1994). 이 모든 수집 방법 중에서 주기,의 사용
설문지는 가장 널리 사용되는 기술입니다. 주기
수집된 정보는 구조화되고 형식화되어 있으므로
정보 분류(Hwang 1987, de Vaus 1991).
나 분석할 때 주기, 조사 전략은 종종 다음을 사용합니다.
통계 분석과 같은 정량적 기술을 사용할 수 있지만
질적 기법도 사용됩니다(Galliers 1992, Pervan
및 Klass 1992, Gable 1994). 평소에는 나는 주기 수집된 것은
연관성의 분포와 패턴을 분석하는 데 사용됩니다.
(파울러 1988).
설문조사는 일반적으로 연구에 적합하지만
그것은 '무엇?'이라는 질문을 다룬다. (무엇) 아니면 그것에서
'얼마나', '얼마나' 등을 파생한다.
'왜' 질문을 통해 질문할 수 있습니다(Sonquist 및
Dunkelberg 1977, Yin 1989). Sonquist와 Dunkelberg에 따르면
(1977), 연구 조사는 어려운 가설, 프로그램을 목표로 합니다.
평가, 인구 설명 및 모델 개발
인간 행동. 추가적으로 설문조사를 사용할 수도 있습니다.
인구, 조건,
의견, 특성, 기대, 심지어 과거의 행동까지도
또는 현재(Neuman 1994).
조사를 통해 연구자는 두 요소 사이의 관계를 발견할 수 있습니다.
모집단과 결과는 일반적으로 다음보다 더 일반적입니다.
다른 방법(Sonquist 및 Dunkelberg 1977, Gable 1994). 그만큼
설문조사를 통해 연구자는 지리적 영역을 다룰 수 있습니다.
더 광범위하고 많은 선언자에게 도달할 수 있습니다(Blalock 1970,
Sonquist와 Dunkelberg 1977, Hwang과 Lin 1987, Gable 1994,
노이먼(1994)). 마지막으로 설문조사는 정보를 제공할 수 있습니다.
다른 곳에서는 구할 수 없거나 분석에 필요한 형태로 제공되지 않는 것
(파울러 1988).
그러나 설문조사를 수행하는 데에는 몇 가지 제한 사항이 있습니다. 하나
단점은 연구자가 많은 정보를 얻을 수 없다는 것이다.
연구 대상에 관해. 이는 다음과 같은 사실 때문입니다.
조사는 특정 시간에만 수행되므로
연구자가 조사할 수 있는 변수와 사람의 수가 제한되어 있습니다.
연구(Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
또 다른 단점은 설문조사를 실행하는 것이
시간과 리소스 측면에서 매우 비용이 많이 듭니다. 특히 다음과 같은 경우에는 더욱 그렇습니다.
대면 인터뷰가 포함됩니다 (Fowler 1988).
3.2.2. 문의 조사 방법
탐구연구 방법은 다음과 같은 심층적인 연구를 포함합니다.
실제 상황 내에서 특정 상황
정해진 기간 동안 당사자의 개입 없이
연구원 (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
주로 이 방법은 사이의 관계를 설명하는 데 사용됩니다.
특정 상황에서 연구되는 변수
(갤리어스 1992). 조사에는 개별 사건이 포함될 수 있습니다.
분석된 현상에 따라 여러 배로 증가합니다(Franz and Robey 1987,
Eisenhardt 1989, Yin 1989).
탐구연구방법은 '탐구'로 정의된다.
현대의 현상을 연구하는 실증적 연구
하나 또는 여러 소스에서 수집된 여러 소스를 사용하여 상대적인 실제 컨텍스트
사람, 집단, 조직 등 다양한 실체”(Yin 1989).
현상과 그 맥락 사이에 명확한 분리가 없습니다.
변수에 대한 통제나 실험적 조작이 없습니다(Yin
1989, Benbasat 등 1987).
수집기술은 다양하다. 주기 그들이 할 수있는
다음을 포함하는 문의 방법을 사용합니다.
직접 관찰, 보관 기록 검토, 설문지,
서류 검토 및 구조화 된 인터뷰. 데
다양한 수확 기술 주기, 조사
연구자들이 두 가지 문제를 모두 다룰 수 있도록 허용 주기 질적인
동시에 수량(Bonoma 1985, Eisenhardt 1989, Yin
1989, 게이블 1994). 조사방법과 마찬가지로,
탐구 연구자는 관찰자나 연구자의 역할을 하는 것이지,
연구중인 조직에 적극적으로 참여합니다.
Benbasat et al.(1987)은 탐구 방법이 다음과 같다고 주장합니다.
특히 이론 구축 연구에 적합합니다.
연구 질문으로 시작하여 훈련을 계속하세요.
수집 과정에서의 이론 주기. 것
무대에도 어울리는
이론 구축에 관해 Franz와 Robey(1987)는 다음과 같이 제안합니다.
문의 방법은 단지에도 사용할 수 있습니다
이론 단계. 이 경우 수집된 증거를 토대로
주어진 이론이나 가설이 검증되거나 반박됩니다. 게다가 수사는
'어떻게' 또는 '어떻게' 질문을 다루는 연구에도 적합합니다.
'왜'(Yin 1989).
다른 방법과 비교하여 설문조사를 통해 연구자는 다음을 수행할 수 있습니다.
필수 정보를 더 자세히 캡처합니다(Galliers
1992, Shanks et al 1993). 또한, 조사를 통해
연구하는 과정의 성격과 복잡성을 이해하는 연구자
(벤바사트 외. 1987).
이 방법에는 네 가지 주요 단점이 있습니다.
조사. 첫 번째는 통제된 공제의 부족입니다. 거기
연구자의 주관성이 결과와 결론을 바꿀 수 있음
연구의 (Yin 1989). 두 번째 단점은 부족하다.
통제된 관찰. 실험적인 방법과는 달리,
탐구 연구자는 연구된 현상을 통제할 수 없다
자연스러운 맥락에서 조사되기 때문입니다(Gable 1994). 그만큼
세 번째 단점은 복제성이 부족하다는 것입니다. 이는 사실 때문이다
연구자가 동일한 사건을 관찰할 가능성이 없으며,
특정 연구의 결과를 확인할 수는 없습니다(Lee 1989).
마지막으로, 복제 불가능성으로 인해 어려운 작업입니다.
하나 이상의 조사에서 얻은 결과를 일반화합니다(Galliers
1992, Shanks et al 1993). 그러나 이 모든 문제는 그렇지 않습니다.
극복할 수 없으며 실제로 다음을 통해 최소화할 수 있습니다.
연구자는 적절한 조치를 취한다(Lee 1989).
3.3. 연구 방법론의 정당화
채택 된
본 연구에서는 두 가지 가능한 연구 방법 중,
조사가 가장 적합하다고 판단됩니다. 조사라는 것은
관련 항목을 신중하게 고려한 후 삭제되었습니다.
장점과 약점. 각각의 편리함이나 부적절함
본 연구의 방법은 아래에서 논의된다.
3.3.1. 연구방법의 부적절성
조사의
문의 방법은 하나에 대한 심층적인 연구가 필요합니다.
하나 이상의 조직 내 특정 상황
시기(Eisenhardt 1989). 이 경우 기간은
이 연구에 주어진 기간을 초과했습니다. 또 다른
설문조사 방식을 채택하지 않은 이유는 결과가
그들은 엄격함이 부족하여 어려움을 겪을 수 있습니다(Yin 1989). 주관
연구자의 의견이 결과와 결론에 영향을 미칠 수 있습니다. 또 다른
그 이유는 이 방법이 질문에 대한 연구에 더 적합하기 때문입니다.
'어떻게' 또는 '왜' 유형(Yin 1989), 연구 질문
이 연구에서는 '무엇' 유형에 속합니다. 마지막으로 중요한 것은
중요한 것은 한 가지 또는 한 가지 연구 결과를 일반화하기가 어렵다는 것입니다.
조사가 거의 없습니다(Galliers 1992, Shanks et al 1993). 의 기초에
이러한 합리적인 설명, 탐구의 연구방법은
본 연구에 적합하지 않아 선택하였다.
3.3.2. 검색방법의 편리성
조사
이번 연구가 진행되었을 당시 데이터 웨어하우징의 실천은
널리 채택되지는 않았으나
호주 조직. 그래서 정보가 별로 없었어요
내에서의 구현과 관련하여
호주 조직. 사용할 수 있는 정보가 나왔습니다
데이터를 구현하거나 사용한 조직으로부터
창고. 이 경우에는 설문 조사 방법이 가장 많이 사용됩니다.
그렇지 않은 정보를 얻을 수 있기 때문에 적합합니다.
다른 곳이나 분석에 필요한 형태로 이용 가능합니다(Fowler 1988).
또한, 설문 조사 방법을 통해 연구자는 다음과 같은 작업을 수행할 수 있습니다.
관행, 상황 또는
특정 시간에 볼 수 있습니다(Galliers 1992, Denscombe 1998).
증가시키기 위해서는 전체적인 시각이 필요하다.
호주 데이터 웨어하우징 경험에 대한 지식.
Sonquist와 Dunkelberg(1977)는 다음과 같은 결과를 제시합니다.
설문 조사 연구는 다른 방법보다 더 일반적입니다.
3.4. 설문조사 연구 설계
데이터 웨어하우징 관행에 대한 조사는 1999년에 수행되었습니다.

대상 집단은 조직으로 구성됨
데이터 웨어하우징 연구에 관심이 있는 호주인
아마 나에 대해 이미 알고 있었을 거야 주기 그들이 저장하는 것과,
따라서 이 연구에 유용한 정보를 제공할 수 있습니다. 거기
초기 조사를 통해 대상 인구가 확인되었습니다.
'The Data Warehousing Institute'(Tdwiaap)의 모든 호주 회원.
이 섹션에서는 연구 단계의 설계에 대해 논의합니다.
이 연구의 경험적 증거.
3.4.1. 수확 기술 주기
설문 조사 연구에 일반적으로 사용되는 세 가지 기술 중
(예: 우편 설문지, 전화 인터뷰 및 인터뷰
개인적) (Nachmias 1976, Fowler 1988, de Vaus 1991)
본 연구에서는 우편질문지를 채택하였다. 첫번째
후자를 채택하는 이유는 다음과 같은 이점을 얻을 수 있기 때문입니다.
지리적으로 분산된 인구(Blalock 1970, Nachmias e
Nachmias 1976, Hwang 및 Lin 1987, de Vaus 1991, Gable 1994).
둘째, 우편 설문지는 참가자에게 적합합니다.
교육 수준이 높습니다(Fowler 1988). 이에 대한 메일 설문지
연구는 데이터 웨어하우징 프로젝트 후원자를 대상으로 했습니다.
이사 및/또는 프로젝트 관리자. 셋째, 설문지 멀리
메일은 보안 목록이 있을 때 적합합니다.
주소 (Salant 및 Dilman 1994). TDWI, 이 경우에는 하나
신뢰할 수 있는 데이터 웨어하우징 협회에서 주소 목록 제공
호주 회원 중. 설문조사의 또 다른 장점
우편과 전화 설문지 또는 인터뷰를 통해
개인적인 점은 등록자가 더 많은 응답을 할 수 있다는 것입니다.
정확성, 특히 등록자가 상담해야 할 때
다른 사람과 메모를 하거나 질문에 대해 토론합니다(파울러
1988).
잠재적인 단점은
우편으로 설문지를 실시합니다. 일반적으로 설문지는 멀리 떨어져 있습니다.
메일은 다음 순서로 진행됩니다: 편지 보내기, 기다리기
응답하고 확인을 보냅니다(Fowler 1988, Bainbridge 1989).
따라서 총 소요시간은 소요시간보다 길어질 수 있습니다.
개인 인터뷰 또는 전화 인터뷰. 그러나, 그
총 시간을 미리 알 수 있다(Fowler 1988,
Denscombe 1998). 인터뷰 진행에 소요된 시간
개인정보는 개인정보와 다르기 때문에 미리 알 수 없습니다.
한 인터뷰에서 다른 인터뷰로(Fowler 1988). 전화 인터뷰
우편 설문조사보다 더 빠를 수 있으며,
개인면접이지만 누락률이 높을 수 있음
일부 사람들의 부재로 인한 반응(Fowler 1988).
또한 전화 인터뷰는 일반적으로 다음 목록으로 제한됩니다.
상대적으로 짧은 질문입니다(Bainbridge 1989).
메일 설문지의 또 다른 약점은 높은 응답률입니다.
반응 부족(Fowler 1988, Bainbridge 1989, Neuman
1994). 그러나 이에 대한 대책이 취해졌습니다.
데이터 분야의 신뢰할 수 있는 기관과 함께한 본 연구
창고업(예: TDWI)(Bainbridge 1989, Neuman 1994)
응답하지 않은 사람들에게 두 개의 알림 편지를 보냅니다.
(Fowler 1988, Neuman 1994) 그리고 편지도 포함되어 있습니다.
연구 목적을 설명하는 보충 자료(Neuman 1994).
3.4.2. 분석단위
본 연구의 목적은 다음과 같은 정보를 얻는 것이다.
데이터 웨어하우징 구현 및 사용
호주 조직 내. 대상 인구
호주의 모든 조직으로 구성되어 있습니다.
구현했거나 구현 중입니다. 데이터웨어 하우스. 에
그러면 개별 조직이 등록됩니다. 설문지
입양에 관심이 있는 기관에 우편으로 발송되었습니다.
di 데이터웨어 하우스. 이 방법은 정보가
수집된 정보는 각 조직의 가장 적합한 리소스에서 나옵니다.
참가자.
3.4.3. 설문조사 샘플
설문조사 참가자의 "메일링 리스트"는 다음에서 얻었습니다.
TDWI. 이 목록에서 3000개의 호주 조직
샘플링의 기준으로 선정되었습니다. ㅏ
추가 편지에는 조사 프로젝트와 목적이 설명되어 있으며,
답안지와 선불 봉투와 함께
완성된 설문지를 다시 보내 샘플로 보냈습니다.
3000개 조직 중 198개 조직이 참여하기로 동의했습니다.
공부하다. 이렇게 적은 수의 응답이 예상되었습니다. 데이터 il
당시에는 수많은 호주 조직이 있었습니다.
날짜 전략을 수용했거나 수용하고 있었습니다.
조직 내 창고 보관. 그래서
본 연구의 대상 인구는 198명으로 구성됩니다.
조직.
3.4.4. 설문지의 내용
설문지의 구조는 날짜 모델을 기반으로 했습니다.
Monash 창고 보관(이전에 2.3부에서 논의함). 그만큼
설문지의 내용은 다음의 분석을 바탕으로 작성되었습니다.
2장에 제시된 문헌. 설문지 사본
설문조사 참가자에게 전송된 내용을 확인할 수 있습니다.
부록 B에 나와 있습니다. 설문지는 6개 섹션으로 구성되어 있습니다.
논의된 모델의 단계는 다음과 같습니다. 다음 6개 단락
각 섹션의 내용을 간략하게 요약합니다.
섹션 A: 조직에 대한 기본 정보
이 섹션에는 프로필과 관련된 질문이 포함되어 있습니다.
참여단체. 게다가 질문 중 일부는 다음과 같습니다.
데이터 웨어하우징 프로젝트의 조건과 관련하여
참가자. 귀하의 이름과 같은 기밀 정보
조사분석에서는 조직의 성격이 드러나지 않았다.
섹션 B: 시작
이 섹션의 질문은 시작 활동과 관련되어 있습니다.
데이터 웨어하우징. 질문은 얼마나 오랫동안 받았는지
프로젝트 개시자, 보증인, 기술 및 지식에 관한 것입니다.
요청, 데이터 웨어하우징 개발 목표 및
최종 사용자의 기대.
섹션 C: 디자인
이 섹션에는 다음 활동과 관련된 질문이 포함되어 있습니다.
계획 데이터웨어 하우스. 특히 질문은 다음과 같습니다.
실행 범위, 프로젝트 기간, 비용에 대해 설명합니다.
프로젝트 및 비용/이익 분석.
섹션 D: 개발
개발 섹션에는 다음 활동과 관련된 질문이 있습니다.
개발 데이터웨어 하우스: 사용자 요구사항 수집
마지막, 소스 주기, 논리 모델 주기, 프로토타입,
용량 계획, 기술 아키텍처 및 선택
데이터 웨어하우징 개발 도구.
섹션 E: 작동
Operation Ed 관련 Operation 질문
확장성에 데이터웨어 하우스, 어떻게 진화하는가
다음 개발 단계. 거기 데이터 품질, 전략
새로 고침 데이 주기, 세분성 주기, 데이터 확장성
창고와 보안 문제 데이터웨어 하우스 그들은 사이에 있었다
질문의 유형.
섹션 F: 개발
이 섹션에는 데이터 사용과 관련된 질문이 포함되어 있습니다.
최종 사용자에 의한 창고. 연구자는 관심을 갖고 있었다.
목적과 유용성에 데이터웨어 하우스, 검토 및 전략
훈련 채택 및 데이터 관리 전략
창고를 채택했습니다.
3.4.5. 응답률
우편 설문조사는 비율이 낮다는 이유로 비판을 받고 있지만
응답률이 낮으므로 이를 높이기 위한 조치가 취해졌습니다.
수익률(이전에 부분적으로 논의한 바와 같이)
3.4.1). '응답률'이라는 용어는 '%'를 의미합니다.
특정 설문조사 표본에 속한 사람들이
설문지(Denscombe 1998). 다음이 사용되었습니다
이 연구의 응답률을 계산하는 공식은 다음과 같습니다.
응답한 사람 수
응답률 =
——————————————————————————– X 100
발송된 총 설문지 수
3.4.6. 파일럿 테스트
설문지를 샘플로 보내기 전에 질문은 다음과 같습니다.
Luck이 제안한 대로 파일럿 테스트를 수행하여 검사를 받았습니다.
그리고 Rubin(1987), Jackson(1988), de Vaus(1991). 목적
파일럿 테스트는 어색하고 모호하며 표현이 모두 드러나는 것입니다.
해석하기 어려운 질문, 명확하게 하기 위해
사용된 정의 및 용어를 확인하고 대략적인 시간을 식별합니다.
설문지를 작성하는 데 필요합니다(Warwick and Lininger 1975,
Jackson 1988, Salant 및 Dilman 1994). 파일럿 테스트는
과 유사한 특성을 가진 과목을 선정하여 실시한다.
Davis e가 제안한 대로 최종 과목의 코센 (1993). 에서
본 연구에서는 6명의 데이터 웨어하우징 전문가가
시범과목으로 선정되었습니다. 각 파일럿 테스트 후에는
필요한 수정이 이루어졌습니다. 수행된 파일럿 테스트에서, 나는
참가자들은 구조를 바꾸고 재설정하는 데 도움을 주었습니다.
설문지의 최종 버전입니다.
3.4.7. 분석 방법 기준 주기
I 주기 비공개 질문 설문지를 통해 수집된 조사 결과는 다음과 같습니다.
통계 소프트웨어 패키지를 사용하여 분석되었습니다.
SPSS라고 합니다. 많은 답변을 분석했습니다.
기술 통계를 사용합니다. 특정 수의 설문지
그들은 불완전하게 돌아왔습니다. 이들은 더 큰 대우를 받았습니다.
내가 주기 누락된 사람은 하나도 없었습니다
데이터 입력 오류의 결과, 그런데 질문이 그렇지 않은 이유
선언자에게 적합했거나 선언자가 적합하지 않기로 결정했습니다.
하나 이상의 구체적인 질문에 답하십시오. 이 답변
누락은 분석 중에 무시되었습니다. 주기 그리고 있었다
프로세스에서 제외되도록 '-9'로 코딩됨
복수.
설문지를 준비하면서 질문이 마감되었습니다.
각 옵션에 번호를 할당하여 사전 코딩되었습니다. 수
그런 다음 그것은 내가 준비하는 데 사용되었습니다 주기 분석하는 동안
(Denscombe 1998, Sapsford 및 Jupp 1996). 예를 들어,
섹션 B의 질문 1에 나열된 XNUMX가지 옵션: 조언
이사회, 고위 임원, IT 부서, 부서
비즈니스, 컨설턴트 등. 파일에는 주기 SPSS의
'프로젝트 개시자'를 나타내는 변수가 생성되었습니다.
1개의 값 레이블 포함: '이사회'의 경우 '2', 'XNUMX'
'고위 임원' 등을 위한 것입니다. 리커틴 척도의 사용
일부 폐쇄형 질문에서도 허용되었습니다.
가치를 사용하면 아무런 노력도 필요하지 않은 식별
SPSS에 입력된 해당 숫자. 질문에 대한
상호 배타적이지 않은 비완전한 답변,
각 옵션은 두 개의 변수가 있는 단일 변수로 처리되었습니다.
값 레이블: '표시됨'의 경우 '1', '표시되지 않음'의 경우 '2'입니다.
개방형 질문은 질문과 다르게 처리되었습니다.
닫은. 이 질문에 대한 답변이 입력되지 않았습니다.
SPSS. 대신 손으로 분석했습니다. 이것의 사용
질문 유형을 사용하면 아이디어에 대한 정보를 얻을 수 있습니다.
자유롭게 표현되었으며 응답자의 개인적인 경험
(Bainbridge 1989, Denscombe 1998). 가능한 경우 완료되었습니다.
답변의 분류.
분석을 위해 주기, 간단한 통계분석 방법을 사용하며,
반응 빈도, 평균, 표준 편차 등
평균과 중앙값(Argyrous 1996, Denscombe 1998).
감마 테스트는 정량적 측정값을 얻는 데 효과적이었습니다.
사이의 연관성 중 주기 서수(Norusis 1983, Argyrous 1996).
사용된 순서 척도가 다음과 같지 않았기 때문에 이러한 테스트는 적절했습니다.
카테고리가 많았고 표로 표시할 수도 있었습니다.
(노루시스 1983).
3.5 요약
이번 장에서는 연구 방법론과
이 연구를 위해 채택된 디자인.
에 가장 적합한 연구 방법을 선택합니다.
특별한 공부가 필요하다
성격과 유형을 포함한 다양한 규칙 고려
연구의 장점과 각각의 가능한 약점
방법(Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987,
yin 1989, Hamilton 및 ives 1992, Galliers 1992, neuman 1994). 보다
이에 대한 기존 지식과 이론이 부족하다.
호주의 데이터 웨어하우징 채택에 대한 이번 연구는
연구에는 기술을 갖춘 해석적 연구 방법이 필요합니다.
조직의 경험을 탐구하는 탐색적
오스트레일리아 사람. 선택한 연구방법은 다음과 같습니다.
날짜 개념 채택에 관한 정보 수집
호주 조직의 창고 보관. ㅏ
수집기법은 우편설문지를 선택하였다. 주기.
연구 방법 및 수집 기술에 대한 정당성 주기
선택한 내용은 이 장에서 제공됩니다. 또한 그것은
분석단위인 샘플에 대한 논의를 제시했습니다.
사용, 응답 비율, 설문지 내용,
설문지의 사전 테스트와 분석 방법 주기.

디자인 데이터웨어 하우스:
엔터티 관계와 차원 모델링 결합
추상
저장 i 주기 많은 사람들에게 현재의 주요 이슈입니다.
조직. 개발의 주요 문제
저장의 주기 그것은 그의 디자인이다.
디자인은 데이터의 개념 감지를 지원해야 합니다.
레거시 시스템 및 기타 소스에 대한 창고 주기 또한 하나
데이터 구현의 쉬운 이해와 효율성
창고.
저장 문헌의 대부분은 주기 추천
엔터티 관계 모델링 또는 차원 모델링을 사용합니다.
디자인을 표현하다 데이터웨어 하우스.
이 문서에서는 두 가지 방법을 모두 보여줍니다.
표현은 하나의 접근 방식으로 결합될 수 있습니다.
그림 데이터웨어 하우스. 사용된 접근 방식은 체계적입니다.
사례 연구에서 조사되었으며 여러 사례에서 확인되었습니다.
전문가에게 중요한 영향을 미칩니다.
데이터 웨어하우징
Un 데이터웨어 하우스 일반적으로 "주제 지향적"으로 정의됩니다.
지원되는 통합형, 시변형, 비휘발성 데이터 수집
경영진의 결정에 영향을 미친다”(Inmon and Hackathorn, 1994).
주제 지향적이고 통합되어 있음을 나타냅니다. 데이터웨어 하우스 è
레거시 시스템의 기능적 경계를 넘도록 설계되었습니다.
통합적인 관점을 제공합니다. 주기.
시간 변화는 역사적 또는 시계열적 특성에 영향을 미칩니다. 주기 in
un 데이터웨어 하우스, 추세를 분석할 수 있습니다.
비휘발성은 다음을 나타냅니다. 데이터웨어 하우스 계속되는 건 아니고
다음과 같이 업데이트되었습니다. 데이터베이스 OLTP의 오히려 업데이트되네
주기적으로, 주기 내부 및 외부 소스에서 발생합니다. 그만큼
데이터웨어 하우스 그것은 연구를 위해 특별히 설계되었습니다
업데이트의 무결성과 성능보다는
운영.
i를 저장하는 아이디어 주기 새로운 건 아니고 목적 중 하나였어
관리의 주기 1982년대 이후(The Martin, XNUMX).
I 데이터웨어 하우스 그들은 인프라를 제공합니다 주기 관리를 위해
지원 시스템. 경영지원 시스템에는 의사결정이 포함됩니다.
지원 시스템(DSS) 및 임원 정보 시스템(EIS).
DSS는 컴퓨터 기반 정보 시스템입니다.
프로세스를 개선하고 결과적으로 그립을 개선하도록 설계되었습니다.
인간의 결정. EIS는 일반적으로 다음을 전달하는 시스템입니다.
주기 기업 임원이 뷰에 쉽게 접근할 수 있도록 지원합니다.
주기.
일반적인 아키텍처 데이터웨어 하우스 의 역할을 강조한다
데이터웨어 하우스 경영지원에 있습니다. 제공하는 것 외에도
인프라 주기 EIS 및 DSS의 경우 데이터웨어 하우스 가능하다.
쿼리를 통해 직접 액세스합니다. 그만큼 주기 날짜에 포함됨
창고는 정보 요구 사항 분석을 기반으로 합니다.
관리되며 내부 레거시 시스템,
특수 목적의 데이터 캡처 시스템 및 외부 데이터 소스. 그만큼
주기 내부 레거시 시스템에서는 중복되는 경우가 많습니다.
일관성이 없고 품질이 낮으며 다양한 형식으로 저장됨
따라서 파일을 로드하기 전에 조정하고 정리해야 합니다.
데이터웨어 하우스 (인먼, 1992; 맥파든, 1996). 그만큼 주기 ~에서
스토리지 시스템에서 주기 임시 및 소스에서 주기
외부는 종종 i를 확장(업데이트, 교체)하는 데 사용됩니다.
주기 레거시 시스템에서.
개발해야 하는 많은 이유가 있습니다. 데이터웨어 하우스,
여기에는 사용을 통한 더 나은 의사 결정이 포함됩니다.
효과적인 추가 정보(Ives 1995), 초점 지원
완전한 사업에 대한 (Graham 1996), 그리고 비용 절감
~의 공급 주기 EIS 및 DSS의 경우(Graham 1996, McFadden
1996).
최근 실증적 연구에 따르면 평균적으로
나를 위한 투자 데이터웨어 하우스 401년 후 XNUMX% 증가(Graham,
1996). 그러나 다른 실증적 연구에서는 데이터웨어 하우스 있다
교육 측정의 어려움을 포함하여 심각한 문제를 발견했습니다.
혜택 할당, 명확한 목적 부족, 과소평가
i 저장 프로세스의 목적과 복잡성 주기
특히 원산지와 청결도에 대해 주기.
저장 i 주기 해결책이라고 볼 수 있다
경영상의 문제로 주기 조직 간. 거기
조작 주기 사회적 자원으로서 그것은 여전히
전 세계의 정보 시스템을 관리하는 데 있어 주요 문제
수년 동안 전 세계에서 (Brancheau et al. 1996, Galliers et al. 1994,
Niedermanet al. 1990, 페르반 1993).
관리에 대한 대중적인 접근 방식 주기 80년대에는 그랬다.
모델 개발 주기 사회의. 모델 주기 사회적이었다
새로운 시스템 개발을 위한 안정적인 기반을 제공하도록 설계되었습니다.
응용 프로그램 전자 데이터베이스 레거시를 재구축하고 통합하는 것
시스템(Brancheau et al.
1989, Goodhueet al. 1988:1992, 김과 에베레스트 1994).
그러나 이 방식에는 문제점이 많다는 점에서
특히, 각 작업의 복잡성과 비용, 그리고 오랜 시간이 소요됩니다.
실질적인 결과를 얻으려면 필요합니다(Beynon-Davies 1994, Earl
1993, Goodhueet al. 1992, Periasamy 1994, Shanks 1997).
Il 데이터웨어 하우스 레거시 데이터베이스와 공존하는 별도의 데이터베이스입니다.
데이터베이스를 교체하는 대신 따라서 다음을 수행할 수 있습니다.
경영을 지휘하다 주기 비용이 많이 드는 재건축을 피하고
레거시 시스템의
데이터 설계에 대한 기존 접근 방식
창고
건물을 짓고 완성하는 과정 데이터웨어 하우스
하나의 과정이라기보다는 진화 과정으로 더 이해되어야 한다.
기존 시스템의 개발 수명주기(Desio, 1995, 샹크스,
O'Donnell과 Arnott 1997a). A에는 많은 프로세스가 관련되어 있습니다.
의 프로젝트 데이터웨어 하우스 초기화, 계획 등;
회사 관리자에게 요청한 요구 사항에서 얻은 정보
소스, 변환, 정리 주기 레거시로부터의 동기화
시스템 및 기타 소스 주기; 개발 중인 전달 시스템;
모니터링 데이터웨어 하우스; 그리고 그 과정의 무의미함
진화와 건설 데이터웨어 하우스 (스틴치스, 오도넬
및 Arnott 1997b). 이 일지에서 우리는 방법에 중점을 둡니다.
내가 그려 주기 이러한 다른 프로세스의 컨텍스트에 저장됩니다.
데이터 아키텍처에 대해 제안된 여러 가지 접근 방식이 있습니다.
문학의 창고(인몬 1994, 아이브스 1995, 킴볼 1994)
맥파든(1996). 이러한 각 방법론에는 간략한 내용이 있습니다.
강점과 약점을 분석하여 검토합니다.
Inmon(1994)의 접근 방식 데이터웨어 하우스
디자인
Inmon(1994)은 데이터를 도출하기 위한 XNUMX가지 반복 단계를 제안했습니다.
창고(그림 2 참조). 첫 번째 단계는 템플릿을 디자인하는 것입니다.
주기 내가 어떻게 지내는지 이해하기 위해 사회적으로 주기 통합될 수 있다
조직 내 기능 영역 전반에 걸쳐
나 나누기 주기 지역에 보관하십시오. 모델 주기 그것은 만들어졌다
저장하다 주기 다음을 포함하여 의사결정과 관련된 주기
역사가 포함 주기 차감하고 합산합니다. 두 번째 단계는
구현 주제 영역을 식별합니다. 이들은 기반
특정 조직이 결정한 우선 순위에 따라. 세 번째
단계에는 데이터베이스 주제 영역에 대한 포즈
적절한 수준의 세분성을 포함하는 데 특별한 주의를 기울이십시오.
Inmon은 엔터티 및 관계 모델을 사용할 것을 권장합니다. 네번째
단계는 소스 시스템을 식별하는 것입니다. 주기 필요하고 개발
i를 캡처, 정리 및 포맷하는 변환 프로세스 주기.
Inmon의 접근 방식의 강점은 모델이 주기 사회적인
통합을 위한 기반을 제공합니다. 주기 조직 내에서
반복적인 데이터 개발을 위한 기획 지원
창고. 단점은 그리기의 어려움과 비용입니다.
모델 주기 사회적, 실체의 모델을 이해하는 데 어려움이 있으며
두 모델 모두에서 사용되는 관계는 주기 사회적 그리고 그것의 주기
주제 영역별로 저장되며, 그 적합성 주기
그림 데이터웨어 하우스 실현을 위해 데이터베이스
관계형이지만 대상이 아닌 데이터베이스 다차원.
Ives(1995)의 접근 방식 데이터웨어 하우스
디자인
Ives(1995)는 디자인에 대한 XNUMX단계 접근 방식을 제안합니다.
그가 데이터 설계에 적용할 수 있다고 생각하는 정보 시스템
창고(그림 3 참조). 접근 방식은 다음을 기반으로 합니다.
정보시스템 개발을 위한 정보공학
(마틴 1990). 첫 번째 단계는 목표, 요소를 결정하는 것입니다.
중요하고 성공적인 핵심 성과 지표. 그만큼
주요 업무 프로세스와 필요한 정보는
우리를 모델로 이끌기 위해 모델을 만들었습니다 주기 사회의. 두 번째 단계
정의적인 아키텍처의 개발이 포함됩니다. 주기
영역별로 저장하고, 데이터베이스 di 데이터웨어 하우스, 구성 요소
필요한 기술, 조직적 지원 세트
구현하고 운영하는 데 필요한 데이터웨어 하우스. 세 번째
단계에는 필수 소프트웨어 패키지 및 도구 선택이 포함됩니다.
네 번째 단계는 세부 설계 및 시공이다.
데이터웨어 하우스. Ives는 다음과 같은 내용을 보관하고 있습니다. 주기 그 사람은 결속된 사람이야
반복적인 프로세스.
Ives의 접근 방식의 강점은 특정 기술을 사용한다는 것입니다.
정보 요구 사항 결정, 구조화된 사용
통합을 지원하는 프로세스 데이터웨어 하우스,
적절한 하드웨어 및 소프트웨어 선택, 그리고 다양한 사용
표현 기법 데이터웨어 하우스. 결함
그것들은 복잡성에 내재되어 있습니다. 다른 것에는 어려움이 포함됩니다.
많은 수준의 개발 데이터베이스 all'interno del 데이터웨어 하우스 in
합리적인 시간과 비용.
Kimball(1994)의 접근 방식 데이터웨어 하우스
디자인
Kimball(1994)은 데이터를 도출하기 위한 XNUMX가지 반복 단계를 제안했습니다.
창고(그림 4 참조). 그의 접근 방식은 특히
단 하나의 디자인에 전념 데이터웨어 하우스 그리고 모델 사용에 관해서
엔터티 및 관계 모델보다 차원적입니다. 킴볼
그 차원 모델을 분석하는 것이 더 이해하기 쉽기 때문입니다.
비즈니스 임원이 거래를 하면 거래할 때 더 효율적입니다.
복잡한 상담과 디자인까지 데이터베이스 육체적인 것이 더 중요하다
효율적이다(Kimball 1994). Kimball은
데이터웨어 하우스 그것은 반복적이며, 데이터웨어 하우스 분리된 그들은 할 수 있다
차원 테이블로 분할하여 통합
흔한.
첫 번째 단계는 특정 주제 영역을 식별하는 것입니다.
완성되었습니다. 두 번째와 세 번째 단계는 형성에 관한 것입니다.
차원. 두 번째 단계에서는 측정을 통해 다음 사항을 식별합니다.
주제 영역에 대한 관심을 사실 테이블로 그룹화합니다.
예를 들어 판매 주제 영역에서 관심 측정값은
판매된 품목의 양과 달러가 포함될 수 있습니다.
판매 통화로 사용됩니다. 세 번째 단계에는 식별이 포함됩니다.
차원을 그룹화할 수 있는 방법
사리. 판매 대상 분야에서 해당 치수
항목, 위치 및 기간이 포함될 수 있습니다. 거기
팩트 테이블에는 각각에 연결되는 다중 부분 키가 있습니다.
차원 테이블이 있으며 일반적으로 매우 많은 수의 테이블을 포함합니다.
사실로 가득 차 있습니다. 이와 대조적으로 차원 테이블에는 다음이 포함됩니다.
차원 및 기타 속성에 대한 설명 정보
사실을 그룹화하는 데 사용할 수 있습니다. 팩트 테이블 e
제안서 양식과 관련된 차원
모양 때문에 별 모양이 됩니다. 네 번째 단계에는 다음이 포함됩니다.
의 건설 데이터베이스 다차원적으로 완벽하게 만들기
별 패턴. 마지막 단계는 소스 시스템을 식별하는 것입니다. 주기
획득, 청소를 ​​위한 변환 프로세스가 필요하고 개발됩니다.
그리고 포맷해 주기.
Kimball의 접근 방식의 강점에는 모델 사용이 포함됩니다.
나를 표현하는 차원 주기 저장해서 만들어요
이해하기 쉽고 효율적인 물리적 설계로 이어집니다. ㅏ
두 가지 모두를 쉽게 사용하는 차원 모델
시스템 데이터베이스 관계형은 완벽할 수도 있고 시스템일 수도 있습니다.
데이터베이스 다차원. 그 결점은 부족함을 포함합니다
계획이나 통합을 용이하게 하는 몇 가지 기술
하나 안에 많은 별 패턴 데이터웨어 하우스
극도로 비정규화된 구조로 설계하는 데 어려움이 있음
차원 모델 a 주기 레거시 시스템에서.
McFadden(1996)의 데이터 접근 방식
창고 디자인
McFadden(1996)은 XNUMX단계 접근 방식을 제안합니다.
~을 그리다 데이터웨어 하우스 (그림 5 참조)
그의 접근 방식은 문헌의 아이디어를 종합한 것에 기초하고 있습니다.
오직 하나의 디자인에만 집중하고 있습니다. 데이터웨어 하우스. 첫번째
단계에는 요구사항 분석이 포함됩니다. 비록 구체적인 내용은
기술은 규정되어 있지 않으며 McFadden의 메모는 다음을 식별합니다.
실재 주기 사양 및 해당 속성이며 Watson 리더를 나타냅니다.
요구사항 포착을 위한 Frolick(1993).
두 번째 단계에서는 엔터티 관계 모델이 설계되었습니다.
데이터웨어 하우스 그런 다음 비즈니스 리더의 검증을 받습니다. 세 번째
단계에는 레거시 시스템에서 매핑을 결정하는 것이 포함됩니다.
그리고 외부 소스 데이터웨어 하우스. 네 번째 단계에는 다음이 포함됩니다.
개발, 배포 및 동기화 프로세스 주기 nel
데이터웨어 하우스. 마지막 단계에서는 시스템이 인도됩니다.
특히 사용자 인터페이스에 중점을 두고 개발되었습니다.
McFadden은 드로잉 프로세스가 일반적으로 다음과 같다고 지적합니다.
반복적 인.
참여에 대한 McFadden 접근 방식의 강점
비즈니스 리더가 요구 사항을 결정하고
자원의 중요성 주기, 청소 및 수집. 그녀의
결함은 분할 프로세스가 부족하다는 점입니다.
훌륭한 프로젝트 데이터웨어 하우스 많은 통합 단계에서
디자인에 사용된 엔터티 및 관계 모델을 이해하는 데 어려움이 있습니다.
데이터웨어 하우스.

    0/5 (0 리뷰)
    0/5 (0 리뷰)
    0/5 (0 리뷰)

    온라인 웹 에이전시에 대해 자세히 알아보세요.

    이메일로 최신 기사를 받으려면 구독하세요.

    작성자 아바타
    관리자 대표이사
    👍온라인 웹 에이전시 | 디지털 마케팅 및 SEO 분야의 웹 에이전시 전문가입니다. 웹 에이전시 온라인은 웹 에이전시입니다. Agenzia Web Online의 디지털 혁신 성공은 Iron SEO 버전 3의 기반을 기반으로 합니다. 전문 분야: 시스템 통합, 엔터프라이즈 애플리케이션 통합, 서비스 지향 아키텍처, 클라우드 컴퓨팅, 데이터 웨어하우스, 비즈니스 인텔리전스, 빅 데이터, 포털, 인트라넷, 웹 애플리케이션 관계형 및 다차원 데이터베이스의 설계 및 관리 디지털 미디어용 인터페이스 설계: 유용성 및 그래픽. 온라인 웹 에이전시는 회사에 다음 서비스를 제공합니다: -Google, Amazon, Bing, Yandex의 SEO; -웹 분석: Google Analytics, Google 태그 관리자, Yandex Metrica; -사용자 전환: Google Analytics, Microsoft Clarity, Yandex Metrica; -Google, Bing, Amazon 광고의 SEM; -소셜 미디어 마케팅(Facebook, Linkedin, Youtube, Instagram).
    나의 애자일 프라이버시
    이 사이트는 기술 및 프로파일링 쿠키를 사용합니다. 동의를 클릭하면 모든 프로파일링 쿠키를 승인하는 것입니다. 거부 또는 X를 클릭하면 모든 프로파일링 쿠키가 거부됩니다. 사용자 지정을 클릭하면 활성화할 프로파일링 쿠키를 선택할 수 있습니다.
    이 사이트는 개인 데이터 보호 및 데이터의 자유로운 이동과 관련된 데이터 보호법(LPD), 25년 2020월 2016일자 스위스 연방법, GDPR, EU 규정 679/XNUMX를 준수합니다.