fbpx

ذخیره سازی داده ها و برنامه ریزی منابع سازمانی | DWH و ERP

بایگانی داده ها CENTRAL: HISTORY ED تحولات

دو موضوع غالب فناوری شرکتی در دهه 90 عبارت بودند از i انبار داده و ERP برای مدت طولانی، این دو جریان قدرتمند، بخش‌هایی از فناوری اطلاعات شرکت‌ها بوده‌اند، بدون اینکه هیچ تلاقی داشته باشند. تقریباً انگار ماده و ضد ماده بودند. اما رشد هر دو پدیده ناگزیر به تلاقی آنها منجر شده است. امروزه شرکت ها با این مشکل مواجه هستند که با ERP و انبار داده. این مقاله به تشریح مشکلات و نحوه رسیدگی شرکت ها به آنها می پردازد.

در آغاز…

در ابتدا وجود داشت انبار داده. انبار داده برای مقابله با سیستم برنامه کاربردی پردازش تراکنش ایجاد شد. در روزهای اولیه حفظ اطلاعات قرار بود فقط نقطه مقابل برنامه های پردازش تراکنش باشد. اما امروزه دیدگاه های بسیار پیچیده تری از آنچه الف وجود دارد انبار داده. در دنیای امروز انبار داده در ساختاری قرار می گیرد که می توان آن را کارخانه اطلاعات شرکتی نامید.

کارخانه اطلاعات شرکتی (CIF)

کارخانه اطلاعات شرکتی دارای اجزای معماری استاندارد است: سطحی از تحول و ادغام کد که یکپارچه سازی اطلاعات در حالی که من اطلاعات آنها از محیط برنامه به سمت محیط حرکت می کنند انبار داده از شرکت؛ آ انبار داده از شرکتی که در آن اطلاعات مورخان دقیق و یکپارچه را انبار داده این شرکت به‌عنوان پایه‌ای عمل می‌کند که تمام بخش‌های دیگر محیط شرکت را می‌توان بر آن بنا کرد انبار داده; یک انبار داده عملیاتی (ODS). ODS یک ساختار ترکیبی است که شامل برخی از جنبه های آن است انبار داده و سایر جنبه های یک محیط OLTP؛ داده‌ها، که در آن بخش‌های مختلف می‌توانند نسخه مخصوص به خود را داشته باشند انبار داده؛ آ انبار داده اکتشاف که در آن "فیلسوفان" شرکت می توانند درخواست های 72 ساعته خود را بدون تأثیر مضر بر انبار داده; و یک حافظه خط نزدیک، که در آن اطلاعات پیر و اطلاعات جزئیات انبوه را می توان با قیمت ارزان ذخیره کرد.

ERP کجا با ERP ترکیب می شود کارخانه اطلاعات شرکتی

ERP در دو مکان با کارخانه اطلاعات شرکت ادغام می شود. ابتدا به عنوان یک برنامه کاربردی پایه (پایه) که i اطلاعات از برنامه به انبار داده. در این مورد من اطلاعات، که به عنوان محصول فرعی فرآیند تراکنش تولید می شود، یکپارچه شده و در آن بارگذاری می شود انبار داده از شرکت. نقطه دوم اتحاد بین ERP و CIF و ODS. در واقع در بسیاری از محیط ها از ERP به عنوان ODS کلاسیک استفاده می شود.

در صورتی که از ERP به عنوان برنامه اصلی استفاده شود، همان ERP می تواند در CIF به عنوان ODS نیز استفاده شود. در هر صورت، اگر قرار است از ERP در هر دو نقش استفاده شود، باید تمایز واضحی بین این دو نهاد وجود داشته باشد. به عبارت دیگر، زمانی که ERP نقش برنامه اصلی و ODS را ایفا می کند، باید دو موجودیت معماری را از هم متمایز کرد. اگر یک پیاده سازی ERP واحد سعی کند هر دو نقش را به طور همزمان انجام دهد، به ناچار مشکلاتی در طراحی و اجرای آن ساختار وجود خواهد داشت.

ODS و کاربردهای اساسی را جدا کنید

دلایل زیادی وجود دارد که منجر به تقسیم بندی اجزای معماری می شود. شاید گویاترین مسئله برای تفکیک اجزای مختلف یک معماری این باشد که هر جزء از معماری دیدگاه خاص خود را دارد. کاربرد خط پایه هدفی متفاوت از ODS دارد. سعی کنید همپوشانی داشته باشید

یک نمای برنامه پایه در دنیای ODS یا بالعکس روش درستی برای کار نیست.

در نتیجه، اولین مشکل یک ERP در CIF این است که بررسی کند که آیا تمایزی بین برنامه های کاربردی پایه و ODS وجود دارد یا خیر.

مدل های داده در شرکت کارخانه اطلاعات

برای دستیابی به انسجام بین اجزای مختلف معماری CIF، باید مدلی از آن وجود داشته باشد اطلاعات. مدل های اطلاعات آنها به عنوان پیوندی بین اجزای مختلف معماری مانند برنامه های کاربردی پایه و ODS عمل می کنند. مدل های اطلاعات آنها به "نقشه راه فکری" تبدیل می شوند تا معنای درست را از اجزای مختلف معماری CIF دریافت کنند.

دست در دست هم با این مفهوم، ایده این است که باید یک مدل بزرگ و واحد وجود داشته باشد اطلاعات. بدیهی است که باید یک مدل وجود داشته باشد اطلاعات برای هر یک از اجزاء و همچنین باید یک مسیر معقول برای اتصال مدل های مختلف وجود داشته باشد. هر جزء از معماری - ODS، برنامه های کاربردی پایه، انبار داده شرکت، و غیره .. – نیاز به مدل خاص خود دارد اطلاعات. و بنابراین باید تعریف دقیقی از چگونگی این مدل ها وجود داشته باشد اطلاعات آنها با یکدیگر ارتباط برقرار می کنند.

MOVE I داده ها ERP در داده ها انبار

اگر منشاء اطلاعات یک برنامه کاربردی پایه و/یا یک ODS است، زمانی که ERP i را درج می کند اطلاعات به انبار داده، این درج باید در پایین ترین سطح "گرانولاریته" انجام شود. به سادگی i را خلاصه یا جمع کنید اطلاعات همانطور که آنها از برنامه پایه ERP بیرون می آیند یا ERP ODS کار درستی نیست. THE اطلاعات جزئیات در مورد نیاز است انبار داده تا اساس فرآیند DSS را تشکیل دهد. چنین اطلاعات به طرق مختلف توسط داده ها و اکتشافات تغییر شکل خواهد یافت انبار داده.

حرکت از اطلاعات از محیط برنامه پایه ERP به انبار داده این شرکت به شیوه ای نسبتاً آرام انجام می شود. این حرکت تقریباً 24 ساعت پس از به روز رسانی یا ایجاد در ERP انجام می شود. واقعیت داشتن یک جنبش "تنبل" از اطلاعات به انبار داده شرکت اجازه می دهد اطلاعات از ERP به "سپرده" می آید. یک بار من اطلاعات در برنامه پایه ذخیره می شوند، سپس می توانید با خیال راحت آن را جابجا کنید اطلاعات ERP در شرکت یکی دیگر از اهداف قابل دستیابی به لطف حرکت "تنبل" از اطلاعات این جدایی واضح بین فرآیندهای عملیاتی و DSS است. با یک حرکت "سریع" از اطلاعات خط تقسیم بین DSS و عملیاتی مبهم است.

Il Movimento dei اطلاعات از ODS ERP به انبار داده این شرکت به صورت دوره ای، معمولاً هفتگی یا ماهانه انجام می شود. در این مورد حرکت از اطلاعات این بر اساس نیاز به "تمیز کردن" قدیمی ها است اطلاعات مورخان البته ODS شامل i اطلاعات که بسیار جدیدتر از اطلاعات مورخان پیدا شده در انبار داده.

حرکت از اطلاعات به انبار داده تقریباً هرگز "عمده فروشی" (به صورت عمده فروشی) انجام نمی شود. یک جدول را از محیط ERP کپی کنید انبار داده این بی معنی است. یک رویکرد بسیار واقعی تر این است که واحدهای انتخاب شده را جابجا کنید اطلاعات. فقط اطلاعات که از آخرین به روز رسانی تغییر کرده اند انبار داده آنها کسانی هستند که باید به داخل منتقل شوند انبار داده. یک راه برای دانستن کدام یک اطلاعات از زمانی که آخرین به‌روزرسانی این است که به مُهرهای زمانی نگاه کنید، تغییر کرده‌اند اطلاعات در محیط ERP یافت می شود. طراح تمام تغییراتی را که از زمان آخرین به روز رسانی رخ داده است انتخاب می کند. رویکرد دیگر استفاده از تکنیک‌های ثبت تغییر است اطلاعات. با استفاده از این تکنیک‌ها، لاگ‌ها و نوارهای ژورنال به منظور تعیین اینکه کدام یک مورد تجزیه و تحلیل قرار می‌گیرند اطلاعات باید از محیط ERP به محیط ERP منتقل شود انبار داده. این تکنیک‌ها بهترین هستند زیرا گزارش‌ها و نوارهای مجله را می‌توان از فایل‌های ERP بدون تأثیر بیشتر بر سایر منابع ERP خواند.

سایر عوارض

یکی از مسائل ERP در CIF این است که چه اتفاقی برای سایر منابع برنامه یا برای سایر منابع می افتد اطلاعات از ODS که باید در آن مشارکت کنند انبار داده اما آنها بخشی از محیط ERP نیستند. با توجه به ماهیت بسته ERP، به ویژه SAP، تلاش برای ادغام کلیدها از منابع خارجی اطلاعات با من اطلاعات که از ERP هنگام جابجایی می آیند اطلاعات به انبار داده، این یک چالش بزرگ است. و دقیقاً چه احتمالاتی وجود دارد که i اطلاعات برنامه‌ها یا ODS‌های خارج از محیط ERP در آن ادغام می‌شوند انبار داده? شانس در واقع بسیار بالا است.

پیدا کردن داده ها تاریخی از ERP

مشکل دیگر با i اطلاعات ERP آن چیزی است که از نیاز به داشتن ناشی می شود اطلاعات مورخان در داخل انبار داده. معمولا انبار داده نیاز دارد اطلاعات مورخان و فناوری ERP معمولاً اینها را ذخیره نمی کند اطلاعات تاریخی، حداقل نه در حدی که در آن لازم باشد انبار داده. زمانی که مقدار زیادی از اطلاعات تاریخ شروع به جمع شدن در محیط ERP می کند، آن محیط باید پاکسازی شود. برای مثال، فرض کنید که الف انبار داده باید با پنج سال بارگذاری شود اطلاعات داده های تاریخی در حالی که ERP حداکثر شش ماه از آنها را نگه می دارد اطلاعات. تا زمانی که شرکت به جمع آوری یک سری از اطلاعات مورخان با گذشت زمان، هیچ مشکلی در استفاده از ERP به عنوان منبع برای آن وجود ندارد انبار داده. اما زمانی که انبار داده او باید به گذشته برگردد و خدایان را بدست آورد اطلاعات تاریخچه هایی که قبلا توسط ERP جمع آوری و ذخیره نشده اند، پس محیط ERP ناکارآمد می شود.

ERP و فراداده

یکی دیگر از ملاحظات در مورد ERP e انبار داده یکی از ابرداده های موجود در محیط ERP است. همانطور که ابرداده از محیط ERP به محیط IT منتقل می شود انبار داده، ابرداده ها باید به همین ترتیب جابجا شوند. علاوه بر این، ابرداده باید به قالب و ساختار مورد نیاز زیرساخت تبدیل شود انبار داده. تفاوت زیادی بین ابرداده عملیاتی و ابرداده DSS وجود دارد. ابرداده عملیاتی در درجه اول برای توسعه دهنده و توسعه دهنده است

برنامه نویس ابرداده DSS در درجه اول برای کاربر نهایی است. ابرداده های موجود در برنامه های کاربردی ERP یا ODS ها باید تبدیل شوند و این تبدیل همیشه آسان و ساده نیست.

منبع یابی داده های ERP

اگر از ERP به عنوان تامین کننده استفاده شود اطلاعات برای انبار داده باید یک رابط جامد وجود داشته باشد که حرکت می کند اطلاعات از محیط ERP به محیط انبار داده. رابط باید:

  • ▪ استفاده آسان باشد
  • ▪ اجازه دسترسی به اطلاعات از ERP
  • ▪  معنی را دریافت کنید اطلاعات که در شرف انتقال به انبار داده
  • ▪ محدودیت‌های ERP را که ممکن است هنگام دسترسی به ERP ایجاد شود، بشناسید اطلاعات از ERP:
  • ▪ یکپارچگی ارجاعی
  • ▪  روابط سلسله مراتبی
  • ▪ روابط منطقی ضمنی
  • ▪  کنوانسیون برنامه
  • ▪  کلیه ساختارهای اطلاعات پشتیبانی شده توسط ERP و غیره …
  • ▪ در دسترسی کارآمد باشید اطلاعات، با ارائه:
  • ▪  حرکت مستقیم اطلاعات
  • ▪  کسب تغییر اطلاعات
  • ▪ از دسترسی به موقع به پشتیبانی کنید اطلاعات
  • ▪  قالب را درک کنید اطلاعات، و غیره… رابط با SAP رابط می تواند دو نوع باشد، خانگی یا تجاری. برخی از واسط های تجاری اصلی عبارتند از:
  • ▪ SAS
  • ▪ Prims Solutions
  • ▪  D2k و غیره… فن آوری های چندگانه ERP برخورد با محیط ERP به گونه ای که انگار یک فناوری واحد است، اشتباه بزرگی است. فناوری های ERP زیادی وجود دارد که هر کدام نقاط قوت خود را دارند. شناخته شده ترین فروشندگان در بازار عبارتند از:
  • ▪ SAP
  • ▪ اوراکل مالی
  • ▪ PeopleSoft
  • ▪ جی دی ادواردز
  • ▪  بان SAP SAP بزرگترین و کامل ترین نرم افزار ERP است. برنامه های کاربردی SAP انواع مختلفی از برنامه ها را در بسیاری از زمینه ها شامل می شود. SAP به این شهرت دارد:
  • ▪  بسیار بزرگ
  • ▪ اجرای بسیار دشوار و پرهزینه است
  • ▪ برای اجرا به افراد و مشاوران زیادی نیاز دارد
  • ▪ برای اجرا به افراد متخصص نیاز دارد
  • ▪  برای پیاده سازی به زمان طولانی نیاز دارد. اطلاعات با دقت بسیار، دسترسی افراد خارج از منطقه SAP را دشوار می کند. نقطه قوت SAP این است که می تواند مقدار زیادی از آن را ضبط و ذخیره کند اطلاعات. اخیرا SAP قصد خود را برای گسترش برنامه های خود به انبار داده. مزایا و معایب زیادی برای استفاده از SAP به عنوان فروشنده وجود دارد انبار داده. یک مزیت این است که SAP قبلاً نصب شده است و اکثر مشاوران قبلاً SAP را می شناسند.
    معایب داشتن SAP به عنوان تامین کننده انبار داده بسیاری وجود دارد: SAP هیچ تجربه ای در جهان ندارد انبار داده اگر SAP تامین کننده باشد انبار داده، لازم است که i اطلاعات از SAP به انبار داده. داتو سابقه یک سیستم بسته SAP، بعید است که به راحتی بتوان i از SAP به آن وارد کرد (???). محیط های قدیمی زیادی وجود دارند که SAP را تامین می کنند، مانند IMS، VSAM، ADABAS، ORACLE، DB2 و غیره. SAP بر رویکرد "در اینجا اختراع نشده" اصرار دارد. SAP نمی خواهد برای استفاده یا ایجاد آن با سایر فروشندگان شریک شود انبار داده. SAP اصرار دارد که تمام نرم افزارهای خود را خودش تولید کند.

اگرچه SAP یک شرکت بزرگ و قدرتمند است، اما تلاش می کند تا فناوری ELT، OLAP، مدیریت سیستم و حتی کد اصلی را بازنویسی کند. dbms این فقط دیوانه است به جای اتخاذ نگرش همکاری با تامین کنندگان انبار داده SAP از دیرباز از رویکرد "آنها بهترین می دانند" را دنبال کرده است. این نگرش مانع از موفقیتی است که SAP می تواند در این زمینه داشته باشد انبار داده.
امتناع SAP از اجازه دادن به فروشندگان خارجی برای دسترسی سریع و دلپذیر به آنها اطلاعات. ماهیت استفاده از a انبار داده دسترسی آسان است اطلاعات. کل تاریخچه SAP بر این اساس است که دسترسی به آن را دشوار می کند اطلاعات.
عدم تجربه SAP در برخورد با حجم زیادی از اطلاعات; در زمینه انبار داده حجم وجود دارد اطلاعات هرگز توسط SAP دیده نشده و برای مدیریت این مقادیر زیاد اطلاعات باید تکنولوژی مناسب داشته باشید SAP ظاهرا از این مانع تکنولوژیکی که برای ورود به این حوزه وجود دارد آگاه نیست انبار داده.
فرهنگ شرکتی SAP: SAP با به دست آوردن آن یک کسب و کار ایجاد کرده است اطلاعات از سیستم اما برای انجام این کار باید ذهنیت متفاوتی داشته باشید. به‌طور سنتی، شرکت‌های نرم‌افزاری که در انتقال داده‌ها به یک محیط خوب عمل می‌کردند، در گرفتن داده‌ها به سمت دیگری خوب عمل نمی‌کردند. اگر SAP موفق به ساخت این نوع سوئیچ شود، اولین شرکتی خواهد بود که این کار را انجام می دهد.

به طور خلاصه، این که آیا یک شرکت باید SAP را به عنوان تامین کننده خود انتخاب کند، جای سوال دارد انبار داده. از یک طرف خطرات بسیار جدی و از طرف دیگر پاداش های بسیار کمی وجود دارد. اما دلیل دیگری وجود دارد که از انتخاب SAP به عنوان تامین کننده جلوگیری می کند انبار داده. زیرا هر شرکتی باید همان را داشته باشد انبار داده از همه شرکت های دیگر؟ این انبار داده قلب مزیت رقابتی است. اگر هر شرکتی همین را اتخاذ کند انبار داده دستیابی به مزیت رقابتی دشوار است، اگرچه غیرممکن نیست. به نظر می رسد SAP فکر می کند که الف انبار داده می توان آن را به عنوان یک کوکی دید و این نشانه دیگری از ذهنیت برنامه های کاربردی "دریافت اطلاعات در" آنها است.

هیچ فروشنده ERP دیگری به اندازه SAP مسلط نیست. بدون شک شرکت هایی وجود خواهند داشت که مسیر SAP را برای خود دنبال خواهند کرد انبار داده اما احتمالاً اینها انبار داده ایجاد SAP بزرگ، پرهزینه و زمان بر خواهد بود.

این محیط ها شامل فعالیت هایی مانند پردازش عابر بانک، فرآیندهای رزرو هواپیمایی، فرآیندهای خسارت بیمه و غیره است. هر چه سیستم تراکنش عملکرد بیشتری داشت، نیاز به جدایی بین فرآیند عملیاتی و DSS (سیستم پشتیبانی تصمیم) آشکارتر بود. با این حال، با سیستم های منابع انسانی و پرسنلی، هرگز با حجم زیادی از تراکنش ها مواجه نمی شوید. و البته، زمانی که فردی استخدام می شود یا شرکت را ترک می کند، این سابقه یک معامله است. اما نسبت به سایر سیستم ها، سیستم های منابع انسانی و پرسنل به سادگی تراکنش های زیادی ندارند. بنابراین، در سیستم های منابع انسانی و پرسنل، کاملاً واضح نیست که نیاز به DataWarehouse وجود دارد. این سیستم ها از بسیاری جهات نشان دهنده ادغام سیستم های DSS هستند.

اما اگر با انبارهای داده و PeopleSoft سروکار دارید، فاکتور دیگری نیز وجود دارد که باید در نظر گرفته شود. در بسیاری از محیط ها، i اطلاعات منابع انسانی و شخصی نسبت به کسب و کار اصلی شرکت در درجه دوم اهمیت قرار دارند. اکثر شرکت ها در زمینه تولید، فروش، ارائه خدمات و غیره فعالیت می کنند. منابع انسانی و سیستم های پرسنلی معمولاً در درجه دوم (یا پشتیبان) خط اصلی کسب و کار شرکت هستند. بنابراین، مبهم و ناخوشایند است انبار داده برای پشتیبانی منابع انسانی و پرسنل مجزا است.

PeopleSoft از این نظر با SAP بسیار متفاوت است. با SAP، اجباری است که وجود داشته باشد انبار داده. با PeopleSoft، این چندان واضح نیست. انبار داده با PeopleSoft اختیاری است.

بهترین چیزی که می توان برای آن گفت اطلاعات PeopleSoft این است که انبار داده می تواند به منظور آرشیو i استفاده شود اطلاعات مربوط به منابع انسانی و شخصی قدیمی است. دلیل دوم اینکه چرا یک شرکت می خواهد از a استفاده کند انبار داده a

زیان محیط PeopleSoft اجازه دسترسی و دسترسی آزاد به ابزارهای تجزیه و تحلیل است اطلاعات توسط PeopleSoft. اما فراتر از این دلایل، ممکن است مواردی وجود داشته باشد که ترجیح داده شود برای آن انبار داده وجود نداشته باشد اطلاعات PeopleSoft.

خلاصه

ایده های زیادی در مورد ساخت a انبار داده در یک نرم افزار ERP
برخی از این موارد عبارتند از:

  • ▪ منطقی است که یک انبار داده که شبیه هر کس دیگری در صنعت است؟
  • ▪  یک ERP چقدر انعطاف‌پذیر است انبار داده نرم افزار؟
  • ▪  یک ERP انبار داده نرم افزار می تواند حجمی از اطلاعات که در الف واقع شده استانبار داده عرصه"؟
  • ▪  از نظر زمان، ردیابی ثبت شده ای که فروشنده ERP در مواجهه با آسان و کم هزینه انجام می دهد چیست، اطلاعات? (سوابق فروشندگان ERP در تحویل داده های ارزان، به موقع و با دسترسی آسان چیست؟)
  • ▪  درک فروشنده ERP از معماری DSS و کارخانه اطلاعات شرکتی چیست؟
  • ▪  فروشندگان ERP می‌دانند چگونه می‌توانند به آن دست یابند اطلاعات در محیط زیست، اما آیا آنها همچنین می دانند که چگونه آنها را صادر کنند؟
  • ▪  فروشنده ERP چقدر برای ابزارهای انبار داده باز است؟
    همه این ملاحظات باید در تعیین محل قرار دادن آنها در نظر گرفته شود انبار داده که میزبان i اطلاعات از ERP و دیگران اطلاعات. به طور کلی، مگر اینکه دلیل قانع کننده ای برای انجام این کار وجود داشته باشد، ساخت و ساز توصیه می شود انبار داده خارج از محیط فروشنده ERP فصل 1 مروری بر نکات کلیدی سازمان BI:
    مخازن اطلاعات برعکس معماری هوش تجاری (BI) کار می کنند:
    فرهنگ شرکتی و فناوری اطلاعات می تواند موفقیت در ایجاد سازمان های BI را محدود کند.

فناوری دیگر عامل محدودکننده برای سازمان های BI نیست. سوال معماران و برنامه ریزان پروژه این نیست که آیا فناوری وجود دارد یا خیر، بلکه این است که آیا آنها می توانند فناوری موجود را به طور موثر پیاده سازی کنند.

برای بسیاری از شرکت ها الف انبار داده چیزی بیشتر از یک سپرده غیرفعال است که توزیع کننده آن است اطلاعات به کاربرانی که به آن نیاز دارند. THE اطلاعات آنها از سیستم های منبع استخراج می شوند و در ساختارهای هدف پر می شوند انبار دادهاست. من اطلاعات آنها همچنین می توانند با هر شانسی تمیز شوند. با این حال هیچ ارزش اضافی اضافه یا جمع آوری شده توسط اطلاعات در طول این فرآیند

اساساً، Dw غیرفعال، در بهترین حالت، فقط i را ارائه می دهد اطلاعات پاک و عملیاتی برای انجمن های کاربر. ایجاد اطلاعات و درک تحلیلی کاملاً به کاربران بستگی دارد. قضاوت کنید که آیا DW (انبار داده) موفقیت ذهنی است. اگر موفقیت را بر اساس توانایی جمع آوری، ادغام و تمیز کردن کارآمد قضاوت کنیم اطلاعات شرکت بر اساس قابل پیش بینی، پس بله، DW یک موفقیت است. از سوی دیگر، اگر به جمع آوری، تجمیع و بهره برداری از اطلاعات در سازمان به طور کلی نگاه کنیم، DW یک شکست است. یک DW مقدار کمی یا بدون ارزش اطلاعاتی را ارائه می دهد. در نتیجه، کاربران مجبور به انجام کار می شوند و در نتیجه سیلوهای اطلاعاتی ایجاد می کنند. این فصل یک چشم انداز جامع برای خلاصه کردن معماری BI (هوش تجاری) شرکت ارائه می دهد. ما با توصیف BI شروع می کنیم و سپس به بحث در مورد طراحی و توسعه اطلاعات می رویم، به جای ارائه صرف اطلاعات. اطلاعات به کاربران سپس بحث ها بر محاسبه ارزش تلاش های BI شما متمرکز می شود. ما با تعریف اینکه چگونه IBM به الزامات معماری BI سازمان شما رسیدگی می کند، نتیجه گیری می کنیم.

شرح معماری از سازمان BI

سیستم‌های اطلاعاتی قدرتمند مبادله‌محور در حال حاضر در هر شرکت بزرگ رایج است و به طور موثر زمینه بازی را برای شرکت‌ها در سراسر جهان هموار می‌کند.

با این حال، رقابتی ماندن در حال حاضر نیازمند سیستم‌های تحلیلی است که می‌توانند توانایی شرکت برای کشف مجدد و استفاده از اطلاعاتی را که از قبل در اختیار دارند، متحول کنند. این سیستم های تحلیلی از درک غنای آن ناشی می شوند اطلاعات در دسترس. BI می تواند عملکرد را در سراسر سازمان بهبود بخشد. شرکت ها می توانند روابط مشتری-تامین کننده را بهبود بخشند، سودآوری محصولات و خدمات را بهبود بخشند، پیشنهادات جدید و بهتری ارائه دهند، ریسک را کنترل کنند و در میان بسیاری از سودهای دیگر هزینه ها را به طور چشمگیری کاهش دهند. با BI، شرکت شما در نهایت شروع به استفاده از اطلاعات مشتری به عنوان یک دارایی رقابتی به لطف برنامه هایی می کند که دارای اهداف بازار هستند.

داشتن ابزارهای تجاری مناسب به معنای داشتن پاسخ های قطعی برای سوالات کلیدی مانند:

  • ▪  کدام یک از ما مشتریان آیا آنها باعث می شوند ما درآمد بیشتری داشته باشیم یا باعث ضرر ما می شوند؟
  • ▪  جایی که بهترین‌های ما زندگی می‌کنند مشتریان در رابطه با فروشگاه/ انباری که رفت و آمد می کنند؟
  • ▪  کدام یک از محصولات و خدمات ما را می‌توان مؤثرترین و به چه کسی فروخت؟
  • ▪  چه محصولاتی را می توان مؤثرتر فروخت و به چه کسی؟
  • ▪  کدام کمپین فروش موفق‌ترین است و چرا؟
  • ▪  کدام کانال‌های فروش برای کدام محصولات مؤثرتر هستند؟
  • ▪  چگونه می‌توانیم روابط با بهترین افراد خود را بهبود بخشیم مشتریان? اکثر شرکت ها دارند اطلاعات راه های تقریبی برای پاسخ به این سوالات
    سیستم های عملیاتی مقادیر زیادی محصول، مشتری و اطلاعات بازار از نقاط فروش، رزرواسیون، خدمات مشتری و سیستم های پشتیبانی فنی. چالش استخراج و بهره برداری از این اطلاعات است. بسیاری از شرکت ها فقط از بخش های کوچکی از آنها سود می برند اطلاعات برای تحلیل های استراتژیک
    I اطلاعات باقی مانده، اغلب با i ترکیب می شود اطلاعات به دست آمده از منابع خارجی مانند گزارش های دولتی و سایر اطلاعات خریداری شده، معدن طلایی هستند که منتظر اکتشاف هستند و اطلاعات آنها فقط باید در چارچوب اطلاعاتی سازمان شما اصلاح شوند.

این دانش را می توان به روش های مختلفی به کار برد، از طراحی یک استراتژی کلی شرکت تا ارتباط شخصی با تامین کنندگان، از طریق مراکز تماس، صورتحساب، اینترنت و نکات دیگر محیط کسب‌وکار امروزی حکم می‌کند که DW و راه‌حل‌های مربوط به BI فراتر از اجرای ساختارهای تجاری سنتی تکامل پیدا کنند. اطلاعات مانند من اطلاعات نرمال شده در سطح اتمی و "مزارع ستاره/مکعب".

آنچه برای رقابتی ماندن لازم است، تلفیقی از فناوری های سنتی و پیشرفته در تلاش برای حمایت از یک چشم انداز تحلیلی گسترده است.
برای نتیجه گیری، محیط عمومی باید دانش شرکت را به عنوان یک کل بهبود بخشد و اطمینان حاصل کند که اقدامات انجام شده در نتیجه تجزیه و تحلیل های انجام شده مفید هستند تا همه از آن سود ببرند.

به عنوان مثال، فرض کنید شما رتبه خود را رتبه بندی می کنید مشتریان به دسته های پرخطر یا کم خطر.
اگر این اطلاعات توسط یک استخراج کننده مدل یا وسایل دیگر تولید شده باشد، باید در DW قرار داده شود و با استفاده از هر ابزار دسترسی، مانند گزارش‌های استاتیک، صفحات گسترده، جداول، یا پردازش تحلیلی آنلاین (OLAP) در دسترس همه قرار گیرد. .

با این حال، در حال حاضر، بسیاری از این نوع اطلاعات در سیلوها باقی مانده است اطلاعات از افراد یا بخش هایی که تجزیه و تحلیل را ایجاد می کنند. سازمان، به عنوان یک کل، دید کمی برای درک دارد یا اصلاً دیده نمی شود. تنها با ادغام این نوع محتوای اطلاعاتی در DW سازمانی خود می توانید سیلوهای اطلاعاتی را حذف کنید و محیط DW خود را ارتقا دهید.
دو مانع عمده برای توسعه یک سازمان BI وجود دارد.
اولاً ما مشکل خود سازمان و نظم و انضباط آن را داریم.
در حالی که ما نمی‌توانیم به تغییرات خط‌مشی سازمانی کمک کنیم، می‌توانیم به درک اجزای BI سازمان، معماری آن و اینکه چگونه فناوری IBM توسعه آن را تسهیل می‌کند، کمک کنیم.
دومین مانعی که باید بر آن غلبه کرد، فقدان فناوری یکپارچه و دانش روشی است که کل فضای BI را در بر می گیرد و تنها یک جزء کوچک را در بر می گیرد.

آی‌بی‌ام با تغییراتی در فناوری یکپارچه‌سازی دست به گریبان است. این مسئولیت شماست که طراحی متفکرانه ارائه دهید. این معماری باید با فناوری انتخاب شده برای ادغام بدون محدودیت، یا حداقل با فناوری که از استانداردهای باز تبعیت می کند، توسعه یابد. علاوه بر این، مدیریت شرکت شما باید اطمینان حاصل کند که تعهد BI طبق برنامه انجام می شود و اجازه توسعه سیلوهای اطلاعاتی را که از دستور کارها یا اهداف خود خدمتی ناشی می شوند، نمی دهد.
این بدان معنا نیست که محیط BI نسبت به واکنش به نیازها و نیازهای مختلف کاربران مختلف حساس نیست. در عوض، به این معنی است که اجرای آن نیازها و الزامات فردی به نفع کل سازمان BI انجام می شود.
شرحی از معماری سازمان BI را می توان در صفحه 9 در شکل 1.1 یافت.معماری ترکیبی غنی از فن آوری ها و تکنیک ها را نشان می دهد.
از دیدگاه سنتی، معماری شامل اجزای انبار زیر است

لایه اتمی (لایه اتمی).

این پایه، قلب کل DW و بنابراین گزارش استراتژیک است.
I اطلاعات ذخیره شده در اینجا یکپارچگی تاریخی را حفظ خواهد کرد اطلاعات و شامل معیارهای مشتق شده، و همچنین پاکسازی، ادغام و ذخیره با استفاده از مدل های استخراج شده است.
تمام استفاده های بعدی از اینها اطلاعات و اطلاعات مرتبط از این ساختار به دست آمده است. این یک منبع عالی برای استخراج است اطلاعات و برای گزارش هایی با پرس و جوهای SQL ساختاریافته

انبار عملیاتی از اطلاعات یا اساس گزارش از اطلاعات(ذخیره اطلاعات عملیاتی (ODS) یا گزارش پایگاه داده.)

این یک ساختار از اطلاعات به طور خاص برای گزارش های فنی طراحی شده است.

I اطلاعات این سازه‌ها که در بالا ذخیره و گزارش شده‌اند، می‌توانند در نهایت از طریق منطقه مرحله‌بندی به انبار انتشار پیدا کنند، جایی که می‌توان از آن برای سیگنال‌دهی استراتژیک استفاده کرد.

منطقه صحنه سازی.

اولین توقف برای بیشتر اطلاعات در نظر گرفته شده برای محیط انبار، منطقه سازمان است.
اینجا من اطلاعات یکپارچه، تمیز و تبدیل می شوند اطلاعات سودی که ساختار انبار را پر خواهد کرد

مسابقه تاریخ.

این بخش از معماری نشان دهنده ساختار اطلاعات به طور خاص برای OLAP استفاده می شود. وجود datamarts، اگر i اطلاعات در طرحواره های ستاره ای با هم همپوشانی ذخیره می شوند اطلاعات چند بعدی در یک محیط رابطه ای، یا در فایل های اطلاعات محرمانه مورد استفاده توسط فناوری OLAP خاص، مانند DB2 OLAP Server، مرتبط نیست.

تنها محدودیت این است که معماری استفاده از آن را تسهیل می کند اطلاعات چند بعدی
این معماری همچنین شامل فن‌آوری‌ها و تکنیک‌های حیاتی BI است که به شرح زیر برجسته می‌شوند:

تحلیل فضایی

فضا برای تحلیلگر یک پول بادآورده اطلاعاتی است و برای تفکیک کامل بسیار حیاتی است. فضا می تواند نشان دهنده اطلاعات افرادی باشد که در یک مکان خاص زندگی می کنند و همچنین اطلاعاتی در مورد اینکه آن مکان از نظر فیزیکی نسبت به بقیه جهان کجاست.

برای انجام این تحلیل، باید اطلاعات خود را به مختصات طول و عرض جغرافیایی متصل کنید. این به عنوان "ژئوکدینگ" شناخته می شود و باید بخشی از فرآیند استخراج، تبدیل و بارگذاری (ETL) در سطح اتمی انبار شما باشد.

داده کاوی.

استخراج از اطلاعات به شرکت های ما اجازه می دهد تا تعداد آنها را افزایش دهند مشتریان، برای پیش بینی روند فروش و اجازه مدیریت روابط با مشتریان (CRM) در میان سایر ابتکارات BI.

استخراج از اطلاعات بنابراین باید با ساختارهای ادغام شود اطلاعات از DWhouse و توسط فرآیندهای انبار پشتیبانی می شود تا از استفاده موثر و کارآمد از فناوری و تکنیک های مرتبط اطمینان حاصل شود.

همانطور که در معماری BI نشان داده شده است، سطح اتمی Dwhouse، و همچنین datamarts، منبع عالی برای اطلاعات برای استخراج همین امکانات همچنین باید دریافت کننده نتایج استخراج باشند تا از دسترسی به وسیع ترین مخاطبان اطمینان حاصل شود.

عوامل

«نمایندگان» مختلفی برای بررسی مشتری برای هر نکته وجود دارد، مانند سیستم عامل های شرکت و خود dw. این عوامل می توانند شبکه های عصبی پیشرفته ای باشند که برای یادگیری در مورد روندها در هر نقطه آموزش دیده اند، مانند تقاضای محصول آینده بر اساس تبلیغات فروش، موتورهای مبتنی بر قانون برای واکنش به یک dato مجموعه ای از شرایط، یا حتی عوامل ساده ای که موارد استثنا را به «مدیران ارشد» گزارش می دهند. این فرآیندها عموماً در زمان واقعی اتفاق می‌افتند و بنابراین، باید با حرکت آنها ارتباط نزدیکی داشته باشند اطلاعات. همه این ساختارهای اطلاعات، فن آوری ها و تکنیک ها تضمین می کنند که شب را صرف ایجاد سازمانی از BI خود نخواهید کرد.

این فعالیت در مراحل افزایشی، برای نقاط کوچک توسعه خواهد یافت.
هر مرحله یک تلاش پروژه مستقل است و در ابتکار DW یا BI شما به عنوان یک تکرار شناخته می شود. تکرارها می توانند شامل اجرای فناوری های جدید، شروع با تکنیک های جدید، افزودن ساختارهای جدید باشند اطلاعات ، بارگیری i اطلاعات اضافی، یا با گسترش تجزیه و تحلیل محیط شما. این پاراگراف در فصل 3 بیشتر مورد بحث قرار گرفته است.

علاوه بر ساختارهای DW سنتی و ابزارهای BI، عملکردهای دیگری نیز در سازمان BI شما وجود دارد که باید برای آنها طراحی کنید، مانند:

نقاط تماس مشتری (لمس مشتری نکته ها).

مانند هر سازمان مدرن، تعدادی از نقاط تماس مشتری وجود دارد که نشان می دهد چگونه یک تجربه مثبت برای خود داشته باشید مشتریان. کانال‌های سنتی مانند خرده‌فروشان، اپراتورهای تابلو، پست مستقیم، تبلیغات چندرسانه‌ای و چاپی و همچنین کانال‌های رایج‌تری مانند ایمیل و وب وجود دارد. اطلاعات محصولات با نقطه تماس باید به دست آورد، حمل و نقل، تمیز، پردازش و سپس در تاسیسات پر شده است اطلاعات از BI.

پایه های اطلاعات انجمن های عملیاتی و کاربری (عملیاتی

پایگاه های داده و جوامع کاربر).
در پایان نقاط تماس از مشتریان پایه ها پیدا می شود اطلاعات از برنامه های کاربردی شرکت و جوامع کاربر. THE اطلاعات موجود هستند اطلاعات سنتی که باید کنار هم جمع شود و با آن ادغام شود اطلاعات که از نقاط تماس برای برآوردن اطلاعات لازم جریان می یابد.

تحلیلگران (تحلیلگران)

ذینفع اصلی محیط BI، تحلیلگر است. اوست که از استخراج فعلی بهره می برد اطلاعات عملیاتی، یکپارچه با منابع مختلف اطلاعات ، افزوده شده با ویژگی هایی مانند تجزیه و تحلیل جغرافیایی (geocoding) و ارائه شده در فناوری های BI که امکان استخراج، OLAP، گزارش پیشرفته SQL و تجزیه و تحلیل جغرافیایی را فراهم می کند. رابط اصلی تحلیلگر برای محیط گزارش، پورتال BI است.

با این حال، تحلیلگر تنها کسی نیست که از معماری BI سود می برد.
مدیران اجرایی، انجمن های کاربران بزرگ، و حتی اعضا، تامین کنندگان و i مشتریان باید در BI سازمانی مزایایی پیدا کند.

حلقه فید برگشتی.

معماری BI یک محیط یادگیری است. یک اصل مشخصه توسعه اجازه دادن به ساختارهای پایدار است اطلاعات با فناوری BI استفاده شده و اقدامات انجام شده توسط کاربر به روز شود. یک مثال امتیازدهی مشتری است.

اگر بخش فروش امتیازات مشتری را برای استفاده از یک سرویس جدید مدل می کند، بخش فروش نباید تنها گروهی باشد که از خدمات بهره می برد.

در عوض، استخراج مدل باید به عنوان بخشی طبیعی از جریان داده در سازمان انجام شود و امتیازات مشتری باید به بخشی از بافت اطلاعات انبار تبدیل شود و برای همه کاربران قابل مشاهده باشد. مجموعه Bi-bI محور IBM شامل DB2 UDB، DB2 OLAP Server شامل اکثر اجزای فناوری اصلی است که در شکل 1.1 تعریف شده است.

ما از معماری همانطور که در این تصویر از کتاب نشان داده شده است استفاده می کنیم تا سطحی از تداوم را به ما بدهد و نشان دهیم که چگونه هر محصول IBM در طرح کلی BI قرار می گیرد.

ارائه محتوای اطلاعاتی (ارائه محتوای اطلاعاتی)

طراحی، توسعه و پیاده سازی محیط BI شما یک کار دلهره آور است. این طرح باید الزامات تجاری فعلی و آتی را در بر گیرد. نقشه معماری باید کامل باشد تا تمام نتایج بدست آمده در مرحله طراحی را شامل شود. اجرا باید به یک هدف واحد متعهد باقی بماند: توسعه معماری BI همانطور که به طور رسمی در طراحی ارائه شده و بر اساس الزامات تجاری است.

به ویژه دشوار است که استدلال کنیم که نظم و انضباط موفقیت نسبی را تضمین می کند.
این ساده است زیرا شما یک محیط BI را به یکباره توسعه نمی دهید، اما آن را در مراحل کوچک در طول زمان انجام می دهید.

با این حال، شناسایی اجزای BI معماری شما به دو دلیل مهم است: شما تمام تصمیمات معماری فنی بعدی را هدایت خواهید کرد.
شما می‌توانید آگاهانه برای استفاده خاصی از فناوری برنامه‌ریزی کنید، حتی اگر چندین ماه دیگر تکرار نشود.

درک کافی نیازهای کسب و کار شما بر نوع محصولاتی که برای معماری خود به دست می آورید تأثیر می گذارد.
طراحی و توسعه معماری شما تضمین می کند که انبار شما درست است

نه یک رویداد تصادفی، بلکه یک "خوب اندیشیده شده" به دقت ساخته شده است. اپرا هنر به عنوان موزاییکی از فناوری ترکیبی

طراحی محتوای اطلاعاتی

تمام طراحی اولیه باید بر روی مؤلفه‌های کلیدی BI که اکنون و در آینده برای محیط کلی مورد نیاز است، تمرکز کرده و شناسایی کند.
دانستن الزامات کسب و کار مهم است.

حتی قبل از شروع هر طراحی رسمی، برنامه ریز پروژه اغلب می تواند بلافاصله یک یا دو جزء را شناسایی کند.
با این حال، تعادل اجزایی که ممکن است برای معماری شما مورد نیاز باشد، به راحتی یافت نمی شود. در طول مرحله طراحی، بخش اصلی معماری جلسه توسعه اپلیکیشن (JAD) را بر روی یک تحقیق برای شناسایی الزامات کسب و کار مرتبط می کند.

گاهی اوقات می توان این الزامات را به ابزارهای پرس و جو و گزارش سپرد.
برای مثال، کاربران بیان می‌کنند که اگر می‌خواهند یک گزارش فعلی را خودکار کنند، باید به صورت دستی آن را با ادغام دو گزارش فعلی و اضافه کردن محاسبات حاصل از ترکیب اطلاعات.
اگرچه این الزام ساده است، اما عملکرد خاصی از ویژگی را مشخص می کند که باید هنگام خرید ابزار گزارش دهی برای سازمان خود، آن را در نظر بگیرید.

طراح همچنین باید الزامات اضافی را برای به دست آوردن یک تصویر کامل دنبال کند. آیا کاربران می خواهند در این گزارش مشترک شوند؟
آیا زیر مجموعه های گزارش تولید و برای کاربران مختلف ایمیل می شوند؟ آیا آنها می خواهند این گزارش را در پورتال شرکت ببینند؟ همه این الزامات بخشی از نیاز ساده برای جایگزینی یک گزارش دستی است که توسط کاربران درخواست شده است. مزیت این نوع الزامات این است که همه، کاربران و طراحان، درک درستی از مفهوم گزارش دارند.

با این حال، انواع دیگری از کسب و کارها وجود دارد که باید برای آنها برنامه ریزی کنیم. هنگامی که الزامات کسب و کار در قالب سوالات استراتژیک کسب و کار بیان می شود، برای طراح متخصص تشخیص اندازه گیری/واقعیت و الزامات ابعادی آسان است.

اگر کاربران JAD ندانند که چگونه الزامات خود را در قالب یک مشکل تجاری بیان کنند، طراح اغلب نمونه هایی را برای شروع سریع جلسه جمع آوری نیازمندی ها ارائه می دهد.
طراح متخصص می تواند به کاربران کمک کند تا نه تنها تجارت استراتژیک، بلکه نحوه شکل گیری آن را نیز درک کنند.
رویکرد جمع آوری نیازمندی ها در فصل 3 مورد بحث قرار گرفته است. در حال حاضر ما فقط می خواهیم به نیاز به طراحی برای انواع الزامات BI اشاره کنیم.

یک مشکل تجاری استراتژیک نه تنها یک نیاز تجاری، بلکه یک سرنخ طراحی نیز هست. اگر باید به یک سوال چند بعدی پاسخ دهید، باید به خاطر بسپارید، i اطلاعات ابعادی، و در صورت نیاز به حفظ کردن اطلاعات چند بعدی، شما باید تصمیم بگیرید که از چه نوع فناوری یا تکنیکی استفاده می کنید.

آیا شما یک طرح ستاره مکعب رزرو شده را پیاده سازی می کنید یا هر دو؟ همانطور که می بینید، حتی یک مشکل تجاری ساده می تواند به طور قابل توجهی بر طراحی تاثیر بگذارد. اما این نوع الزامات تجاری، حداقل توسط طراحان و برنامه ریزان با تجربه پروژه رایج و قابل درک است.

بحث های کافی در مورد فناوری ها و پشتیبانی OLAP صورت گرفته است و طیف وسیعی از راه حل ها در دسترس هستند. تا اینجا ما به نیاز به گردآوری گزارش‌های ساده با الزامات ابعادی تجاری و اینکه چگونه این الزامات بر تصمیمات فنی معماری تأثیر می‌گذارند، اشاره کرده‌ایم.

اما چه الزاماتی وجود دارد که توسط کاربران یا تیم Dw به راحتی قابل درک نیست؟ آیا هرگز به تحلیل فضایی نیاز خواهید داشت؟
مدل های استخراج از اطلاعات آیا آنها بخشی ضروری از آینده شما خواهند بود؟ چه کسی می داند؟

توجه به این نکته مهم است که این نوع فناوری‌ها توسط عموم کاربران و اعضای تیم Dw به خوبی شناخته نشده‌اند، تا حدی ممکن است به این دلیل باشد که آنها معمولاً توسط برخی از کارشناسان فنی داخلی یا شخص ثالث مدیریت می‌شوند. این یک مورد شدید از مشکلاتی است که این نوع فناوری ها ایجاد می کنند. اگر کاربران نتوانند الزامات کسب و کار را توصیف کنند یا آنها را به گونه ای چارچوب بندی کنند که برای طراحان راهنمایی باشد، می توانند مورد توجه قرار نگیرند یا بدتر از آن، به سادگی نادیده گرفته شوند.

زمانی مشکل سازتر می شود که طراح و توسعه دهنده نتوانند کاربرد یکی از این فناوری های پیشرفته اما حیاتی را تشخیص دهند.
همانطور که اغلب شنیده‌ایم که طراحان می‌گویند، «خب، چرا آن را کنار نمی‌گذاریم تا به این چیزهای دیگر دست پیدا کنیم؟ «آیا آنها واقعاً به اولویت‌ها علاقه دارند، یا صرفاً از الزاماتی که نمی‌فهمند اجتناب می‌کنند؟ به احتمال زیاد آخرین فرضیه است. فرض کنید تیم فروش شما یک الزام تجاری را بیان کرده است، همانطور که در شکل 1.3 بیان شده است، همانطور که می بینید، این نیاز به شکل یک مشکل تجاری در نظر گرفته شده است. تفاوت بین این مسئله و مسئله ابعادی معمولی فاصله است. در این صورت، تیم فروش می خواهد به صورت ماهانه از کل فروش محصولات، انبارها و فروشگاه ها مطلع شود. مشتریان که در 5 مایلی انباری که در آن خرید می کنند زندگی می کنند.

متأسفانه، طراحان یا معماران می توانند به سادگی با گفتن این جمله که «ما مشتری، محصول و اطلاعات از سپرده بیایید فاصله را تا تکرار دیگری حفظ کنیم.

"جواب اشتباه. این نوع از مشکلات کسب و کار همه چیز در مورد BI است. این نشان دهنده درک عمیق تر از تجارت ما و یک فضای تحلیلی قوی برای تحلیلگران ما است. BI فراتر از پرس و جوی ساده یا گزارش استاندارد یا حتی OLAP است. این بدان معنا نیست که این فناوری ها برای BI شما مهم نیستند، اما به خودی خود نشان دهنده محیط BI نیستند.

طراحی برای زمینه اطلاعات (طراحی برای محتوای اطلاعاتی)

اکنون که نیازمندی‌های تجاری را شناسایی کرده‌ایم که مؤلفه‌های بنیادی مختلف را متمایز می‌کند، آنها باید در یک طرح کلی معماری گنجانده شوند. برخی از مؤلفه‌های BI بخشی از تلاش‌های اولیه ما هستند، در حالی که برخی برای چندین ماه اجرا نمی‌شوند.

با این حال، تمام الزامات شناخته شده در طراحی منعکس شده است به طوری که زمانی که ما نیاز به پیاده سازی یک فناوری خاص داریم، آماده انجام آن هستیم. چیزی در مورد پروژه منعکس کننده تفکر سنتی است.

این مجموعه از اطلاعات برای پشتیبانی از کاربردهای بعدی استفاده می شود اطلاعات ابعادی که توسط مسائل تجاری که ما شناسایی کرده ایم هدایت می شود. همانطور که اسناد اضافی تولید می شوند، مانند توسعه طراحی اطلاعات، ما شروع به رسمی کردن نحوه i اطلاعات در محیط پخش می شوند. ما نیاز به نمایندگی i را مشخص کرده ایم اطلاعات به صورت ابعادی، آنها را (با توجه به نیازهای خاص) به دیتامارت ها تقسیم می کند.

سوال بعدی که باید پاسخ داد این است: این دیتا مارت ها چگونه ساخته خواهند شد؟
آیا شما ستاره ها را برای حمایت از مکعب ها می سازید یا فقط مکعب ها یا فقط ستاره ها را؟ (یا مکعب های راست، یا ستاره های سمت راست). ایجاد معماری برای مارت های داده وابسته که نیاز به یک لایه اتمی برای همه دارند اطلاعات آیا به دست می آورید؟ به داده‌های مستقل اجازه دهید i را بدست آورند اطلاعات مستقیما از سیستم عامل؟

چه فناوری مکعبی را می خواهید استاندارد کنید؟

شما تعداد زیادی خدا دارید اطلاعات برای تجزیه و تحلیل ابعادی مورد نیاز است یا آیا به مکعب هایی از نیروی فروش ملی خود به صورت هفتگی نیاز دارید یا هر دو؟ آیا چیزی به قدرتمندی DB2 OLAP Server برای امور مالی یا مکعب های Cognos PowerPlay برای سازمان فروش خود می سازید یا هر دو؟ اینها تصمیمات بزرگ طراحی معماری هستند که از اینجا به بعد بر محیط BI شما تأثیر خواهند گذاشت. بله، شما نیاز به OLAP را ایجاد کرده اید. حال چگونه آن نوع تکنیک و فناوری را اجرا خواهید کرد؟

چگونه برخی از پیشرفته ترین فناوری ها بر طراحی های شما تأثیر می گذارند؟ بیایید فرض کنیم شما نیاز به فضا را در سازمان خود شناسایی کرده اید. اکنون باید نسخه های طراحی معماری را به یاد بیاورید حتی اگر برای چندین ماه قصد ساخت اجزای فضایی را ندارید. معمار باید امروز بر اساس آنچه نیاز است طراحی کند. نیاز به تجزیه و تحلیل فضایی که تولید، ذخیره، اجرا و دسترسی به آن را فراهم می کند، پیش بینی کنید اطلاعات فضایی. این به نوبه خود باید به عنوان یک محدودیت در مورد نوع فناوری نرم افزار و مشخصات پلت فرمی باشد که در حال حاضر می توانید در نظر بگیرید. به عنوان مثال، سیستم مدیریت از پایگاه داده لایه رابطه ای (RDBMS) که برای لایه اتمی خود انجام می دهید باید دارای پسوند فضایی قوی باشد. این کار حداکثر عملکرد را هنگام استفاده از هندسه و اشیاء فضایی در برنامه های تحلیلی شما تضمین می کند. اگر RDBMS شما نمی تواند با آن مقابله کند اطلاعات (فضایی محور) به صورت داخلی، بنابراین شما باید یک را ایجاد کنید پایگاه داده (فضایی محور) خارجی. این امر مدیریت مسائل را پیچیده می‌کند و عملکرد کلی شما را به خطر می‌اندازد، به غیر از مشکلات اضافی ایجاد شده برای DBA‌های شما، زیرا آنها احتمالاً درک حداقلی از اصول اولیه دارند. اطلاعات فضایی نیز از طرف دیگر، اگر موتور RDMBS شما تمام اجزای فضایی را مدیریت می کند و بهینه ساز آن از نیازهای ویژه اشیاء فضایی (مثلاً نمایه سازی) آگاه است، DBA های شما به راحتی می توانند مدیریت مسائل را انجام دهند و می توانید عملکرد را به حداکثر برسانید.

علاوه بر این، باید ناحیه مرحله بندی و لایه محیط اتمی را تنظیم کنید تا شامل پاکسازی آدرس (الف

عنصر کلیدی برای تجزیه و تحلیل فضایی)، و همچنین صرفه جویی بعدی در اشیاء فضایی. توالی نسخه های ترسیمی اکنون که مفهوم جهت روشن را معرفی کرده ایم ادامه دارد. برای یک چیز، این برنامه نوع نرم افزار مورد نیاز برای تلاش ETL شما را دیکته می کند.

آیا برای ارائه یک آدرس تمیز به محصولاتی مانند Trillium نیاز دارید یا به یک فروشنده ETL انتخابی شما برای ارائه این قابلیت؟
در حال حاضر مهم است که از سطح طراحی که باید قبل از شروع اجرای انبار خود تکمیل شود، قدردانی کنید. مثال‌های بالا باید تعداد زیادی از تصمیم‌گیری‌های طراحی را نشان دهند که باید به دنبال شناسایی هر نیاز تجاری خاص باشند. اگر این تصمیمات طراحی به درستی اتخاذ شوند، وابستگی متقابل بین ساختارهای فیزیکی محیط شما، انتخاب فناوری مورد استفاده و جریان انتشار محتوای اطلاعاتی را تقویت می کنند. بدون این معماری مرسوم BI، سازمان شما در معرض ترکیبی بی‌نظم از فناوری‌های موجود قرار می‌گیرد، که در بهترین حالت برای ایجاد ثبات ظاهری به هم متصل شده‌اند.

محتوای اطلاعاتی را حفظ کنید

آوردن ارزش اطلاعات به سازمان شما کار بسیار دشواری است. بدون درک و تجربه کافی، یا برنامه ریزی و طراحی مناسب، حتی بهترین تیم ها نیز شکست خواهند خورد. از سوی دیگر، اگر شهود عالی و برنامه ریزی دقیق دارید اما نظم و انضباط برای اجرا ندارید، فقط پول و زمان خود را هدر داده اید زیرا تلاش شما محکوم به شکست است. پیام باید واضح باشد: اگر شما فاقد یک یا چند مورد از این مهارت ها، درک/تجربه یا برنامه ریزی/طراحی یا اجرا هستید، ساختمان سازمان BI را فلج یا ویران می کند.

آیا تیم شما به اندازه کافی آماده است؟ آیا کسی در تیم BI شما وجود دارد که چشم انداز تحلیلی گسترده موجود در محیط های BI و تکنیک ها و فناوری های مورد نیاز برای حفظ آن چشم انداز را درک کند؟ آیا فردی در تیم شما وجود دارد که بتواند تفاوت برنامه های پیشرفته را تشخیص دهد؟

گزارش استاتیک و OLAP، یا تفاوت بین ROLAP و OLAP؟ آیا یکی از اعضای تیم شما به وضوح نحوه استخراج را تشخیص می دهد و چگونه می تواند بر انبار تأثیر بگذارد یا اینکه چگونه انبار می تواند عملکرد استخراج را پشتیبانی کند؟ یک عضو تیم ارزش آن را درک می کند اطلاعات فضا یا فناوری مبتنی بر عامل؟ آیا کسی را دارید که از کاربرد منحصر به فرد ابزارهای ETL در مقابل فناوری واسطه پیام قدردانی کند؟ اگر آن را ندارید، یکی بگیرید. BI بسیار بزرگتر از یک لایه اتمی نرمال شده، OLAP، طرحواره های ستاره ای و ODS است.

داشتن درک و تجربه برای شناخت الزامات BI و راه حل های آنها برای توانایی شما در رسمی کردن صحیح نیازهای کاربر و طراحی و اجرای راه حل های آنها ضروری است. اگر جامعه کاربری شما در توصیف الزامات مشکل دارد، وظیفه تیم انبار است که این درک را ارائه دهد. اما اگر تیم انبار

کاربرد خاص BI را نمی شناسد - به عنوان مثال، داده کاوی - پس بهترین چیز نیست که محیط های BI اغلب به مخازن غیرفعال بودن محدود می شوند. با این حال، نادیده گرفتن این فناوری ها از اهمیت آنها و تأثیر آنها بر ظهور قابلیت های هوش تجاری سازمان شما و همچنین چشم انداز اطلاعاتی که قصد دارید آن را تقویت کنید، نمی کاهد.

برنامه ریزی باید شامل مفهوم ترسیم باشد و هر دو به یک فرد شایسته نیاز دارند. علاوه بر این، طراحی نیاز به فلسفه انبار تیمی و رعایت استانداردها دارد. به عنوان مثال، اگر شرکت شما یک پلتفرم استاندارد ایجاد کرده است یا یک RDBMS خاص را شناسایی کرده است که می‌خواهید آن را در سراسر پلتفرم استاندارد کنید، مسئولیت پایبندی به آن استانداردها بر عهده همه اعضای تیم است. به طور کلی یک تیم نیاز به استانداردسازی را (برای جوامع کاربر) نشان می دهد، اما خود تیم تمایلی به رعایت استانداردهای ایجاد شده در حوزه های دیگر در شرکت یا شاید حتی در شرکت های مشابه ندارد. این نه تنها ریاکارانه است، بلکه نشان می دهد که شرکت قادر به بهره برداری از منابع و سرمایه گذاری های موجود نیست. این بدان معنا نیست که هیچ موقعیتی وجود ندارد که یک پلت فرم یا فناوری غیر استاندارد را تضمین کند. با این حال، تلاش های انبار

آنها باید با حسادت از استانداردهای شرکت محافظت کنند تا زمانی که الزامات تجاری خلاف آن را دیکته کند.

سومین جزء کلیدی مورد نیاز برای ایجاد یک سازمان BI، نظم و انضباط است.
در کل، به طور مساوی به افراد و محیط بستگی دارد. برنامه ریزان پروژه، حامیان مالی، معماران و کاربران باید از نظم و انضباط لازم برای ایجاد ساختار اطلاعاتی شرکت قدردانی کنند. طراحان باید تلاش های طراحی خود را به گونه ای هدایت کنند که مکمل سایر تلاش های ضروری در جامعه باشد.

به عنوان مثال، فرض کنید شرکت شما یک برنامه ERP می سازد که دارای یک جزء انبار است.
بنابراین این مسئولیت طراحان ERP است که با تیم محیط انبار همکاری کنند تا با کارهایی که از قبل شروع شده رقابت نکنند یا تکراری نشوند.

نظم و انضباط نیز موضوعی است که باید توسط کل سازمان مورد توجه قرار گیرد و معمولاً ایجاد و به یک سطح اجرایی سپرده می شود.
آیا مدیران مایلند به یک رویکرد طراحی شده پایبند باشند؟ رویکردی که نوید ایجاد محتوای اطلاعاتی را می‌دهد که در نهایت برای همه حوزه‌های سازمانی ارزش ایجاد می‌کند، اما شاید برنامه‌های فردی یا دپارتمان را به خطر بیاندازد؟ این جمله را به خاطر بسپارید که «فکر کردن به همه چیز مهمتر از فکر کردن به یک چیز است». این جمله برای سازمان های BI صادق است.

متأسفانه، بسیاری از انبارها تلاش خود را بر تلاش برای هدف قرار دادن و ارزش بخشیدن به یک بخش خاص یا کاربران خاص متمرکز می کنند، بدون توجه به سازمان در کل. فرض کنید مدیر اجرایی از تیم انبار درخواست کمک کند. این تیم با تلاش 90 روزه پاسخ می دهد که شامل نه تنها ارائه الزامات اعلان تعریف شده توسط مدیر است، بلکه تضمین می کند که همه اطلاعات پایه قبل از اینکه به فناوری مکعب پیشنهادی معرفی شود در سطح اتمی مخلوط می شوند.
این افزوده مهندسی تضمین می کند که شرکت انبار از مزایای آن بهره مند خواهد شد اطلاعات برای مدیر لازم است.
با این حال، مدیر اجرایی با شرکت های مشاوره خارجی صحبت کرد که برنامه مشابهی را با تحویل در کمتر از 4 هفته پیشنهاد کردند.

با فرض اینکه تیم انبار داخلی صلاحیت داشته باشد، مجری یک انتخاب دارد. چه کسی می تواند از رشته مهندسی اضافی مورد نیاز برای پرورش شرکت دارایی اطلاعات پشتیبانی کند یا می تواند راه حل خود را به سرعت بسازد. به نظر می‌رسد که آخرین مورد خیلی زیاد انتخاب می‌شود و فقط برای ایجاد محفظه‌هایی از اطلاعات است که فقط به نفع عده‌ای یا افراد است.

اهداف کوتاه مدت و بلند مدت

معماران و طراحان پروژه باید یک چشم انداز بلند مدت از معماری کلی و برنامه های رشد در یک سازمان BI رسمیت دهند. این ترکیب سود کوتاه‌مدت و برنامه‌ریزی بلندمدت نشان‌دهنده دو طرف تلاش‌های BI است. سود کوتاه مدت جنبه ای از BI است که با تکرارهای انبار شما مرتبط است.

اینجاست که برنامه ریزان، معماران و حامیان مالی بر روی برآوردن نیازهای تجاری خاص تمرکز می کنند. در این سطح است که سازه های فیزیکی ساخته می شوند، تکنولوژی خریداری می شود و تکنیک ها اجرا می شوند. آنها به هیچ وجه برای پاسخگویی به الزامات خاصی که توسط جوامع کاربری خاص تعریف شده اند ساخته نشده اند. همه چیز به منظور رسیدگی به الزامات خاص تعریف شده توسط یک جامعه خاص انجام می شود.
با این حال، برنامه ریزی بلند مدت، جنبه دیگر BI است. اینجاست که طرح‌ها و طرح‌ها تضمین می‌کنند که هر ساختار فیزیکی ساخته شده است، فناوری‌ها انتخاب شده و تکنیک‌های پیاده‌سازی شده با توجه به شرکت انجام می‌شوند. این برنامه ریزی بلندمدت است که انسجام لازم را برای اطمینان از اینکه منافع کسب و کار از هرگونه سود کوتاه مدت حاصل می شود را فراهم می کند.

تلاش BI خود را توجیه کنید

Un انبار داده به خودی خود هیچ ارزش ذاتی ندارد. به عبارت دیگر، هیچ ارزش ذاتی بین فناوری های انبار و تکنیک های پیاده سازی وجود ندارد.

ارزش هر تلاش انبار در اقدامات انجام شده در نتیجه محیط انبار و محتوای اطلاعاتی پرورش یافته در طول زمان یافت می شود. این نکته مهمی است که باید قبل از اینکه بخواهید ارزش هر ابتکار خانه را تخمین بزنید، درک کنید.

اغلب، معماران و طراحان سعی می کنند ارزشی را برای اجزای فیزیکی و فنی انبار اعمال کنند، در حالی که در واقع ارزش مبتنی بر فرآیندهای تجاری است که به طور مثبت تحت تأثیر انبار و اطلاعات به دست آمده است.

چالش ایجاد BI در اینجا نهفته است: چگونه سرمایه گذاری را توجیه می کنید؟ اگر مکان خود ارزش ذاتی نداشته باشد، طراحان پروژه باید مزایای به دست آمده توسط افرادی را که از انبار برای بهبود فرآیندهای تجاری خاص یا ارزش اطلاعات محافظت شده یا هر دو استفاده می کنند، بررسی، تعریف و رسمیت بخشند.

برای پیچیده تر کردن مسائل، هر فرآیند تجاری تحت تأثیر تلاش های انبارداری می تواند مزایای "قابل توجه" یا "خفیف" را به همراه داشته باشد. مزایای قابل توجه معیاری ملموس برای اندازه‌گیری بازگشت سرمایه (ROI) ارائه می‌کند - به عنوان مثال، تبدیل موجودی یک زمان اضافی در طول یک دوره خاص یا هزینه حمل و نقل کمتر برای هر محموله. تعریف مزایای ظریف، مانند بهبود دسترسی به اطلاعات، از نظر ارزش ملموس دشوارتر است.

پروژه خود را وصل کنید تا در مورد آن بیاموزید درخواست های تجاری

اغلب اوقات، برنامه ریزان پروژه تلاش می کنند ارزش انبار را به اهداف سازمانی بی شکل مرتبط کنند. با اعلام اینکه "ارزش یک انبار بر اساس توانایی ما در برآوردن درخواست های استراتژیک است" بحث را به شیوه ای دلپذیر باز می کنیم. اما این به تنهایی برای تعیین اینکه آیا سرمایه گذاری در موجودی منطقی است کافی نیست. بهترین کار این است که تکرارهای انبار را با نیازهای تجاری مشخص و شناخته شده مرتبط کنید.

اندازه گیری بازگشت سرمایه

محاسبه ROI در تنظیمات انبار می تواند به خصوص دشوار باشد. به خصوص دشوار است اگر مزیت

اصل یک تکرار خاص چیزی است که قابل لمس یا اندازه گیری آسان نیست. یک مطالعه نشان داد که کاربران دو مزیت اصلی ابتکارات BI را درک می کنند:

  • ▪  توانایی برای تصمیم‌گیری ایجاد کنید
  • ▪  دسترسی به اطلاعات ایجاد کنید
    این مزایا مزایای نرم (یا ملایم) هستند. به راحتی می‌توان دید که چگونه می‌توانیم ROI را بر اساس یک مزیت سخت (یا عمده) مانند کاهش هزینه‌های حمل‌ونقل محاسبه کنیم، اما چگونه می‌توانیم توانایی تصمیم‌گیری بهتر را بسنجیم؟
    این قطعا یک چالش برای برنامه ریزان پروژه است، زمانی که می خواهند شرکت را متقاعد کنند تا در یک انبار خاص سرمایه گذاری کند. افزایش فروش یا کاهش هزینه ها دیگر موضوعات اصلی محرک محیط BI نیستند.
    در عوض، شما به درخواست‌های تجاری برای دسترسی بهتر به اطلاعات نگاه می‌کنید تا یک بخش خاص بتواند سریع‌تر تصمیم بگیرد. اینها محرک‌های استراتژیک هستند که اتفاقاً به یک اندازه برای شرکت مهم هستند، اما مبهم‌تر هستند و توصیف آنها در یک معیار ملموس دشوارتر است. در این مورد، محاسبه ROI اگر نامربوط نباشد، می تواند گمراه کننده باشد.
    طراحان پروژه باید بتوانند ارزش ملموسی را برای مدیران به نمایش بگذارند تا تصمیم بگیرند که آیا سرمایه گذاری در یک تکرار خاص ارزش آن را دارد یا خیر. با این حال، ما روش جدیدی برای محاسبه ROI پیشنهاد نمی کنیم و هیچ استدلالی برای یا مخالف آن ارائه نمی کنیم.
    مقالات و کتاب های زیادی در دسترس هستند که در مورد اصول محاسبه ROI بحث می کنند. پیشنهادهای ارزش ویژه ای مانند ارزش سرمایه گذاری (VOI) وجود دارد که توسط گروه هایی مانند گارتنر ارائه شده است که می توانید درباره آنها تحقیق کنید. در عوض، ما بر جنبه‌های اصلی هر ROI یا سایر گزاره‌های ارزشی که باید در نظر بگیرید، تمرکز می‌کنیم. اعمال بازگشت سرمایه فراتر از بحث در مورد مزایای "سخت" در مقابل مزایای "نرم" مرتبط با تلاش های BI، مسائل دیگری نیز در هنگام اعمال ROI وجود دارد. مثلا:

صرفه جویی های زیادی را به تلاش های DW نسبت دهید که به هر حال انجام می شود
فرض کنید شرکت شما از یک معماری مرکزی به یک محیط یونیکس توزیع شده منتقل شده است. بنابراین هر گونه صرفه جویی که ممکن است (یا ممکن است) از آن تلاش محقق شود، نباید منحصراً، اگر اصلاً (؟)، به انبار نسبت داده شود.

حساب نکردن همه چیز پرهزینه است. و موارد زیادی وجود دارد که باید در نظر گرفته شود. لیست زیر را در نظر بگیرید:

  • ▪  هزینه راه اندازی، از جمله امکان سنجی.
  • ▪  هزینه سخت‌افزار اختصاصی با فضای ذخیره‌سازی و ارتباطات مرتبط
  • ▪  هزینه نرم افزار، از جمله مدیریت اطلاعات و برنامه‌های افزودنی مشتری/سرور، نرم‌افزار ETL، فناوری‌های DSS، ابزارهای تجسم، برنامه‌های زمان‌بندی و گردش کار، و نرم‌افزار نظارت، .
  • ▪  هزینه طراحی سازه اطلاعات، با ایجاد و بهینه سازی
  • ▪  هزینه توسعه نرم افزار به طور مستقیم با تلاش BI مرتبط است
  • ▪  هزینه پشتیبانی خانگی، از جمله بهینه‌سازی عملکرد، از جمله کنترل نسخه نرم‌افزار و عملیات کمک ROI "Big-Bang" را اعمال کنید. ساخت انبار به‌عنوان یک تلاش غول‌پیکر محکوم به شکست است، بنابراین حتی نرخ بازگشت سرمایه را برای یک ابتکار شرکت بزرگ محاسبه کنید. چرا برنامه ریزان سعی می کنند برای ابتکار تجاری ارزش پولی قائل شوند، در صورتی که به طور گسترده شناخته شده و پذیرفته شده است که تخمین تکرارهای خاص دشوار است؟ چطور ممکنه؟ با چند استثنا امکان پذیر نیست. انجامش نده اکنون که مشخص کرده‌ایم در هنگام محاسبه ROI چه کارهایی نباید انجام دهیم، در اینجا چند نکته وجود دارد که به ما در ایجاد یک فرآیند قابل اعتماد برای تخمین ارزش تلاش‌های BI شما کمک می‌کند.

به دست آوردن اجماع ROI. صرف نظر از انتخاب روش شما برای تخمین ارزش تلاش‌های BI شما، باید مورد توافق همه طرف‌ها، از جمله طراحان پروژه، حامیان مالی و مدیران تجاری باشد.

ROI را به قسمت های قابل شناسایی کاهش دهید. یک گام ضروری برای محاسبه معقول ROI، تمرکز آن محاسبه بر روی یک پروژه خاص است. سپس به شما این امکان را می دهد که یک ارزش را بر اساس الزامات کسب و کار خاصی که برآورده شده است، تخمین بزنید

هزینه ها را تعریف کنید. همانطور که گفته شد، هزینه های متعددی باید در نظر گرفته شود. علاوه بر این، هزینه‌ها نه تنها باید شامل هزینه‌های مرتبط با یک تکرار باشد، بلکه باید شامل هزینه‌های مرتبط با اطمینان از انطباق با استانداردهای شرکت نیز باشد.

مزایا را تعریف کنید. با پیوند دادن واضح ROI به الزامات تجاری خاص، باید بتوانیم مزایایی را که منجر به برآورده شدن الزامات می شود، شناسایی کنیم.

کاهش هزینه ها و منافع در سود قریب الوقوع. این بهترین راه برای استوار کردن ارزش‌گذاری‌های خود بر مبنای ارزش فعلی خالص (NPV) است، در مقابل تلاش برای پیش‌بینی ارزش آتی در سودهای آتی.

زمان تقسیم ROI خود را به حداقل برسانید. در طول مدت زمانی طولانی که در ROI شما استفاده شده است، به خوبی مستند شده است.

از بیش از یک فرمول ROI استفاده کنید. روش‌های متعددی برای پیش‌بینی ROI وجود دارد و باید برنامه‌ریزی کنید که از یک یا چند مورد از جمله ارزش فعلی خالص، نرخ بازده داخلی (IRR) و بازپرداخت استفاده کنید.

تعریف فرآیند تکرارپذیر این برای محاسبه هر ارزش بلند مدت بسیار مهم است. یک فرآیند تکرارپذیر واحد باید برای تمام مراحل بعدی پروژه مستند شود.

مشکلات ذکر شده رایج ترین مشکلاتی است که توسط کارشناسان در محیط انبار تعریف شده است. اصرار مدیریت بر ارائه ROI "بیگ بنگ" بسیار ناامیدکننده است. اگر تمام محاسبات ROI خود را با تقسیم آنها به قطعات قابل شناسایی و ملموس شروع کنید، شانس خوبی برای تخمین رتبه ROI دقیق دارید.

سوالات مربوط به مزایای بازگشت سرمایه

مزایای شما هر چه که باشد، نرم یا سخت، می توانید از چند سوال اساسی برای تعیین ارزش آنها استفاده کنید. به عنوان مثال، با استفاده از یک سیستم مقیاس بندی ساده، از 1 تا 10، می توانید تأثیر هر تلاشی را با استفاده از سؤالات زیر اندازه گیری کنید:

  • درک را چگونه ارزیابی می کنید اطلاعات این پروژه شرکت شما را دنبال می کنید؟
  • بهبود فرآیند را در نتیجه این پروژه چگونه ارزیابی می کنید؟
  • چگونه تأثیر بینش ها و استنباط های جدیدی را که اکنون با این تکرار در دسترس قرار گرفته اند، اندازه گیری می کنید
  • تأثیر محیط‌های محاسباتی جدید و با کارایی بالا در نتیجه آموخته‌ها چه بود؟ اگر پاسخ به این سوالات کم باشد، ممکن است شرکت ارزش سرمایه گذاری انجام شده را نداشته باشد. سوالات با امتیاز بالا به دستاوردهای ارزشی قابل توجهی اشاره می کنند و باید به عنوان راهنما برای بررسی بیشتر عمل کنند. به عنوان مثال، نمره بالا برای بهبود فرآیندها باید طراحان را به بررسی چگونگی بهبود فرآیندها سوق دهد. ممکن است متوجه شوید که برخی یا همه سودهای به دست آمده ملموس هستند و بنابراین می توان به راحتی ارزش پولی را اعمال کرد. بیشترین بهره را از اولین تکرار از انبار بزرگترین نتیجه تلاش سازمانی شما اغلب در چند تکرار اول است. این تلاش‌های اولیه به طور سنتی مفیدترین محتوای اطلاعاتی را برای عموم ایجاد می‌کنند و به ایجاد شالوده فناوری برای برنامه‌های بعدی BI کمک می‌کنند. معمولا هر دنباله بعدی از اطلاعات پروژه های انبار به طور کلی ارزش اضافی کمتر و کمتری را برای شرکت به ارمغان می آورد. این امر به ویژه در صورتی صادق است که تکرار موضوعات جدیدی اضافه نکند یا نیازهای یک جامعه کاربری جدید را برآورده نکند.

این ویژگی ذخیره‌سازی برای پشته‌های در حال رشد نیز کاربرد دارد اطلاعات مورخان همانطور که تلاش های بعدی مستلزم بیشتر است اطلاعات و چگونه بیشتر اطلاعات به مرور زمان به انبار ریخته می شوند، بیشتر اطلاعات کمتر به تحلیل مورد استفاده مرتبط می شود. اینها اطلاعات آنها اغلب نامیده می شوند اطلاعات غیر فعال هستند و نگهداری آنها همیشه گران است زیرا تقریباً هرگز استفاده نمی شوند.

این برای حامیان پروژه چه معنایی دارد؟ اساساً، حامیان اولیه بیش از هزینه سرمایه گذاری به اشتراک می گذارند. این امر اولیه است زیرا آنها انگیزه ای برای ایجاد محیط فناوری گسترده و لایه منابع انبار، از جمله ارگانیک هستند.

اما این اولین قدم ها بالاترین ارزش را به همراه دارد و بنابراین طراحان پروژه اغلب باید سرمایه گذاری را توجیه کنند.
پروژه‌هایی که پس از ابتکار BI شما انجام می‌شوند ممکن است هزینه‌های کمتر (در مقایسه با اولی) و مستقیم داشته باشند، اما ارزش کمتری برای شرکت به ارمغان می‌آورند.

و صاحبان سازمان باید شروع به بررسی دور انداختن انباشت کنند اطلاعات و فناوری های کمتر مرتبط.

داده کاوی: استخراج Dati

بسیاری از اجزای معماری نیازمند تغییراتی در فن‌آوری‌ها و تکنیک‌های داده کاوی هستند.
به عنوان مثال، "عامل" های مختلف برای بررسی نقاط مورد علاقه مشتریان، سیستم عامل های شرکت و برای خود dw. این عوامل می توانند شبکه های عصبی پیشرفته ای باشند که بر روی روندهای POT آموزش دیده اند، مانند تقاضای محصول آینده بر اساس تبلیغات فروش. موتورهای مبتنی بر قوانین برای واکنش به یک مجموعه dato در مورد شرایط، به عنوان مثال، تشخیص پزشکی و توصیه های درمانی؛ یا حتی عوامل ساده با نقش گزارش استثنایی به مدیران ارشد. به طور کلی این فرآیندهای استخراج اطلاعات si

تأیید در زمان واقعی؛ بنابراین، آنها باید به طور کامل با جنبش متحد شوند اطلاعات استسی

پردازش تحلیلی آنلاین

تجزیه و تحلیل آنلاین

توانایی برش، تاس، رول کردن، دریل کردن، و انجام تجزیه و تحلیل
what-if، در محدوده، تمرکز مجموعه فناوری IBM است. به عنوان مثال، توابع پردازش تحلیلی آنلاین (OLAP) برای DB2 وجود دارد که تجزیه و تحلیل ابعادی را به موتور نرم افزار می آورد. پایگاه داده یکسان .

این توابع به SQL سودمندی ابعادی اضافه می کنند و در عین حال از تمام مزایای طبیعی بودن بخشی از DB2 بهره می برند. نمونه دیگری از ادغام OLAP ابزار استخراج DB2 OLAP Server Analyzer است. این فناوری به مکعب های سرور DB2 OLAP اجازه می دهد تا به سرعت و به طور خودکار تجزیه و تحلیل شوند تا مقادیر مقادیر را تعیین و گزارش دهند. اطلاعات غیرمعمول یا غیرمنتظره در سراسر مکعب برای تحلیلگر تجاری. و در نهایت، ویژگی‌های مرکز DW ابزاری را برای معماران فراهم می‌کند تا، در میان چیزهای دیگر، نمایه یک مکعب سرور DB2 OLAP را به عنوان بخشی طبیعی از فرآیندهای ETL کنترل کنند.

تحلیل فضایی تحلیل فضایی

فضا نشان دهنده نیمی از لنگرهای تحلیلی (سرنخ) مورد نیاز برای یک پانوراما است
تحلیلی گسترده (زمان نشان دهنده نیمه دیگر است). سطح اتمی انبار، که در شکل 1.1 نشان داده شده است، شامل اصول زمانی و مکانی است. تمبر زمان لنگر تجزیه و تحلیل بر اساس زمان و آدرس اطلاعات لنگر تجزیه و تحلیل بر اساس مکان. مهرهای زمانی تجزیه و تحلیل را بر اساس زمان انجام می دهند و اطلاعات آدرس، تجزیه و تحلیل را بر اساس مکان انجام می دهند. نمودار نشان می دهد geocoding - فرآیند تبدیل آدرس ها به نقاط در نقشه یا نقاط در فضا به طوری که مفاهیمی مانند فاصله و داخل / خارج را می توان در تجزیه و تحلیل استفاده کرد - انجام شده در سطح اتمی و تجزیه و تحلیل فضایی که در دسترس قرار می گیرد. تحلیلگر IBM پسوندهای فضایی را که با موسسه تحقیقات سیستم محیطی (ESRI) توسعه یافته است، فراهم می کند پایگاه داده DB2 به طوری که اشیاء فضایی را می توان به عنوان یک بخش عادی ذخیره کرد پایگاه داده رابطه ای DB2

Spatial Extenderها همچنین تمام پسوندهای SQL را برای استفاده از تجزیه و تحلیل فضایی ارائه می دهند. به عنوان مثال، پسوندهای SQL برای پرس و جو در مقابل
فاصله بین آدرس ها یا اینکه یک نقطه در داخل یا خارج از یک ناحیه چند ضلعی تعریف شده است، یک استاندارد تحلیلی با گسترش دهنده فضایی است. برای اطلاعات بیشتر به فصل 16 مراجعه کنید.

پایگاه دادهابزارهای مقیم پایگاه داده-ساکن

DB2 دارای بسیاری از ویژگی‌های SQL مقیم BI است که به تجزیه و تحلیل کمک می‌کنند. این شامل:

  • توابع بازگشتی برای انجام تجزیه و تحلیل، مانند "یافتن تمام مسیرهای پرواز ممکن از سان فرانسیسکو a نیویورک".
  • توابع تحلیلی برای رتبه‌بندی، توابع تجمعی، مکعب و جمع‌آوری برای تسهیل کارهایی که معمولاً فقط با فناوری OLAP انجام می‌شوند، اکنون بخشی طبیعی از موتور هستند. پایگاه داده
  • امکان ایجاد جداول حاوی نتایج
    فروشندگان از پایگاه داده رهبران بیشتر قابلیت‌های BI را با هم ترکیب می‌کنند پایگاه داده یکسان.
    تامین کنندگان اصلی از پایگاه داده آنها قابلیت های بیشتری از BI را با هم ترکیب می کنند پایگاه داده یکسان.
    این عملکرد بهتر و گزینه های اجرایی بیشتری را برای راه حل های BI ارائه می دهد.
    ویژگی ها و عملکردهای DB2 V8 در فصل های زیر به تفصیل مورد بحث قرار گرفته است:
    معماری فنی و مبانی مدیریت داده ها (فصل 5)
  • مبانی DB2 BI (فصل 6)
  • جداول پرس و جو مادی شده DB2 (فصل 7)
  • توابع OLAP DB2 (فصل 13)
  • ویژگی ها و عملکردهای پیشرفته BI DB2 (فصل 15) سیستم تحویل داده ساده شده سیستم تحویل از اطلاعات ساده شده

معماری نشان داده شده در شکل 1.1 شامل سازه های متعددی است اطلاعات فیزیکی یکی انبار است اطلاعات عملیاتی. به طور کلی، یک ODS یک شی موضوع گرا، یکپارچه و جاری است. شما می توانید یک ODS برای پشتیبانی، به عنوان مثال، دفتر فروش بسازید. فروش ODS مکمل خواهد بود اطلاعات از چندین سیستم مختلف، اما برای مثال، فقط معاملات امروزی را حفظ می کند. ODS همچنین می تواند چندین بار در روز به روز شود. در همان زمان، فرآیندها فشار می آورند اطلاعات با سایر برنامه ها ادغام شده است. این ساختار به طور خاص برای یکپارچه سازی طراحی شده است اطلاعات فعلی و پویا و کاندیدای احتمالی برای پشتیبانی از تجزیه و تحلیل بلادرنگ، مانند ارائه به نمایندگان خدمات است مشتریان اطلاعات فروش فعلی مشتری با استخراج اطلاعات روند فروش از خود انبار. ساختار دیگری که در شکل 1.1 نشان داده شده است یک حالت رسمی برای dw است. نه تنها این مکان برای اجرای یکپارچگی لازم، کیفیت است اطلاعات، و از تبدیل اطلاعات انبار ورودی، اما همچنین یک انبار مطمئن و موقت برای اطلاعات تکرارهایی که می توانند در تحلیل های بلادرنگ استفاده شوند. اگر تصمیم به استفاده از یک ODS یا یک منطقه صحنه سازی دارید، یکی از بهترین ابزارها برای پر کردن این سازه ها است اطلاعات استفاده از منابع عملیاتی مختلف، پرس و جوی توزیع شده ناهمگن DB2 است. این قابلیت توسط ویژگی اختیاری DB2 به نام DB2 Relational Connect (فقط پرس و جو) و از طریق DB2 DataJoiner (محصول جداگانه ای که قابلیت جستجو، درج، به روز رسانی و حذف را به RDBMS های ناهمگن توزیع شده ارائه می دهد) ارائه می شود.

این فناوری به معماران اجازه می دهد تا اطلاعات بستن اطلاعات تولید با فرآیندهای تحلیلی این فناوری نه تنها می‌تواند تقریباً با هر یک از نیازهای تکراری که ممکن است با تجزیه و تحلیل بلادرنگ ایجاد شود، سازگار شود، بلکه می‌تواند به پایگاه‌های مختلفی متصل شود. اطلاعات محبوب ترین، از جمله DB2، Oracle، Sybase، SQL Server، Informix و دیگران. DB2 DataJoiner می تواند برای پر کردن یک ساختار استفاده شود اطلاعات رسمی به عنوان یک ODS یا حتی یک جدول دائمی نشان داده شده در انبار که برای بازیابی سریع به روز رسانی های فوری یا برای فروش طراحی شده است. البته همین ساختارها اطلاعات می توان با استفاده از

یکی دیگر از فناوری های مهم طراحی شده برای تکرار اطلاعات, IBM DataPropagator Relational. (DataPropagator یک محصول جداگانه برای سیستم های مرکزی است. DB2 UNIX، Linux، Windows، و OS/2 شامل خدمات تکثیر داده می شوند. اطلاعات به عنوان یک ویژگی استاندارد).
روش دیگری برای جابجایی اطلاعات در اطراف شرکت یک ادغام کننده برنامه سازمانی وجود دارد که در غیر این صورت به عنوان واسطه پیام شناخته می شود. اطلاعات در اطراف شرکت IBM دارای پرکاربردترین واسطه پیام، MQSeries، یا گونه‌ای از محصول است که شامل الزامات تجارت الکترونیک، IBM WebSphere MQ.
برای بحث بیشتر در مورد نحوه استفاده از MQ برای پشتیبانی از یک انبار و محیط BI، به این سایت مراجعه کنید سایت اینترنتی از کتاب. در حال حاضر، کافی است بگوییم که این فناوری وسیله ای عالی برای گرفتن و تبدیل (با استفاده از MQSeries Integrator) است. اطلاعات اپراتورهای متمرکز (هدفمند) که برای راه حل های BI استخدام شده اند. فناوری MQ در UDB V8 ادغام و بسته بندی شده است، به این معنی که اکنون می توان صف های پیام را به گونه ای مدیریت کرد که گویی جداول DB2 هستند. مفهوم جوشکاری پیام های صف و جهان از پایگاه داده رابطه به سمت یک محیط تحویل قدرتمند می رود اطلاعات.

تاخیر صفر تاخیر صفر

هدف استراتژیک نهایی IBM تجزیه و تحلیل زمان تاخیر صفر است. همانطور که توسط
گارتنر، یک سیستم BI باید قادر به استنباط، جذب و ارائه اطلاعات به تحلیلگران در صورت تقاضا باشد. چالش، البته، نحوه ترکیب کردن است اطلاعات جاری و زمان واقعی با اطلاعات تاریخی لازم، مانند i اطلاعات الگو/روند مرتبط، یا درک استخراج شده، مانند پروفایل مشتری.

چنین اطلاعاتی شامل، برای مثال، شناسایی مشتریان ریسک بالا یا کم یا کدام محصولات i مشتریان اگر از قبل در سبد خرید خود پنیر داشته باشند، به احتمال زیاد خرید خواهند کرد.

دستیابی به تاخیر صفر در واقع به دو مکانیسم اساسی بستگی دارد:

  • اتحاد کامل اطلاعات که با تکنیک ها و ابزارهای ایجاد شده توسط BI تجزیه و تحلیل می شوند
  • یک سیستم تحویل از اطلاعات این پیش نیازها برای تأخیر صفر هیچ تفاوتی با دو هدف تعیین شده توسط IBM و شرح داده شده در بالا ندارند. جفت نزدیک از اطلاعات این بخشی از برنامه یکپارچه سازی یکپارچه IBM است. و ایجاد یک سیستم تحویل از اطلاعات کارآمد کاملاً به فناوری موجود وابسته است که فرآیند تحویل را ساده می کند اطلاعات. در نتیجه، دو مورد از سه هدف IBM برای تحقق هدف سوم حیاتی هستند. IBM آگاهانه در حال توسعه فناوری خود است تا اطمینان حاصل کند که تاخیر صفر واقعیتی برای تلاش‌های انبار است. خلاصه / ترکیب سازمان BI یک نقشه راه برای ساختن محیط شما ارائه می دهد
    به صورت مکرر باید برای بازتاب نیازهای کسب و کار شما، چه در حال حاضر و چه در آینده، تنظیم شود. بدون دیدگاه معماری گسترده، تکرارهای انبار کمی بیشتر از پیاده سازی های تصادفی انبار مرکزی هستند که کار کمی برای ایجاد یک شرکت گسترده و آموزنده انجام می دهند. اولین مانع برای مدیران پروژه این است که چگونه سرمایه گذاری های مورد نیاز برای توسعه سازمان BI را توجیه کنند. در حالی که محاسبه ROI به عنوان پایه اصلی پیاده سازی انبار باقی مانده است، پیش بینی دقیق آن دشوارتر می شود. این منجر به روش های دیگری برای تعیین اینکه آیا ارزش پول خود را به دست می آورید یا خیر. برای مثال، ارزش سرمایه گذاری 2 (VOI)، به عنوان یک راه حل تبلیغ می شود. بر عهده معماران است اطلاعات و برنامه ریزان پروژه عمداً اطلاعاتی را تولید و به انجمن های کاربران ارائه می کنند و صرفاً به آنها خدمات ارائه نمی دهند اطلاعات. تفاوت زیادی بین این دو وجود دارد. اطلاعات چیزی است که در فرآیندهای تصمیم گیری و اثربخشی تفاوت ایجاد می کند. نسبتاً، i اطلاعات آنها بلوک هایی برای استخراج آن اطلاعات هستند.

حتی اگر من به منبع انتقادی داشته باشم اطلاعات برای رسیدگی به درخواست‌های تجاری، محیط BI باید نقش بزرگ‌تری در ایجاد محتوای اطلاعاتی داشته باشد. ما باید اقدامات اضافی را برای پاکسازی، ادغام، تبدیل یا ایجاد محتوای اطلاعاتی انجام دهیم که کاربران بتوانند بر اساس آن عمل کنند، و سپس باید اطمینان حاصل کنیم که این اقدامات و تصمیمات، در صورت معقول بودن، در محیط BI منعکس می شوند. اگر انبار را به خدمت واگذار کنیم اطلاعات، اطمینان حاصل می شود که انجمن های کاربران محتوای اطلاعاتی مورد نیاز برای اقدام را ایجاد می کنند. این تضمین می کند که جامعه آنها می تواند تصمیمات بهتری بگیرد، اما شرکت از کمبود دانشی که آنها استفاده کرده اند رنج می برد. داتو که معماران و برنامه ریزان پروژه پروژه های خاصی را در محیط BI آغاز می کنند، آنها در برابر کل شرکت پاسخگو می مانند. یک مثال ساده از این مشخصه دو طرفه تکرارهای BI در منبع یافت می شود اطلاعات. همه اطلاعات دریافت شده برای درخواست های تجاری خاص باید در اولین لایه اتمی پر شود. این امر توسعه دارایی اطلاعات سازمانی و همچنین مدیریت، رسیدگی به درخواست های کاربر خاص تعریف شده در تکرار را تضمین می کند.

WhatisaDataWarehouse؟

انبار داده از سال 1990 قلب معماری سیستم های اطلاعاتی بوده است و با ارائه یک پلت فرم یکپارچه جامد از فرآیندهای اطلاعاتی پشتیبانی می کند. اطلاعات داده های تاریخی به عنوان مبنایی برای تجزیه و تحلیل های بعدی. THE انبار داده آنها سهولت یکپارچه سازی را در دنیایی از سیستم های کاربردی ناسازگار ارائه می دهند. انبار داده به یک روند تبدیل شده است. انبار داده سازماندهی و ذخیره سازی i اطلاعات برای فرآیندهای اطلاعاتی و تحلیلی بر اساس یک دیدگاه زمانی طولانی تاریخی ضروری است. همه اینها مستلزم تعهد قابل توجه و مداوم در ساخت و نگهداری است انبار داده.

پس a چیست انبار داده؟ انبار داده و:

  • ▪ موضوع محور
  • ▪  سیستم یکپارچه
  • ▪ زمان متغیر
  • ▪  غیر فرار (پاک نمی شود)

مجموعه ای از اطلاعات برای حمایت از تصمیمات مدیریتی در اجرای فرآیندها استفاده می شود.
I اطلاعات درج شده است انبار داده در بیشتر موارد آنها از محیط های عملیاتی ناشی می شوند. این انبار داده توسط یک واحد ذخیره سازی ایجاد می شود که به طور فیزیکی از بقیه سیستم که شامل آن است جدا شده است اطلاعات قبلاً توسط برنامه هایی که بر اساس اطلاعات حاصل از محیط عملیاتی کار می کنند، تغییر شکل داده اند.

تعریف تحت اللفظی الف انبار داده سزاوار توضیح عمیق است زیرا انگیزه های مهم و معانی اساسی وجود دارد که ویژگی های یک انبار را توصیف می کند.

جهت گیری موضوعی موضوعی

اولین ویژگی الف انبار داده این است که به سمت بازیگران اصلی یک شرکت گرایش دارد. راهنمای آزمایشات از طریق اطلاعات این در تضاد با روش کلاسیک تر است که شامل جهت گیری برنامه ها به سمت فرآیندها و توابع است، روشی که عمدتاً توسط اکثر سیستم های مدیریتی کمتر اخیر مشترک است.

دنیای عملیاتی حول برنامه ها و کارکردهایی مانند وام، پس انداز، کارت های بانکی و اعتماد برای یک موسسه مالی طراحی شده است. دنیای dw حول موضوعات اصلی مانند مشتری، فروشنده، محصول و فعالیت سازماندهی شده است. همسویی حول موضوعات بر طراحی و اجرای آن تأثیر می گذارد اطلاعات در dw یافت شد. مهمتر از آن، موضوع اصلی بر مهمترین بخش ساختار کلیدی تأثیر می گذارد.

دنیای اپلیکیشن هم تحت تاثیر طراحی پایگاه داده و هم طراحی فرآیند است. دنیای dw منحصراً بر مدلسازی متمرکز است اطلاعات و در مورد طراحی پایگاه داده. طراحی فرآیند (در شکل کلاسیک آن) بخشی از محیط dw نیست.

تفاوت بین انتخاب کاربرد فرآیند/عملکرد و انتخاب موضوع نیز به عنوان تفاوت در محتوای اطلاعات در سطح دقیق THE اطلاعات از dw شامل i نمی شود اطلاعات که برای فرآیند DSS در حین برنامه استفاده نمی شود

عملیاتی گرا اطلاعات حاوی i اطلاعات برای برآوردن فوری الزامات عملکردی/پردازشی که ممکن است برای تحلیلگر DSS کاربرد نداشته باشد یا نداشته باشد.
یکی دیگر از راه های مهم که در آن برنامه های کاربردی عملیات گرا اطلاعات متفاوت از اطلاعات از dw در گزارش های dei است اطلاعاتاست. من اطلاعات عملیات یک رابطه مستمر بین دو یا چند جدول را بر اساس یک قانون تجاری فعال حفظ می کند. THE اطلاعات dw از طیف زمانی عبور می کند و روابط موجود در dw بسیار است. بسیاری از قوانین تجاری (و به همین ترتیب، بسیاری از روابط از اطلاعات ) در انبار از اطلاعات بین دو یا چند میز

(برای توضیح دقیق در مورد چگونگی روابط بین اطلاعات در DW بررسی می شود، ما به موضوع فنی در مورد آن موضوع مراجعه می کنیم.)
از منظر دیگری به جز تفاوت اساسی بین انتخاب برنامه کاربردی/فرایندی و انتخاب موضوع، تفاوت بیشتری بین سیستم عامل و اطلاعات و DW.

ادغام ادغام

مهمترین جنبه محیط dw این است که i اطلاعات موجود در dw به راحتی ادغام می شوند. همیشه. بدون استثنا. ماهیت محیط dw این است که i اطلاعات موجود در محدوده انبار یکپارچه شده است.

ادغام خود را به طرق مختلف نشان می دهد - در قراردادهای شناسایی شده منسجم، در اندازه گیری متغیر منسجم، در ساختارهای رمزگذاری شده سازگار، در ویژگی های فیزیکی اطلاعات سازگار و غیره

در طول سال‌ها، طراحان برنامه‌های کاربردی مختلف تصمیم‌های زیادی در مورد چگونگی توسعه یک اپلیکیشن گرفته‌اند. سبک و تصمیمات طراحی فردی برنامه های طراحان خود را به صد طریق نشان می دهد: در تفاوت در کدنویسی، ساختار کلیدی، ویژگی های فیزیکی، شناسایی قراردادها و غیره. توانایی جمعی بسیاری از طراحان برنامه برای ایجاد برنامه های کاربردی ناسازگار افسانه ای است. شکل 3 برخی از مهم ترین تفاوت ها را در روش های طراحی برنامه ها نشان می دهد.

رمزگذاری: رمزگذاری:

طراحان اپلیکیشن رمزگذاری رشته – جنسیت – را به روش های مختلف انتخاب کرده اند. یک طراح جنسیت را به صورت "m" و "f" نشان می دهد. طراح دیگری جنسیت را به صورت "1" و "0" نشان می دهد. طراح دیگری جنسیت را به صورت "x" و "y" نشان می دهد. طراح دیگری جنسیت را به صورت "مرد" و "مونث" نشان می دهد. نحوه ورود جنسیت به DW خیلی مهم نیست. "M" و "F" احتمالاً به خوبی کل نمایشنامه هستند.

آنچه اهمیت دارد این است که از هر منبعی که میدان جنسی مشتق شده باشد، آن میدان در یک حالت یکپارچه سازگار به DW می رسد. در نتیجه وقتی فیلد از برنامه‌ای که در آن با فرمت «M» و «F» نمایش داده شده است در DW بارگذاری می‌شود، اطلاعات باید به فرمت DW تبدیل شود.

اندازه گیری صفات: اندازه گیری از ویژگی های:

طراحان اپلیکیشن طی سال‌ها اندازه‌گیری خط لوله را به روش‌های مختلفی انتخاب کرده‌اند. یک طراح آن را ذخیره می کند اطلاعات خط لوله بر حسب سانتی متر یکی دیگر از طراحان برنامه ذخیره می کند اطلاعات خط لوله بر حسب اینچ. یکی دیگر از طراحان برنامه ذخیره می کند اطلاعات خط لوله بر حسب میلیون فوت مکعب در ثانیه و طراح دیگری اطلاعات خطوط لوله را بر حسب یارد ذخیره می کند. منبع هر چه باشد، وقتی اطلاعات خط لوله به DW می رسد باید به همان روش اندازه گیری شود.

با توجه به نشانه های شکل 3، مسائل یکپارچه سازی تقریباً بر تمام جنبه های پروژه تأثیر می گذارد - ویژگی های فیزیکی اطلاعات، معضل داشتن بیش از یک منبع از اطلاعات، موضوع نمونه های شناسایی ناسازگار، فرمت های اطلاعات ناسازگار و غیره

موضوع طراحی هر چه باشد، نتیجه یکسان است - i اطلاعات باید در DW به شیوه ای منفرد و قابل قبول جهانی ذخیره شوند، حتی زمانی که سیستم عامل های زیربنایی آنها را به طور متفاوت ذخیره می کنند. اطلاعات.

وقتی تحلیلگر DSS به DW نگاه می کند، هدف تحلیلگر باید بهره برداری از اطلاعات که در انبار هستند،

به جای تعجب در مورد اعتبار یا سازگاری اطلاعات.

واریانس زمانی

همه من اطلاعات در DW آنها تا حدی در زمان دقیق هستند. این ویژگی اساسی از اطلاعات در DW بسیار متفاوت از آنهایی است اطلاعات در محیط عملیاتی یافت می شود. THE اطلاعات محیط عملیاتی به اندازه لحظه دسترسی دقیق هستند. به عبارت دیگر، در محیط عملیاتی زمانی که یک درایو قابل دسترسی است اطلاعات، انتظار می رود که مقادیر دقیق را در زمان دسترسی منعکس کند. چون من اطلاعات در DW دقیق هستند که در یک مقطع زمانی (یعنی نه "در حال حاضر")، گفته می شود که من اطلاعات که در DW یافت می شوند "واریانس زمانی" هستند.
واریانس زمانی از اطلاعات توسط DW به طرق متعددی اشاره شده است.
ساده ترین راه این است که i اطلاعات از یک DW نشان می دهد اطلاعات در یک افق زمانی طولانی - پنج تا ده سال. افق زمانی ارائه شده برای محیط عملیاتی بسیار کوتاهتر از مقادیر فعلی تا شصت نود است.
برنامه هایی که باید به خوبی کار کنند و باید برای پردازش تراکنش در دسترس باشند، باید حداقل مقدار را داشته باشند اطلاعات اگر اجازه هر درجه ای از انعطاف را بدهند. بنابراین برنامه های کاربردی مانند یک موضوع طراحی اپلیکیشن صوتی، افق زمانی کوتاهی دارند.
روش دومی که "واریانس زمانی" در DW ظاهر می شود در ساختار کلید است. هر ساختار کلیدی در DW به طور ضمنی یا صریح شامل یک عنصر زمانی مانند روز، هفته، ماه و غیره است. عنصر زمان تقریباً همیشه در پایین کلید پیوسته موجود در DW قرار دارد. در این موارد، عنصر زمان به طور ضمنی وجود خواهد داشت، مانند حالتی که یک فایل کامل در پایان ماه یا سه ماهه تکرار می شود.
سومین روشی که واریانس زمانی نمایش داده می شود این است که i اطلاعات از DW، پس از ثبت صحیح، نمی توان آن را به روز کرد. THE اطلاعات از DW، برای تمام اهداف عملی، یک سری طولانی از عکس های فوری هستند. البته اگر عکس های فوری اشتباه گرفته شده باشند، می توان عکس های فوری را تغییر داد. اما با فرض اینکه عکس های فوری به درستی گرفته شده اند، به محض گرفتن اصلاح نمی شوند. در برخی

در برخی موارد ممکن است تغییر دادن عکس های فوری در DW غیراخلاقی یا حتی نامعتبر باشد. THE اطلاعات عملیاتی هستند، با دقت در لحظه دسترسی، می توانند در صورت نیاز به روز شوند.

غیر فرار

چهارمین ویژگی مهم DW غیر فرار بودن آن است.
به روز رسانی ها، درج ها، حذف ها و اصلاحات به طور منظم در محیط های عملیاتی بر اساس رکورد به رکورد انجام می شود. اما دستکاری اساسی از اطلاعات که در DW مورد نیاز است بسیار ساده تر است. تنها دو نوع عملیات در DW وجود دارد - بارگذاری اولیه اطلاعات و دسترسی به اطلاعات. هیچ به روز رسانی وجود ندارد اطلاعات (به معنای کلی به روز رسانی) در DW به عنوان یک عملیات پردازش عادی. پیامدهای بسیار قدرتمندی از این تفاوت اساسی بین پردازش عملیاتی و پردازش DW وجود دارد. در سطح طراحی، نیاز به احتیاط در مورد به روز رسانی غیرعادی عاملی در DW نیست، زیرا به روز رسانی اطلاعات انجام نمی شود. این بدان معنی است که در سطح طراحی فیزیکی، می توان از آزادی ها برای بهینه سازی دسترسی استفاده کرد اطلاعات، به ویژه در پرداختن به موضوعات عادی سازی فیزیکی و غیرعادی سازی. یکی دیگر از پیامدهای ساده بودن عملیات DW در فناوری زیربنایی مورد استفاده برای اجرای محیط DW است. پشتیبانی از به‌روزرسانی‌های رکورد به رکورد درون خطی (همانطور که اغلب در مورد پردازش عملیاتی اتفاق می‌افتد) مستلزم این است که این فناوری پایه بسیار پیچیده‌ای در زیر سادگی ظاهری داشته باشد.
فناوری که از پشتیبان گیری و بازیابی، تراکنش ها و یکپارچگی پشتیبانی می کند اطلاعات و تشخیص و رفع شرایط بن بست بسیار پیچیده است و برای پردازش DW ضروری نیست. ویژگی های یک DW، جهت گیری طراحی، ادغام اطلاعات در DW، واریانس زمانی و سادگی مدیریت اطلاعات، همه چیز به محیطی منتهی می شود که بسیار بسیار متفاوت از محیط عملیاتی کلاسیک است. منبع تقریباً همه اطلاعات DW محیط عملیاتی هستند. این وسوسه انگیز است که فکر کنیم که افزونگی عظیمی وجود دارد اطلاعات بین دو محیط
در واقع، اولین برداشتی که بسیاری از مردم دارند، این است که بیش از حد زیاد است اطلاعات بین محیط عملیاتی و محیط عملیاتی

DW. چنین تفسیری سطحی است و عدم درک آنچه در DW اتفاق می افتد را نشان می دهد.
در واقع حداقل افزونگی وجود دارد اطلاعات بین محیط عملیاتی و i اطلاعات از DW. موارد زیر را در نظر بگیرید: I اطلاعات آنها فیلتر می شوند dato که از محیط عملیاتی به محیط DW می رسد. زیاد اطلاعات آنها هرگز خارج از محیط عملیاتی عبور نمی کنند. جز اینکه من اطلاعات که برای پردازش DSS ضروری هستند جهت خود را در محیط پیدا می کنند

▪  افق زمانی اطلاعات از محیطی به محیط دیگر بسیار متفاوت است. THE اطلاعات در محیط عملیاتی آنها بسیار باحال هستند. THE اطلاعات در DW آنها بسیار قدیمی تر هستند. فقط از منظر افق زمانی، همپوشانی بسیار کمی بین محیط عملیاتی و DW وجود دارد.

▪  DW حاوی اطلاعات خلاصه ای که هرگز در محیط یافت نمی شوند

▪  من اطلاعات هنگامی که آنها به شکل 3 انتقال می یابند، تحت یک تغییر اساسی قرار می گیرند که بیشتر آن را نشان می دهد اطلاعات به شرط انتخاب و انتقال به DW به طور قابل توجهی اصلاح می شوند. به عبارت دیگر، اکثر موارد اطلاعات با انتقال به DW از نظر فیزیکی و اساسی تغییر می کند. از نقطه نظر ادغام آنها یکسان نیستند اطلاعات که در محیط عملیاتی ساکن هستند. با توجه به این عوامل، افزونگی از اطلاعات بین دو محیط یک رویداد نادر است که منجر به افزونگی کمتر از 1% بین دو محیط می شود. ساختار انبار DW ها ساختار مشخصی دارند. سطوح مختلفی از خلاصه و جزئیات وجود دارد که DW ها را مشخص می کند.
اجزای مختلف یک DW عبارتند از:

  • متاداده
  • Dati جزئیات فعلی
  • Dati از جزئیات قدیمی
  • Dati کمی خلاصه شده
  • Dati بسیار خلاصه شده است

تا حد زیادی نگرانی اصلی برای اطلاعات جزئیات فعلی این نگرانی اصلی است زیرا:

  • I اطلاعات جزئیات فعلی منعکس کننده رویدادهای اخیر است که همیشه مورد توجه و علاقه زیادی هستند
  • i اطلاعات جزئیات فعلی حجیم است زیرا در پایین ترین سطح دانه بندی ذخیره می شود و
  • i اطلاعات جزئیات فعلی تقریباً همیشه در حافظه دیسک ذخیره می‌شوند که دسترسی به آن سریع است، اما استفاده از آن گران و پیچیده است اطلاعات از جزئیات هر چه سنشان بیشتر باشد اطلاعات که روی مقداری حافظه ذخیره می شوند جرم. به صورت پراکنده قابل دسترسی است و در سطحی از جزئیات سازگار با آن ذخیره می شود اطلاعات جزئیات فعلی در حالی که به دلیل حجم زیاد ذخیره سازی در یک محیط ذخیره سازی جایگزین اجباری نیست اطلاعات همراه با دسترسی پراکنده از اطلاعات، پشتیبانی از حافظه برای اطلاعات داده های جزئیات قدیمی معمولاً روی دیسک ذخیره نمی شوند. THE اطلاعات اندکی خلاصه شده اند اطلاعات که از سطح کم جزئیات یافت شده تا سطح جزئیات فعلی تقطیر می شوند. این سطح از DW تقریباً همیشه در حافظه دیسک ذخیره می شود. مشکلات طراحی که برای معمار به وجود می آید اطلاعات در ساخت این سطح از DW عبارتند از:
  • خلاصه ای که در بالا انجام شد چند واحد زمان است
  • کدام محتوا، ویژگی ها کمی محتوای آن را خلاصه می کند اطلاعات سطح بعدی از اطلاعات موجود در DW است که از اطلاعات بسیار خلاصه شده است THE اطلاعات بسیار خلاصه شده جمع و جور و به راحتی در دسترس هستند. THE اطلاعات بسیار خلاصه شده گاهی اوقات در محیط DW و در موارد دیگر i اطلاعات بسیار خلاصه شده در خارج از دیوارهای فوری فناوری که DW را در خود جای داده است، یافت می شود. (در هر صورت من اطلاعات بسیار خلاصه شده بخشی از DW بدون در نظر گرفتن جایی است که i اطلاعات به صورت فیزیکی اسکان داده می شوند). مؤلفه نهایی DW فراداده است. از بسیاری جهات، ابرداده ها در ابعاد متفاوتی نسبت به سایرین قرار دارند اطلاعات از DW، زیرا فراداده حاوی هیچ کدام نیست dato مستقیماً از محیط عملیاتی گرفته شده است. ابرداده نقش ویژه و بسیار مهمی در DW دارد. از متادیتا به صورت زیر استفاده می شود:
  • دایرکتوری برای کمک به تحلیلگر DSS در شناسایی محتویات DW،
  • راهنمای نقشه برداری اطلاعات از اینکه چگونه من اطلاعات از محیط عملیاتی به محیط DW تبدیل شده اند،
  • راهنمای الگوریتم های مورد استفاده برای خلاصه سازی بین اطلاعات از جزئیات جاری و i اطلاعات کمی خلاصه شده، i اطلاعات به طور خلاصه، فراداده نقش بسیار بیشتری در محیط DW ایفا می کند تا زمانی که در محیط عملیاتی داشته است. محیط ذخیره‌سازی جزئیات قدیمی از نوار مغناطیسی می توان برای ذخیره این نوع مواد استفاده کرد اطلاعات. در واقع طیف گسترده ای از رسانه های ذخیره سازی وجود دارد که باید برای ذخیره سازی قدیمی در نظر گرفته شوند اطلاعات از جزئیات بسته به حجم اطلاعات، فرکانس دسترسی، هزینه ابزارها و نوع دسترسی، کاملاً محتمل است که ابزارهای دیگر به سطح قبلی جزئیات در DW نیاز داشته باشند. جریان داده ها یک جریان عادی و قابل پیش بینی وجود دارد اطلاعات داخل DW
    I اطلاعات DW را از محیط عملیاتی وارد کنید. (توجه: استثناهای بسیار جالبی برای این قانون وجود دارد. با این حال، تقریباً همه اطلاعات DW را از محیط عملیاتی وارد کنید). داتو که من اطلاعات DW را از محیط عملیاتی وارد کنید، همانطور که قبلا توضیح داده شد تبدیل می شود. به شرط ورود به DW، i اطلاعات همانطور که نشان داده شده است، سطح جزئیات فعلی را وارد کنید. در آنجا ساکن است و تا زمانی که یکی از سه رویداد رخ دهد استفاده می شود:
  • پاک می شود،
  • خلاصه می شود، و/یا ▪è فرآیند منسوخ در یک DW حرکت می کند اطلاعات جزئیات فعلی الف اطلاعات از جزئیات قدیمی، بر اساس سن اطلاعات. فرآیند

خلاصه از جزئیات استفاده می کند اطلاعات برای محاسبه i اطلاعات سطوح کمی خلاصه و بسیار خلاصه شده از اطلاعات. برخی استثناها برای جریان نشان داده شده وجود دارد (بعداً مورد بحث قرار خواهد گرفت). با این حال، معمولا، برای اکثریت قریب به اتفاق از اطلاعات موجود در یک DW، جریان اطلاعات همانطور که به تصویر کشیده شده است.

استفاده از انبار داده

جای تعجب نیست که سطوح مختلف اطلاعات در DW آنها سطوح مختلف استفاده را دریافت نمی کنند. به عنوان یک قاعده، هر چه سطح خلاصه‌سازی بالاتر باشد، i اطلاعات آنها استفاده می شوند.
استفاده های زیادی در اطلاعات بسیار خلاصه شده است، در حالی که آنهایی که قدیمی است اطلاعات از جزئیات تقریباً هرگز استفاده نمی شود. دلیل خوبی برای حرکت سازمان به پارادایم استفاده از منابع وجود دارد. خلاصه بیشتر i اطلاعات، هر چه سریعتر و کارآمدتر به آن برسید اطلاعات. اگر یک فروشگاه متوجه می شود که بسیاری از فرآیندها را در سطح جزئیات DW انجام می دهد، سپس مقدار زیادی از منابع ماشین مصرف می شود. این به نفع همه است که در اسرع وقت به سطح بالایی از خلاصه سازی رسیدگی شود.

برای بسیاری از مغازه ها، تحلیلگر DSS در یک محیط قبل از DW استفاده کرده است اطلاعات در سطح جزئیات از بسیاری جهات ورود در اطلاعات خلاصه تفصیلی شبیه یک پوشش امنیتی است، حتی زمانی که سایر سطوح خلاصه در دسترس هستند. یکی از فعالیت های معمار اطلاعات این است که کاربر DSS را از استفاده مداوم از اطلاعات در پایین ترین سطح جزئیات دو انگیزه برای معمار وجود دارد اطلاعات:

  • با نصب یک سیستم بازپرداخت شارژ، که در آن کاربر نهایی هزینه منابع مصرف شده را پرداخت می کند
  • که نشان می دهد زمانی که رفتار با i می توان به زمان پاسخ بسیار خوبی دست یافت اطلاعات در سطح بالایی از خلاصه سازی قرار دارد، در حالی که زمان پاسخ ضعیف ناشی از رفتار افراد است اطلاعات در سطح پایین دیدگاه های دیگر برخی دیگر از ملاحظات ساخت و ساز DW و مدیریت وجود دارد.
    اولین ملاحظه مربوط به شاخص هاست. THE اطلاعات در سطوح بالاتر از خلاصه سازی می توان آنها را آزادانه نمایه کرد، در حالی که i اطلاعات

در سطوح پایین‌تر جزئیات، آن‌قدر حجیم هستند که می‌توان آن‌ها را با صرفه‌جویی فهرست کرد. از همین رو، i اطلاعات در سطوح بالایی از جزئیات را می توان نسبتاً به راحتی بازسازی کرد، در حالی که حجم اطلاعات در سطوح پایین آنقدر بزرگ است که i اطلاعات آنها را نمی توان به راحتی بازسازی کرد. در نتیجه، مدل از اطلاعات و کار رسمی انجام شده توسط طراحی، پایه و اساس DW را ایجاد کرد که تقریباً به طور انحصاری در سطح جزئیات فعلی اعمال می شود. به عبارت دیگر، فعالیت های مدل سازی از اطلاعات آنها تقریباً در هر موردی برای سطوح خلاصه سازی اعمال نمی شوند. یکی دیگر از ملاحظات ساختاری مربوط به تقسیم بندی است اطلاعات توسط DW.

پارتیشن را می توان در دو سطح انجام داد - در سطح dbms و در سطح برنامه در تقسیم بندی در سطح dbms، dbms از تقسیمات مطلع شده و بر اساس آن آنها را کنترل می کند. در مورد تقسیم در سطح برنامه، فقط برنامه نویس از تقسیمات مطلع می شود و مسئولیت اداره آنها به او واگذار می شود.

زیر سطح dbms، بسیاری از کارها به صورت خودکار انجام می شود. عدم انعطاف زیادی در ارتباط با مدیریت تقسیم خودکار وجود دارد. در مورد تقسیمات در سطح کاربردی از اطلاعات از انبار داده، کار زیادی بر دوش برنامه نویس سنگینی می کند، اما نتیجه نهایی انعطاف پذیری در مدیریت است اطلاعات به انبار داده

ناهنجاری های دیگر

در حالی که اجزای تشکیل دهنده انبار داده آنها تقریباً برای همه همانطور که توضیح داده شد کار می کنند اطلاعات، استثناهای مفیدی وجود دارد که باید مورد بحث قرار گیرند. یک استثنا این است که از اطلاعات داده های خلاصه عمومی اینها هستند اطلاعات خلاصه هایی که از انبار داده اما جامعه از آنها استفاده می کند. THE اطلاعات خلاصه های عمومی در ذخیره و مدیریت می شوند انبار داده، اگرچه همانطور که قبلا ذکر شد آنها محاسبه می شوند. حسابداران برای تولید چنین فصلنامه ای کار می کنند اطلاعات مانند درآمد، هزینه های سه ماهه، سود سه ماهه و غیره. کار انجام شده توسط حسابداران خارجی است انبار داده. با این حال، من اطلاعات "داخلی" در داخل شرکت استفاده می شود - از بازار یابی، فروش و غیره یکی دیگر از ناهنجاری ها که مورد بحث قرار نخواهد گرفت، ناهنجاری است اطلاعات استرنی

یک نوع استثنایی دیگر اطلاعات که در الف یافت می شود انبار داده داده های جزئیات دائمی است. اینها باعث نیاز به ذخیره دائمی می شوند اطلاعات در سطح دقیق به دلایل اخلاقی یا قانونی. اگر یک شرکت کارگران خود را در معرض مواد خطرناک قرار می دهد، نیاز است اطلاعات مفصل و دائمی اگر شرکتی محصولی تولید کند که شامل ایمنی عمومی باشد، مانند قطعات هواپیما، نیاز به این کار وجود دارد اطلاعات جزئیات دائمی و همچنین اگر شرکتی قراردادهای خطرناکی منعقد کند.

این شرکت نمی تواند جزئیات را نادیده بگیرد زیرا طی چند سال آینده در صورت شکایت، فراخوان، نقص ساختمانی مورد مناقشه و غیره. قرار گرفتن در معرض شرکت می تواند بزرگ باشد. در نتیجه یک نوع منحصر به فرد وجود دارد اطلاعات به عنوان داده های جزئیات دائمی شناخته می شود.

خلاصه

Un انبار داده یک شی گرا، یکپارچه، نوع زمان، مجموعه ای از اطلاعات غیر فرار برای حمایت از نیازهای تصمیم گیری دولت. هر یک از کارکردهای برجسته a انبار داده پیامدهای خود را دارد. به علاوه چهار سطح از وجود دارد اطلاعات از انبار داده:

  • جزئیات قدیمی
  • جزئیات فعلی
  • Dati کمی خلاصه شده است
  • Dati فراداده بسیار خلاصه شده نیز بخش مهمی از این است انبار داده. خلاصه مفهوم ذخیره سازی از اطلاعات اخیراً بسیار مورد توجه قرار گرفته و به ترند دهه 90 تبدیل شده است. این به دلیل توانایی یک انبار داده برای غلبه بر محدودیت های سیستم های پشتیبانی مدیریت مانند سیستم های پشتیبانی تصمیم (DSS) و سیستم های اطلاعات اجرایی (EIS). حتی اگر مفهوم انبار داده امیدوار کننده به نظر می رسد، i انبار داده می تواند به دلیل فرآیندهای انبارداری در مقیاس بزرگ مشکل ساز باشد. با وجود پیچیدگی پروژه های ذخیره سازی اطلاعات، بسیاری از تامین کنندگان و مشاوران که سهام اطلاعات ادعا می کنند که ذخیره سازی اطلاعات جریان هیچ مشکلی ایجاد نمی کند. اما در آغاز این پروژه تحقیقاتی تقریباً هیچ تحقیق مستقل، دقیق و منظمی انجام نشده بود. در نتیجه، دشوار است که بگوییم هنگام ساخت آنها در صنعت چه اتفاقی می افتد انبار داده. این مطالعه عملکرد ذخیره سازی را مورد بررسی قرار داد اطلاعات معاصران با هدف ایجاد درک غنی تر از عملکرد استرالیا. بررسی ادبیات زمینه و پایه مطالعه تجربی را فراهم کرد. تعدادی یافته از این تحقیق وجود دارد. ابتدا، این مطالعه فعالیت‌هایی را که در طول توسعه آن به وجود آمدند را نشان داد انبار داده. در بسیاری از مناطق، i اطلاعات جمع آوری شده، عملکرد گزارش شده در ادبیات را تایید کرد. دوم، مسائل و مشکلاتی که ممکن است بر توسعه آن تأثیر بگذارد انبار داده توسط این مطالعه شناسایی شدند. در نهایت، مزایای به دست آمده توسط سازمان های استرالیایی مرتبط با استفاده از انبار داده آشکار شده اند.

فصل 1

زمینه تحقیق

مفهوم انبار داده در معرض گسترده قرار گرفت و در دهه 90 به یک روند نوظهور تبدیل شد (McFadden 1996, TDWI 1996, Shah and Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman and Oates 2000). این را می توان از تعداد فزاینده مقالات در مورد انبار داده در نشریات تجاری مشاهده کرد (لیتل و گیبسون 1999). بسیاری از مقالات (برای مثال، به Fisher 1995، Hackathorn 1995، Morris 1995a، Bramblett and King 1996، Graham et al. 1996، Sakaguchi and Frolick 1996، Alvarez 1997، Brousell 1997، 1997، 1997، 1997، مکلارت، 1998، 1999، مکاتورن، XNUMX، XNUMX، مکلارت XNUMX، XNUMX، مکلار XNUMX، XNUMX، مکلار XNUMX، XNUMX، مکلار XNUMX، XNUMX، مکلار XNUMX، XNUMX. ، ادواردز XNUMX، TDWI XNUMX) مزایای قابل توجهی را گزارش کرده اند که توسط سازمان هایی که I. انبار داده. آنها نظریه خود را با شواهد حکایتی از اجرای موفقیت آمیز، ارقام بازده بالای سرمایه گذاری (ROI) و همچنین با ارائه دستورالعمل ها یا روش هایی برای توسعه انبار داده

(شانکس و همکاران 1997، سدون و بنجامین 1998، لیتل و گیبسون 1999). در یک مورد شدید، گراهام و همکاران. (1996) متوسط ​​بازده سرمایه گذاری سه ساله را 401% گزارش کرد.

با این حال، بسیاری از ادبیات فعلی، پیچیدگی های موجود در انجام چنین پروژه هایی را نادیده گرفته اند. پروژه های انبار داده آنها معمولاً پیچیده و در مقیاس بزرگ هستند و بنابراین اگر به دقت کنترل نشوند احتمال شکست بالایی دارند (شاه و میلشتاین 1997، اکرسون 1997، فولی 1997b، زیمر 1997، بورت 1998، گیبس و کلایمر 1998، رائو 1998). آنها به مقادیر زیادی از منابع انسانی و مالی و زمان و تلاش برای ساخت آنها نیاز دارند (هیل 1998، کرافتز 1998). زمان معمول و امکانات مالی مورد نیاز به ترتیب تقریباً دو سال و دو تا سه میلیون دلار است (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). این زمان و امکانات مالی برای کنترل و تجمیع بسیاری از جنبه های مختلف انبار داده ها مورد نیاز است (کافاسو 1995، هیل 1998). در کنار ملاحظات سخت‌افزاری و نرم‌افزاری، عملکردهای دیگری نیز وجود دارد که از استخراج متفاوت است اطلاعات به فرآیندهای بارگیری از اطلاعات، ظرفیت حافظه برای مدیریت به روز رسانی ها و متا اطلاعات برای آموزش کاربر، باید در نظر گرفته شود.

در زمان شروع این پروژه تحقیقاتی، تحقیقات آکادمیک بسیار کمی در زمینه ذخیره سازی داده ها، به ویژه در استرالیا، انجام می شد. این امر از کمبود مقالات منتشر شده در مورد ذخیره سازی داده ها از مجلات یا سایر نوشته های دانشگاهی آن زمان مشهود بود. بسیاری از نوشته‌های آکادمیک موجود تجربه ایالات متحده را توصیف می‌کنند. فقدان تحقیقات آکادمیک در حوزه ذخیره‌سازی داده‌ها باعث شده است که تحقیقات دقیق و مطالعات تجربی مورد نیاز باشد (McFadden 1996, Shanks et al. 1997, Little and Gibson 1999). به طور خاص، مطالعات تحقیقاتی در مورد فرآیند پیاده سازی انبار داده نیاز به انجام برای گسترش دانش عمومی در مورد اجرای انبار داده و به عنوان مبنایی برای یک مطالعه تحقیقاتی آینده خواهد بود (شانکس و همکاران 1997، لیتل و گیبسون 1999).

بنابراین، هدف این مطالعه بررسی این است که وقتی سازمان‌ها i را اجرا و استفاده می‌کنند، واقعاً چه اتفاقی می‌افتد انبار داده در استرالیا. به طور خاص، این مطالعه شامل تجزیه و تحلیل کل فرآیند توسعه a انبار داده، از شروع و برنامه ریزی از طریق طراحی و اجرا و استفاده بعدی در سازمان های استرالیایی شروع می شود. علاوه بر این، این مطالعه با شناسایی مناطقی که می‌توان آن‌ها را بیشتر بهبود بخشید و ناکارآمدی‌ها و خطرات را به حداقل رساند یا اجتناب کرد، به عملکرد فعلی کمک می‌کند. علاوه بر این، به عنوان مبنایی برای مطالعات دیگر در مورد انبار داده در استرالیا و شکافی را که در حال حاضر در ادبیات وجود دارد پر خواهد کرد.

سوالات تحقیق

هدف این تحقیق بررسی فعالیت های درگیر در اجرای انبار داده و استفاده از آنها توسط سازمان های استرالیایی. به طور خاص، عناصر مربوط به برنامه ریزی پروژه، توسعه، بهره برداری، استفاده و ریسک های موجود مورد مطالعه قرار می گیرند. بنابراین سوال این تحقیق این است:

«رویه فعلی چیست؟ انبار داده در استرالیا؟"

برای پاسخگویی مؤثر به این سؤال، تعدادی سؤال تحقیقاتی فرعی مورد نیاز است. به طور خاص، سه سؤال فرعی از ادبیات، که در فصل 2 ارائه شده است، برای هدایت این پروژه تحقیقاتی شناسایی شد: چگونه انبار داده از سازمان های استرالیایی؟ با چه مشکلاتی مواجه شده اید؟

مزایای تجربه شده چیست؟
در پاسخ به این سوالات از طرح تحقیق اکتشافی با استفاده از پیمایش استفاده شد. به عنوان یک مطالعه اکتشافی، پاسخ به سوالات فوق کامل نیست (شانکس و همکاران 1993، دنسکوم 1998). در این مورد، مثلث بندی برای بهبود پاسخ به این سؤالات لازم است. با این حال، این تحقیق یک پایه محکم برای کار آینده در بررسی این سؤالات فراهم می کند. بحث مفصلی در مورد توجیه و طراحی روش تحقیق در فصل 3 ارائه شده است.

ساختار پروژه تحقیقاتی

این پروژه تحقیقاتی به دو بخش تقسیم می‌شود: مطالعه زمینه‌ای مفهوم انبار داده و تحقیق تجربی (نگاه کنید به شکل 1.1)، که هر کدام در زیر مورد بحث قرار گرفته‌اند.

بخش اول: مطالعه زمینه‌ای

بخش اول پژوهش شامل مرور ادبیات جاری در مورد انواع مختلف انبار داده از جمله سیستم‌های پشتیبانی تصمیم (DSS)، سیستم‌های اطلاعات اجرایی (EIS)، مطالعات موردی انبار داده و مفاهیم انبار داده. علاوه بر این، نتایج انجمن انبار داده و گروه های جلسه متخصص و متخصص به رهبری تیم تحقیقاتی موناش DSS، در این مرحله از مطالعه مشارکت داشتند که هدف آن به دست آوردن بینشی در مورد عملکرد انبار داده و خطرات ناشی از پذیرش آنها را شناسایی کنید. در طول این دوره مطالعه زمینه‌ای، درک حوزه مشکل برای ارائه دانش پس‌زمینه برای تحقیقات تجربی بعدی ایجاد شد. با این حال، این یک فرآیند مداوم در طول انجام مطالعه پژوهشی بود.

بخش دوم: تحقیق تجربی

مفهوم نسبتاً جدید ذخیره‌سازی داده، به‌ویژه در استرالیا، نیاز به یک نظرسنجی را برای دریافت تصویری وسیع از تجربه کاربر ایجاد کرده است. این بخش زمانی انجام شد که دامنه مشکل از طریق مرور ادبیات گسترده ایجاد شد. مفهوم انبار داده شکل گرفته در مرحله مطالعه زمینه ای به عنوان ورودی پرسشنامه اولیه این مطالعه استفاده شد. پس از این، پرسشنامه مورد بررسی قرار گرفت. شما متخصص هستید انبار داده در آزمون شرکت کردند. هدف از تست پرسشنامه اولیه بررسی کامل بودن و صحت سوالات بود. بر اساس نتایج آزمون، پرسشنامه اصلاح شد و نسخه اصلاح شده برای شرکت کنندگان در نظرسنجی ارسال شد. سپس پرسشنامه های برگشتی برای i تجزیه و تحلیل شدند اطلاعات در جداول، نمودارها و فرمت های دیگر. THE

نتایج تجزیه و تحلیل از اطلاعات آنها تصویری از عمل انبارداری داده در استرالیا را تشکیل می دهند.

بررسی اجمالی انبار داده

مفهوم انبار داده با پیشرفت در فناوری کامپیوتر تکامل یافته است.
هدف آن غلبه بر مشکلاتی است که گروه های پشتیبانی برنامه مانند سیستم پشتیبانی تصمیم (DSS) و سیستم اطلاعات اجرایی (EIS) با آن مواجه هستند.

در گذشته بزرگترین مانع این برنامه ها عدم توانایی این برنامه ها در ارائه یک بوده است پایگاه داده برای تجزیه و تحلیل لازم است.
این عمدتاً ناشی از ماهیت کار مدیریت است. منافع مدیریت یک شرکت به طور مداوم بسته به منطقه تحت پوشش متفاوت است. بنابراین من اطلاعات اساسی برای این برنامه ها، آنها باید بتوانند به سرعت بسته به بخشی که باید درمان شوند، تغییر کنند.
این بدان معنی است که من اطلاعات باید در فرم مناسب برای تجزیه و تحلیل های درخواستی موجود باشد. در واقع، گروه‌های پشتیبانی برنامه در گذشته جمع‌آوری و ادغام آن را بسیار دشوار می‌دانستند اطلاعات از منابع پیچیده و متنوع

در ادامه این بخش مروری بر مفهوم انبار داده ارائه می‌شود و چگونگی این را مورد بحث قرار می‌دهد انبار داده می تواند بر مشکلات گروه های پشتیبانی برنامه غلبه کند.
اصطلاح "انبار داده” توسط ویلیام اینمون در سال 1990 رایج شد انبار داده به عنوان مجموعه ای از اطلاعات موضوع محور، یکپارچه، غیر فرار و متغیر در طول زمان، در حمایت از تصمیمات مدیریت.

با استفاده از این تعریف Inmon مشخص می کند که i اطلاعات ساکن در a انبار داده آنها باید دارای 4 ویژگی زیر باشند:

  • ▪  موضوع محور
  • ▪  یکپارچه شده است
  • ▪  غیر فرار
  • ▪  تغییر در طول زمان توسط Inmon موضوع محور به این معنی است که i اطلاعات به انبار داده در بزرگترین حوزه های سازمانی که بوده اند

در مدل تعریف شده است اطلاعات. به عنوان مثال همه اطلاعات در مورد i مشتریان در حوزه موضوعی موجود هستند مشتریان. به همین ترتیب همه اطلاعات مربوط به محصولات در قسمت موضوع محصولات موجود است.

منظور از Integrated Inmon این است که i اطلاعات از پلتفرم‌ها، سیستم‌ها و مکان‌های مختلف ترکیب شده و در یک مکان ذخیره می‌شوند. در نتیجه اطلاعات موارد مشابه باید به فرمت های ثابت تبدیل شوند تا بتوان آنها را به راحتی اضافه و مقایسه کرد.
به عنوان مثال، جنسیت مذکر و مؤنث در یک سیستم با حروف M و F و در سیستم دیگر با 1 و 0 نشان داده می شود. برای ادغام صحیح آنها، یک یا هر دو فرمت باید تغییر شکل دهند تا دو فرمت یکسان باشند. در این حالت می توانیم M را به 1 و F را به 0 یا برعکس تغییر دهیم. موضوع محور و یکپارچه نشان می دهد که انبار داده طراحی شده است تا یک دید کاربردی و عرضی از اطلاعات توسط شرکت

منظور او از Non-volatile این است که i اطلاعات به انبار داده ثابت ماندن و به روز رسانی اطلاعات لازم نیست. در عوض، هر تغییری در اطلاعات اصل به اضافه شده است پایگاه داده از انبار داده. این بدان معناست که دی تاریخی اطلاعات موجود است در انبار داده.

برای متغیرهای با زمان Inmon نشان می دهد که i اطلاعات به انبار داده همیشه شامل شاخص های زمان و i اطلاعات آنها معمولاً از یک افق زمانی معین عبور می کنند. به عنوان مثال الف
انبار داده می تواند حاوی 5 سال ارزش تاریخی باشد مشتریان از 1993 تا 1997. در دسترس بودن تاریخ و یک سری زمانی از اطلاعات به شما امکان تجزیه و تحلیل روندها را می دهد.

Un انبار داده او می تواند خود را جمع آوری کند اطلاعات از سیستم های OLTP؛ از منابع اطلاعات خارج از سازمان و/یا سایر پروژه های سیستم جذب ویژه اطلاعات.
I اطلاعات عصاره ها می توانند از طریق یک فرآیند تمیز کردن، در این مورد i اطلاعات قبل از اینکه در آن ذخیره شوند، تبدیل و یکپارچه می شوند پایگاه داده از انبار داده. سپس من اطلاعات

ساکنین داخل پایگاه داده از انبار داده برای ورود کاربر نهایی و ابزارهای بازیابی در دسترس قرار می گیرند. با استفاده از این ابزارها کاربر نهایی می تواند به نمای یکپارچه سازمان دسترسی پیدا کند اطلاعات.

I اطلاعات ساکنین داخل پایگاه داده از انبار داده آنها هم در جزئیات و هم در قالب های خلاصه ذخیره می شوند.
سطح خلاصه ممکن است به ماهیت آن بستگی داشته باشد اطلاعاتاست. من اطلاعات جزئیات ممکن است شامل اطلاعات فعلی e اطلاعات مورخان
I اطلاعات حق امتیاز شامل نمی شود انبار داده تا من اطلاعات به انبار داده به روز می شوند.
علاوه بر ذخیره سازی i اطلاعات خودشان، الف انبار داده همچنین می تواند انواع مختلفی را ذخیره کند dato به نام METADATA توصیف می کند اطلاعات ساکنین در او پایگاه داده.
دو نوع ابرداده وجود دارد: فراداده توسعه و فراداده تحلیلی.
ابرداده توسعه برای مدیریت و خودکارسازی فرآیندهای استخراج، تمیز کردن، نقشه برداری و بارگذاری استفاده می شود. اطلاعات به انبار داده.
اطلاعات موجود در ابرداده توسعه می تواند شامل جزئیات سیستم عامل، جزئیات عناصر استخراج شده، مدل باشد. اطلاعات از انبار داده و قوانین تجاری برای تبدیل اطلاعات.

نوع دوم فراداده که به عنوان فراداده تجزیه و تحلیل شناخته می شود، کاربر نهایی را قادر می سازد تا محتوای آن را کشف کند. انبار داده برای پیدا کردن اطلاعات موجود و معنای آنها به صورت واضح و غیر فنی.

بنابراین فراداده های تحلیلی به عنوان پلی بین انبار داده و برنامه های کاربردی کاربر نهایی این ابرداده می تواند شامل مدل کسب و کار، توضیحاتی باشد اطلاعات مطابق با مدل کسب و کار، پرس و جوها و گزارش های از پیش تعریف شده، اطلاعات برای دسترسی کاربر و فهرست.

فراداده های تجزیه و تحلیل و توسعه باید در یک فراداده محدود یکپارچه ترکیب شوند تا به درستی کار کنند.

متأسفانه بسیاری از ابزارهای موجود دارای ابرداده خاص خود هستند و در حال حاضر هیچ استانداردی برای آن وجود ندارد

به ابزارهای انبار داده اجازه می دهد تا این ابرداده را یکپارچه کنند. برای اصلاح این وضعیت، بسیاری از معامله گران ابزارهای اصلی انبار داده شورای متا داده را تشکیل دادند که بعداً به ائتلاف متا داده تبدیل شد.

هدف این ائتلاف ایجاد یک مجموعه ابرداده استاندارد است که به ابزارهای مختلف انبار داده اجازه می دهد تا ابرداده ها را تبدیل کنند.
تلاش آنها منجر به تولد مشخصات تبادل داده های متا (MDIS) شد که امکان تبادل اطلاعات بین آرشیوهای مایکروسافت و فایل های MDIS مربوطه را فراهم می کند.

وجود اطلاعات خلاصه / نمایه شده و جزئی به کاربر این امکان را می دهد که یک DRILL DROWN (حفاری) را از اطلاعات نمایه شده به جزئیات و بالعکس. وجود اطلاعات تاریخچه های دقیق امکان ایجاد تحلیل روند در طول زمان را فراهم می کند. علاوه بر این، فراداده تجزیه و تحلیل را می توان به عنوان فهرست راهنمای استفاده کرد پایگاه داده از انبار داده برای کمک به کاربران نهایی در یافتن محل اطلاعات ضروری

در مقایسه با سیستم های OLTP، با توانایی آنها در پشتیبانی از تجزیه و تحلیل اطلاعات و گزارش، انبار داده به عنوان سیستم مناسب تری برای فرآیندهای اطلاعاتی مانند ساختن و پاسخگویی به پرس و جوها و تولید گزارش ها دیده می شود. بخش بعدی تفاوت های این دو سیستم را با جزئیات برجسته می کند.

پایگاه داده تحلیلی در برابر سیستم های OLTP

بسیاری از سیستم های اطلاعاتی درون سازمان ها برای پشتیبانی از عملیات روزانه در نظر گرفته شده اند. این سیستم‌ها که به سیستم‌های OLTP معروف هستند، تراکنش‌های روزانه به‌روزرسانی‌شده مداوم را ضبط می‌کنند.

I اطلاعات در این سیستم ها اغلب اصلاح، اضافه یا حذف می شوند. به عنوان مثال، آدرس مشتری به محض اینکه از مکانی به مکان دیگر نقل مکان می کند، تغییر می کند. در این صورت آدرس جدید با تغییر فیلد آدرس ثبت می شود پایگاه داده. هدف اصلی این سیستم ها کاهش هزینه های تراکنش و در عین حال کاهش زمان پردازش است. نمونه هایی از سیستم های OLTP شامل اقدامات حیاتی مانند ثبت سفارش، حقوق و دستمزد، فاکتور، ساخت، خدمات مشتری است. مشتریان.

برخلاف سیستم‌های OLTP که برای فرآیندهای مبتنی بر تراکنش و رویداد ایجاد شده‌اند، i انبار داده برای ارائه پشتیبانی از فرآیندهای مبتنی بر تجزیه و تحلیل ایجاد شدند اطلاعات و فرآیندهای تصمیم گیری

این معمولاً با ادغام i به دست می آید اطلاعات از OLTP های مختلف و سیستم های خارجی در یک "کانتینر" واحد اطلاعات، همانطور که در بخش قبل بحث شد.

مدل فرآیند ذخیره سازی داده موناش

مدل فرآیند برای انبار داده موناش توسط محققان گروه تحقیقاتی Monash DSS توسعه یافته است و بر اساس ادبیات آن است انبار داده، در مورد تجربه در پشتیبانی از توسعه زمینه های سیستمی، در مورد بحث با فروشندگان برنامه های کاربردی برای استفاده در انبار داده، بر روی گروهی از متخصصان در استفاده از انبار داده.

این مراحل عبارتند از: شروع، برنامه ریزی، توسعه، عملیات و تبیین. نمودار ماهیت تکراری یا تکاملی توسعه a را توضیح می دهد انبار داده با استفاده از فلش های دو طرفه که بین فازهای مختلف قرار داده شده است. در این زمینه، "تکرار کننده" و "تکاملی" به این معنی است که، در هر مرحله از فرآیند، فعالیت های پیاده سازی همیشه می توانند به سمت عقب به سمت فاز قبلی انتشار یابند. این به دلیل ماهیت یک پروژه است انبار داده که در آن درخواست های اضافی از کاربر نهایی در هر زمان مطرح می شود. به عنوان مثال، در مرحله توسعه یک فرآیند انبار داده، یک بعد یا موضوع جدید توسط کاربر نهایی درخواست می شود که بخشی از طرح اولیه نبوده است، این باید به سیستم اضافه شود. این باعث تغییر در پروژه می شود. نتیجه این است که تیم طراحی باید الزامات اسناد ایجاد شده تا کنون را در مرحله طراحی تغییر دهد. در بسیاری از موارد، وضعیت فعلی پروژه باید به مرحله طراحی برگردد که در آن نیاز جدید باید اضافه و مستند شود. کاربر نهایی باید بتواند مستندات خاص بررسی شده و تغییرات ایجاد شده در مرحله توسعه را ببیند. در پایان این چرخه توسعه، پروژه باید بازخورد بسیار خوبی از تیم توسعه و کاربر دریافت کند. سپس از بازخورد برای بهبود پروژه آینده استفاده مجدد می شود.

برنامه ریزی ظرفیت
Dw از نظر اندازه بسیار بزرگ است و به سرعت رشد می کند (Best 1995, Rudin 1997a) در نتیجه مقدار اطلاعات تاریخ هایی که آنها از مدت زمان خود حفظ می کنند. رشد نیز می تواند ناشی از اطلاعات اضافات درخواست شده توسط کاربران برای افزایش ارزش اطلاعات که آنها قبلا دارند. بر این اساس، الزامات ذخیره سازی برای اطلاعات می تواند به طور قابل توجهی افزایش یابد (Eckerson 1997). بنابراین، ضروری است که با انجام برنامه ریزی ظرفیت، اطمینان حاصل شود که سیستم ساخته شده می تواند با رشد نیازها رشد کند (Best 1995، LaPlante 1996، Lang 1997، Eckerson 1997، Rudin 1997a، Foley 1997a).
در برنامه ریزی برای مقیاس پذیری پایگاه داده، باید رشد مورد انتظار در اندازه انبار، انواع پرس و جوهایی که احتمالاً انجام می شود و تعداد کاربران نهایی پشتیبانی شده را دانست (Best 1995, Rudin 1997b, Foley 1997a). ساخت برنامه‌های کاربردی مقیاس‌پذیر به ترکیبی از فناوری‌های سرور مقیاس‌پذیر و تکنیک‌های طراحی برنامه‌های مقیاس‌پذیر نیاز دارد (Best 1995, Rudin 1997b. هر دو در ساخت یک برنامه کاربردی بسیار مقیاس‌پذیر ضروری هستند. فناوری‌های سرور مقیاس‌پذیر می‌توانند افزودن فضای ذخیره‌سازی، حافظه و CPU را بدون تخریب آسان و سودمند کنند. عملکرد (Lang 1997، Telephony 1997).

دو فناوری اصلی مقیاس پذیر سرور وجود دارد: پردازش متقارن چندگانه (SMP) و پردازش موازی گسترده (MPP) (IDC 1997، Humphries et al. 1999). یک سرور SMP معمولا دارای چندین پردازنده است که حافظه، گذرگاه سیستم و منابع دیگر را به اشتراک می گذارند (IDC 1997، Humphries et al. 1999). برای افزایش آن می توان پردازنده های اضافی اضافه کرد قدرت محاسباتی روش دیگری برای افزایش قدرت از سرور SMP، ترکیب چندین ماشین SMP است. این تکنیک به عنوان خوشه بندی شناخته می شود (Humphries et al. 1999). یک سرور MPP، از سوی دیگر، دارای چندین پردازنده است که هر کدام حافظه، سیستم اتوبوس و سایر منابع خاص خود را دارند (IDC 1997، Humphries et al. 1999). هر پردازنده یک گره نامیده می شود. افزایش در قدرت محاسباتی قابل دستیابی است

اضافه کردن گره های اضافی به سرورهای MPP (Humphries et al. 1999).

نقطه ضعف سرورهای SMP این است که بسیاری از عملیات ورودی-خروجی (I/O) می توانند گذرگاه سیستم را شلوغ کنند (IDC 1997). این مشکل در سرورهای MPP رخ نمی دهد زیرا هر پردازنده سیستم گذرگاه خود را دارد. با این حال، اتصالات بین هر گره به طور کلی بسیار کندتر از سیستم گذرگاه SMP است. علاوه بر این، سرورهای MPP می توانند سطح پیچیدگی بیشتری را به توسعه دهندگان برنامه اضافه کنند (IDC 1997). بنابراین، انتخاب بین سرورهای SMP و MPP می‌تواند تحت تأثیر عوامل بسیاری از جمله پیچیدگی برنامه‌ها، نسبت قیمت/عملکرد، ظرفیت پردازش مورد نیاز، برنامه‌های dw جلوگیری‌شده و افزایش اندازه پایگاه داده از dw و تعداد کاربران نهایی.

تکنیک های طراحی اپلیکیشن مقیاس پذیر متعددی را می توان در برنامه ریزی ظرفیت به کار برد. یکی از دوره های اطلاع رسانی مختلفی مانند روز، هفته، ماه و سال استفاده می کند. داشتن دوره های مختلف اطلاع رسانی، پایگاه داده می توان آن را به قطعات دسته بندی شده با مدیریت تقسیم کرد (اینمون و همکاران 1997). روش دیگر استفاده از جداول خلاصه است که با خلاصه سازی ساخته می شوند اطلاعات da اطلاعات دقیق بنابراین، من اطلاعات خلاصه شده فشرده تر از جزئیات هستند، که به فضای حافظه کمتری نیاز دارد. بنابراین اطلاعات جزئیات را می توان در یک واحد ذخیره سازی ارزان تر ذخیره کرد، که باعث صرفه جویی در ذخیره سازی بیشتر می شود. اگرچه استفاده از جدول های خلاصه می تواند فضای حافظه را ذخیره کند، اما برای به روز نگه داشتن آنها و مطابق با نیازهای تجاری، به تلاش زیادی نیاز دارد. با این حال، این تکنیک به طور گسترده مورد استفاده قرار می گیرد و اغلب در ارتباط با تکنیک قبلی استفاده می شود (Best 1995, Inmon 1996a, Chauduri and Dayal
1997).

تعریف کردن انبار داده معماری های فنی تعریف تکنیک های معماری dw

پذیرندگان اولیه انبار داده در درجه اول اجرای متمرکز dw را تصور می کردند که در آن همه اطلاعاتاز جمله i اطلاعات خارجی، در یک واحد ادغام شدند،
ذخیره سازی فیزیکی (Inmon 1996a, Bresnahan 1996, Peacock 1998).

مزیت اصلی این رویکرد این است که کاربران نهایی قادر به دسترسی به نمای گسترده سازمانی هستند اطلاعات سازمانی (Ovum 1998). مزیت دیگر این است که استانداردسازی را ارائه می دهد اطلاعات از طریق سازمان، به این معنی که تنها یک نسخه یا تعریف برای هر اصطلاحات مورد استفاده در مخزن dw (متاداده) وجود دارد (Flanagan and Safdie 1997, Ovum 1998). از سوی دیگر، عیب این رویکرد این است که ساخت آن گران و دشوار است (Flanagan and Safdie 1997, Ovum 1998, Inmon et al. 1998). مدت زیادی از معماری ذخیره سازی نگذشته است اطلاعات متمرکز محبوب شد، مفهوم استخراج زیر مجموعه های کوچکتر تکامل یافته است اطلاعات برای پشتیبانی از نیازهای برنامه های کاربردی خاص (وارنی 1996، IDC 1997، برسون و اسمیت 1997، طاووس 1998). این سیستم های کوچک مشتقاتی از سیستم بزرگتر هستند انبار داده متمرکز آنها نام برده می شود انبار داده وابسته به دپارتمان یا داده های وابسته. معماری وابسته به داده‌های مارت به عنوان معماری سه لایه شناخته می‌شود که اولین لایه از آن تشکیل شده است انبار داده متمرکز، دوم شامل سپرده های اطلاعات بخش و سوم شامل دسترسی به اطلاعات و با ابزارهای تحلیل (Demarest 1994، Inmon et al. 1997).

دیتامارت ها معمولاً بعد از این ساخته می شوند انبار داده متمرکز برای رفع نیازهای واحدهای خاص ساخته شد (وایت 1995، وارنی 1996).
Data marts ذخیره می کند اطلاعات بسیار مرتبط با واحدهای خاص (اینمون و همکاران 1997، اینمون و همکاران 1998، IA 1998).

مزیت این روش این است که وجود نخواهد داشت dato یکپارچه نیست و اینکه i اطلاعات از همه این‌ها، در داده‌های مارت‌ها کمتر زائد خواهد بود اطلاعات آنها از یک انبار می آیند اطلاعات یکپارچه. مزیت دیگر این است که اتصالات کمی بین هر دیتا مارت و منابع آن وجود خواهد داشت اطلاعات زیرا هر دیتا مارت فقط یک منبع دارد اطلاعات. به علاوه با وجود این معماری، کاربران نهایی همچنان می توانند به نمای کلی دسترسی داشته باشند اطلاعات

سازمان های شرکتی این روش به عنوان روش از بالا به پایین شناخته می شود، که در آن داده های مارت پس از ساخت ساخته می شوند انبار داده (طاووس 1998، گاف 1998).
با افزایش نیاز به نشان دادن نتایج زودهنگام، برخی از سازمان ها شروع به ساخت مارت های داده مستقل کرده اند (Flanagan and Safdie 1997, White 2000). در این مورد، دیتا مارت ها خود را می گیرند اطلاعات مستقیما از اصول اولیه اطلاعات OLTP و نه از انبار متمرکز و یکپارچه، بنابراین نیاز به وجود انبار مرکزی در محل را از بین می برد.

هر دیتا مارت به حداقل یک پیوند به منابع خود نیاز دارد اطلاعات. نقطه ضعف داشتن چندین اتصال برای هر دیتا مارت این است که در مقایسه با دو معماری قبلی، فراوانی بیش از حد اطلاعات به طور قابل توجهی افزایش می یابد.

هر دیتا مارت باید تمام اطلاعات را ذخیره کند اطلاعات به صورت محلی مورد نیاز است تا تأثیری بر روی سیستم های OLTP نداشته باشد. این باعث می شود که i اطلاعات آنها در داده های مختلف ذخیره می شوند (اینمون و همکاران 1997). یکی دیگر از معایب این معماری این است که منجر به ایجاد ارتباطات پیچیده بین دیتا مارت ها و منابع داده آنها می شود. اطلاعات که انجام و کنترل آنها دشوار است (اینمون و همکاران 1997).

یکی دیگر از معایب این است که کاربران نهایی نمی توانند به نمای کلی اطلاعات شرکت دسترسی داشته باشند زیرا i اطلاعات داده های مختلف یکپارچه نیستند (Ovum 1998).
یکی دیگر از معایب این است که ممکن است بیش از یک تعریف برای هر اصطلاح مورد استفاده در داده‌ها وجود داشته باشد که باعث ایجاد ناسازگاری در اطلاعات در سازمان (Ovum 1998).
علیرغم معایبی که در بالا مورد بحث قرار گرفت، داده‌های مستقل هنوز مورد توجه بسیاری از سازمان‌ها قرار می‌گیرد (IDC 1997). یکی از عواملی که آنها را جذاب می کند این است که آنها سریعتر توسعه می یابند و به زمان و منابع کمتری نیاز دارند (برسناهان 1996، برسون و اسمیت 1997، اووم 1998). در نتیجه، آنها در درجه اول به عنوان پروژه های آزمایشی عمل می کنند که می توانند برای شناسایی سریع مزایا و/یا عیوب در پروژه استفاده شوند (پارسای 1995، برالی 1995، نیوینگ 1996). در این مورد، بخشی که باید در پروژه آزمایشی اجرا شود باید کوچک اما برای سازمان مهم باشد (نیوینگ 1996، منسل-لوئیس 1996).

با بررسی نمونه اولیه، کاربران نهایی و مدیریت می توانند تصمیم بگیرند که آیا پروژه را ادامه دهند یا متوقف کنند (Flanagan and Safdie 1997).
اگر قرار است این تصمیم ادامه یابد، دیتامارت‌ها برای صنایع دیگر باید یکی یکی ساخته شوند. دو گزینه برای کاربران نهایی بر اساس نیازهایشان در ساخت ماتریس های داده مستقل وجود دارد: یکپارچه/فدرال و غیر یکپارچه (Ovum 1998)

در روش اول، هر دیتا مارت جدید باید بر اساس دیتامارت های فعلی و مدل ساخته شود اطلاعات مورد استفاده شرکت (وارنی 1996، برسون و اسمیت 1997، طاووس 1998). لزوم استفاده از مدل اطلاعات شرکت به این معنی است که باید اطمینان حاصل شود که تنها یک تعریف برای هر اصطلاحات مورد استفاده در داده‌ها وجود دارد، همچنین اطمینان حاصل شود که داده‌های مختلف می‌توانند برای ارائه یک نمای کلی از اطلاعات شرکت ترکیب شوند (Bresnahan 1996). این روش از پایین به بالا نامیده می شود و زمانی بهترین است که محدودیت مالی و زمان وجود داشته باشد (Flanagan and Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). در روش دوم، داده‌های ساخته شده فقط می‌توانند نیازهای یک واحد خاص را برآورده کنند. یک نوع از دیتا مارت فدرال است انبار داده توزیع شده که در آن پایگاه داده میان افزار سرور هاب برای ادغام بسیاری از داده ها در یک مخزن واحد استفاده می شود اطلاعات توزیع شده (White 1995). در این مورد، i اطلاعات شرکت ها در چندین بازار داده توزیع شده اند. درخواست های کاربر نهایی به ارسال می شود پایگاه داده میان افزار هاب سرور، که همه را استخراج می کند اطلاعات توسط data marts درخواست شده و نتایج را به برنامه های کاربردی کاربر نهایی برمی گرداند. این روش اطلاعات تجاری را در اختیار کاربران نهایی قرار می دهد. با این حال، مشکلات داده‌های مستقل هنوز برطرف نشده است. معماری دیگری نیز وجود دارد که می توان از آن استفاده کرد که به نام the انبار داده مجازی (White 1995). با این حال، این معماری که در شکل 2.9 توضیح داده شده است، یک معماری ذخیره سازی داده نیست. اطلاعات واقعی است زیرا بارگذاری را از سیستم های OLTP به آن منتقل نمی کند انبار داده (Demarest 1994).

در واقع درخواست های اطلاعات توسط کاربران نهایی به سیستم‌های OLTP منتقل می‌شوند که پس از پردازش درخواست‌های کاربر، نتایج را برمی‌گردانند. اگرچه این معماری به کاربران نهایی اجازه می‌دهد تا گزارش‌ها و درخواست‌ها را تهیه کنند، اما نمی‌تواند آن را ارائه دهد

اطلاعات تاریخچه و مروری بر اطلاعات شرکت به عنوان i اطلاعات از سیستم های مختلف OLTP یکپارچه نشده اند. از این رو، این معماری نمی تواند تجزیه و تحلیل را برآورده کند اطلاعات پیچیده مانند پیش بینی ها

انتخاب برنامه های دسترسی و بازیابی اطلاعات

هدف از ساخت الف انبار داده انتقال اطلاعات به کاربران نهایی است (اینمون و همکاران 1997، پو 1996، مک فادن 1996، شانکس و همکاران 1997، هامرگرن 1998). یک یا چند برنامه دسترسی و بازیابی اطلاعات باید فراهم شود. تا به امروز، طیف گسترده ای از این برنامه ها وجود دارد که کاربر می تواند از بین آنها انتخاب کند (Hammergren 1998, Humphries et al. 1999). برنامه‌هایی که انتخاب می‌کنید موفقیت تلاش‌های انبارداری شما را تعیین می‌کنند اطلاعات در یک سازمان زیرا برنامه های کاربردی قابل مشاهده ترین بخش هستند انبار داده به کاربر نهایی (اینمون و همکاران 1997، پو 1996). موفق بودن الف انبار داده، باید بتواند از فعالیت های تجزیه و تحلیل پشتیبانی کند اطلاعات کاربر نهایی (Poe 1996, Seddon and Benjamin 1998, Eckerson 1999). بنابراین «سطح» آنچه کاربر نهایی می‌خواهد باید مشخص شود (پو 1996، ماتیسون 1996، اینمون و همکاران 1997، هامفریس و همکاران 1999).

به طور کلی، کاربران نهایی را می توان به سه دسته تقسیم کرد: کاربران اجرایی، تحلیلگران تجاری و کاربران قدرتمند (پو 1996، هامفریز و همکاران 1999). کاربران اجرایی نیاز به دسترسی آسان به مجموعه های از پیش تعریف شده گزارش دارند (Humphries et al. 1999). با پیمایش منو به راحتی می توان به این نسبت ها دسترسی داشت (Poe 1996). علاوه بر این، گزارش ها باید اطلاعاتی را با استفاده از نمایش گرافیکی مانند جداول و الگوها برای انتقال سریع اطلاعات ارائه دهند (Humphries et al. 1999). تحلیلگران تجاری، که ممکن است توانایی های فنی برای توسعه گزارش ها از ابتدا را به تنهایی نداشته باشند، باید بتوانند گزارش های فعلی را برای رفع نیازهای خاص خود اصلاح کنند (Poe 1996, Humphries et al. 1999). از طرف دیگر، کاربران قدرتمند، آن دسته از کاربران نهایی هستند که توانایی تولید و نوشتن درخواست‌ها و گزارش‌ها را از ابتدا دارند (Poe 1996, Humphries et al. 1999). آنها کسانی هستند که

آنها گزارش هایی را برای انواع دیگر کاربران تهیه می کنند (Poe 1996, Humphries et al. 1999).

هنگامی که الزامات کاربر نهایی مشخص شد، باید انتخابی از برنامه های دسترسی و بازیابی انجام شود اطلاعات در میان تمام موارد موجود (پو 1996، اینمون و همکاران 1997).
دسترسی به اطلاعات و ابزارهای بازیابی را می توان به 4 نوع طبقه بندی کرد: ابزارهای OLAP، ابزارهای EIS/DSS، ابزارهای پرس و جو و گزارش و ابزارهای داده کاوی.

ابزارهای OLAP به کاربران این امکان را می‌دهند که کوئری‌های موردی و همچنین مواردی را که در آن ایجاد می‌شوند ایجاد کنند پایگاه داده از انبار داده. علاوه بر این، این محصولات به کاربران اجازه می‌دهند تا از آن خارج شوند اطلاعات کلی تا جزئی

ابزارهای EIS/DSS گزارش‌های اجرایی مانند تحلیل «چه می‌شد اگر» و دسترسی به گزارش‌های منو محور را ارائه می‌دهند. گزارش ها باید از پیش تعریف شده و با منوها ادغام شوند تا ناوبری آسان تر شود.
ابزارهای پرس و جو و گزارش به کاربران این امکان را می دهند که گزارش های از پیش تعریف شده و خاصی تولید کنند.

از ابزارهای داده کاوی برای شناسایی روابطی استفاده می شود که می تواند نور جدیدی را بر روی عملیات فراموش شده در آن بتاباند اطلاعات از انبار داده

در کنار بهینه سازی نیازهای هر نوع کاربر، ابزارهای انتخاب شده باید بصری، کارآمد و آسان برای استفاده باشند. آنها همچنین باید با سایر بخش های معماری سازگار بوده و بتوانند با سیستم های موجود کار کنند. همچنین توصیه می شود ابزارهای دسترسی و بازیابی اطلاعات را با قیمت و کارایی مناسب انتخاب کنید. معیارهای دیگری که باید در نظر گرفته شوند عبارتند از تعهد فروشنده ابزار به حمایت از محصول خود و پیشرفت هایی که در نسخه های بعدی خواهد داشت. برای اطمینان از مشارکت کاربر در استفاده از انبار داده، تیم توسعه، کاربران را در فرآیند انتخاب ابزار مشارکت می دهد. در این مورد یک ارزیابی عملی کاربر باید انجام شود.

برای بهبود ارزش انبار داده، تیم توسعه همچنین می تواند دسترسی وب به انبار داده خود را فراهم کند. یک انبار داده با قابلیت وب به کاربران امکان دسترسی به آن را می دهد اطلاعات از مکان های دور یا در هنگام سفر. اطلاعات بیشتر می تواند

از طریق کاهش هزینه های آموزشی با هزینه های کمتر ارائه شود.

2.4.3 انبار داده فاز عملیاتی

این مرحله شامل سه فعالیت است: تعریف استراتژی های به روز رسانی داده ها، کنترل فعالیت های انبار داده و مدیریت امنیت انبار داده.

تعریف استراتژی های به روز رسانی داده ها

پس از بارگذاری اولیه، i اطلاعات به پایگاه داده انبار داده ها باید به طور دوره ای به روز شوند تا تغییرات ایجاد شده در آنها بازتولید شود اطلاعات اصل بنابراین باید تصمیم بگیرید که چه زمانی به‌روزرسانی شود، هر چند وقت یک‌بار رفرش باید برنامه‌ریزی شود و چگونه داده‌ها را تازه‌سازی کنید. اطلاعات. پیشنهاد می شود به روز رسانی اطلاعات زمانی که می توان سیستم را آفلاین کرد. فرکانس به‌روزرسانی توسط تیم توسعه بر اساس نیازهای کاربر تعیین می‌شود. دو رویکرد برای به روز رسانی انبار داده وجود دارد: تازه سازی کامل و بارگذاری مداوم تغییرات.

اولین رویکرد، به‌روزرسانی کامل، نیازمند بارگیری مجدد همه است اطلاعات از ابتدا این بدان معنی است که همه اطلاعات مورد نیاز باید استخراج، تمیز، تبدیل و ادغام در هر تازه سازی شود. تا آنجا که ممکن است باید از این رویکرد اجتناب شود زیرا به زمان و منابع زیادی نیاز دارد.

یک رویکرد جایگزین، آپلود مداوم تغییرات است. این i را اضافه می کند اطلاعات که از آخرین چرخه به روز رسانی انبار داده تغییر کرده اند. شناسایی رکوردهای جدید یا اصلاح شده به میزان قابل توجهی کاهش می یابد اطلاعات که باید در هر به روز رسانی به انبار داده منتشر شود زیرا فقط اینها هستند اطلاعات به اضافه خواهد شد پایگاه داده از انبار داده

حداقل 5 رویکرد وجود دارد که می توان از آنها برای خروج i استفاده کرد اطلاعات جدید یا اصلاح شده برای به دست آوردن یک استراتژی کارآمد به روز رسانی داده ها اطلاعات ترکیبی از این رویکردها که تمام تغییرات سیستم را در بر می گیرد می تواند مفید باشد.

رویکرد اول، که از مهرهای زمانی استفاده می کند، فرض می کند که همه تخصیص داده شده اند اطلاعات یک مهر زمانی را ویرایش و به روز کرد تا بتوانید به راحتی همه را شناسایی کنید اطلاعات اصلاح شده و جدید با این حال، این رویکرد به طور گسترده در اکثر سیستم عامل های امروزی استفاده نشده است.
روش دوم استفاده از یک فایل دلتا است که توسط یک برنامه تولید شده است که فقط شامل تغییرات ایجاد شده در آن است اطلاعات. استفاده از این فایل چرخه به روز رسانی را نیز تقویت می کند. با این حال، حتی این روش در بسیاری از کاربردها استفاده نشده است.
روش سوم اسکن یک فایل لاگ است که اساسا حاوی اطلاعاتی مشابه فایل دلتا است. تنها تفاوت این است که یک فایل log برای فرآیند بازیابی ایجاد می شود و درک آن دشوار است.
روش چهارم اصلاح کد برنامه است. با این حال، اکثر کدهای برنامه قدیمی و شکننده هستند. بنابراین باید از این تکنیک اجتناب شود.
آخرین رویکرد، مقایسه است اطلاعات منابع با فایل اصلی dei اطلاعات.

کنترل فعالیت های انبار داده

هنگامی که انبار داده برای کاربران منتشر شد، باید در طول زمان نظارت شود. در این حالت، مدیر انبار داده می تواند از یک یا چند ابزار مدیریتی و کنترلی برای نظارت بر استفاده از انبار داده استفاده کند. به ویژه، می توان اطلاعاتی در مورد افراد و زمان دسترسی آنها به انبار داده جمع آوری کرد. بیا دیگه اطلاعات جمع آوری شده، نمایه ای از کار انجام شده می تواند ایجاد شود که می تواند به عنوان ورودی در اجرای بازپرداخت شارژ کاربر استفاده شود. بازپرداخت شارژ به کاربران اجازه می دهد تا از هزینه پردازش انبار داده مطلع شوند.

علاوه بر این، ممیزی انبار داده همچنین می تواند برای شناسایی انواع پرس و جوها، اندازه آنها، تعداد پرس و جو در روز، زمان واکنش پرس و جو، بخش های به دست آمده و مقدار استفاده شود. اطلاعات فرآوری شده. هدف دیگر از انجام ممیزی انبار داده، شناسایی اطلاعات که در حال استفاده نیستند. اینها اطلاعات برای بهبود زمان می توان آنها را از انبار داده حذف کرد

پاسخ اجرای پرس و جو و نظارت بر رشد اطلاعات که در داخل ساکن هستند پایگاه داده از انبار داده

مدیریت امنیت انبار داده

انبار داده شامل اطلاعات یکپارچه، انتقادی، حساس که به راحتی قابل دسترسی است. به همین دلیل باید از کاربران غیرمجاز محافظت شود. یکی از راه های پیاده سازی امنیت استفاده از تابع del است DBMS برای تخصیص امتیازات مختلف به انواع مختلف کاربران. به این ترتیب برای هر نوع کاربر باید یک پروفایل دسترسی حفظ شود. راه دیگر برای ایمن سازی انبار داده، رمزگذاری آن است که در آن نوشته شده است پایگاه داده از انبار داده دسترسی به اطلاعات و ابزارهای بازیابی باید رمزگشایی شوند اطلاعات قبل از ارائه نتایج به کاربران

2.4.4 انبار داده فاز استقرار

این آخرین مرحله در چرخه پیاده سازی انبار داده است. فعالیت هایی که در این مرحله انجام می شود شامل آموزش کاربران برای استفاده از انبار داده و انجام بررسی های انبار داده است.

آموزش کاربر

آموزش کاربر باید قبل از دسترسی انجام شود اطلاعات از انبار داده و استفاده از ابزارهای بازیابی. به طور کلی، جلسات باید با مقدمه ای بر مفهوم ذخیره سازی شروع شود اطلاعات، محتوای انبار داده، متا اطلاعات و ویژگی های اساسی ابزار. سپس، کاربران پیشرفته‌تر نیز می‌توانند جداول فیزیکی و ویژگی‌های کاربر ابزارهای دسترسی و بازیابی داده را مطالعه کنند.

روش های زیادی برای انجام آموزش کاربران وجود دارد. یکی از این موارد شامل انتخاب بسیاری از کاربران یا تحلیلگران است که از میان مجموعه ای از کاربران بر اساس مهارت های رهبری و ارتباطی آنها انتخاب می شوند. آنها شخصاً در مورد همه چیزهایی که برای آشنایی با سیستم نیاز دارند آموزش دیده اند. پس از پایان آموزش، آنها به شغل خود باز می گردند و به سایر کاربران نحوه استفاده از سیستم را آموزش می دهند. در

بر اساس آنچه که آموخته اند، سایر کاربران می توانند شروع به کاوش در انبار داده کنند.
روش دیگر آموزش کاربران زیادی به طور همزمان است، گویی در حال گذراندن یک دوره کلاسی هستید. این روش زمانی مناسب است که کاربران زیادی وجود داشته باشند که نیاز به آموزش همزمان دارند. روش دیگر آموزش هر کاربر به صورت جداگانه و تک تک است. این روش زمانی مناسب است که کاربران کم باشند.

هدف از آموزش کاربران آشنایی شما با دسترسی به آن است اطلاعات و ابزارهای بازیابی و همچنین محتویات انبار داده ها. با این حال، برخی از کاربران ممکن است از حجم اطلاعات ارائه شده در طول جلسه آموزشی غرق شوند. بنابراین، تعداد معینی از جلسات تجدید نظر باید برای کمک مداوم و پاسخ به سوالات خاص انجام شود. در برخی موارد یک گروه کاربری برای ارائه این نوع پشتیبانی تشکیل می شود.

جمع آوری بازخورد

هنگامی که انبار داده راه اندازی شد، کاربران می توانند از i استفاده کنند اطلاعات که برای اهداف مختلف در انبار داده ساکن هستند. اغلب، تحلیلگران یا کاربران از i اطلاعات در انبار داده برای:

  1. 1  روندهای شرکت را شناسایی کنید
  2. 2 نمایه‌های خرید را تجزیه و تحلیل کنید مشتریان
  3. 3  I را تقسیم کنید مشتریان و من
  4. 4  بهترین خدمات را ارائه دهید مشتریان - سفارشی کردن خدمات
  5. 5  استراتژی ها را تدوین کنید بازار یابی
  6. 6  برای تجزیه و تحلیل هزینه و کمک به کنترل، قیمت‌های رقابتی تولید کنید
  7. 7  از تصمیم گیری استراتژیک حمایت کنید
  8. 8  فرصت هایی برای برجسته شدن را شناسایی کنید
  9. 9  کیفیت فرآیندهای تجاری فعلی را بهبود بخشید
  10. 10  سود را بررسی کنید

به دنبال مسیر توسعه انبار داده، می توان یک سری بررسی ها را برای سیستم انجام داد تا بازخورد دریافت کند.

هم از تیم توسعه و هم از جامعه کاربر نهایی.
نتایج به دست آمده را می توان برای چرخه توسعه بعدی در نظر گرفت.

از آنجایی که انبار داده رویکردی افزایشی دارد، درس گرفتن از موفقیت ها و اشتباهات پیشرفت های قبلی بسیار مهم است.

2.5 خلاصه

در این فصل رویکردهای موجود در ادبیات مورد بحث قرار گرفته است. در بخش 1، مفهوم انبار داده و نقش آن در علم تصمیم‌گیری مورد بحث قرار گرفت. بخش 2 تفاوت های اصلی بین انبارهای داده و سیستم های OLTP را تشریح کرد. در بخش 3 ما مدل انبار داده موناش را مورد بحث قرار دادیم که در بخش 4 برای توصیف فعالیت های درگیر در فرآیند توسعه یک انبار داده استفاده شد، این پایان نامه ها بر اساس تحقیقات دقیق نبودند. آنچه در واقعیت اتفاق می‌افتد می‌تواند بسیار متفاوت از آنچه در ادبیات گزارش شده باشد، با این حال این نتایج می‌تواند برای ایجاد یک پس‌زمینه اساسی که بر مفهوم انبار داده برای این تحقیق تأکید می‌کند، استفاده شود.

فصل 3

روش تحقیق و طراحی

این فصل به روش های تحقیق و طراحی برای این مطالعه می پردازد. بخش اول نمای کلی از روش های تحقیق موجود برای بازیابی اطلاعات را نشان می دهد و معیارهای انتخاب بهترین روش برای یک مطالعه خاص مورد بحث قرار می گیرد. در بخش 2، دو روش انتخاب شده با معیارهایی که به تازگی در معرض دید قرار گرفته اند، مورد بحث قرار می گیرند. از این میان، یکی با دلایل مندرج در بخش 3 انتخاب و اتخاذ خواهد شد که در آن دلایل استثنای معیار دیگر نیز ذکر شده است. بخش 4 طرح تحقیق و بخش 5 نتیجه گیری را ارائه می دهد.

3.1 تحقیق در سیستم های اطلاعاتی

تحقیق در سیستم های اطلاعاتی صرفاً به حوزه فناوری محدود نمی شود، بلکه باید برای اهداف رفتاری و سازمانی نیز گسترش یابد.
ما این را مدیون پایان نامه های رشته های مختلف از علوم اجتماعی تا علوم طبیعی هستیم. این امر منجر به نیاز به طیف خاصی از روش های تحقیق شامل روش های کمی و کیفی برای استفاده در سیستم های اطلاعاتی می شود.
همه روش های تحقیق موجود مهم هستند، در واقع چندین محقق مانند جنکینز (1985)، Nunamaker و همکاران. (1991) و گالیرز (1992) استدلال می کنند که هیچ روش جهانی خاصی برای انجام تحقیقات در زمینه های مختلف سیستم های اطلاعاتی وجود ندارد. در واقع یک روش ممکن است برای یک تحقیق خاص مناسب باشد اما برای سایرین مناسب نباشد. این نیاز ما را به انتخاب روشی می‌آورد که برای پروژه تحقیقاتی خاص ما مناسب است: برای این انتخاب Benbasat et al. (1987) بیان می کند که ماهیت و هدف تحقیق باید در نظر گرفته شود.

3.1.1 ماهیت تحقیق

روش های مختلف بر اساس ماهیت تحقیق را می توان به سه سنت که در علم اطلاعات به طور گسترده شناخته شده است طبقه بندی کرد: تحقیقات اثباتی، تفسیری و انتقادی.

3.1.1.1 پژوهش پوزیتیویستی

تحقیقات پوزیتیویستی به عنوان مطالعه علمی یا تجربی نیز شناخته می شود. به دنبال این است: "توضیح و پیش بینی آنچه در جهان اجتماعی اتفاق می افتد با نگاه کردن به قوانین و روابط علت و معلولی بین عناصر تشکیل دهنده آن" (شانکس و همکاران 1993).

تحقیقات پوزیتیویستی نیز با تکرارپذیری، ساده سازی و ابطال مشخص می شود. علاوه بر این، تحقیقات پوزیتیویستی وجود روابط پیشینی بین پدیده های مورد مطالعه را تایید می کند.
طبق نظر گالیرز (1992) تاکسونومی یک روش تحقیقی است که در پارادایم پوزیتیویستی گنجانده شده است، اما به این محدود نمی شود، در واقع آزمایش های آزمایشگاهی، آزمایش های میدانی، مطالعات موردی، نمایش قضایا، پیش بینی ها و شبیه سازی ها وجود دارد. با استفاده از این روش ها، محققان اذعان می کنند که می توان پدیده های مورد مطالعه را به طور عینی و دقیق مشاهده کرد.

3.1.1.2 تحقیق تفسیری

تحقیقات تفسیری، که اغلب پدیدارشناسی یا ضد پوزیتیویسم نامیده می شود، توسط نیومن (1994) به عنوان «تحلیل سیستماتیک معنای اجتماعی کنش از طریق مشاهده مستقیم و دقیق افراد در موقعیت های طبیعی، به منظور دستیابی به یک درک و فهم توصیف شده است. به تفسیر اینکه مردم چگونه دنیای اجتماعی خود را ایجاد و حفظ می کنند. مطالعات تفسیری این فرض را رد می کند که پدیده های مشاهده شده را می توان به طور عینی مشاهده کرد. در واقع آنها بر اساس تفاسیر ذهنی هستند. علاوه بر این، محققان تفسیری به پدیده هایی که مطالعه می کنند، معانی پیشینی تحمیل نمی کنند.

این روش شامل مطالعات ذهنی/استدلالی، اقدام پژوهی، مطالعات توصیفی/تفسیری، آینده پژوهی و ایفای نقش می باشد. علاوه بر این بررسی‌ها و مطالعات موردی را می‌توان در این رویکرد گنجاند زیرا به مطالعات افراد یا سازمان‌ها در موقعیت‌های پیچیده دنیای واقعی مربوط می‌شود.

3.1.1.3 تحقیق انتقادی

تحقیق انتقادی ناشناخته ترین رویکرد در علوم اجتماعی است اما اخیراً مورد توجه محققان سیستم های اطلاعاتی قرار گرفته است. این فرض فلسفی که واقعیت اجتماعی به طور تاریخی توسط مردم و همچنین سیستم های اجتماعی با کنش ها و کنش های متقابل آنها تولید و بازتولید می شود. با این حال، توانایی آنها توسط تعدادی از ملاحظات اجتماعی، فرهنگی و سیاسی میانجی گری می شود.

مانند پژوهش تفسیری، پژوهش انتقادی معتقد است که پژوهش پوزیتیویستی هیچ ارتباطی با زمینه اجتماعی ندارد و تأثیر آن بر اعمال انسان را نادیده می گیرد.
از سوی دیگر، تحقیقات انتقادی، تحقیقات تفسیری را به دلیل ذهنی بودن بیش از حد و عدم هدف کمک به افراد برای بهبود زندگی خود مورد انتقاد قرار می دهد. بزرگترین تفاوت بین تحقیق انتقادی با دو رویکرد دیگر، بعد ارزشیابی آن است. در حالی که هدف سنت‌های پوزیتیویستی و تفسیری پیش‌بینی یا تبیین وضعیت موجود یا واقعیت اجتماعی است، هدف پژوهش انتقادی ارزیابی انتقادی و دگرگونی واقعیت اجتماعی مورد مطالعه است.

پژوهشگران انتقادی معمولاً برای رفع اختلافات اجتماعی و بهبود شرایط اجتماعی با وضعیت موجود مخالفت می کنند. پژوهش انتقادی تعهدی به دیدگاه فرآیندی از پدیده های مورد علاقه دارد و بنابراین، معمولاً طولی است. نمونه‌هایی از روش‌های تحقیق، مطالعات تاریخی بلندمدت و مطالعات قوم‌نگاری است. با این حال، تحقیقات انتقادی به طور گسترده در تحقیقات سیستم های اطلاعاتی مورد استفاده قرار نگرفته است

3.1.2 هدف تحقیق

در کنار ماهیت تحقیق، می توان از هدف آن برای راهنمایی محقق در انتخاب روش تحقیق خاص استفاده کرد. هدف یک پروژه تحقیقاتی ارتباط تنگاتنگی با موقعیت تحقیق در رابطه با چرخه تحقیق دارد که شامل سه مرحله نظریه سازی، تست تئوری و پالایش نظریه است. بنابراین، بر اساس زمان‌بندی چرخه پژوهش، یک پروژه تحقیقاتی می‌تواند هدفی تبیینی، توصیفی، اکتشافی یا پیش‌بینی داشته باشد.

3.1.2.1 تحقیق اکتشافی

هدف تحقیق اکتشافی بررسی موضوعی کاملاً جدید و تدوین سؤالات و فرضیه‌هایی برای تحقیقات آتی است. این نوع تحقیق در نظریه سازی برای به دست آوردن مراجع اولیه در یک حوزه جدید استفاده می شود. معمولاً از روش های تحقیق کیفی مانند مطالعات موردی یا مطالعات پدیدارشناسی استفاده می شود.

با این حال، می توان از تکنیک های کمی مانند بررسی های اکتشافی یا آزمایش ها نیز استفاده کرد.

3.1.3.3 تحقیق توصیفی

هدف تحقیق توصیفی تجزیه و تحلیل و تشریح دقیق یک موقعیت یا عملکرد سازمانی خاص است. این برای ساخت نظریه ها مناسب است و همچنین می تواند برای تایید یا چالش فرضیه ها استفاده شود. تحقیقات توصیفی معمولاً شامل استفاده از معیارها و نمونه ها می شود. مناسب ترین روش تحقیق شامل بررسی و تحلیل پیشینیان است.

3.1.2.3 تحقیق تبیینی

تحقیق تبیینی سعی می کند علت وقوع اتفاقات را توضیح دهد. این بر اساس حقایقی است که قبلا مورد مطالعه قرار گرفته است و سعی در یافتن دلایل این حقایق دارد.
بنابراین تحقیقات تبیینی معمولاً مبتنی بر تحقیقات اکتشافی یا توصیفی است و کمکی به آزمایش و تئوری های پالایش است. پژوهش تبیینی معمولاً از مطالعات موردی یا روش‌های تحقیق مبتنی بر نظرسنجی استفاده می‌کند.

3.1.2.4 تحقیقات پیشگیرانه

هدف تحقیق پیشگیرانه پیش بینی رویدادها و رفتارهای تحت مشاهده است که در حال مطالعه هستند (مارشال و راسمن 1995). پیش بینی آزمون علمی استاندارد حقیقت است. این نوع تحقیق عموماً از نظرسنجی یا تجزیه و تحلیل استفاده می کند اطلاعات مورخان (یین 1989)

بحث بالا نشان می دهد که تعدادی از روش های تحقیقاتی ممکن وجود دارد که می توانند در یک مطالعه خاص مورد استفاده قرار گیرند. با این حال، باید یک روش خاص وجود داشته باشد که برای نوع خاصی از پروژه تحقیقاتی مناسب تر از روش های دیگر باشد. (Galliers 1987, Yin 1989, De Vaus 1991). بنابراین، هر محققی برای اتخاذ مناسب ترین و سازگارترین روش تحقیق با طرح پژوهشی، نیازمند ارزیابی دقیق نقاط قوت و ضعف روش های مختلف است. (جنکینز 1985، پروان و کلاس 1992، بونومیا 1985، یین 1989، هیمیلتون و آیوز 1992).

3.2. روش های احتمالی تحقیق

هدف این پروژه بررسی تجربه در سازمان های استرالیایی با i اطلاعات ذخیره شده با توسعه انبار داده. داتو با توجه به اینکه در حال حاضر کمبود تحقیق در زمینه انبار داده در استرالیا وجود دارد، این پروژه تحقیقاتی همچنان در مرحله تئوری چرخه تحقیق قرار دارد و هدف اکتشافی دارد. بررسی تجربه در سازمان‌های استرالیایی که از انبار داده استفاده می‌کنند، نیازمند تفسیر جامعه واقعی است. در نتیجه، فرض فلسفی زیربنای پروژه تحقیقاتی از تفسیر سنتی پیروی می کند.

پس از بررسی دقیق روش‌های موجود، دو روش تحقیق ممکن شناسایی شد: پیمایش و مطالعات موردی، که می‌توانند برای تحقیقات اکتشافی مورد استفاده قرار گیرند (شانکس و همکاران 1993). گالیرز (1992) در طبقه بندی اصلاح شده خود با بیان اینکه آنها برای تئوری سازی مناسب هستند، در مورد مناسب بودن این دو روش برای این مطالعه خاص استدلال می کند. دو بخش زیر هر روش را به تفصیل مورد بحث قرار می دهد.

3.2.1 روش تحقیق پیمایشی

روش تحقیق پیمایشی برگرفته از روش سرشماری باستانی است. سرشماری شامل جمع آوری اطلاعات از کل جمعیت است. این روش گران و غیرعملی است، به خصوص اگر جمعیت زیاد باشد. بنابراین، در مقایسه با یک سرشماری، یک نظرسنجی معمولاً بر جمع آوری اطلاعات برای تعداد کمی یا نمونه کوچکی از نمایندگان جمعیت متمرکز است (فاولر 1988، نیومن 1994). یک نمونه، جمعیتی را که از آن استخراج شده است، با سطوح مختلف دقت، بسته به ساختار نمونه، اندازه، و روش انتخاب مورد استفاده منعکس می کند (فاولر 1988، بابی 1982، نیومن 1994).

روش پیمایشی به عنوان «عکس‌های فوری از عملکردها، موقعیت‌ها یا دیدگاه‌ها در یک برهه زمانی خاص، که با استفاده از پرسشنامه یا مصاحبه انجام می‌شود، که ممکن است استنتاج از آن‌ها باشد، تعریف می‌شود.
ساخته شده است» (Galliers 1992:153) [عکس فوری از اعمال، موقعیت ها یا دیدگاه ها در یک مقطع زمانی خاص، انجام شده با استفاده از پرسشنامه یا مصاحبه، که می توان از آن استنباط کرد]. نظرسنجی ها با جمع آوری اطلاعات در مورد برخی از جنبه های مطالعه، از تعداد معینی از شرکت کنندگان، با پرسیدن سؤالات سروکار دارند (فاولر 1988). این پرسشنامه ها و مصاحبه ها که شامل مصاحبه های تلفنی حضوری و ساخت یافته می باشد نیز از تکنیک های گردآوری اطلاعات که بیشتر در تحقیقات به کار می رود (Blalock 1970, Nachmias and Nachmias 1976, Fowler 1988) می توان از مشاهدات و تحلیل ها استفاده کرد (Gable 1994). از همه این روش های جمع آوری اطلاعات، استفاده از پرسشنامه محبوب ترین تکنیک است، زیرا تضمین می کند که i اطلاعات

جمع آوری شده ساختار و قالب بندی می شوند و بنابراین طبقه بندی اطلاعات را تسهیل می کند (هوانگ 1987، د واو 1991).

هنگام تجزیه و تحلیل i اطلاعاتیک استراتژی تحقیق اغلب از تکنیک های کمی مانند تجزیه و تحلیل آماری استفاده می کند، اما از تکنیک های کیفی نیز می توان استفاده کرد (Galliers 1992, Pervan).

و کلاس 1992، گیبل 1994). به طور معمول، i اطلاعات جمع آوری شده برای تجزیه و تحلیل توزیع ها و الگوهای انجمن ها استفاده می شود (فاولر 1988).

در حالی که نظرسنجی‌ها عموماً برای پرسش‌هایی مناسب هستند که به سؤال «چه؟» یا از آن ناشی می‌شوند، مانند «چقدر» و «چند»، می‌توان از طریق سؤال «چرا» پرسید (سانکوئیست و دانکلبرگ 1977، یین 1989). . به گفته سونکوئیست و دانکلبرگ (1977)، هدف تحقیق تحقیقی به چالش کشیدن فرضیه ها، ارزیابی برنامه ها، توصیف جمعیت و توسعه مدل های رفتار انسانی است. علاوه بر این، نظرسنجی‌ها می‌توانند برای مطالعه نظر جمعیت، شرایط، نظرات، ویژگی‌ها، انتظارات و حتی رفتارهای گذشته یا حال مورد استفاده قرار گیرند (نیومن 1994).

نظرسنجی ها به محقق اجازه می دهد تا روابط بین جمعیت را کشف کند و نتایج به طور معمول عمومی تر از روش های دیگر است (سانکوئیست و دانکلبرگ 1977، گیبل 1994). نظرسنجی‌ها به محققان اجازه می‌دهد تا منطقه جغرافیایی بزرگ‌تری را پوشش دهند و به بسیاری از پاسخ‌دهندگان دسترسی پیدا کنند (Blalock 1970, Sonquist and Dunkelberg 1977, Hwang and Lin 1987, Gable 1994, Neuman 1994). در نهایت، نظرسنجی ها می توانند اطلاعاتی را ارائه دهند که در جای دیگر یا به شکل مورد نیاز برای تجزیه و تحلیل در دسترس نیست (فاولر 1988).

با این حال، محدودیت هایی در انجام یک نظرسنجی وجود دارد. یک عیب این است که محقق نمی تواند اطلاعات زیادی در مورد شی مورد مطالعه به دست آورد. این امر به این دلیل است که بررسی ها فقط در یک زمان خاص انجام می شود و بنابراین تعداد محدودی از متغیرها و افراد وجود دارد که محقق می تواند

مطالعه (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). یکی دیگر از معایب این است که انجام یک نظرسنجی می تواند از نظر زمان و منابع بسیار پرهزینه باشد، به ویژه اگر شامل مصاحبه های حضوری باشد (فاولر 1988).

3.2.2. روش تحقیق پرس و جو

روش تحقیق پرس و جو شامل مطالعه عمیق یک موقعیت خاص در زمینه دنیای واقعی آن در یک دوره زمانی مشخص، بدون هیچ گونه مداخله ای از سوی محقق است (شانکس و سی. 1993، آیزنهارت 1989، جنکینز 1985). عمدتاً از این روش برای توصیف روابط بین متغیرهایی که در یک موقعیت خاص مورد مطالعه قرار می گیرند استفاده می شود (گالیرز 1992). تحقیقات می تواند شامل موارد منفرد یا چندگانه باشد، بسته به پدیده مورد تجزیه و تحلیل (فرانتس و رابی 1987، آیزنهارت 1989، یین 1989).

روش تحقیق پرس و جو به عنوان "یک تحقیق تجربی که یک پدیده معاصر را در زمینه واقعی آن با استفاده از منابع متعدد جمع آوری شده از یک یا چند موجودیت مانند افراد، گروه ها یا سازمان ها مطالعه می کند" تعریف می شود (یین 1989). هیچ جدایی واضحی بین پدیده و زمینه آن وجود ندارد و هیچ کنترل تجربی یا دستکاری متغیرها وجود ندارد (Yin 1989, Benbasat et al. 1987).

تکنیک های مختلفی برای جمع آوری خدایان وجود دارد اطلاعات که می تواند در روش پرس و جو استفاده شود که شامل مشاهدات مستقیم، بررسی سوابق بایگانی، پرسشنامه، بررسی اسناد و مصاحبه های ساختاریافته است. داشتن طیف متنوعی از تکنیک های برداشت اطلاعات، تحقیقات به محققان اجازه می دهد تا با هر دوی اینها برخورد کنند اطلاعات کیفی و کمی به طور همزمان (بونوما 1985، آیزنهارت 1989، یین 1989، گیبل 1994). همانند روش تحقیق، محقق پرسشگر به عنوان ناظر یا محقق عمل می کند و نه به عنوان یک شرکت کننده فعال در سازمان مورد مطالعه.

بنباسات و همکاران (1987) اظهار می دارند که روش تحقیق به ویژه برای ایجاد نظریه تحقیق مناسب است که با یک سؤال تحقیق شروع می شود و با آموزش ادامه می یابد.

یک نظریه در طول فرآیند جمع آوری اطلاعات. برای صحنه هم مناسب بودن

فرانتس و روبی (1987) از نظر ساختمان نظریه پیشنهاد می کنند که روش تحقیق می تواند برای فاز نظریه پیچیده نیز استفاده شود. در این صورت، بر اساس شواهد جمع آوری شده، یک نظریه یا فرضیه مورد تایید یا رد می شود. علاوه بر این، این نظرسنجی برای تحقیقاتی که با سؤالات «چگونه» یا «چرا» سروکار دارد نیز مناسب است (یین 1989).

در مقایسه با روش‌های دیگر، نظرسنجی به محقق اجازه می‌دهد تا اطلاعات ضروری را با جزئیات بیشتری به دست آورد (Galliers 1992، Shanks et al. 1993). علاوه بر این، نظرسنجی ها به محقق اجازه می دهد تا ماهیت و پیچیدگی فرآیندهای مورد مطالعه را درک کند (بنباسات و همکاران 1987).

چهار نقطه ضعف اصلی در ارتباط با روش نظرسنجی وجود دارد. اولین مورد عدم کسر کنترل شده است. ذهنیت محقق می تواند نتایج و نتیجه گیری های مطالعه را تغییر دهد (یین 1989). دومین عیب عدم مشاهده کنترل شده است. بر خلاف روش های تجربی، محقق پرس و جو نمی تواند پدیده های مورد مطالعه را همانطور که در زمینه طبیعی خود بررسی می شود، کنترل کند (گیبل 1994). سومین عیب، عدم تکرارپذیری است. این به این دلیل است که محقق بعید است که رویدادهای مشابه را مشاهده کند و نمی تواند نتایج یک مطالعه خاص را تأیید کند (لی 1989). در نهایت، به دلیل عدم تکرارپذیری، تعمیم نتایج به دست آمده از یک یا چند تحقیق دشوار است (گالیرز 1992، شانکس و همکاران 1993). با این حال، همه این مشکلات غیر قابل حل نیستند و در واقع می توانند توسط محقق با اعمال اقدامات مناسب به حداقل برسند (لی 1989).

3.3. روش تحقیق را توجیه کنید به تصویب رسید

از بین دو روش پژوهشی ممکن برای این پژوهش، روش پیمایش مناسب ترین در نظر گرفته شده است. این تحقیق به دنبال بررسی دقیق موارد مربوطه کنار گذاشته شد

محاسن و ضعف ها مناسب بودن یا نامناسب بودن هر روش برای این مطالعه در زیر مورد بحث قرار گرفته است.

3.3.1. نامناسب بودن روش تحقیق تحقیق

روش پرس و جو مستلزم مطالعه عمیق در مورد یک موقعیت خاص در یک یا چند سازمان در یک دوره زمانی است (ایزنهارت 1989). در این مورد، دوره ممکن است از بازه زمانی ارائه شده برای این مطالعه بیشتر شود. دلیل دیگر عدم اتخاذ روش پیمایشی این است که نتایج ممکن است از عدم دقت رنج ببرند (یین 1989). ذهنیت محقق می تواند بر نتایج و نتیجه گیری تأثیر بگذارد. دلیل دیگر این است که این روش بیشتر برای تحقیق در مورد سؤالاتی از نوع «چگونه» یا «چرا» مناسب است (یین 1989)، در حالی که سؤال پژوهشی این مطالعه از نوع «چه چیزی» است. در نهایت، تعمیم یافته های تنها یک یا چند تحقیق دشوار است (گالیرز 1992، شانکس و همکاران 1993). بر این اساس، روش تحقیق پیمایشی به دلیل نامناسب بودن برای این پژوهش انتخاب نشد.

3.3.2. راحتی روش جستجو از تحقیق و بررسی

هنگامی که این تحقیق انجام شد، عمل انبار داده ها به طور گسترده توسط سازمان های استرالیا پذیرفته نشده بود. از این رو، اطلاعات زیادی در مورد اجرای آنها در سازمان های استرالیایی وجود نداشت. اطلاعات موجود از سازمان‌هایی که الف را اجرا کرده یا استفاده کرده‌اند به دست آمده است انبار داده. در این مورد، روش تحقیق پیمایشی مناسب‌ترین روش است زیرا امکان به دست آوردن اطلاعاتی را می‌دهد که در جای دیگر یا به شکل مورد نیاز برای تجزیه و تحلیل در دسترس نیست (فاولر 1988). علاوه بر این، روش تحقیق پیمایشی به محقق اجازه می دهد تا بینش خوبی نسبت به عملکردها، موقعیت ها یا دیدگاه ها در یک زمان خاص به دست آورد (گالیرز 1992، دنسکام 1998). یک مرور کلی برای افزایش دانش در مورد تجربه انبار داده استرالیا مورد نیاز بود.

علاوه بر این، سونکوئیست و دانکلبرگ (1977) بیان می کنند که نتایج تحقیقات پیمایشی نسبت به سایر روش ها کلی تر است.

3.4. طرح تحقیق پیمایشی

نظرسنجی در مورد شیوه‌های ذخیره‌سازی داده‌ها در سال 1999 انجام شد. جمعیت هدف را سازمان‌های استرالیایی علاقه‌مند به مطالعات انبارداری داده تشکیل می‌دادند، زیرا احتمالاً قبلاً در مورد این موضوع مطلع شده بودند. اطلاعات که ذخیره می کنند و بنابراین می توانند اطلاعات مفیدی برای این مطالعه ارائه دهند. جامعه هدف با یک نظرسنجی اولیه از تمام اعضای استرالیایی موسسه انبار داده (Tdwi-aap) شناسایی شد. این بخش به طراحی مرحله تحقیق تجربی این مطالعه می پردازد.

3.4.1. تکنیک برداشت اطلاعات

از سه تکنیکی که معمولاً در تحقیق پیمایشی استفاده می شود (یعنی پرسشنامه پستی، مصاحبه تلفنی و مصاحبه شخصی) (ناچمیاس 1976، فاولر 1988، د واو 1991)، پرسشنامه پستی برای این مطالعه اتخاذ شد. اولین دلیل برای پذیرش دومی این است که می تواند به یک جمعیت پراکنده جغرافیایی برسد (Blalock 1970, Nachmias and Nachmias 1976, Hwang and Lin 1987, de Vaus 1991, Gable 1994). ثانیا، پرسشنامه پستی برای شرکت کنندگان با تحصیلات عالی مناسب است (فاولر 1988). پرسشنامه پستی برای این مطالعه به حامیان مالی پروژه انبار داده، مدیران و/یا مدیران پروژه ارسال شد. سوم، پرسشنامه های پستی زمانی مناسب هستند که یک لیست پستی امن در دسترس باشد (سالانت و دیلمن 1994). TDWI، در این مورد، یک انجمن انبار داده قابل اعتماد لیست پستی اعضای استرالیایی خود را ارائه کرده است. مزیت دیگر پرسشنامه پستی نسبت به پرسشنامه تلفنی یا مصاحبه های شخصی این است که به پاسخ دهندگان اجازه می دهد تا با دقت بیشتری پاسخ دهند، به ویژه زمانی که پاسخ دهندگان باید یادداشت ها را بررسی کنند یا در مورد سؤالات با افراد دیگر بحث کنند (فاولر 1988).

یک نقطه ضعف بالقوه ممکن است زمان مورد نیاز برای انجام پرسشنامه ها از طریق پست باشد. به طور معمول، یک نظرسنجی پستی به این ترتیب انجام می شود: نامه های پستی، منتظر پاسخ ها، و ارسال تاییدیه (فاولر 1988، باینبریج 1989). بنابراین، کل زمان ممکن است بیشتر از زمان مورد نیاز برای مصاحبه شخصی یا مصاحبه تلفنی باشد. با این حال، کل زمان را می توان از قبل شناخت (فاولر 1988، دنسکام 1998). زمان صرف شده برای انجام مصاحبه های شخصی را نمی توان از قبل مشخص کرد زیرا از مصاحبه ای به مصاحبه دیگر متفاوت است (فاولر 1988). مصاحبه‌های تلفنی می‌تواند سریع‌تر از پرسشنامه‌های پستی و مصاحبه‌های شخصی باشد، اما به دلیل در دسترس نبودن برخی از افراد، می‌تواند نرخ عدم پاسخگویی بالایی داشته باشد (فاولر 1988). علاوه بر این، مصاحبه های تلفنی به طور کلی به لیست های نسبتاً کوتاهی از سوالات محدود می شود (Bainbridge 1989).

یکی دیگر از نقاط ضعف پرسشنامه پستی، نرخ بالای عدم پاسخگویی است (فاولر 1988، باینبریج 1989، نیومن 1994). با این حال، اقدامات متقابل با مرتبط کردن این مطالعه با یک مؤسسه انبار داده مورد اعتماد (به عنوان مثال TDWI) انجام شده است (Bainbridge 1989، Neuman 1994)، که دو نامه یادآوری را برای افراد غیر پاسخگو ارسال می کند (Fowler 1988، Neuman 1994) و همچنین شامل یک نامه اضافی است. توضیح هدف مطالعه (نیومن 1994).

3.4.2. واحد تحلیل

هدف از این مطالعه به دست آوردن اطلاعات در مورد اجرای انبار داده و استفاده از آن در سازمان های استرالیایی است. جامعه هدف شامل تمام سازمان‌های استرالیایی است که i انبار داده. سپس هر سازمان به نام ثبت می شود. پرسشنامه از طریق پست برای سازمان های علاقمند به پذیرش ارسال شد انبار داده. این روش تضمین می کند که اطلاعات جمع آوری شده از مناسب ترین منابع هر سازمان مشارکت کننده به دست می آید.

3.4.3. نمونه نظرسنجی

"لیست پستی" شرکت کنندگان در نظرسنجی از TDWI به دست آمد. از این فهرست، 3000 سازمان استرالیایی به عنوان مبنای نمونه گیری انتخاب شدند. نامه تکمیلی در توضیح پروژه و هدف نظرسنجی به همراه یک برگه پاسخ و یک پاکت از پیش پرداخت شده برای بازگرداندن پرسشنامه تکمیل شده برای نمونه ارسال شد. از 3000 سازمان، 198 سازمان با شرکت در این مطالعه موافقت کردند. انتظار چنین تعداد کمی از پاسخ ها بود dato تعداد زیادی از سازمان‌های استرالیایی که در آن زمان استراتژی ذخیره‌سازی داده‌ها را در سازمان‌های خود پذیرفته بودند یا پذیرفته بودند. بنابراین جامعه هدف این پژوهش تنها 198 سازمان است.

3.4.4. محتویات پرسشنامه

ساختار پرسشنامه بر اساس مدل انبار داده موناش (که قبلا در قسمت 2.3 بحث شد) بود. محتوای پرسشنامه بر اساس تجزیه و تحلیل ادبیات ارائه شده در فصل 2 بود. نسخه ای از پرسشنامه ارسال شده برای شرکت کنندگان در نظرسنجی را می توان در پیوست B یافت. پرسشنامه شامل شش بخش است که مراحل مدل تحت پوشش را دنبال می کند. شش پاراگراف زیر به طور خلاصه محتویات هر بخش را خلاصه می کند.

بخش A: اطلاعات اولیه در مورد سازمان
این بخش شامل سوالات مربوط به مشخصات سازمان های شرکت کننده است. علاوه بر این، برخی از سوالات مربوط به وضعیت پروژه انبار داده شرکت‌کننده است. اطلاعات محرمانه مانند نام سازمان در تحلیل نظرسنجی فاش نشد.

بخش ب: آغاز
سوالات این بخش مربوط به فعالیت شروع انباره داده است. سوالاتی در مورد آغازگر پروژه، ضامنان، مهارت ها و دانش مورد نیاز، اهداف توسعه انبار داده و انتظارات کاربر نهایی پرسیده شد.

بخش ج: طراحی
این بخش شامل سوالات مربوط به برنامه ریزی فعالیت ها می باشد انبار داده. به طور خاص، سوالات در مورد محدوده اجرا، مدت زمان پروژه، هزینه پروژه و تجزیه و تحلیل هزینه / فایده بود.

بخش د: توسعه
در بخش توسعه سوالات مربوط به فعالیت های توسعه وجود دارد انبار داده: مجموعه ای از نیازهای کاربر نهایی، منابع اطلاعات، مدل منطقی از اطلاعات، نمونه های اولیه، برنامه ریزی ظرفیت، معماری های فنی و انتخاب ابزارهای توسعه انبار داده.

بخش E: عملیات
سوالات عملیاتی مربوط به عملکرد و توسعه پذیری انبار داده، چگونه در مرحله بعدی توسعه تکامل می یابد. آنجا کیفیت داده، استراتژی های تازه سازی اطلاعات، دانه بندی از اطلاعات، مقیاس پذیری از انبار داده و مسائل امنیتی انبار داده از انواع سوالات مطرح شده بود.

بخش F: توسعه
این بخش شامل سوالاتی در مورد استفاده از انبار داده توسط کاربران نهایی محقق به هدف و سودمندی آن علاقمند بود انبار داده، بررسی و راهبردهای آموزشی اتخاذ شده و استراتژی کنترل از انبار داده به تصویب رسید.

3.4.5. نرخ پاسخ

اگرچه نظرسنجی های پستی به دلیل داشتن نرخ پاسخ پایین مورد انتقاد قرار می گیرند، اقداماتی برای افزایش نرخ بازگشت انجام شده است (همانطور که قبلا در قسمت 3.4.1 بحث شد). اصطلاح "نرخ پاسخ" به درصدی از افراد در یک نمونه نظرسنجی خاص که به پرسشنامه پاسخ می دهند اشاره دارد (دنسکوم 1998). برای محاسبه میزان پاسخگویی به این تحقیق از فرمول زیر استفاده شده است:

تعداد افرادی که پاسخ دادند
میزان پاسخ = ——————————————————————————– X 100 تعداد کل پرسشنامه های ارسالی

3.4.6. تست خلبانی

قبل از ارسال پرسشنامه به نمونه، سوالات با انجام تست های آزمایشی مورد بررسی قرار گرفتند، همانطور که توسط لوک و روبین (1987)، جکسون (1988) و دی وو (1991) پیشنهاد شد. هدف از آزمون‌های آزمایشی آشکار کردن هرگونه عبارات و سؤالات مبهم و نامناسب است که تفسیر آنها دشوار است، برای روشن کردن تعاریف و اصطلاحات استفاده شده و شناسایی زمان تقریبی مورد نیاز برای تکمیل پرسشنامه (وارویک و لینگر 1975، جکسون 1988، سالانت). و دیلمن 1994). آزمایش‌های آزمایشی با انتخاب افراد با ویژگی‌های مشابه با آزمودنی‌های نهایی، همانطور که توسط دیویس ای پیشنهاد شد، انجام شد. کوزنسا (1993). در این مطالعه، شش نفر از متخصصان انبار داده به عنوان آزمودنی‌های آزمایشی انتخاب شدند. پس از هر آزمایش پایلوت، اصلاحات لازم انجام شد. از آزمایش‌های آزمایشی انجام شده، شرکت‌کنندگان در شکل‌دهی و تنظیم مجدد نسخه نهایی پرسشنامه مشارکت داشتند.

3.4.7. روش های تجزیه و تحلیل توسط Dati

I اطلاعات نظرسنجی های جمع آوری شده از پرسشنامه های بسته با استفاده از یک بسته برنامه آماری به نام SPSS مورد تجزیه و تحلیل قرار گرفت. بسیاری از پاسخ ها با استفاده از آمار توصیفی تحلیل شدند. تعدادی از پرسشنامه ها ناقص برگشت داده شد. برای اطمینان از اینکه i اطلاعات گم شدن نتیجه خطاهای وارد کردن داده ها نبود، بلکه به این دلیل که سؤالات برای ثبت نام کننده مناسب نبودند، یا ثبت نام کننده تصمیم گرفت به یک یا چند سؤال خاص پاسخ ندهد. این پاسخ های گمشده در طول تجزیه و تحلیل نادیده گرفته شدند اطلاعات و به عنوان '- 9' کدگذاری شدند تا از حذف آنها از فرآیند تجزیه و تحلیل اطمینان حاصل شود.

هنگام تهیه پرسشنامه، سوالات بسته با اختصاص یک عدد به هر گزینه از پیش کدگذاری می شد. سپس از شماره برای آماده سازی استفاده شد اطلاعات در طول تجزیه و تحلیل (Denscombe 1998، Sapsford و Jupp 1996). به عنوان مثال، شش گزینه در سوال 1 بخش B وجود داشت: هیئت مدیره، مدیر ارشد اجرایی، بخش فناوری اطلاعات، واحد تجاری، مشاوران و غیره. در فایل از اطلاعات در SPSS، متغیری برای نشان دادن «مؤسس پروژه» با شش برچسب مقدار ایجاد شد: «1» برای «هیئت مدیره»، «2» برای «مدیری ارشد» و غیره. خیابان. استفاده از مقیاس لیکرتین در برخی از سؤالات بسته نیز با توجه به استفاده از مقادیر عددی مربوطه وارد شده در SPSS، امکان شناسایی بی دردسر را فراهم می کند. برای پرسش‌هایی با پاسخ‌های غیر جامع، که متقابلاً انحصاری نبودند، هر گزینه به‌عنوان یک متغیر واحد با دو برچسب ارزش در نظر گرفته شد: «1» برای «علامت‌گذاری‌شده» و «2» برای «نشان‌گذاری نشده».

با سؤالات باز متفاوت از سؤالات بسته برخورد شد. پاسخ این سوالات در SPSS وارد نشده است. در عوض، آنها با دست تجزیه و تحلیل شدند. استفاده از این نوع سؤال به ما امکان می دهد اطلاعاتی در مورد عقاید آزادانه و تجربیات شخصی پاسخ دهندگان به دست آوریم (Bainbridge 1989، Denscombe 1998). در صورت امکان، یک دسته بندی از پاسخ ها انجام شد.

برای تحلیل اطلاعاتاز روش های ساده تحلیل آماری مانند فرکانس پاسخ، میانگین، انحراف معیار و میانه استفاده می شود (آرگیروس 1996، دنسکام 1998).
آزمون گاما برای به دست آوردن معیارهای کمی ارتباط بین عملکرد خوبی داشت اطلاعات ترتیبی (نوروسیس 1983، آرگیروس 1996). این آزمون ها مناسب بودند زیرا مقیاس های ترتیبی استفاده شده دارای دسته بندی های زیادی نبودند و می توانستند در جدول نشان داده شوند (نوروسیس 1983).

3.5 سوماریو

در این فصل، روش تحقیق و طرح اتخاذ شده برای این پژوهش مورد بحث قرار گرفت.

انتخاب مناسب ترین روش تحقیق برای یک مطالعه خاص مورد توجه قرار می گیرد
در نظر گرفتن تعدادی از قوانین، از جمله ماهیت و نوع تحقیق، و همچنین محاسن و ضعف های هر روش ممکن (جنکینز 1985، بنباسات و همکاران 1097، گالیرز و لند 1987، یین 1989، همیلتون و آیوز 1992، گالیرز. 1992، نیومن 1994). با توجه به فقدان دانش و نظریه موجود در مورد پذیرش انبار داده در استرالیا، این مطالعه پژوهشی نیازمند یک روش تحقیق تفسیری با توانایی اکتشافی برای کشف تجربیات سازمان‌های استرالیایی است. روش تحقیق انتخاب شده برای جمع آوری اطلاعات در مورد پذیرش مفهوم انبار داده توسط سازمان های استرالیایی انتخاب شد. پرسشنامه پستی به عنوان تکنیک گردآوری انتخاب شد اطلاعات. توجیه روش تحقیق و تکنیک گردآوری اطلاعات انتخاب شده در این فصل ارائه خواهد شد. همچنین در مورد واحد تجزیه و تحلیل، نمونه مورد استفاده، درصد پاسخ ها، محتوای پرسشنامه، پیش آزمون پرسشنامه و روش تجزیه و تحلیل نتایج بحث و تبادل نظر شد. اطلاعات.

طراحی یک انبار داده:

ترکیب رابطه موجودیت و مدل سازی ابعادی

چکیده
ذخیره سازی i اطلاعات یکی از مسائل مهم فعلی برای بسیاری از سازمان ها است. یک مسئله کلیدی در توسعه ذخیره سازی مواد غذایی اطلاعات طراحی اوست
طراحی باید از تشخیص مفاهیم در آن پشتیبانی کند انبار داده به سیستم میراث و سایر منابع اطلاعات و همچنین درک آسان و کارایی در اجرای انبار داده.
بسیاری از ادبیات ذخیره سازی از اطلاعات استفاده از مدل‌سازی رابطه موجودیت یا مدل‌سازی ابعادی را برای نشان دادن طراحی توصیه می‌کند انبار داده.
در این مقاله نشان می دهیم که چگونه می توان هر دو نمایش را در یک رویکرد برای ترسیم ترکیب کرد انبار داده. رویکرد مورد استفاده سیستماتیک است

در یک مطالعه موردی مورد بررسی قرار گرفت و در تعدادی از مفاهیم مهم با پزشکان شناسایی شد.

انبار داده ها

Un انبار داده معمولاً به عنوان "مجموعه موضوع محور، یکپارچه، متغیر زمان و غیرفرار از داده ها در حمایت از تصمیمات مدیریت" تعریف می شود (اینمون و هکاثورن، 1994). موضوع محور و یکپارچه نشان می دهد که انبار داده طراحی شده است تا از مرزهای عملکردی سیستم های Legaci عبور کند تا یک چشم انداز یکپارچه ارائه دهد اطلاعات.
متغیر زمانی بر ماهیت تاریخی یا سری زمانی آن تأثیر می گذارد اطلاعات در یک انبار داده، که امکان تجزیه و تحلیل روندها را فراهم می کند. غیر فرار نشان می دهد که انبار داده به طور مداوم مانند a به روز نمی شود پایگاه داده از OLTP. بلکه به صورت دوره ای به روز می شود، با اطلاعات از منابع داخلی و خارجی می آید. این انبار داده این به طور خاص برای جستجو به جای به روز رسانی یکپارچگی و عملکرد عملیات طراحی شده است.
ایده ذخیره سازی i اطلاعات جدید نیست، یکی از اهداف مدیریتی بود اطلاعات از دهه شصت (مارتین، 1982).
I انبار داده زیرساخت را ارائه می دهند اطلاعات برای سیستم های پشتیبانی مدیریت سیستم های پشتیبانی مدیریت شامل سیستم های پشتیبانی تصمیم (DSS) و سیستم های اطلاعات اجرایی (EIS) است. DSS یک سیستم اطلاعاتی مبتنی بر کامپیوتر است که برای بهبود تصمیم گیری انسانی طراحی شده است. EIS معمولاً یک سیستم تحویل است اطلاعات که رهبران کسب و کار را قادر می سازد تا به راحتی به نمای آن دسترسی داشته باشند اطلاعات.
معماری کلی الف انبار داده نقش را برجسته می کند انبار داده در پشتیبانی مدیریت علاوه بر ارائه زیرساخت ها اطلاعات برای EIS و DSS، al انبار داده مستقیماً از طریق پرس و جو قابل دسترسی است. THE اطلاعات گنجانده شده در الف انبار داده بر اساس تجزیه و تحلیل الزامات اطلاعات مدیریت و از سه منبع به دست می‌آیند: سیستم‌های قدیمی داخلی، سیستم‌های جمع‌آوری داده با هدف ویژه و منابع داده خارجی. THE اطلاعات در سیستم‌های قدیمی داخلی، اغلب اضافی، ناسازگار، با کیفیت پایین و در قالب‌های مختلف ذخیره می‌شوند، بنابراین باید قبل از بارگیری در سیستم، با هم هماهنگ و تمیز شوند.

انبار داده (اینمون، 1992؛ مک فادن، 1996). THE اطلاعات از سیستم های ذخیره سازی می آید اطلاعات موقت و از منابع اطلاعات خارجی اغلب برای تقویت (به روز رسانی، جایگزینی) استفاده می شود اطلاعات از سیستم های قدیمی

دلایل قانع کننده زیادی برای توسعه a وجود دارد انبار دادهکه شامل بهبود تصمیم گیری از طریق استفاده مؤثر از اطلاعات بیشتر (Ives 1995)، حمایت از تمرکز بر کل معاملات (گراهام 1996) و کاهش در اطلاعات برای EIS و DSS (گراهام 1996، مک فادن 1996).

یک مطالعه تجربی اخیر به طور متوسط، بازگشت سرمایه را برای انبار داده 401٪ پس از سه سال (گراهام، 1996). با این حال، سایر مطالعات تجربی از انبار داده مشکلات قابل توجهی از جمله دشواری در اندازه گیری و تخصیص مزایا، فقدان هدف مشخص، دست کم گرفتن هدف و پیچیدگی فرآیند ذخیره سازی مزایا یافت. اطلاعات، به ویژه در مورد منابع و تمیزی اطلاعات. ذخیره سازی i اطلاعات می تواند به عنوان راه حلی برای مشکل مدیریت در نظر گرفته شود اطلاعات بین سازمان ها دستکاری از اطلاعات به‌عنوان یک منبع اجتماعی، سال‌ها یکی از مشکلات کلیدی در مدیریت سیستم‌های اطلاعاتی در سراسر جهان باقی مانده است (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

یک رویکرد محبوب برای مدیریت اطلاعات در دهه هشتاد توسعه یک مدل بود اطلاعات اجتماعی. مدل اطلاعات social برای ارائه پایه ای پایدار برای توسعه سیستم های کاربردی جدید طراحی شده است پایگاه داده و بازسازی و ادغام سیستم های قدیمی (Brancheau et al.

1989، گودهو و همکاران. 1988:1992، کیم و اورست 1994). با این حال، مشکلات زیادی در این رویکرد وجود دارد، به ویژه، پیچیدگی و هزینه هر کار، و زمان طولانی مورد نیاز برای تولید نتایج ملموس (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997). ).

Il انبار داده این یک پایگاه داده جداگانه است که به جای جایگزین کردن آنها با پایگاه داده های قدیمی همراه است. بنابراین به شما اجازه می دهد تا مدیریت را هدایت کنید اطلاعات و از بازسازی پرهزینه سیستم های قدیمی جلوگیری کنید.

رویکردهای موجود برای طراحی داده

انبار

فرآیند ساخت و تکمیل الف انبار داده باید بیشتر به عنوان یک فرآیند تکاملی درک شود تا چرخه حیات توسعه سیستم های سنتی (دسیو، 1995، Shanks، O'Donnell و Arnott 1997a). فرآیندهای زیادی در یک پروژه وجود دارد انبار داده مانند مقداردهی اولیه، برنامه ریزی. اطلاعات به دست آمده از الزامات خواسته شده از مدیران شرکت؛ منابع، تحولات، تمیز کردن اطلاعات و همگام سازی از سیستم های قدیمی و منابع دیگر اطلاعات; سیستم های تحویل در حال توسعه؛ نظارت بر انبار داده; و بی معنی بودن روند تکاملی و ساخت الف انبار داده (Stinchi, O'Donnell and Arnott 1997b). در این ژورنال، ما بر نحوه ترسیم آن تمرکز می کنیم اطلاعات در چارچوب این فرآیندهای دیگر ذخیره می شود. تعدادی رویکرد پیشنهادی برای معماری وجود دارد انبار داده در ادبیات (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). هر یک از این متدولوژی ها دارای یک بررسی مختصر با تجزیه و تحلیل نقاط قوت و ضعف خود هستند.

رویکرد اینمون (1994) برای انبار داده طرح

اینمون (1994) چهار مرحله تکراری را برای طراحی الف پیشنهاد کرد انبار داده (شکل 2 را ببینید). اولین قدم طراحی یک قالب است اطلاعات اجتماعی برای درک اینکه چگونه من اطلاعات را می توان در سراسر حوزه های عملکردی در یک سازمان با تقسیم کردن ادغام کرد اطلاعات در مناطق ذخیره کنید مدل اطلاعات برای ذخیره سازی ساخته شده است اطلاعات مربوط به تصمیم گیری، از جمله اطلاعات مورخان و شامل اطلاعات کسر و تجمیع می شود. مرحله دوم شناسایی حوزه های موضوعی برای اجرا است. اینها بر اساس اولویت هایی است که توسط یک سازمان خاص تعیین می شود. مرحله سوم شامل ترسیم a پایگاه داده برای حوزه موضوعی، توجه ویژه ای به گنجاندن سطوح مناسب از دانه بندی داشته باشید. اینمون استفاده از مدل نهادها و روابط را توصیه می کند. مرحله چهارم شناسایی سیستم های منبع است اطلاعات فرآیندهای تبدیل مورد نیاز و توسعه برای ضبط، تمیز کردن و قالب‌بندی i اطلاعات.

نقاط قوت رویکرد اینمون این است که مدل اطلاعات اجتماعی مبنایی برای ادغام ارائه می دهد اطلاعات در سازمان و برنامه ریزی پشتیبانی برای توسعه مکرر انبار داده. اشکالات آن سختی و هزینه در طراحی مدل است اطلاعات اجتماعی، مشکل در درک مدل های موجودیت ها و روابط مورد استفاده در هر دو مدل، که اطلاعات اجتماعی و آن از اطلاعات ذخیره شده بر اساس منطقه موضوع، و مناسب بودن اطلاعات از نقاشی از انبار داده برای تحقق پایگاه داده رابطه ای اما نه برای پایگاه داده چند بعدی

رویکرد ایوز (1995) به انبار داده طرح

آیوز (1995) یک رویکرد چهار مرحله ای را برای طراحی یک سیستم اطلاعاتی پیشنهاد می کند که معتقد است برای طراحی یک سیستم قابل استفاده است. انبار داده (شکل 3 را ببینید). این رویکرد بسیار مبتنی بر مهندسی اطلاعات برای توسعه سیستم های اطلاعاتی است (مارتین 1990). اولین قدم تعیین اهداف، عوامل حیاتی و موفقیت و شاخص های کلیدی عملکرد است. فرآیندهای کلیدی کسب و کار و اطلاعات لازم برای هدایت ما به یک مدل مدل سازی شده است اطلاعات اجتماعی. مرحله دوم شامل توسعه یک معماری تعریف کننده است اطلاعات ذخیره شده توسط مناطق، پایگاه داده di انبار داده، مولفه های فناوری که مورد نیاز است، مجموعه پشتیبانی سازمانی مورد نیاز برای پیاده سازی و عملیات با انبار داده. مرحله سوم شامل انتخاب بسته های نرم افزاری و ابزارهای مورد نیاز است. مرحله چهارم طراحی دقیق و ساخت و ساز انبار داده. آیوز یادداشت می کند که ذخیره سازی اطلاعات این یک فرآیند تکراری محدود است.

نقطه قوت رویکرد Ives استفاده از تکنیک های خاص برای تعیین نیازهای اطلاعاتی، استفاده از یک فرآیند ساختاریافته برای پشتیبانی از یکپارچگی انبار داده، انتخاب سخت افزار و نرم افزار مناسب و استفاده از تکنیک های نمایش چندگانه برای انبار داده. عیوب آن در پیچیدگی ذاتی است. برخی دیگر شامل مشکل در توسعه بسیاری از سطوح است پایگاه داده all'interno del انبار داده در زمان ها و هزینه های معقول

رویکرد کیمبال (1994) به انبار داده طرح

کیمبال (1994) پنج مرحله تکراری را برای طراحی الف پیشنهاد کرد انبار داده (شکل 4 را ببینید). رویکرد او به ویژه به طراحی یک سولو اختصاص دارد انبار داده و در مورد استفاده از مدل های بعدی در ترجیح مدل های موجودیت ها و روابط. کیمبال آن مدل‌های بعدی را تجزیه و تحلیل می‌کند، زیرا درک کسب‌وکار برای رهبران کسب‌وکار آسان‌تر است، هنگام سر و کار داشتن با مشاوره‌های پیچیده و طراحی کارآمدتر است. پایگاه داده فیزیکی کارآمدتر است (Kimball 1994). کیمبال تشخیص می دهد که توسعه a انبار داده تکراری است و این انبار داده جداول جداگانه را می توان با تقسیم آنها به جداول با ابعاد مشترک یکپارچه کرد.

اولین گام شناسایی حوزه موضوعی خاصی است که باید کامل شود. مرحله دوم و سوم مربوط به مدل سازی ابعادی است. در مرحله دوم، اندازه‌گیری‌ها موارد مورد علاقه در حوزه موضوعی را شناسایی کرده و آنها را در یک جدول واقعی گروه‌بندی می‌کنند. به عنوان مثال، در یک حوزه موضوع فروش، معیارهای مورد علاقه ممکن است شامل مقدار اقلام فروخته شده و دلار به عنوان ارز فروش باشد. مرحله سوم شامل شناسایی ابعادی است که از طریق آنها حقایق را می توان گروه بندی کرد. در یک حوزه موضوع فروش، ابعاد مرتبط ممکن است شامل مورد، مکان و دوره زمانی باشد. جدول حقایق دارای یک کلید چند قسمتی برای پیوند دادن آن به هر یک از جداول ابعاد است و معمولاً شامل تعداد بسیار زیادی حقایق است. در مقابل، جداول ابعاد حاوی اطلاعات توصیفی در مورد ابعاد و سایر ویژگی ها هستند که می توانند برای گروه بندی حقایق استفاده شوند. جدول حقایق و ابعاد پیشنهادی مرتبط، به دلیل شکل آن، طرح واره ستاره ای را تشکیل می دهد. مرحله چهارم شامل ساخت الف است پایگاه داده چند بعدی برای تکمیل الگوی ستاره. مرحله آخر شناسایی سیستم های منبع است اطلاعات فرآیندهای تبدیل مورد نیاز و توسعه برای ضبط، تمیز کردن و قالب‌بندی i اطلاعات.

نقاط قوت رویکرد کیمبال شامل استفاده از مدل های ابعادی برای نشان دادن آن است اطلاعات ذخیره شده که درک آن را آسان می کند و منجر به طراحی فیزیکی کارآمد می شود. یک مدل ابعادی که به راحتی از هر دو سیستم استفاده می کند پایگاه داده رابطه ای می تواند کامل شود یا سیستم ها پایگاه داده چند بعدی نقص‌های آن شامل فقدان برخی تکنیک‌ها برای تسهیل برنامه‌ریزی یا ادغام بسیاری از الگوهای ستاره در a انبار داده و دشواری طراحی از ساختار غیرعادی شدید به یک مدل بعدی اطلاعات در سیستم میراث

رویکرد مک فادن (1996) به داده ها طراحی انبار

مک فادن (1996) یک رویکرد پنج مرحله ای را برای طراحی پیشنهاد می کند انبار داده (شکل 5 را ببینید).
رویکرد او بر اساس ترکیبی از ایده ها از ادبیات است و بر طراحی یک تک متمرکز است انبار داده. مرحله اول شامل تجزیه و تحلیل نیازمندی ها است. اگرچه مشخصات فنی تجویز نشده است، یادداشت های مک فادن این موجودات را مشخص می کند اطلاعات مشخصات و ویژگی های آنها، و به خوانندگان Watson و Frolick (1993) برای دریافت نیازها اشاره می کند.
در مرحله دوم، یک مدل روابط موجودیت طراحی شده است انبار داده و سپس توسط مدیران شرکت تایید شده است. مرحله سوم شامل تعیین نقشه از سیستم های قدیمی و منابع خارجی است انبار داده. مرحله چهارم شامل فرآیندهای توسعه، استقرار و هماهنگ سازی است اطلاعات به انبار داده. در مرحله آخر، تحویل سیستم با تاکید ویژه بر رابط کاربری توسعه می‌یابد. مک فادن خاطرنشان می کند که فرآیند ترسیم به طور کلی تکراری است.

نقاط قوت رویکرد مک فادن به مشارکت رهبران تجاری در تعیین الزامات و همچنین اهمیت منابع اشاره دارد. اطلاعات، نظافت و جمع آوری آنها. از ایرادات آن می توان به عدم وجود فرآیندی برای شکستن یک پروژه بزرگ اشاره کرد انبار داده در بسیاری از مراحل یکپارچه، و

مشکل در درک موجودیت و مدل های رابطه مورد استفاده در طراحی انبار داده.

فقط کسانی نیستند که به ما نزدیک هستند که ما را انتخاب می کنند.

    0/5 (0 نظر)
    0/5 (0 نظر)
    0/5 (0 نظر)

    از آژانس اینترنتی آنلاین اطلاعات بیشتری کسب کنید

    برای دریافت آخرین مقالات از طریق ایمیل مشترک شوید.

    آواتار نویسنده
    مدیر سایت مدیریت عامل
    👍آژانس اینترنتی آنلاین | کارشناس آژانس وب در دیجیتال مارکتینگ و سئو. وب آژانس آنلاین یک آژانس وب است. برای Agenzia Web Online موفقیت در تحول دیجیتال بر اساس مبانی Iron SEO نسخه 3 است. تخصص ها: یکپارچه سازی سیستم، یکپارچه سازی برنامه های سازمانی، معماری سرویس گرا، رایانش ابری، انبار داده، هوش تجاری، داده های بزرگ، پورتال ها، اینترانت ها، برنامه های کاربردی وب طراحی و مدیریت پایگاه های داده رابطه ای و چند بعدی طراحی رابط برای رسانه های دیجیتال: قابلیت استفاده و گرافیک. آژانس وب آنلاین به شرکت ها خدمات زیر را ارائه می دهد: -SEO در گوگل، آمازون، بینگ، یاندکس. تجزیه و تحلیل وب: Google Analytics، Google Tag Manager، Yandex Metrica. تبدیل کاربر: Google Analytics، Microsoft Clarity، Yandex Metrica. -SEM در تبلیغات گوگل، بینگ، آمازون؛ - بازاریابی رسانه های اجتماعی (فیس بوک، لینکدین، یوتیوب، اینستاگرام).
    حریم خصوصی چابک من
    این سایت از کوکی های فنی و پروفایل استفاده می کند. با کلیک بر روی پذیرش، تمام کوکی های پروفایل را مجاز می کنید. با کلیک بر روی رد یا X، تمام کوکی های پروفایل رد می شوند. با کلیک بر روی customize می توانید انتخاب کنید که کدام کوکی های پروفایل فعال شوند.
    این سایت با قانون حفاظت از داده ها (LPD)، قانون فدرال سوئیس در 25 سپتامبر 2020، و GDPR، مقررات اتحادیه اروپا 2016/679، مربوط به حفاظت از داده های شخصی و همچنین جابجایی آزادانه این داده ها، مطابقت دارد.