https://unimib.academia.edu/stefanofantin

https://unimib.academia.edu/stefanofantin

doi:https://unimib.academia.edu/stefanofantin

מחסן נתונים ו- ERP | ארכיון הנתונים המרכזי: היסטוריה ואבולוציות

ארכיון נתונים מרכז: היסטוריה ואבולוציות

שני הנושאים הדומיננטיים של הטכנולוגיה הארגונית בשנות ה -90 הם
קובע אני מחסן נתונים וה-ERP. במשך זמן רב שני אלה חזקים
הזרמים היו חלקים מ- IT ארגוני מבלי שיהיו
צמתים. זה היה כמעט כאילו הם חומר ואנטי-חומר. אבל
הצמיחה של שתי התופעות הביאה בהכרח לאחת
הצומת שלהם. כיום חברות מתמודדות עם הבעיה של
מה לעשות עם ERP e מחסן נתונים. מאמר זה ימחיש
מה הבעיות ואיך מטפלים בהן חברות.
בהתחלה…
בהתחלה היה ה מחסן נתונים. מחסן נתונים נולד עבור
נגד מערכת היישומים לעיבוד עסקאות.
בימים הראשונים השינון של נתונים זה נועד לקרות
רק נקודת נגד לעיבוד היישומים של
עסקאות. אבל כיום יש חזונות הרבה יותר מתוחכמים
ממה א מחסן נתונים. בעולם של היום ה
מחסן נתונים הוא מוכנס בתוך מבנה שיכול להיות
נקרא מפעל למידע תאגידי.
מפעל המידע התאגידי
(CIF)
מפעל המידע התאגידי כולל רכיבים אדריכליים
תקן: רמת שינוי קוד ואינטגרציה
המשלב את i נתונים בעוד אני נתונים הם עוברים מהסביבה של
יישום סביבתי של מחסן נתונים של החברה; א
מחסן נתונים של החברה שבה אני נתונים
היסטוריות מפורטות ומשולבות. ה מחסן נתונים של החברה משמש כ
בסיס שעליו ניתן לבנות את כל החלקים האחרים
של הסביבה של מחסן נתונים; מאגר נתונים תפעולי (ODS).
ODS הוא מבנה היברידי המכיל כמה היבטים של הנתונים
מחסן והיבטים אחרים של סביבת OLTP; מארס נתונים, שבו אני
למחלקות שונות יכולה להיות גרסה משלהן של הנתונים
מַחסָן; א מחסן נתונים של חקר שבו אני
"הוגים" של החברה יכולים להציג את שאילתותיהם
72 שעות ללא השפעה מזיקה על מחסן נתונים; וזיכרון
קו קרוב, בו נתונים ישן ו נתונים פרט בתפזורת יכול להיות
מאוחסן בזול.
איפה ש- ERP מתחבר עם ה-
מפעל מידע תאגידי
ה- ERP מתמזג עם מפעל המידע הארגוני בשני מקומות.
ראשית כיישום בסיסי (בסיס) המספק את ה-
נתונים של הבקשה ל מחסן נתונים. במקרה זה אני נתונים,
נוצר כתוצר לוואי של תהליך עסקה,
משולבים וטעונים לתוך מחסן נתונים של החברה. ה
נקודת איחוד שנייה בין ERP ו- CIF לבין ה- ODS. אכן, רבים
סביבות ה- ERP משמש כ- ODS קלאסי.
במקרה ש- ERP משמש כאפליקציית ליבה, זה
אותו ERP יכול לשמש גם ב- CIF כ- ODS. ב
עם זאת, אם יש להשתמש ב- ERP בשני התפקידים, שם
זו חייבת להיות הבחנה ברורה בין שתי הישויות. במילים אחרות,
כאשר ERP ממלא את התפקיד של יישום הליבה ו- ODS, ה-
שני גופים אדריכליים חייבים להיות נפרדים אם יחיד
יישום ERP מנסה למלא את שני התפקידים
יחד עם זאת יהיו בהכרח בעיות במערכת
תכנון ויישום של מבנה זה.
הפרדות אפליקציות ויישומים בסיסיים
ישנן סיבות רבות המובילות לפיצול רכיבים
אדריכלי. אולי השאלה המדברת ביותר להפריד בין
רכיבים שונים של ארכיטקטורה הם שכל רכיב
לאדריכלות יש השקפה משלה. יש צורך ביישום הבסיסי
למטרה אחרת מזו של ה- ODS. נסו לחפוף
תצוגת יישום בסיסית על עולמו של ODS או להיפך
זו לא דרך נכונה לעבוד.
כתוצאה מכך, הבעיה הראשונה של ERP ב- CIF היא זו של
לבדוק אם יש הבחנה בין יישומים בסיסיים לבין
אודס.
דגמי נתונים בחברה
מפעל מידע
כדי להשיג לכידות בין המרכיבים השונים
של הארכיטקטורה של ה- CIF, חייב להיות מודל של נתונים. אני
דגמים של נתונים משמשים כחוליה מקשרת בין המרכיבים השונים
ארכיטקטורה כגון יישומי בסיס ו- ODS. ה
דגמים של נתונים להיות "מפת הדרכים האינטלקטואלית" שיש לה את
משמעות נכונה על ידי המרכיבים האדריכליים השונים של ה- CIF.
הולכים יד ביד עם הרעיון הזה, הרעיון הוא שיהיה
להיות מודל נהדר וייחודי של נתונים. ברור שהוא צריך
להיות מודל של נתונים עבור כל אחד מהרכיבים ויתרה מכך
זה חייב להיות דרך הגיונית המחברת בין המודלים השונים.
כל רכיב בארכיטקטורה - ODS, יישומי בסיס,
מחסן נתונים חברה, וכן הלאה .. - צריך משלה
מודל של נתונים. ולכן חייבת להיות הגדרה מדויקת של
כמו הדגמים האלה של נתונים הם מתקשרים זה עם זה.
להזיז אני נתונים מתאריך ה- ERP
חדר כושר
אם מקורו של נתונים הוא יישום בסיסי ו / או ODS, כאשר
הוספות ERP i נתונים Nel מחסן נתונים, הכנסה כזו חייבת
להתרחש ברמה הנמוכה ביותר של "פירוט". סיכום או
פשוט צבירה i נתונים כשהם יוצאים
מהיישום הבסיסי של ה- ERP או ה- ODS של ה- ERP אינו
הדבר הנכון לעשות. ה נתונים יש צורך בפרטים בתאריך
מחסן כדי להוות בסיס לתהליך DSS. כגון נתונים
הם יעוצבו מחדש בדרכים רבות על ידי ביצוע נתונים וחקירות
דל מחסן נתונים.
העקירה של נתונים מסביבת היישום הבסיסית
של ה-ERP לסביבת ה- מחסן נתונים של החברה נעשה ב
רגוע למדי. השינוי הזה קורה אחרי זה
כ- 24 שעות מהעדכון או היצירה ב- ERP. העובדה של
יש תנועה "עצלה" של אלים נתונים Nel מחסן נתונים
של החברה מאפשרת נתונים מגיע מ- ERP כדי "להתיישב".
פעם אני נתונים מופקדים בבקשה הבסיסית,
אז אתה יכול להזיז בבטחה i נתונים של ה- ERP
בחברה. מטרה נוספת ברת השגה הודות לתנועה
אלים "עצלנים" נתונים היא התיחום הברור בין תהליכים מבצעיים לבין
DSS. עם תנועה "מהירה" של נתונים קו ההפרדה
בין DSS לתפעול נותר מעורפל.
התנועה של נתונים מה-ODS של ה-ERP ועד מחסן נתונים
של החברה נעשית מעת לעת, בדרך כלל
שבועי או חודשי. במקרה זה התנועה של
נתונים זה מבוסס על הצורך "לנקות" את הישן נתונים היסטוריונים.
כמובן, ה- ODS מכיל את i נתונים שהם הרבה יותר עדכניים
מ נתונים היסטוריונים שנמצאו ב מחסן נתונים.
העקירה של נתונים Nel מחסן נתונים זה כמעט אף פעם לא נעשה
"סיטונאי" (באופן סיטונאי). העתק שולחן
מסביבת ERP ועד מחסן נתונים זה לא הגיוני. גישה אחת
הרבה יותר מציאותית התנועה של יחידות נבחרות של נתונים.
רק נתונים שהשתנו מאז העדכון האחרון של התאריך
המחסן הוא זה שיש להעביר בנתונים
מַחסָן. דרך אחת לדעת אילו מהן נתונים הם שונו
מאז העדכון האחרון הוא להסתכל על חותמות הזמן של נתונים
נמצא בסביבת ה- ERP. המעצב בוחר את כל השינויים
שהתרחשו מאז העדכון האחרון. גישה אחרת
הוא להשתמש בטכניקות של רכישת שינוי נתונים. עם
טכניקות אלה מנותחות קלטות יומן ויומן על מנת
לקבוע אילו נתונים יש להעביר מסביבת ה- ERP אל
זה של ה מחסן נתונים. טכניקות אלה הן הטובות ביותר
כמה יומני קלטות יומן ניתן לקרוא מקבצי ה- ERP
ללא השפעות נוספות על המשאבים האחרים של ה- ERP.
סיבוכים אחרים
אחת הבעיות עם ERP ב- CIF היא מה שקורה לאחרים
מקורות יישום או ai נתונים של ה- ODS שחייב לתרום ל
מחסן נתונים אך הם אינם חלק מסביבת ה-ERP. בהינתן
אופי סגור של ERP, במיוחד SAP, הניסיון להשתלב
מקשים ממקורות חיצוניים של נתונים עם i נתונים שמגיעים מ- ERP למערכת
זמן לזוז i נתונים Nel מחסן נתונים, זה אתגר גדול.
וכמה בדיוק ההסתברות שאני נתונים של יישומים או
ODS מחוץ לסביבת ה- ERP ישולב בנתונים
מַחסָן? הסיכויים הם למעשה גבוהים מאוד.
למצוא נתונים היסטוריות מ ERP
בעיה נוספת עם נתונים של ה- ERP הוא זה שנוצר
מהצורך שיהיה נתונים היסטורי בתוך ה מחסן נתונים.
בדרך כלל ה מחסן נתונים הוא צריך נתונים היסטוריונים. IS
בדרך כלל טכנולוגיית ERP אינה מאחסנת אותם נתונים
היסטורי, לפחות לא עד כדי כך שהוא נחוץ בתאריך
מַחסָן. כאשר כמות גדולה של נתונים היסטוריונים מתחילים
להוסיף לסביבת ה- ERP, סביבה כזו חייבת להיות
ניקה. לדוגמה, נניח א מחסן נתונים דבה
להיות עמוס בחמש שנים של נתונים היסטורי ואילו ה- ERP מחזיק ב-
מקסימום שישה חודשים מאלה נתונים. כל עוד החברה מרוצה
לאסוף מגוון של נתונים היסטורי ככל שעובר הזמן,
אז אין בעיות בשימוש ב- ERP כמקור ל-
מחסן נתונים. אבל כאשר ה מחסן נתונים חייב ללכת
אחורה בזמן ולקחת אלים נתונים היסטוריונים שלא היו
נאסף ונשמר בעבר על ידי ה- ERP, ואז סביבת ה- ERP
הופך להיות לא יעיל.
ERP ו- METADATA
שיקול נוסף שיש לעשות לגבי ERP ו מחסן נתונים האם זה
על מטא נתונים קיימים בסביבת ה- ERP. כמו גם מטא נתונים
הם עוברים מסביבת ה-ERP ל- מחסן נתונים, את
יש להעביר מטא נתונים באותו אופן. יתר על כן, אני
יש לשנות את המטא-נתונים בפורמט ובמבנה
נדרש על ידי התשתית של מחסן נתונים. יש אחד גדול
ההבדל בין מטא נתונים תפעוליים למטא נתונים של DSS. המטא נתונים
התפעול מיועד בעיקר עבור היזם ועבור
מְתַכנֵת. מטא נתונים של DSS מיועדים בעיקר למשתמש
הגמר. מטא נתונים קיימים ביישומי ERP או ODS
צריך להמיר אותם והמרה זו לא תמיד קלה
ולכוון.
המקור לנתוני ה- ERP
אם ה- ERP משמש כספק של נתונים עבור מחסן נתונים ci
זה חייב להיות ממשק מוצק שזז את i נתונים מהסביבה
ERP לסביבה מחסן נתונים. הממשק חייב:
▪ להיות קל לשימוש
▪ אפשר גישה אל נתונים של ה- ERP
▪ קח את המשמעות של נתונים שעומדים להתרגש
Nel מחסן נתונים
▪ דע את המגבלות של ERP שעלולות להתעורר ב
הזמן שבו אתה מתחבר אל נתונים של ה- ERP:
▪ שלמות התייחסותית
▪ יחסים היררכיים
▪ יחסים לוגיים מרומזים
▪ אמנת יישום
▪ כל מבני השטח נתונים נתמך על ידי ה- ERP, וכן הלאה ...
▪ להיות יעיל בגישה נתונים, על ידי מתן:
▪ תנועה ישירה של נתונים
▪ רכישת שינוי נתונים
▪ תמיכה בגישה מתוזמנת בזמן נתונים
▪ להבין את הפורמט של ה- נתונים, וכולי…
ממשק עם SAP
הממשק יכול להיות משני סוגים, ביתי או מסחרי.
חלק מהממשקים המסחריים העיקריים כוללים:
▪ SAS
▪ פתרונות פרימס
▪ D2k, וכן הלאה ...
טכנולוגיות ERP מרובות
התייחסות לסביבת ה- ERP כאילו מדובר בטכנולוגיה אחת היא
טעות גדולה. ישנן טכנולוגיות ERP רבות, שלכל אחת מהן משלה
חוזק. הספקים הידועים ביותר בשוק הם:
▪ SAP
▪ פיננסים של אורקל
▪ PeopleSoft
▪ JD אדוארדס
▪ באן
SAP
SAP היא תוכנת ה- ERP הגדולה והשלמה ביותר. יישומים
של SAP מקיפים סוגים רבים של יישומים בתחומים רבים. ל- SAP יש
המוניטין של להיות:
▪ גדול מאוד
▪ מאוד קשה ויקר ליישום
▪ זקוק לאנשים ויועצים רבים להיות
מוטמע
▪ זקוק לאנשים מתמחים ליישום
▪ לוקח הרבה זמן ליישם
בנוסף, ל- SAP מוניטין של שינון משלה נתונים molto
בזהירות, מה שמקשה על הגישה אליהם
אדם מחוץ לאזור ה- SAP. הכוח של SAP הוא להיות
מסוגל ללכוד ולאחסן כמות גדולה של נתונים.
לאחרונה הודיעה SAP על כוונתה להאריך
היישומים שלו ai מחסן נתונים. יש הרבה יתרונות וחסרונות
בשימוש ב-SAP כספק של מחסן נתונים.
יתרון אחד הוא ש- SAP כבר מותקנת וכי רוב
יועצים כבר מכירים את SAP.
החסרונות של SAP כספק של מחסן נתונים סונו
רבים: ל-SAP אין ניסיון בעולם של מחסן נתונים
אם SAP היא הספקית של מחסן נתונים, יש צורך "להוציא"
i נתונים מ-SAP אל מחסן נתונים. דאטו רקורד SAP של
מערכת סגורה, לא סביר שיהיה קל להכנס ל- SAP
זה (???). ישנן סביבות מורשת רבות המפעילות SAP,
כגון IMS, VSAM, ADABAS, ORACLE, DB2, וכן הלאה.
SAP מתעקשת על גישה "לא הומצאה כאן". סאפ לא רוצה
שתף פעולה עם ספקים אחרים כדי להשתמש או ליצור את מחסן נתונים.
SAP מתעקשת לייצר את כל התוכנות שלה לבד.
למרות ש- SAP היא חברה גדולה וחזקה, העובדה של
מנסה לשכתב את הטכנולוגיה של ELT, OLAP, ניהול ה-
מערכת ואפילו קוד הבסיס של ה- dbms זה פשוט מטורף.
במקום לאמץ גישה שיתופית עם ספקים
di מחסן נתונים במשך שנים רבות, SAP פעלה לפי הגישה
הם "יודעים יותר". גישה זו מעכבת את ההצלחה ש
SAP עשוי להיות בתחום של מחסן נתונים.
סירובה של SAP לאפשר גישה לספקים חיצוניים
מיד וחינני אליהם נתונים. עצם השימוש
un מחסן נתונים גישה נוחה אליו נתונים. כל הסיפור של SAP הוא
בהתבסס על הקשת הגישה נתונים.
חוסר הניסיון של SAP בהתמודדות עם כמויות גדולות של נתונים;
בתחום של מחסן נתונים יש כרכים של נתונים מעולם לא נראה
SAP ולטפל בכמויות גדולות אלה של נתונים אתה חייב להיות כזה
טכנולוגיה מתאימה. SAP כנראה לא מודעת לכך
מחסום טכנולוגי שקיים בכניסה לשדה הנתונים
מַחסָן.
התרבות הארגונית של SAP: SAP יצרה עסק
בהשגת i נתונים מהמערכת. אבל כדי לעשות זאת אתה צריך שיהיה לך
מנטליות אחרת. באופן מסורתי חברות תוכנה שהיו
טובים בלהכניס נתונים לסביבה לא היו טובים ב
מקבל נתונים ללכת בדרך אחרת. אם SAP יכולה לעשות סוג זה של
switch תהיה החברה הראשונה שתעשה זאת.
בקיצור, שאלה אם חברה צריכה לבחור
SAP כספק של מחסן נתונים. ישנם סיכונים חמורים מאוד
מצד אחד ומעט מאוד תגמולים מצד שני. אבל יש עוד
סיבה שמייאשת את הבחירה ב- SAP כספקית תאריכים
מַחסָן. כי כל חברה צריכה להיות באותו תאריך
מחסן של כל החברות האחרות? ה מחסן נתונים זה הלב
יתרון תחרותי. אם כל חברה אימצה את אותו הדבר
מחסן נתונים זה יהיה קשה, גם אם לא בלתי אפשרי,
להשיג יתרון תחרותי. נראה כי SAP חושבת כי א
מחסן נתונים אפשר לראות את זה כעוגייה וזה א
סימן נוסף של "קבל את הנתונים
ב ".
אף ספק אחר של ERP אינו דומיננטי כמו SAP.
ללא ספק יהיו חברות שיעברו בדרך ה- SAP
עבור שלהם מחסן נתונים אבל ככל הנראה תאריכים אלה
מחסני SAP יהיו גדולים, יקרים ותובעניים מאוד
זמן ליצירתם.
סביבות אלה כוללות פעילויות כמו "עיבוד מגדלי בנק",
תהליכים להזמנות תעופה, תהליכים לתלונות
ביטוח וכן הלאה. מערכת הביצועים הביאה יותר לביצועים,
ברור יותר היה הצורך בהפרדה בין תהליך מבצעי לבין
DSS (מערכת תומכת החלטות). עם זאת, עם מערכות משאבים
אנושי ואישי, אתה לעולם לא עומד בפני כמויות גדולות של
עסקאות. וכמובן, כאשר אדם מתקבל לעבודה
או עזוב את החברה זה תיעוד של עסקה.
אך ביחס למערכות אחרות, מערכות משאבי אנוש ו
אישית פשוט אין הרבה עסקאות. לכן, ב
מערכות של משאבים אנושיים ואישיים לא לגמרי ברור שיש
צריך DataWarehouse. במובנים רבים מערכות אלו
מייצגים את מיזוג מערכות DSS.
אבל יש גורם נוסף שצריך לקחת בחשבון אם צריך
לעשות עם Datawarehouse ועם PeopleSoft. בסביבות רבות, אני נתונים
משאבים אנושיים ואישיים הם משניים לעסק
חברה ראשית. רוב החברות מופיעות
ייצור, מכירות, אספקת שירותים וכן הלאה. ה
מערכות משאבים אנושיות ואישיות הן בדרך כלל משניות (או של
תמיכה) לקו העסקים המרכזי של החברה. לכן, זה
מעורפל ולא נוח א מחסן נתונים נפרד עבור
תמיכה במשאבים אנושיים ואישיים.
PeopleSoft שונה מאוד מ- SAP מבחינה זו. עם SAP, זה כן
חובה שיש א מחסן נתונים. עם PeopleSoft, זה לא
ואז כל כך ברור. מחסן נתונים הוא אופציונלי עם PeopleSoft.
הדבר הטוב ביותר שאפשר לומר עבור נתונים PeopleSoft זה התאריך
ניתן להשתמש במחסן לאחסון i נתונים לגבי
משאבים אנושיים ואישיים ישנים. סיבה שנייה ל
שבו חברה תרצה להשתמש א מחסן נתונים a
לרעת הסביבה של PeopleSoft היא לאפשר גישה ו-
גישה חופשית לכלי ניתוח, ai נתונים מאת PeopleSoft. אבל
בנוסף לסיבות אלה, יתכנו מקרים בהם עדיף שלא
יש מחסן נתונים עבור נתונים רכות אנשים.
לסיכום
ישנן תובנות רבות בנוגע לבניית תאריך
מחסן בתוך תוכנת ERP.
כמה מהם הם:
▪ הגיוני שיהיה א מחסן נתונים שנראה כמו כל אחד
אחר בענף?
▪ כמה גמיש הוא ERP מחסן נתונים תוֹכנָה?
▪ ERP מחסן נתונים תוכנה יכולה להתמודד עם נפח של
נתונים שנמצא ב"מחסן נתונים זִירָה"?
▪ מהו הרקורד שמייצר ספק ה- ERP שלו
מול קל וזול, מבחינת זמן, ai נתונים? (מה
הוא רשומת הספקים של ERP במסירה של זול, ב-
זמן, קל לגשת לנתונים?)
▪ מהי ההבנה של ארכיטקטורת DSS ושל
"מפעל למידע תאגידי" על ידי ספק ה- ERP?
▪ ספקי ERP מבינים איך להשיג נתונים בתוך
הסביבה, אך גם מבינים כיצד לייצא אותם?
▪ עד כמה ספק ה- ERP פתוח למכשירים עדכניים
אחסנה?
יש לבחון את כל השיקולים הללו בקביעה
איפה לשים את מחסן נתונים אשר יארח את i נתונים ERP ואחרים
נתונים. באופן כללי, אלא אם כן יש לכך סיבה משכנעת
לעשות אחרת, מומלץ לבנות מחסן נתונים fuori
מהסביבה של ספק ה- ERP.
פרק 1
סקירה כללית של ארגון BI
נקודות עיקריות:
מאגרי המידע פועלים בצורה הפוכה
לאדריכלות מודיעין עסקי (BI):
תרבות ארגונית ו- IT יכולים להגביל את ההצלחה ב
בניית ארגוני BI.
הטכנולוגיה אינה עוד הגורם המגביל עבור ארגוני BI. ה
הבעיה עבור אדריכלים ומתכנני פרויקטים אינה אם
טכנולוגיה קיימת, אך אם הם יכולים ליישם את היעילה
טכנולוגיה זמינה.
עבור חברות רבות א מחסן נתונים זה קצת יותר מפיקדון
הפצה פסיבית i נתונים למשתמשים הזקוקים לכך. ה נתונים
הם מופקים ממערכות המקור ומאוכלסים במבני יעד
di מחסן נתונים. אני נתונים ניתן לנקות אותם עם כל זה
מַזָל. עם זאת, לא מוסף ערך נוסף
נאסף על ידי נתונים במהלך תהליך זה.
בעיקרו של דבר, DW פסיבי, במקרה הטוב, מספק
רק אני נתונים נקי ותפעולי לעמותות משתמשים. שם
יצירת מידע והבנה אנליטית תלויים
לחלוטין על ידי משתמשים. תשפוט אם ה-DW (מחסן נתונים) הוא
הצלחה היא סובייקטיבית. אם נשפוט את ההצלחה על
יכולת לאסוף, לשלב ולנקות ביעילות i נתונים
ארגוני על בסיס צפוי, אז כן, ה- DW הוא הצלחה.
מצד שני, אם נסתכל על האוסף, על האיחוד וזה
ניצול מידע אז הארגון בכללותו
ה- DW הוא כישלון. DW מספק ערך מועט או ללא ערך של ה-
מֵידָע. כתוצאה מכך המשתמשים נאלצים להסתפק,
וכך נוצרים ממגורות מידע. פרק זה מציג
תצוגה מלאה לסיכום הארכיטקטורה של BI (Business
מודיעין) של החברות. נתחיל בתיאור BI ו-
ואז נעבור לדיונים על עיצוב ו
פיתוח מידע, לעומת פשוט לספק i נתונים
למשתמשים. לאחר מכן הדיונים מתמקדים בחישוב של
ערך מאמצי ה- BI שלך. אנו מסכמים בהגדרת האופן שבו יבמ
מתייחס לדרישות ה- BI האדריכליות של הארגון שלך.
תיאור הארכיטקטורה של
ארגון BI
מערכות מידע חזקות מונחות עסקאות קיימות כעת
על סדר היום בכל מפעל גדול, כפי שהם מפלסים
למעשה מגרש המשחקים לחברות ברחבי העולם.
עם זאת, הישארות תחרותית דורשת מערכות באופן אנליטי
מכוון אשר יכול לחולל מהפכה ביכולתה של החברה על ידי גילוי מחדש ו
באמצעות המידע שכבר יש להם. מערכות אלו
אנליטיקה נובעת מהבנת העושר של נתונים
זמין. BI יכול לשפר את הביצועים בכל המידע
של החברה. חברות יכולות לשפר את קשרי הלקוחות ו
ספקים, לשפר את הרווח של מוצרים ושירותים, לייצר
הצעות חדשות וטובות ביותר, בקרת סיכונים ובין רבים אחרים
הרווחים הורידו את ההוצאות באופן דרסטי. עם BI שלך
סוף סוף החברה מתחילה להשתמש במידע הלקוח
כנכס תחרותי הודות ליישומים שמטרתם
שׁוּק.
קיום עסק נכון פירושו להיות תשובות סופיות ל
שאלות מרכזיות כמו:
▪ מי משלנו לקוחות הם גורמים לנו להרוויח יותר, או שם
האם הם שולחים בהפסד?
▪ איפה הכי טובים שלנו גרים לקוחות ביחס ל חנות/
מחסן שהם פוקדים?
▪ איזה מהמוצרים והשירותים שלנו ניתן למכור הכי הרבה
ביעילות ולמי?
▪ אילו מוצרים ניתן למכור בצורה היעילה ביותר ולמי?
▪ איזה קמפיין מכירות היה המוצלח ביותר ומדוע?
▪ אילו ערוצי מכירה הם היעילים ביותר עבור אילו מוצרים?
▪ כיצד אנו יכולים לשפר את היחסים עם המיטב שלנו לקוחות?
לרוב החברות יש נתונים מחוספס לענות
השאלות האלה.
מערכות תפעוליות מייצרות כמויות גדולות של מוצרים, של
לקוח ו נתונים שוק מנקודות מכירה, הזמנות,
ממערכות שירות לקוחות ומערכות תמיכה טכניות. האתגר הוא
לחלץ ולנצל מידע זה.
חברות רבות מנצלות שברים קטנים בלבד משלהם נתונים
לניתוחים אסטרטגיים.
I נתונים נשאר, לעתים קרובות הצטרף עם i נתונים כתוצאה ממקורות חיצוניים כגון i
"דוחות הממשלה", ומידע אחר שנרכש, הם אחד
מכרה זהב שרק ממתין להיחקר, אי נתונים צריך
להיות מעודן רק בהקשר האינפורמטיבי שלך
אִרגוּן.
ניתן ליישם ידע זה בכמה דרכים, וריאציות
מעיצוב אסטרטגיה ארגונית כללית ועד
תקשורת אישית עם ספקים, באמצעות מוקדים טלפוניים,
חשבונית, אינטרנט ועוד נקודות. הסביבה העסקית של היום מכתיבה
ש- DW ופתרונות BI קשורים מתפתחים עוד יותר
ביצוע מבנים מסורתיים של נתונים אשר אני נתונים מנורמל ל
ברמה אטומית ו"חוות כוכבים / קוביות ".
מה שנדרש כדי להישאר תחרותי הוא מיזוג של
טכנולוגיות מסורתיות ומתקדמות במטרה לתמוך ב
נוף אנליטי עצום.
לבסוף, על הסביבה הכללית לשפר את הידע
של החברה כולה, וודא כי הפעולות שבוצעו
כתוצאה מהניתוחים שבוצעו הם שימושיים כך שכולם יעשו זאת
תועלת.
לדוגמא, נניח שאתה מדרג את שלך לקוחות בקטגוריות
סיכון גבוה או נמוך.
אם מידע זה נוצר על ידי מודל כרייה או
אמצעים אחרים, יש להכניס ל- DW ולהנגיש אותם ל
כל אחד, בכל אמצעי גישה, כגון i
דוחות סטטיים, גיליונות אלקטרוניים, טבלאות או עיבוד אנליטי ב
קו (OLAP).
עם זאת, נכון לעכשיו, הרבה מסוג זה של מידע
להישאר בממגורות של נתונים של היחידים או המחלקות שהם מייצרים
הניתוח. לארגון בכללותו אין נראות קטנה או לא
להבנה. רק על ידי ערבוב סוג זה של תוכן
מידע בחברת DW שלך אתה יכול לחסל את הממגורות של
מידע ולהעלות את סביבת ה- Dw שלך.
ישנם שני מכשולים עיקריים להתפתחותו של ארגון
של BI.
ראשית, יש לנו את הבעיה של הארגון עצמו
של התקנות הקשורות לכך.
למרות שאיננו יכולים לעזור בשינויים במדיניות
אנו יכולים לעזור לך להבין את המרכיבים של
ארגון BI, הארכיטקטורה שלו וכיצד
טכנולוגיית IBM מקלה על התפתחותה.
המחסום השני להתגבר הוא היעדר טכנולוגיה
משולב וידע של שיטה שמזכירה את החלל כולו
של BI לעומת רכיב קטן בלבד.
יבמ מגיבה לשינויים בטכנולוגיה
של אינטגרציה. באחריותך לספק עיצוב
מודעות עצמית. יש לפתח את הארכיטקטורה הזו
טכנולוגיה שנבחרה לשילוב ללא אילוצים, או לפחות עם
טכנולוגיה העומדת בסטנדרטים פתוחים. גם שלך
הנהלת החברה חייבת לוודא שהמיזם של Bi הוא
מבוצע על פי לוח הזמנים ולא כדי לאפשר זאת
פיתוח ממגורות מידע הנובעות משירות עצמי
סדר יום, או יעדים.
זה לא אומר שסביבת ה- BI אינה רגישה אליה
להגיב לצרכים ולדרישות השונות של משתמשים שונים; במקום זאת, זה אומר
כי יישום הצרכים והדרישות האישיים הוא
נעשה לטובת כל ארגון ה- BI.
תיאור הארכיטקטורה של ארגון BI יכול
ניתן למצוא בעמוד 9 באיור 1.1. האדריכלות מדגימה
תערובת עשירה של טכנולוגיות וטכניקות.
מהנוף המסורתי, הארכיטקטורה כוללת את המרכיבים הבאים
של מחסן
שכבה אטומית.
זהו היסוד, הלב של כל DW ולכן של
דיווח אסטרטגי.
I נתונים מאוחסנים כאן ישמרו על שלמות היסטורית, כך מדווחים
נתונים וכולל את המדד הנגזר, כמו גם להיות נקי,
משולב ומאוחסן באמצעות תבניות חילוץ.
כל השימוש שלאחר מכן באלה נתונים ומידע קשור הוא
נגזר ממבנה זה. זהו מקור מצוין עבור
מיצוי של נתונים ולדוחות עם שאילתות SQL מובנות
פיקדון תפעולי של נתונים או בסיס דוחות של
נתונים(מאגר נתונים תפעולי (ODS) או דיווח
מסד נתונים.)
זהו מבנה של נתונים תוכנן במיוחד עבור
דיווח טכני.
I נתונים מאוחסן ומובל על מבנים אלה יכול סוף סוף
להפיץ במחסן דרך אזור הארגון (בימוי
אזור), שם הוא יכול לשמש לדיווח אסטרטגי.
אזור בימוי.
התחנה הראשונה לרוב נתונים מיועד לסביבה של
המחסן הוא אזור הארגון.
הנה אני נתונים הם משולבים, מנוקים והופכים אותם נתונים שימושי זה
יאכלס את מבנה המחסן
צעדות תאריך.
חלק זה של האדריכלות מייצג את המבנה של נתונים בשימוש
במיוחד עבור OLAP. נוכחותם של הנתונים, אם אני נתונים סונו
מאוחסנים בסכמת הכוכבים החופפים נתונים
רב מימדי בסביבה יחסית, או בארונות תיוק
di נתונים קניינית המשמשת טכנולוגיית OLAP ספציפית, כגון
שרת DB2 OLAP, זה לא רלוונטי.
האילוץ היחיד הוא שהארכיטקטורה מקלה על השימוש בה נתונים
רַב מֵמָדִים.
אדריכלות כוללת גם טכנולוגיות וטכניקות קריטיות של Bi
אשר נבדלים כ:
ניתוח מרחבי
החלל הוא נפילת מידע עבור האנליטיקאי ו
זה קריטי להשלים את הרזולוציה. החלל יכול
מייצגים את המידע של אנשים החיים בפרט
מיקום, כמו גם מידע על היכן המיקום הזה נמצא
באופן פיזי בהשוואה לשאר העולם.
כדי לבצע ניתוח זה, עליך להתחיל ולקשור את שלך
מידע בקואורדינטות רוחב ואורך. זהו זה
המכונה "קידוד גיאוגרפי" ועליו להיות חלק מהמיצוי,
טרנספורמציה, ותהליך הטעינה (ETL) ברמה
של המחסן שלך.
כריית מידע.
החילוץ של נתונים מאפשר לחברות שלנו לגדל את
מספר של לקוחות, לחזות מגמות מכירות ולאפשר
ניהול היחסים עם i לקוחות (CRM), בין יתר היוזמות של ה
דוּ.
החילוץ של נתונים לכן יש לשלב אותו במבנים של
נתונים של DWHouse ונתמך על ידי תהליכי מחסן עבור
לוודא גם שימוש יעיל ויעיל בטכנולוגיה וגם
טכניקות קשורות.
כפי שצוין בארכיטקטורת BI, הרמה האטומית של
Dwhouse, כמו datamarts, הוא מקור מצוין ל נתונים
למיצוי. אותם מבנים חייבים להיות גם כן
מקבלי תוצאות מיצוי כדי לברר זמינות
הקהלים הרחבים ביותר.
סוכנים.
ישנם גורמים שונים לבחינת הלקוח עבור כל נקודה כגון, i
מערכות הפעלה של החברה ואותו dw. סוכנים אלה יכולים
להיות רשתות עצביות מתקדמות שהוכשרו ללמוד על
מגמות של כל נקודה, כגון המוצר מבוסס הביקוש העתידי
על קידום מכירות, מנועים מבוססי כללים להגיב אליהם
un נתתי מכלול נסיבות, או אפילו סוכנים פשוטים ש
הם מדווחים על חריגים ל"מנהלים בכירים ". תהליכים אלה כן
בדרך כלל נוכח בזמן אמת ולכן חייב
להיות בשילוב הדוק עם התנועה של אותו נתונים.
כל המבנים האלה של נתונים, טכנולוגיות וטכניקות מבטיחות
שלא תבלה את הלילה בהפקת ארגון של
ה- BI שלך.
פעילות זו תפותח בצעדים מצטברים, עבור קטנים
נקודות.
כל שלב הוא מאמץ עצמאי של הפרויקט, ומדווח עליו
כאיטרציה ביוזמת ה- dw או ה- BI שלך. האיטרציות
עשוי לכלול יישום של טכנולוגיות חדשות, עבור
התחל בטכניקות חדשות על ידי הוספת מבנים חדשים נתונים ,
טוען i נתונים נוסף, או עם הרחבת הניתוח של
הסביבה שלך. פסקה זו נדונה יותר
לעומק בפרק 3.
בנוסף למבנים המסורתיים של Dw ולכלים של Bi ישנם אחרים
פונקציות של ארגון ה- BI שלך שאתה חייב
עיצוב, כגון:
נקודות מגע של לקוח (מגע של לקוח
נקודות).
כמו בכל ארגון מודרני ישנם מספר
נקודות מגע של לקוחות המציינות כיצד לחוות חוויה
חיובי לשלך לקוחות. ישנם ערוצים מסורתיים כמו i
סוחרים, מפעילי מרכזיות, דיוור ישיר, מולטימדיה והדפסה
פרסום, כמו גם את הערוצים העדכניים ביותר כגון דואר אלקטרוני ורשת, i נתונים
יש לרכוש מוצרים עם נקודת מגע כלשהי,
הועבר, ניקה, עבר שינוי ואז אוכלס במבנים של נתונים של
דוּ.
יסודות נתונים איגודים תפעוליים ומשתמשים
מאגרי מידע וקהילות משתמשים).
בסוף נקודות הקשר של לקוחות תוכלו למצוא את היסודות של נתונים
יישום של החברה ושל קהילות המשתמשים. ה נתונים קיים
סונו נתונים המסורתי שיש לאחד אותו ולמזג אותו עם נתונים כי
זרם מנקודות המגע כדי לספק את הצורך
מֵידָע.
אנליסטים. (אנליסטים)
המרוויח העיקרי מסביבת BI הוא האנליטיקאי. זה הוא זה
נהנה מהמיצוי הנוכחי של נתונים מבצעית, משולבת עם
מקורות שונים של נתונים , בתוספת תכונות כגון ניתוח
גיאוגרפי (גיאוגרפי) ומוצג בטכנולוגיות BI
מאפשרים לך לחלץ, OLAP, דיווח וניתוח SQL מתקדמים
גֵאוֹגרָפִי. הממשק העיקרי של האנליטיקאי לסביבה של
הדיווח הוא פורטל BI.
עם זאת, האנליטיקאי אינו היחיד שמרוויח מהארכיטקטורה של
דוּ.
מנהלים, עמותות משתמשים גדולות ואפילו שותפים, ספקים ואני
לקוחות הם צריכים למצוא יתרונות ב- BI ארגוני.
לולאת הזנה אחורית.
ארכיטקטורת BI היא סביבת למידה. עיקרון
המאפיין של ההתפתחות הוא לאפשר מבנים מתמשכים של נתונים
להתעדכן באמצעות טכנולוגיית BI המשמשת ובאמצעות פעולות
משתמש intrapese. דוגמה היא הערכת ה-
לקוח (ניקוד לקוחות).
אם מחלקת המכירות מייצרת מודל כרייה
של ציוני הלקוח לגבי שימוש בשירות חדש, ואז ה-
מחלקת מכירות לא צריכה להיות הקבוצה הנהנית היחידה
של השירות.
במקום זאת, יש לייצר את מודל הכרייה כחלק
זרימת נתונים טבעית בתוך החברה וציוני הלקוח
זה אמור להפוך לחלק משולב מסביבת המידע של
מחסן, גלוי לכל המשתמשים. חבילת IBM של Bi-bi-centric
כולל DB2 UDB, שרת ה- DB2 OLAP כולל את רובם
חלק מהמרכיבים החשובים של הטכנולוגיה, המוגדרים באיור
1.1.
אנו משתמשים בארכיטקטורה כפי שהיא מופיעה באיור ספר זה עבור
תן לנו רמת המשכיות והראה כיצד כל מוצר
של IBM תואמים את התוכנית הכללית של BI.
אספקת תוכן המידע (מתן
תוכן מידע)
תכנון, פיתוח ויישום סביבת ה- BI שלך הוא
פעולה מפרכת. העיצוב חייב לאמץ כל כך הרבה
דרישות עסקיות עכשוויות ועתידיות. תכנון האדריכלות
עליו לכלול את כל המסקנות שנמצאו
בשלב התכנון. ההוצאה לפועל חייבת להישאר
מחויבת למטרה אחת: לפתח את הארכיטקטורה של BI
כפי שהוצג באופן רשמי בשרטוט ועל סמך הדרישות של
עֵסֶק.
קשה במיוחד לטעון כי משמעת תבטיח את
הצלחה יחסית.
זה פשוט מכיוון שלא מפתחים סביבת BI שלמה
פתאום, אבל זה מתרחש בצעדים קטנים לאורך זמן.
עם זאת, זיהוי רכיבי ה- BI של הארכיטקטורה שלך הוא
חשוב משתי סיבות: תנחה את כל ההחלטות הבאות
טכניקות אדריכליות.
תוכל לעצב במודע שימוש מסוים בטכנולוגיה
אם כי ייתכן שלא תקבל נציג שזקוק ל
טכנולוגיה במשך מספר חודשים.
הבנת הדרישות העסקיות שלך מספיק תשפיע על הסוג
של מוצרים שתרכשו עבור האדריכלות שלכם.
העיצוב והפיתוח של הארכיטקטורה שלך מבטיחים
שהמחסן שלך הוא
לא אירוע אקראי, אלא "מחושב היטב",
מודעה שנבנתה בקפידה לפעול של אמנות כפסיפס של
טכנולוגיה מעורבבת.
תכנן את תוכן המידע
כל התכנון הראשוני חייב להתמקד ולהזדהות
המרכיבים העיקריים של BI שיהיה צורך בסביבה
כללי בהווה ובעתיד.
הכרת הדרישות העסקיות חשובה.
עוד לפני שמתחיל כל התכנון המקובל,
מתכנן הפרויקט יכול לעיתים קרובות לזהות אחד או שניים
רכיב מיד.
מאזן הרכיבים העשוי להיות נחוץ עבור ה-
האדריכלות שלך, לעומת זאת, לא ניתן למצוא בקלות.
בשלב התכנון, החלק העיקרי של האדריכלות
קושר את מושב פיתוח היישומים (JAD) בחיפוש
לזהות דרישות עסקיות.
לפעמים ניתן לבצע מיקור חוץ על דרישות אלה
שאילתות ודיווחים.
לדוגמה, משתמשים מצהירים שאם הם רוצים לעשות אוטומציה
כרגע יש ליצור דוח באופן ידני על ידי שילוב
שני יחסים שוטפים והוספת החישובים הנגזרים מ
שילוב של נתונים.
אמנם דרישה זו פשוטה, אך מגדירה דרישה מסוימת
הפונקציונליות של התכונה שעליך לכלול כאשר
קנה כלי דיווח עבור הארגון שלך.
על המעצב גם לחפש דרישות נוספות עבור
לקבל תמונה מלאה. משתמשים רוצים להירשם כמנוי
הדוח הזה?
קבוצות המשנה של הדוח נוצרות ונשלחות בדוא"ל לשונות
משתמשים? רוצה לראות את הדו"ח הזה בפורטל החברה?
כל הדרישות הללו הן חלק מהצורך הפשוט
החלף דוח ידני כנדרש על ידי המשתמשים. היתרון
לדרישות מסוג זה יש לכולם, משתמשים ומעצבים
הבנה של מושג הדוחות.
ישנם סוגים אחרים של עסקים, אולם אנו צריכים לתכנן.
כאשר הדרישות העסקיות נקבעות בצורה של
שאלות אסטרטגיות עסקיות, קל למעצב הוותיק
להבחין במדד / עובדה ודרישות המימד.
איור 1.2 מדגים רכיבי מדידה וממד של א
בעיה עסקית.
אם משתמשי JAD לא יודעים להצהיר על דרישותיהם
בצורה של בעיה עסקית, המעצב יספק לעיתים קרובות
דוגמאות לדלג על הפעלת האיסוף
דרישות.
המעצב המומחה יכול לעזור למשתמשים להבין לא רק את
סחר אסטרטגי, אך גם כיצד לאמן אותו.
גישת איסוף הדרישות נדונה בפרק 3; ל
כעת אנו רוצים רק לציין את הצורך בעיצוב עבור כולם
סוגי דרישות ה- BI
בעיה עסקית אסטרטגית היא לא רק דרישה
עסקים, אבל גם רמז עיצובי. אם אתה צריך לענות
לשאלה רב מימדית, אז אתה צריך לשנן,
הגש i נתונים מידות, ואם אתה צריך לשנן את
נתונים רב-ממדי, עליכם להחליט איזו טכנולוגיה או
טכניקה שאתה הולך להשתמש בה.
האם אתה מיישם תוכנית כוכב קוביות שמורה, או שניהם?
כפי שאתה יכול לראות, אפילו בעיה עסקית פשוטה
יכולה להיות השפעה ניכרת על העיצוב. למרות זאת
דרישות עסקיות מסוג זה הן רגילות וכמובן, לפחות
על ידי מעצבים ומתכנני פרויקטים מנוסים.
היה דיון מספיק על הטכנולוגיות והתמיכה של
OLAP, ומגוון רחב של פתרונות זמינים. עד עכשיו
הזכרנו את הצורך לשלב דיווח פשוט עם i
דרישות ממדיות של העסק, ואיך דרישות אלה
להשפיע על החלטות אדריכליות טכניות.
אך מהן הדרישות שאינן מובנות בקלות
על ידי המשתמשים או על ידי צוות DW? לעולם לא תזדקק לניתוח
מרחבית (ניתוח מרחבי)?
דגמי הכרייה של נתונים הם יהיו חלק הכרחי שלך
עתיד? מי יודע?
חשוב לציין כי סוג זה של טכנולוגיות איננו הרבה
ידוע על ידי קהילות המשתמשים הכלליות וחברי הצוות של
Dw, באופן חלקי, זה יכול לקרות בגלל שהם בדרך כלל
הם מטופלים על ידי כמה מומחים טכניים פנימיים או של צד שלישי. זה
מקרה קיצוני של בעיות שיוצרים סוגים אלה של טכנולוגיות. עצמי
משתמשים אינם יכולים לתאר דרישות עסקיות או למסגר אותן
כדי לספק הנחיות למעצבים, הם יכולים
להישאר מעיניהם או, גרוע מכך, פשוט להתעלם ממנה.
זה הופך להיות בעייתי יותר כאשר המעצב והמפתח נכשלים
הם עשויים לזהות יישום של אחד מהמתקדמים הללו
טכנולוגיות קריטיות.
כפי ששמענו לא פעם המעצבים אומרים, "טוב, למה
האם אנחנו לא שמים את זה בצד עד שנקבל את הדבר האחר הזה?
"האם הם באמת מעוניינים בסדרי עדיפויות, או פשוט נמנעים מ- i
דרישות שהם לא מבינים? ככל הנראה זו ההשערה האחרונה.
נניח שצוות המכירות שלך העביר דרישה
כפי שמצוין באיור 1.3, כפי שאתה יכול לראות,
הדרישה ממוסגרת בצורה של בעיה עסקית. שם
ההבדל בין בעיה זו לבין הבעיה הממדית האופיינית הוא
המרחק. במקרה זה, קבוצת המכירות רוצה לדעת,
על בסיס חודשי, סך המכירות ממוצרים, מחסנים ו
לקוחות שגרים בטווח של 5 קילומטרים מהמחסן בו הם נמצאים
הם קונים.
למרבה הצער, מעצבים או אדריכלים פשוט יכולים
התעלם מרכיב החלל באומרו, "יש לנו את הלקוח, את
מוצר ואני נתונים של הפיקדון. אנו מרחיקים את המרחק עד
איטרציה נוספת.
"תשובה לא נכונה. סוג זה של בעיות עסקיות נוגע
לגמרי BI. זה מייצג הבנה עמוקה יותר של ה
העסק שלנו ומרחב אנליטי חזק עבור האנליסטים שלנו.
BI הוא מעבר לשאילתות פשוטות או לדיווח רגיל, או
אפילו OLAP. זה לא אומר שטכנולוגיות אלה לא
חשובים ל- BI שלך, אך לבד הם אינם מייצגים
את סביבת ה- BI.
תכנון להקשר המידע
(תכנון לתוכן מידע)
כעת לאחר שזיהינו את הדרישות העסקיות המייחדות אותם
יש לכלול בשרטוט מרכיבים בסיסיים שונים
אדריכלי כללי. חלק מהרכיבים של BI הם חלק מ-
מהמאמצים הראשוניים שלנו, בעוד שחלקם לא יושמו עבור
מספר חודשים.
עם זאת, כל הדרישות הידועות באות לידי ביטוי בתכנון כך
כשאנחנו צריכים ליישם טכנולוגיה מסוימת, אנחנו כן
תתכונן לעשות את זה. משהו בפרויקט ישקף את החשיבה
מָסוֹרתִי.
לדוגמא, איור 1.1, בתחילת הפרק, מציג תאריך
מארט ששומר על נתונים מְמַדִי.
סט זה של נתונים משמש לתמיכה בשימושים מאוחרים יותר של
נתונים מונע ממדי על ידי הנושאים העסקיים ש
זיהינו. כפי שמסמכים נוספים הם
שנוצר, כגון פיתוח העיצוב של נתונים, אנחנו
נתחיל לנסח כיצד אני נתונים הם מתפשטים בסביבה.
בדקנו את הצורך לייצג את נתונים כך
ממדי, מחלק אותם (לפי צרכים ספציפיים
נקבע) על צעדות.
השאלה הבאה עליה יש לענות היא: איך הם יבנו
הנתונים האלה מצעדים?
האם אתה בונה את הכוכבים כדי לתמוך בקוביות, או סתם קוביות, או רק את הכוכבים?
(או קוביות ימניות, או כוכבים ימניים). צור את הארכיטקטורה של הנתונים
צעדים תלויים הדורשים שכבה אטומית לכל נתונים
נרכש? אפשר לרכוש הצבעות נתונים עצמאיות נתונים
ישירות ממערכות הפעלה?
איזו טכנולוגיית קוביות תנסה לתקנן?
יש לך כמויות אדירות של אלים נתונים נדרש לניתוח ממדי
או שאתה צריך קוביות כוח מכירות ארציות על אחת
על בסיס שבועי או על שניהם? בנה פריט חזק
כגון שרת DB2 OLAP למימון או קוביות קוגנוס
PowerPlay עבור ארגון המכירות שלך או שניהם?
אלה החלטות התכנון האדריכלי הנהדרות ש
מכאן והלאה הם ישפיעו על סביבת ה- BI שלך. כן,
זיהית צורך ב- OLAP. עכשיו איך תבצע את זה
סוג של טכניקה וטכנולוגיה?
איך חלק מהטכנולוגיות המתקדמות יותר משפיעות על שלך
ציורים? אנו מניחים שזיהית צורך
מקום בארגון שלך. עכשיו אתה צריך להתקשר ל
מהדורות רישום אדריכליות אם כי לא מתוכננות
לבצע רכיבי חלל למשך מספר חודשים. על האדריכל
תכנן היום על סמך מה שצריך. ניבאו את הצורך ב
ניתוח מרחבי שמייצר, מאחסן, מבצע ומספק
גישה ל נתונים מֶרחָב. זה בתורו אמור לשמש כ
אילוץ לגבי סוג הטכנולוגיה והמפרטים
פלטפורמת תוכנה שאתה יכול לשקול כרגע. ל
לדוגמה, מערכת הניהול של מאגר מידע יחסי
(RDBMS) שאתה מבצע עבור שכבת האטום שלך חייב להיות
הרחבה מרחבית חזקה זמינה. זה יבטיח את
ביצועים מרביים בעת שימוש בגיאומטריה ובעצמים
מקום ביישומים האנליטיים שלך. אם ה- RDBMS שלך לא
יכול להתמודד עם i נתונים (ממוקד מרחבי) באופן פנימי, אז תצטרך
לייצב א מאגר מידע (מרחבי-מרכזי) חיצוני. זה מסבך את
ניהול מהדורות ופגיעה בביצועים הכוללים שלך,
שלא לדבר על הבעיות הנוספות שנוצרו עבורכם
DBA, מכיוון שיש להם כנראה הבנה מינימלית
מהיסודות של נתונים גם שטח. מצד שני, אם שלך
RDMBS מטפל בכל הרכיבים המרחבים והקשרים
האופטימיזציה מודעת לצרכים המיוחדים (למשל,
אינדקס) של האובייקטים המרחבים, ואז ה- DBA שלך יוכלו להתמודד
לנהל במהירות מהדורות ותוכל להעלות את
ביצועים.
כמו כן, עליך להתאים את אזור ההיערכות (אזור הסצנה) והשכבה
סביבה אטומית לכלול ניקוי כתובות (א
אלמנט מפתח לניתוח מרחבי), כמו גם להלן
חיסכון בחפצי שטח. רצף המהדורות של
העיצוב ממשיך כעת לאחר שהצגנו את מושג הניקיון
כתובת. ראשית, אפליקציה זו תכתיב את סוג ה-
תוכנה הדרושה למאמץ ה- ETL שלך.
אתה צריך מוצרים כמו Trillium כדי לספק לך כתובת
נקי, או ספק ETL שבחרת לספק זאת
פונקציונליות?
לעת עתה חשוב שתעריך את רמת העיצוב שיש
עליו להשלים לפני שתתחיל להכין את שלך
סביבה (מחסן). הדוגמאות לעיל צריכות
להדגים את שלל ההחלטות העיצוביות שצריכות לבוא
זיהוי כל דרישה עסקית מסוימת. אם נעשה
נכון, החלטות עיצוב אלה מקדמות
התלות ההדדית בין המבנים הפיזיים של הסביבה שלך,
בחירת הטכנולוגיה בה נעשה שימוש וזרימת התפשטות
תוכן מידע. בלי האדריכלות המקובלת הזו
של BI, הארגון שלך יהיה כפוף לתערובת
כאוטי של הטכנולוגיות הקיימות, במקרה הטוב, מאוחדות כל כך
לא מדויק כדי לספק יציבות נראית לעין.
שמור על תוכן מידע
הבאת ערך המידע לארגון שלך היא
פעולה קשה מאוד. ללא הבנה מספקת
וניסיון, או תכנון נכון וציור, אפילו את
קבוצות טובות יותר ייכשלו. מצד שני, אם יש לך אחד גדול
אינטואיציה ותכנון מפורט אך ללא משמעת ל
הוצאה לפועל, פשוט בזבזת את הכסף שלך ואת הזמן שלך
כי המאמץ שלך נידון להיכשל. המסר צריך
היה ברור: אם חסר לך אחד או יותר מאלה
מיומנויות, הבנה / התנסות או תכנון / ציור o
משמעת יישום, זה יוביל לנכה או
להשמיד את בניית ארגון BI.
האם הצוות שלך מוכן מספיק? יש מישהו שלך
צוות BI שמבין את הנוף האנליטי העצום שיש
בסביבות BI, בטכניקות ובטכנולוגיות הדרושות
להשפיע על הנוף הזה? יש מישהו בצוות שלך
אשר יכול לזהות את ההבדל ביישום בין מתקדם
דיווח סטטי ו- OLAP, או ההבדלים בין ROLAP ל- OLAP? אחד מ
חברי הצוות שלך מזהים את הדרך בבירור
לחלץ וכיצד הוא עשוי להשפיע על המחסן או כיצד
האם המחסן יכול לתמוך בביצועי הכרייה? חבר
של הצוות מבין את הערך של נתונים חלל או טכנולוגיה
מבוסס סוכן? האם יש לך מישהו שמעריך את היישום הייחודי
של כלי ETL לעומת טכנולוגיית ברוקר
הוֹדָעָה? אם אין לך את זה, קבל אחד. BI זה הרבה יותר
גדול משכבה אטומית מנורמלת, של OLAP, של התוכניות א
כוכב ו- ODS.
יש הבנה וניסיון להכיר את הדרישות
של BI והפתרונות שלהם הוא חיוני ליכולת שלך
רשמי כראוי את צרכי המשתמש ועיצובו
ולבצע את הפתרונות שלהם. אם לקהילת המשתמשים שלך יש
קושי בתיאור הדרישות, זה תפקיד הצוות
המחסן מספק את ההבנה. אבל אם הצוות של
מחסן
אינו מכיר את היישום הספציפי של BI - למשל, נתון
כרייה - אז זה לא הדבר הכי טוב שסביבות BI עושות
מוגבל לרוב להיות פיקדונות פסיביים. עם זאת, התעלם מאלה
הטכנולוגיות אינן מקטינות את חשיבותן ואת ההשפעה שיש להן
על הופעתן של אפשרויות הבינה העסקית שלך
הארגון, כמו גם את מבנה המידע שאתה מעצב
לקדם.
על העיצוב לכלול את מושג העיצוב, עורך
שניהם דורשים אדם מוסמך. בנוסף, העיצוב
זה דורש צוות פילוסופיה של בתי בית וצפייה
של תקנים. לדוגמא, אם החברה שלך הקימה אחד כזה
פלטפורמה סטנדרטית או זיהה RDBMS מסוים שאתה
רוצה לתקנן על פני הפלטפורמה, זה מסתכן
כולם בצוות מקפידים על סטנדרטים אלה. באופן כללי אחד
צוות חושף את הצורך בנורמליזציה (למשתמש
אבל הצוות עצמו לא מוכן להצטרף ל
סטנדרטים שנקבעו בתחומים אחרים בחברה או אולי אפילו ב
חברות דומות. לא רק שזה צבוע, אלא שהוא מבטיח שהחברה לא תעשה זאת
מסוגל לנצל משאבים והשקעות קיימים. זה לא אומר
שאין מצבים המבטיחים פלטפורמה או מצב כזה
טכנולוגיה לא סטנדרטית; עם זאת, המאמצים של המחסן
עליהם להגן בקנאות על הסטנדרטים של הארגון עד
שדרישות עסקיות אינן מכתיבות אחרת.
מרכיב המפתח השלישי הדרוש לבניית BI
הארגון הוא המשמעת.
זה תלוי בסך הכל, באותה מידה באנשים פרטיים ובסביבה.
מתכנני פרויקטים, נותני חסות, אדריכלים ומשתמשים חייבים להעריך את
משמעת הדרושה לבניית מבנה המידע של החברה.
על המעצבים לכוון את מאמצי העיצוב באופן כזה
להשלים מאמצים הכרחיים אחרים בחברה.
לדוגמא, נניח שהחברה שלך בונה א
יישום ERP בעל רכיב מחסן.
אז באחריותם של מעצבי ה- ERP לשתף פעולה עם ה-
צוות סביבת מחסן כדי לא להתחרות גם כן
עבודות כפולות כבר החלו.
משמעת היא גם נושא שצריך לעסוק בו
על ידי הארגון כולו והוא בדרך כלל הוקם ומופקד בידי א
רמת הנהלה.
האם מנהלים מוכנים להקפיד על גישה מעוצבת? א
גישה שמבטיחה ליצור תוכן מידע של
הקצה יביא ערך לכל תחומי המיזם, אבל אולי
האם זה מתפשר על אנשים או אג'נדות מחלקתיות? זכור את האמרה
"לחשוב על הכל חשוב יותר מאשר לחשוב על דבר אחד".
אמירה זו נכונה עבור ארגוני BI.
למרבה הצער, מחסנים רבים ממקדים את מאמציהם
מנסה לתת מענה ולהביא ערך למחלקה מסוימת או ל
משתמשים ספציפיים, עם מעט התייחסות לארגון
כללי. נניח שהמנהל מבקש סיוע מה-
בית בית. הצוות מגיב עם 90 ימי עבודה
כולל לא רק מסירת דרישות ההודעה המוגדרות על ידי
אך מבטיח כי כולם נתונים בסיס מעורבב ברמה
אטומי לפני שהוכנס לטכנולוגיית קוביות
הצעה.
תוספת הנדסית זו מבטיחה כי המשרד
בית חולים ירוויח נתונים הכרחי למנהל.
עם זאת, ההנהלה שוחחה עם חברות ייעוץ חיצוניות
הציעו בקשה דומה עם משלוח בפחות מ -4
שבועות.
בהנחה שצוות ביתי הבית מוסמך,
למנהל יש ברירה. מי יכול לתמוך במשמעת של
הנדסה נוספת הדרושה לטיפוח הטוב
מפעל אינפורמטיבי או יכול לבחור לבצע את שלהם
פתרון במהירות. נראה כי האחרון נבחר באמת
לעתים קרובות מדי ומשמש רק ליצירת מכלי מידע של
שמועילים רק למעטים או לסינגל.
מטרות קצרות וארוכות טווח
אדריכלים ומתכנני פרויקטים חייבים לפרסם אחד כזה
ראייה ארוכת טווח של האדריכלות הכללית והתוכניות עבור
לגדול לארגון BI. השילוב הזה של
רווח לטווח קצר ותכנון לטווח ארוך
מייצגים את שני הפנים של מאמצי BI. הרווח בטווח הקצר
התפוגה היא הפן של BI שקשור לאיטרציות של ה-
המחסן שלך.
כאן מתמקדים מתכננים, אדריכלים וספונסרים
לעמוד בדרישות מסחריות ספציפיות. זה ברמה שבה
נבנים מבנים פיזיים, נרכשת הטכנולוגיה וה
הטכניקות מיושמות. הם בשום אופן לא נועדו להתמודד
דרישות ספציפיות כפי שהוגדרו על ידי קהילות משתמשים מסוימות.
הכל נעשה על מנת לתת מענה לדרישות מוגדרות ספציפיות
מקהילה מסוימת.
תכנון לטווח הרחוק, לעומת זאת, הוא ההיבט השני
של BI. זה המקום בו התוכניות והפרויקטים הבטיחו שזה היה
בנה כל מבנה פיזי, את הטכנולוגיות שנבחרו ואת
טכניקות שנעשו בעין כלפי החברה. וה
תכנון לטווח ארוך המספק לכידות
הכרחי כדי להבטיח כי היתרונות העסקיים נובעים מכל
הרווחים לטווח הקצר שנמצאו.
הצדק את מאמץ ה- BI שלך
Un מחסן נתונים כשלעצמו אין לו ערך מובנה. באחר
במילים, אין ערך מובנה בין הטכנולוגיות של
טכניקות מחסן ויישום.
הערך של כל מאמץ מחסן נמצא בפעולות
מבוצע כתוצאה מסביבת המחסן והתוכן
אינפורמטיבי שגדל לאורך זמן. זו נקודה קריטית להבנה
לפני שתנסה אי פעם לאמוד את ערכה של יוזמה כלשהי
איפה.
לעתים קרובות מדי, אדריכלים ומתכננים מנסים להחיל ערך
רכיבים פיזיים וטכניים של המחסן כאשר למעשה הערך הוא
הוקמה עם התהליכים העסקיים המושפעים באופן חיובי על ידי
מחסן ומידע שנרכש היטב.
כאן טמון האתגר שהוקם BI: איך אתה מצדיק את ההשקעה?
אם לבית הכניסה עצמו אין ערך מהותי, המעצבים של
על הפרויקט לחקור, להגדיר ולבסס את היתרונות
מושגת על ידי אותם אנשים שישתמשו במחסן
לשפר תהליכים עסקיים ספציפיים או את הערך של
מידע מוגן או שניהם.
כדי לסבך את העניינים, כל תהליך עסקי
המושפעים ממאמצי המחסן עשויים לספק יתרונות
"ניכר" או "קל". יתרונות ניכרים מספקים אחד כזה
מדד מוחשי למדידת החזר ההשקעה (ROI) - מודעה
לדוגמא, הפוך את המלאי לזמן נוסף במהלך תקופה
ספציפי או בעלות הובלה נמוכה יותר למשלוח. זה יותר
קשה להגדיר את היתרונות הקלים, כמו שיפור הגישה ל
מידע, מבחינת ערך מוחשי.
חבר את הפרויקט שלך כדי לדעת את
בקשות עסקיות
לעתים קרובות מדי, מעצבי הפרויקטים מנסים לקשר בין ערך
של המחסן עם מטרות אמורפיות של המשרד. בקביעה זו
"הערך של מחסן מבוסס על היכולת שלנו
לספק בקשות אסטרטגיות "אנו פותחים את
נְאוּם. אבל לבד זה לא מספיק כדי לקבוע אם
השקעה במלאי הגיונית. עדיף לחבר נציגים
מחסן עם בקשות מסחריות ספציפיות וידועות.
מדידת החזר ה- ROI
חישוב ההחזר על ההשקעה במערך המחסן יכול להיות
קשה במיוחד. זה קשה במיוחד אם היתרון
עיקר חזרה מסוימת הוא משהו בלתי מוחשי או
קל למדידה. מחקר אחד מצא שמשתמשים תופסים
שני היתרונות העיקריים של יוזמות BI:
▪ צור יכולת לקבל החלטות
▪ צור גישה למידע
הטבות אלה הן הטבות רכות (או קלות). זה קל לראות
כיצד נוכל לחשב החזר ROI על בסיס יתרון קשה (או
יותר) כמו הפחתת עלות ההובלה, אבל איך
האם אנו מודדים את היכולת לקבל החלטות טובות יותר?
זה בהחלט אתגר עבור מעצבי הפרויקטים כאשר
הם מנסים לגרום לחברה להשקיע בחברה מסוימת
מאמץ מחסן. הגדלת מכירות או ירידה בעלויות
הם כבר לא הנושאים המרכזיים המניעים את סביבת ה- BI.
במקום זאת, אתה מחפש גישה בבקשות עסקיות
עדיף למידע כך שמחלקה מסוימת תוכל
לקבל החלטות מהירות יותר. אלה גורמים אסטרטגיים ל
אשר במקרה חשוב לא פחות לעסק אך הם כן
מעורפל יותר וקשה יותר לאפיין במדד מוחשי.
במקרה זה, חישוב ההחזר על ההשקעה יכול להיות מטעה, אם לא רלוונטי.
מעצבי הפרויקט צריכים להיות מסוגלים להפגין ערך
מוחשי למנהלים להחליט אם להשקיע
חזרה מסוימת מחזיקה. עם זאת, לא נציע חדש
שיטה לחישוב ההחזר על ההשקעה, וגם לא נעשה שום פרו או טיעון
נגד זה.
ישנם מאמרים וספרים רבים שדנים ביסודות עבור
לחשב את ההחזר על ההשקעה. יש הצעות ערך מיוחדות כגון ערך
בהשקעה (YOU), המוצעים על ידי קבוצות כמו גרטנר, שתוכלו
לחקור. במקום זאת, נתמקד בהיבטי הליבה של כל אחד מהם
ROI או הצעות ערך אחרות שעליך לשקול.
החלת ROI
בנוסף לוויכוח על יתרונות "קשים" מול יתרונות "קלים"
הקשורים למאמצי BI יש נושאים אחרים שיש לקחת בחשבון
כאשר אנו מיישמים את ההחזר על ההשקעה. לדוגמה:
ייחוס יותר מדי חיסכון למאמצי ה- DW שיגיעו
בכל מקרה
נניח שהחברה שלך עברה מארכיטקטורה של
מיינפריים לסביבת UNIX מבוזרת. אז כל
חסכון שעשוי (או שלא) להתממש על ידי מאמץ זה
אין לייחס באופן בלעדי, אם לכל (?), ל-
מַחסָן.
לא מתחשב עם כל מה שעולה. ויש הרבה דברים מ
לָקַחַת בְּחֶשְׁבּוֹן. שקול את הרשימה הבאה:
עלות הפעלה, כולל כדאיות.
עלות חומרה ייעודית עם אחסון קשור
תקשורת
עלות התוכנה, כולל ניהול נתונים והרחבות
לקוח / שרת, תוכנת ETL, טכנולוגיות DSS,
יישומי הדמיה, תכנות וזרימה
תוכנת עבודה ומעקב ,.
▪ עלות תכנון מבנה נתונים, עם ההבנה, ו
האופטימיזציה של
▪ עלות פיתוח תוכנה הקשורה ישירות למאמץ
BI
עלות תמיכה ביתית, כולל אופטימיזציה של
ביצועים, כולל בקרת גרסת תוכנה ה
פעולות עזרה
החל את ההחזר על ההשקעה "Big-Bang".
בניית המחסן כמאמץ יחיד וענק
נידון להיכשל, ולכן הוא גם מחשב את החזר ה- ROI ליוזמה
מפעל גדול ההיצע מפתיע, וכי מעצבים
להמשיך לעשות ניסיונות קלושים לאמוד את הערך של השלם
מַאֲמָץ.
כי המעצבים מנסים לתת ערך כספי
ביוזמה עסקית אם ידוע ומקובל על כך
האם קשה לאמוד חזרות ספציפיות? איך זה אפשרי? זה לא
אפשרי למעט כמה יוצאים מן הכלל. אל תעשו את זה.
עכשיו שקבענו מה לא לעשות כשאנחנו מחשבים
ROI, הנה כמה נקודות שיעזרו לנו בהגדרה של
תהליך אמין להערכת ערך מאמצי ה- BI שלך.
השגת הסכמת ROI. בלי קשר לשלך
בחירת הטכניקה להערכת ערך מאמצי ה- BI שלך, חייבת
להיות מוסכם על כל הצדדים, כולל מתכנני הפרויקטים,
נותני חסות ומנהלי חברות.
הפחת את ההחזר על ההשקעה לחלקים הניתנים לזיהוי. צעד הכרחי לקראת פנימה
חישוב ROI סביר הוא למקד את החישוב על אחד
פרויקט ספציפי. זה מאפשר לך לאמוד ערך
בהתבסס על דרישות עסקיות ספציפיות שממלאות
הגדירו את העלויות. כאמור, עלויות רבות חייבות להיות
נחשב. יתר על כן, העלויות חייבות לכלול לא רק את העלויות הנלוות
לאיטרציה היחידה אך גם לעלויות הנלוות
להבטחת עמידה בתקני החברה.
הגדר יתרונות. קישור ברור של החזר ה- ROI לדרישות
מסחרית, עלינו להיות מסוגלים לזהות את
יתרונות שיובילו לעמידה בדרישות.
צמצם עלויות והטבות ברווחים הקרובים. זו הדרך
הדרך הטובה ביותר לבסס את הערכות השווי שלך על ערך נוכחי נקי
(NPV) בניגוד לניסיון לחזות ערך עתידי ב
רווחים עתידיים.
שמור על זמן פיצול החזר ה- ROI למינימום. IS '
מתועד היטב לאורך זמן זה נעשה שימוש שלך
החזר ROI
השתמש ביותר מנוסחת ROI אחת. ישנן שיטות רבות עבור
תחזית ROI ועליך לתכנן אם להשתמש באחד או
בנוסף, כולל הערך הנוכחי הנקי, המהירות הפנימית של ההחזר
(IRR) והתאוששות.
הגדר את התהליך שניתן לחזור עליו. זה קריטי לחישוב
כל ערך לטווח הארוך. א
תהליך חוזר יחיד לכל רצפי הפרויקט א
לעקוב אחר.
הבעיות המפורטות הן הנפוצות ביותר שהוגדרו על ידי מומחים
של סביבת ביתן. ההתעקשות מצד הנהלת
קבלת החזר ה- ROI "Big-Bang" מבלבל מאוד. אם אתה מתחיל את כל
את חישובי ההחזר על ההשקעה שלך על ידי הקטנתם לחלקים הניתנים לזיהוי ומוחשי
סיכוי טוב לאמוד הערכת החזר השקעה מדויק.
שאלות לגבי היתרונות של החזר ה- ROI
לא משנה מה היתרונות שלך, רכים או קשים, אתה יכול להשתמש בהם
כמה שאלות מהותיות לקביעת ערכן. ל
דוגמה באמצעות מערכת קנה מידה פשוטה, מ -1 עד 10, אתה
אתה יכול לזהות את ההשפעה של כל מאמץ באמצעות הדברים הבאים
שאלות:
▪ איך היית מדרג את ההבנה של נתונים בעקבות זה
הפרויקט של החברה שלך?
▪ כיצד היית מעריך את שיפורי התהליך כתוצאה מ-
הפרויקט הזה?
▪ כיצד היית מודד את ההשפעה של תובנות ומסקנות חדשות כעת
זמין על ידי איטרציה זו
▪ מה הייתה ההשפעה של סביבות מחשב חדשות ה
ביצוע כתוצאה ממה שנלמד?
אם התשובות לשאלות אלו מעטות, יתכן כי
החברה אינה שווה את ההשקעה שבוצעה. שאלות עם שיא
ציון נקודות לרווחי ערך משמעותיים וצריך
משמשים כמדריכים להמשך חקירה.
לדוגמא, ציון גבוה לשיפור התהליכים
זה צריך להוביל את המעצבים לבחון את התהליכים
שופרו. יתכן שתגלה שחלק או כל הרווחים נעשים
הם מוחשיים ולכן ערך כספי יכול להיות בקלות
הוחל.
להפיק את המרב מהאיטרציה הראשונה של
מחסן
התוצאה הגדולה ביותר של המאמץ העסקי שלך היא לעתים קרובות
איטרציות ראשונות. מאמצים ראשונים אלה באופן מסורתי
להקים את תוכן המידע השימושי ביותר לציבור
מקים סיוע לבסיס הטכנולוגי למען הבאים
יישומי BI.
בדרך כלל כל המשך הבא של נתונים של פרויקט של
מחסנים מביאים פחות ופחות ערך מוסף לארגון
כללי. זה נכון במיוחד אם איטרציה לא
מוסיף נושאים חדשים או אינו עונה על צרכיו של נושא חדש
קהילת משתמשים.
תכונה זו של אחסון חלה גם על סוללות
גידול של נתונים היסטוריונים. מאחר שהמאמצים הבאים דורשים יותר
נתונים ואיך יותר נתונים מוזגים למחסן לאורך זמן
נתונים זה הופך פחות רלוונטי לניתוח המשמש. אלה נתונים סונו
לרוב נקרא נתונים לנמנם וזה תמיד יקר לשמור עליהם כי
כמעט ולא משתמשים בהם.
מה המשמעות של נותני החסות לפרויקט? בעיקרו של דבר, אני
נותני החסות הראשונים חולקים יותר מעלויות ההשקעה.
זה עיקרי מכיוון שהם התנופה למצוא את השכבה
סביבה טכנולוגית גדולה ומשאבי מחסן,
כולל אורגני.
אך הצעדים הראשונים הללו מביאים את הערך הגבוה ביותר ולכן את המעצבים
לעתים קרובות צריך להצדיק את ההשקעה.
לפרויקטים שנעשים לאחר יוזמת ה- BI שלך עלויות
נחות (בהשוואה לראשון) וישיר, אך נושא פחות ערך
לחברה.
ובעלי ארגונים צריכים להתחיל לשקול
לזרוק את הצטברות של נתונים ופחות טכנולוגיות רלוונטיות.
כריית נתונים: כרייה לתת לי
רכיבים אדריכליים רבים דורשים וריאציות של
טכנולוגיות וכריית נתונים -
למשל, ה"סוכנים "השונים לבחינת נקודות העניין של
לקוחות, מערכות ההפעלה של החברה ובאותה דירה. אלה
סוכנים יכולים להיות מתקדמים ברשתות עצביות
מגמות בסירים, כגון דרישה עתידית למוצרים על בסיס
קידום מכירות; מנועים מבוססי כללים עבור
להגיב לשלמות נתתי נסיבות, למשל, אבחון
המלצות רפואיות וטיפוליות; או אפילו סוכנים פשוטים
עם התפקיד של דיווח על חריגים למנהלים בכירים (למעלה
מנהלים). בדרך כלל תהליכי מיצוי אלה נתונים si
לאמת בזמן אמת; לכן עליהם להיות מאוחדים
לחלוטין עם התנועה של נתונים סטסי.
עיבוד מקוון של עיבוד אנליטי
אנליטיקס מקוון
היכולת לפרוס, לקצוץ, לגלגל, לקדוח
ולבצע את הניתוח
מה-אם, הוא במסגרת היעד של הסוויטה
טכנולוגיית IBM. לדוגמא פונקציות העיבוד האנליטיות
מקוון (OLAP) קיים עבור DB2 שמביא ניתוח מימדי אל תוך
מנוע של מסד נתונים אותו.
פונקציות מוסיפות כלי SQL ממדי תוך כדי
נצל את כל היתרונות של היותך חלק טבעי מ- DB2. אַחֵר
דוגמה לשילוב OLAP הוא כלי החילוץ, DB2
מנתח שרתים OLAP. טכנולוגיה זו מאפשרת את הקוביות של
שרת DB2 OLAP יהיה מהיר ואוטומטי
נותחו כדי לזהות ולדווח על ערכים של נתונים יוצא דופן או לא צפוי
לאורך הקוביה לאנליסט הסחר. ולבסוף, הפונקציות של
מרכז DW מספק אמצעים לשליטת אדריכלים בין
דברים אחרים, הפרופיל של קוביית שרת DBAP OLAP כחלק
אופי תהליכי ETL.
ניתוח מרחבי ניתוח מרחבי
החלל מייצג מחצית מהעוגנים האנליטיים (הולכה)
הכרחי לפנורמה
אנליטית רחבה (הזמן מייצג את החצי השני). הרמה האטומית
(ברמה האטומית) של המחסן, המיוצג באיור 1.1,
הוא כולל את יסודות הזמן והמרחב כאחד. ההקלטות
של ניתוח עוגן הזמן למידע על זמן וכתובת
ניתוח מרחב עוגן. חותמות זמן (חותמות זמן)
הם מבצעים את הניתוח בזמן ומידע הכתובת מוביל
הניתוח לפי החלל. התרשים מראה קידוד גיאוגרפי - תהליך של
המרת כתובות לנקודות במפה או לנקודות במרחב
כך שמושגים כמו מרחק ופנימי / חיצוני יכולים להיות
משמש בניתוח - נערך ברמה האטומית וניתוח מרחבי
המועמד לרשות האנליטיקאי. יבמ מספקת הרחבות
שטח, שפותח עם מכון המחקר למערכת הסביבה (ESRI),
al מסד נתונים DB2 כך שאובייקטים מרחביים יכולים להיות
מאוחסן כחלק רגיל מה- מסד נתונים יחסיים. DB2
מרחיבים מרחביים, הם מספקים גם את כל הרחבות ה- SQL עבור
נצל את הניתוח המרחבי. לדוגמא, סיומות SQL מ
שאלה על
מרחק בין כתובות או אם נקודה נמצאת בתוך אזור או מחוצה לו
מוגדרים מצולעים, הם סטנדרט אנליטי עם המרחב
מאריך. ראה פרק 16 למידע נוסף.
מסד נתונים-כלי כלים לתושבות מסד נתונים-
תוֹשָׁב
ל- DB2 תכונות SQL רבות תושבות BI המסייעות
בפעולת הניתוח. אלו כוללים:
▪ פונקציות רקורסיות לביצוע ניתוח, כגון "מצא
כל נתיבי הטיסה האפשריים מ סן פרנסיסקו a ניו יורק".
▪ הפונקציות האנליטיות לדירוג, פונקציות מצטברות, קוביות
ואוספים כדי להקל על משימות המתרחשות בדרך כלל
רק עם טכנולוגיית OLAP, הם כיום חלק טבעי מה-
מנוע של מסד נתונים
▪ היכולת ליצור טבלאות המכילות תוצאות
מוכרים של מסד נתונים מנהיגים מערבבים יותר מיכולות BI
Nel מסד נתונים עצמו.
הספקים העיקריים של מאגר מידע הם מערבבים יותר מ-
פונקציונליות BI ב- מסד נתונים עצמו.
זה מספק את הביצועים הטובים ביותר ואפשרויות ביצוע רבות יותר עבור
פתרונות BI.
נדון בתכונות ובפונקציות של DB2 V8
בפירוט בפרקים הבאים:
יסודות אדריכלות טכנית וניהול נתונים
(פרק 5)
▪ יסודות DB2 BI (פרק 6)
▪ שאילתת חומרי DB2
לוחות) (פרק 7)
▪ פונקציות DBAP OLAP (פרק 2)
▪ DB2 משופר BI
תכונות ופונקציות) (פרק 15)
מערכת אספקת נתונים פשוטה
מערכת אספקה של נתונים מְפוּשָׁט
הארכיטקטורה המיוצגת באיור 1.1 כוללת כמה
מבנים נתונים גוּפָנִי. האחד הוא המחסן של נתונים מִבצָעִי.
באופן כללי, ODS הוא נושא מוכוון,
משולב ועדכני. האם אתה בונה ODS לתמיכה, מודעה
לדוגמא, משרד המכירות. מכירות ODS היו משתלבות נתונים
מגיע ממספר מערכות שונות אך רק ישמור, מודעה
לדוגמא, העסקאות של היום. ניתן לעדכן את ה- ODS
אפילו פעמים רבות ביום. יחד עם זאת, התהליכים
לדחוף אני נתונים משולב ביישומים אחרים. מבנה זה הוא
תוכנן במיוחד לשילוב נתונים נוכחי ודינמי e
יהיה מועמד סביר לעבור ניתוח בזמן אמת,
כיצד לספק סוכני שירות לקוחות מידע על מכירות
זרמים של לקוח על ידי חילוץ מידע על מגמת מכירות
מהמחסן עצמו. מבנה נוסף המוצג באיור 1.1 הוא
מעמד רשמי לדור. לא רק זה המקום בשביל
ביצוע האינטגרציה הדרושה, האיכות של נתוניםו -
של השינוי של נתונים מלאי בדרך, אבל זה גם כן
אזור אחסון אמין וזמני עבור נתונים ענה את זה
יכול לשמש בניתוח בזמן אמת. אם תחליט
השתמש ב- ODS או באזור בימוי, אחד
מהכלים הטובים ביותר לאכלוס מבנים אלה נתונים באמצעות
מקורות הפעלה שונים הם השאילתה המבוזרת ההטרוגנית של DB2.
יכולת זו מסופקת על ידי תכונת DB2 האופציונלית
נקרא DB2 Relational Connect (שאילתה בלבד) ודרך DB2
DataJoiner (מוצר נפרד שמספק את היישום,
הכנסה, עדכון ואפשרות ביטול א
הטרוגניים מבוזרים RDBMS).
טכנולוגיה זו מאפשרת לאדריכלים נתונים לקשור נתונים di
ייצור עם תהליכים אנליטיים. לא רק טכנולוגיה יכולה
להתאים למעשה לכל אחת מבקשות השכפול
הם עשויים להופיע עם ניתוחים בזמן אמת, אבל זה
הם יכולים גם להתחבר למגוון רחב של בסיסים של נתונים מח"ש
פופולרי, כולל DB2, Oracle, Sybase, SQL Server,
אינפורמיקס ואחרים. ניתן להשתמש ב- DB2 DataJoiner לאכלוס
מבנה נתונים רשמי כ- ODS או אפילו כטבלה
מיוצג קבוע במחסן המיועד לשיקום
מהיר של עדכונים מיידיים או למכירה. כמובן,
אותם מבנים נתונים ניתן לאכלס באמצעות
טכנולוגיה מרכזית נוספת המיועדת לשכפול של נתוניםיבמ
יחס DataPropagator. (DataPropagator הוא מוצר נפרד
למערכות מרכזיות. DB2 UNIX, Linux, Windows ו- OS / 2 כוללים
שירותי שכפול של נתונים כתכונה סטנדרטית).
שיטה נוספת להעברת ה- נתונים פועל מסביב
עבור הארגון הוא אינטגרטור יישום ארגוני אחרת
ידוע כמתווך המסרים
טכנולוגיה ייחודית מאפשרת לשלוט ללא תחרות למרכז
(מיקוד) ונע נתונים ברחבי החברה. ל- IBM יש את המתווך
של ההודעה הנפוצה יותר, MQSeries, או וריאציה
של המוצר הכולל את הדרישות של מסחר אלקטרונייבמ
WebSphere MQ.
לדיון נוסף כיצד למנף MQ לתמיכה ב-
מחסן וסביבת BI, בקר אתר אינטרנט מהספר. לעת עתה, זהו
די לומר כי טכנולוגיה זו היא מדיום מצוין עבור
לכידת והפיכה (באמצעות MQSeries Integrator) נתונים
מפעילים ממוקדים שגויסו לפתרונות BI. שם
טכנולוגיית MQ שולבה ונארזה ב- UDB V8, אשר
המשמעות היא שניתן כעת לנהל את תורי ההודעות
כאילו היו טבלאות DB2. הרעיון של ריתוך של
תורים ומסרים ביקום מסד נתונים ראשי יחס
לקראת סביבת מסירה חזקה נתונים.
אפס חביון אפס חביון
המטרה האסטרטגית הסופית עבור יבמ היא ניתוח אפס חביון (אפסות).
כהגדרתו
גרטנר, מערכת BI חייבת להיות מסוגלת להסיק, להטמיע
ולספק מידע לאנליסטים על פי בקשה. האתגר,
כמובן, זה טמון כיצד לערבב נתונים עדכני ובזמן אמת
עם מידע היסטורי הכרחי, כגון i נתונים מודל קשור / של
מגמה, או הבנה מחולצת, כתיחום של
הלקוח.
מידע כזה כולל, למשל, זיהוי של לקוחות ad
סיכון גבוה או נמוך או אילו מוצרים אני לקוחות הם יקנו הרבה
כנראה אם כבר יש להם גבינה בעגלות
קניות.
קבלת חביון אפס תלויה למעשה בשניים
מנגנונים בסיסיים:
▪ איחוד מוחלט של נתונים אשר מנותחים עם
טכניקות מבוססות ועם הכלים שפותחו על ידי BI
▪ מערכת משלוחים של נתונים יעיל להבטיח זאת
ניתוח בזמן אמת זמין באמת
תנאי ההשהיה האפסיים אינם שונים מהשניים
יעדים שהוגדרו על ידי יבמ ותוארו לעיל.
צימוד הדוק של נתונים הוא חלק מה-
אינטגרציה חלקה שמסודרת על ידי IBM. וליצור מערכת
משלוח של נתונים יעיל תלוי לחלוטין ב
טכנולוגיה זמינה שמפשטת את תהליך המסירה של
נתונים. כתוצאה מכך, שניים משלושת המטרות של יבמ הם קריטיים
לממש את השלישי. יבמ מפתחת באופן מודע את עצמה
טכנולוגיה כדי להבטיח שאפס חביון הוא מציאות עבור
מאמצי מחסן.
סיכום / סינתזה
ארגון BI מספק מפת דרכים עבור
ליצור את הסביבה שלך
באופן איטרטיבי. זה צריך להיות מותאם כדי לשקף את הצרכים של
העסק שלך, גם בהווה ובעתיד. בלי חזון אדריכלי
רחב, חזרות המניות הן מעט יותר מ
יישומי מחסן מרכזיים אקראיים שעושים מעט עבור
ליצור מפעל גדול ואינפורמטיבי.
המכשול הראשון עבור מנהלי הפרויקטים הוא איך להצדיק
השקעות הנחוצות לפיתוח ארגון BI.
למרות שחישוב ההחזר על ההשקעה נותר תומך מרכזי עבור
הישגי מחסן, זה הופך להיות קשה יותר
לחזות בדיוק. זה הוביל לשיטות אחרות עבור
לקבוע אם אתה מקבל את שווי הכסף שלך. ה
ערך על השקעה 2 (YOU), למשל, נרכש
כפתרון.
זה מתנשא מעל אדריכלי נתונים ועל מתכנני פרויקטים
בכוונה לייצר ולספק מידע לאגודות של
משתמשים ולא פשוט לתת שירות ב נתונים. יש
הבדל עצום בין השניים. מידע הוא משהו שעושה אחד
הבדל בקבלת ההחלטות וביעילות; יחסית, אני
נתונים הם מהווים אבני בניין להפקת מידע זה.
אם כי קריטי למקור נתונים לטפל בבקשות
מסחרית, סביבת ה- BI צריכה לשמש תפקיד גדול יותר
ביצירת תוכן מידע. אנחנו חייבים לקחת
אמצעים נוספים לניקוי, שילוב, שינוי או
אחרת ליצור תוכן מידע לפיו
משתמשים יכולים לנקוט בפעולה, ולכן עלינו לוודא כי אלה
פעולות וההחלטות הללו, כאשר הן סבירות, באות לידי ביטוי
בסביבת BI. אם נדחה את המחסן לשרת רק בו נתונים,
מובטח כי שיוכי משתמשים ייצרו את התוכן
את המידע הדרוש לנקיטת פעולה. זה מבטיח כי שלהם
הקהילה תוכל לקבל החלטות טובות יותר, אך המשרד
זה סובל מחוסר ידע בו השתמשו.
דאטו שאדריכלים ומתכנני פרויקטים יוזמים פרויקטים
ספציפית לסביבת BI, הם נשארים אחראיים כלפי הארגון
בגדול. דוגמה פשוטה לתכונה דו-כיוונית זו
פרצופים של איטרציות של BI נמצאים במקור נתונים. כל ה
נתונים להתקבל עבור בקשות מסחריות ספציפיות חייב להיות
מאוכלס בשכבה האטומית הראשונה. זה מבטיח את התפתחותו של
נכס המידע הארגוני, כמו גם הניהול, מתייחס ל
בקשות ספציפיות למשתמש שהוגדרו באיטרציה.

האם התה ד אטא בית?
מחסן נתונים זה הלב של ארכיטקטורת מערכות המידע
מאז 1990 ותומך בתהליכי מידע על ידי הצעה מוצקה
פלטפורמה משולבת של נתונים היסטוריונים נלקחו כבסיס להמשך
ניתוחים. ה מחסן נתונים להציע את הקלות של שילוב לתוך א
עולם מערכות היישומים שאינן תואמות זו את זו. תַאֲרִיך
מחסן התפתח והפך לטרנד. מחסן נתונים
מארגן ומחסן i נתונים הכרחי לתהליכי מידע ה
אנליטית על בסיס נקודת מבט זמן היסטורית ארוכה. את כל
זה כרוך במחויבות ניכרת ומתמדת בבנייה
בשמירה על מחסן נתונים.
אז מה זה א מחסן נתונים? מחסן נתונים הוא:
▪ מכוון לנושאים
▪ מערכת משולבת
זמן גרסה
▪ לא נדיף (לא מבטל)
אוסף של נתונים משמש לתמיכה בהחלטות ניהוליות ב
יישום תהליך.
I נתונים מוכנס פנימה מחסן נתונים להתעורר ברוב ה
מקרים מסביבות תפעוליות. ה מחסן נתונים נעשה על ידי א
יחידת אחסון, נפרדת פיזית משאר חלקי המחשב
מערכת, המכילה נתונים בעבר השתנה על ידי
יישומים הפועלים על ידי מידע הנובע מהסביבה
מִבצָעִי.
ההגדרה המילולית של א מחסן נתונים ראוי להסתכל לעומק
הסבר שכן יש מניעים ומשמעויות חשובות של
קרן המתארת את מאפייני המחסן.
הכוונת נושא
נוֹשְׂאִי
התכונה הראשונה של א מחסן נתונים זה שהוא מכוון אוויר
שחקנים גדולים בחברה. השיפוט של המשפטים באמצעות i
נתונים זה בניגוד לשיטה הקלאסית יותר המספקת
כיוון היישומים כלפי תהליכים ופונקציות,
רוב השיטה המשותפת לרוב
מערכות כיווניות ישנות יותר.
עולם ההפעלה מתוכנן סביב יישומים ופונקציות
כגון הלוואות, חסכונות, כרטיסי בנק ונאמנות למוסד
כַּספִּי. עולמו של הדור מאורגן סביב נושאים
כגון הלקוח, המוכר, המוצר והעסק.
יישור סביב נושאים משפיע על עיצוב ו
על המימוש של נתונים נמצא בדור. באופן רלוונטי יותר,
הטיעון העיקרי משפיע על החלק החשוב ביותר של
מבנה מפתח.
עולם היישום מושפע גם מעיצוב התאריך
בסיס ומתכנון התהליך. העולם של
dw מתמקדת אך ורק בדוגמנות נתונים ועל
ציור של מסד נתונים. תכנון התהליך (בצורתו
קלאסי) אינו חלק מסביבת dw.
ההבדלים בין בחירת התהליך / פונקציה ליישום
בחירה לפי נושא מתגלה גם כהבדלים בתוכן
של נתונים ברמה מפורטת. ה נתונים del dw אינם כוללים את i נתונים כי
הם לא ישמשו לתהליך DSS בזמן יישומים
מכוונת מבצעית ל נתונים להכיל את i נתונים לספק
באופן מיידי את דרישות התפקוד / עיבוד שעשויות או
פחות בשימוש כלשהו עבור אנליסט DSS.
דרך חשובה נוספת בה יישומים מכוונים תפעוליים
ai נתונים שונה מ נתונים של dw נמצא בדוחות של נתונים. אני נתונים
המבצעי מקיים קשר רציף בין שתי טבלאות או יותר
בהתבסס על כלל עסקי פעיל. ה נתונים מאת dw
הם משתרעים על ספקטרום זמן והיחס שנמצא ב- dw הוא
הרבה. כללי מסחר רבים (ובהתאם, רבים
דיווחים על נתונים מיוצגים במחסן של נתונים בין שני o
מספר שולחנות.
(להסבר מפורט כיצד מערכות היחסים בין נתונים סונו
מנוהל ב- DW, אנו מתייחסים לנושא הטק בנושא
שְׁאֵלָה.)
מנקודת מבט אחרת מזו של ההבדל
בסיסי בין בחירה בין פונקציונלי / תהליך ליישום
בחירת נושא, יש הבדל גדול יותר בין המערכות
מבצעית ו נתונים וה- DW.
אינטגרציה אינטגרציה
ההיבט החשוב ביותר בסביבת dw הוא כי אני נתונים מצאתי
בתוך ה- dw הם משולבים בקלות. תמיד. לְלֹא
חריגים. מהותה של סביבת ה- dw היא שאני נתונים
הכלולים בגבולות המחסן משולבים.
שילוב מתגלה בדרכים רבות ושונות - במוסכמות
מזוהה כעקבי, במידה של משתנים עקביים, ב
מבנים מקודדים המורכבים מהתכונות הפיזיות של נתונים
עקבי, וכן הלאה.
במהלך השנים מעצבי היישומים השונים עשו זאת
להחזיק החלטות רבות לגבי אופן השימוש בבקשה
לְהִתְפַּתֵחַ. סגנון פרטני והחלטות עיצוביות
יישומים של מעצבים חושפים את עצמם במאה דרכים:
הבדלים בקידוד, מבנה מפתח, מאפיינים פיזיים,
מוסכמות זיהוי וכן הלאה. היכולת הקולקטיבית של רבים
מעצבי יישומים ליצור יישומים לא עקביים
זה אגדי. איור 3 חושף כמה מההבדלים יותר
חשוב בדרכי התכנון של יישומים.
קידוד: קידוד:
מעצבי יישומים בחרו בקידוד שדה -
מין - בכמה דרכים. מעצב מייצג מין כ
"m" ו- "f". מעצב אחר מייצג את המין כ- "1"
ו- "0". מעצב אחר מייצג מין כ- "x"
"Y". מעצב אחר מייצג את המין כ"גברי "
"נְקֵבָה". זה לא ממש משנה איך המין מגיע ב- DW. ה- "M"
וה- "F" כנראה טובים ככלל
יִצוּג.
מה שחשוב הוא שמכל מקור שמוצא תחום המין,
שדה זה מגיע ל- DW במצב משולב עקבי. שֶׁל
תוצאה כאשר השדה נטען ל- DW מ-
יישום שבו הוא יוצג בפורמט
"M" ו- "F", i נתונים יש להמיר לפורמט DW.
מדידת תכונות: מדידת
תכונות:
מעצבי היישומים בחרו למדוד את הצינור ב
מגוון דרכים בקורס
כמה שנים. חנויות מעצבים i נתונים של הצינור ב
סנטימטרים. מעצב יישומים נוסף חנויות i נתונים
של הצינור במונחים של סנטימטרים. מעצב אחר מ
חנויות יישומים i נתונים של הצינור במיליון מטר מעוקב
לשניה. ומעצב אחר מאחסן את המידע של
צינור מבחינת חצרות. לא משנה מה המקור, כאשר ה-
המידע על הצינור מגיע ל- DW שהם חייבים להיות
נמדד באותו אופן.
על פי האינדיקציות באיור 3, נושאי האינטגרציה
הם משפיעים כמעט על כל היבט בפרויקט - על התכונות
פיזית של נתונים, הדילמה שיש יותר ממקור אחד של נתונים, את
עניין של דוגמאות מזוהות לא עקביות, פורמטים של נתונים
לא עקבי, וכן הלאה.
לא משנה מה הטיעון העיצובי, התוצאה היא זהה -
i נתונים חייב להיות מאוחסן ב- DW ביחיד e
באופן מקובל בעולם גם כאשר מערכות הפעלה של
חנות תחתונה אחרת אני נתונים.
כאשר אנליסט DSS מסתכל על ה- DW, היעד של האנליסט
צריך להיות ניצול של נתונים שנמצאים במחסן,
במקום לתהות לגבי האמינות או העקביות של
נתונים.
זמן שונות
כל נתונים ב- DW הם מדויקים בנקודת זמן מסוימת.
תכונה בסיסית זו של נתונים ב- DW זה שונה מאוד מ- נתונים
נמצא בסביבת ההפעלה. ה נתונים של סביבת ההפעלה הם
מדויק כמו בזמן הגישה. במילים אחרות,
בסביבת ההפעלה בעת גישה לכונן נתונים, אבל גם
המתן עד שישקף ערכים מדויקים כמו ברגע הגישה.
למה אני נתונים ב- DW מדויקים כמו בשלב כלשהו ב
זמן (כלומר, לא "עכשיו"), אני נתונים נמצא ב- DW
הם "שונות זמן".
שונות הזמן של נתונים DW מכונה בדרכים רבות.
הדרך הפשוטה ביותר היא שאני נתונים של DW מייצג נתונים זה
אופק זמן ארוך - חמש עד עשר שנים. האופק
הזמן המיועד לסביבת ההפעלה קצר בהרבה
▪ מהערכים הנוכחיים של היום עד שישים ותשעים
יישומים שחייבים לעבוד טוב וחייבים להיות כאלה
הזמינים לעיבוד עסקאות חייבים לשאת את
כמות מינימלית של נתונים אם הם מודים במידת מה
גְמִישׁוּת. כך שליישומים המבצעיים יש אופק
זמן קצר, כנושא עיצובי של
יישומי שמע.
הדרך השנייה בה מופיעה 'שונות זמן' ב- DW היא ב-
מבנה מפתח. כל מבנה מפתח ב- DW מכיל,
במשתמע או במפורש, אלמנט זמן, כגון
יום, שבוע, חודש וכו '. אלמנט הזמן הוא כמעט תמיד
בתחתית המפתח המשורשר שנמצא ב- DW. באלה
במקרים, אלמנט הזמן יתקיים באופן מרומז, לפי העניין
כאשר קובץ שלם משוכפל בסוף החודש או הרבעון.
הדרך השלישית להופעת שונות היא כי אני נתונים דל
DW, שרשום רק כראוי, לא יכול להיות
מְעוּדכָּן. ה נתונים של ה- DW הם, לכל המטרות המעשיות, ארוכים
סדרת תמונות (תמונת מצב). כמובן שאם התצלומים הם
נלקחו בצורה שגויה, ואז ניתן לעשות צילומי תמונות
שונה. אבל בהנחה שהתמונות נעשות
נכון, הם לא משתנים בסיום. בחלק
המקרים יכולים להיות לא אתיים או אפילו לא תקפים מכיוון שהתמונות המצוינות ב
DW השתנו. ה נתונים פועל, מדויק כמו ב
עם הגישה, ניתן לעדכן אותם כפי שהוא מציג את עצמו
הצורך.
לא תנודתי
המאפיין הרביעי החשוב של DW הוא שהוא אינו נדיף.
עדכונים, הכנסות, ביטולים ושינויים נעשים
באופן קבוע לסביבות מבצעיות לפי רשומות. אבל ה
מניפולציה בסיסית של נתונים המתרחשים ב- DW הוא הרבה יותר
פָּשׁוּט. ישנם רק שני סוגים של פעולות המתרחשות ב
DW - הטעינה הראשונית של ה- נתונים וגישה ל נתונים. אין
כל עדכון של נתונים (במובן הכללי של
עדכון) ב- DW כפעולת עיבוד רגילה.
יש כמה השלכות חזקות מאוד של ההבדל הזה
בסיס בין עיבוד תפעולי לעיבוד DW. בשלב
עיצוב, הצורך להיות זהיר לגבי עדכון
אנומלי אינו גורם ב- DW, שכן עדכון ה- נתונים זה לא
בוצע. המשמעות היא שברמה הפיזית של העיצוב,
ניתן לקחת חירויות כדי לייעל את הגישה אל נתונים,
בפרט בהתמודדות עם נושאי הנורמליזציה ו
דנורמליזציה גופנית. תוצאה נוספת של פשטות
מפעילות DW היא בטכנולוגיה הבסיסית ששימשה לה
להפעיל את סביבת DW. צריך לתמוך בעדכונים
רשומה לפי רשומה באופן מקוון (כפי שקורה לעתים קרובות
עיבוד תפעולי) הטכנולוגיה נדרשת
יסודות מורכבים מאוד בפשטות לכאורה.
הטכנולוגיה התומכת בגיבוי ושחזור, עסקאות
ושלמות של נתונים וגילוי ותיקון מצב מבוי סתום הוא
מורכב למדי ולא הכרחי לעיבוד DW.
המאפיינים של DW, אוריינטציה עיצובית,
שילוב של נתונים בתוך DW, שונות זמן ופשטות
הנהלה של נתונים, הכל מוביל לסביבה שהיא מאוד מאוד
שונה מסביבת ההפעלה הקלאסית. המקור של כמעט כולם
נתונים של DW הם סביבת ההפעלה. מפתה לחשוב
שיש יתירות מסיבית של נתונים בין שתי הסביבות.
למעשה, הרושם הראשוני של אנשים רבים הוא זה של
יתירות רבה של נתונים בין סביבת ההפעלה לבין
DW. פרשנות כזו היא שטחית ומוכיחה אחת כזו
חוסר הבנה מה קורה ב- DW.
למעשה יש מינימום יתירות של נתונים בין סביבת ההפעלה
ו - נתונים של ה- DW. בואו ניקח בחשבון את הדברים הבאים:
▪ אני נתונים מסוננים נתתי שאתה עובר מסביבת ההפעלה
לסביבת DW. הרבה נתונים הם אף פעם לא מתעלפים
מסביבת ההפעלה. אלא שאני נתונים אשר נדרשים עבור
עיבוד DSS מוצא את הכיוון שלהם בסביבה
אופק הזמן של נתונים זה שונה מאוד מסביבה
לאחר. ה נתונים בסביבת ההפעלה הם טריים מאוד. ה נתונים
ב- DW הם הרבה יותר מבוגרים. רק מנקודת המבט
באופק הזמן, יש מעט מאוד חפיפה
בין סביבת ההפעלה ל- DW.
▪ ה- DW מכיל נתונים סיכום שלעולם לא נמצא
בסביבה
▪ אני נתונים עוברים שינוי מהותי מאז
כאשר הם עוברים לאיור 3 ממחיש את זה ביותר
חלק מ נתונים משתנים באופן משמעותי בתנאי
להיבחר והועבר ל- DW. במילים אחרות, ה-
רוב נתונים משתנה פיזית ה
באופן קיצוני כיצד הוא מועבר ל- DW. מנקודת המבט
שילוב אינו זהה נתונים שמתגוררים
בסביבת ההפעלה.
לאור גורמים אלה יתירותם של נתונים בין שתי הסביבות הוא
אירוע נדיר, המוביל לפחות מ -1% יתירות בין השניים
סביבות.
מבנה המחסן
DWs יש מבנה מובחן. ישנן רמות סיכום ודי שונות
פרט שתוחם את ה- DWs.
המרכיבים השונים של DW הם:
▪ מטא נתונים
▪ לתת לי פרטים עדכניים
▪ לתת לי של פרט ישן
▪ לתת לי מסוכם מעט
▪ לתת לי מסוכם מאוד
ללא ספק הדאגה העיקרית היא עבור i נתונים של פירוט
זרמים. זה הדאגה העיקרית כי:
▪ אני נתונים הפרטים הנוכחיים משקפים את האירועים האחרונים,
שתמיד מעניינים מאוד ו
▪ אני נתונים של הפרטים הנוכחיים הם נפחיים כי זה כן
מאוחסנים ברמת הגרעיניות הנמוכה ביותר ה
▪ אני נתונים הפרטים הנוכחיים נשמרים כמעט תמיד
זיכרון דיסק, מהיר לגישה, אך יקר
מורכב מ
I נתונים פרטים ישנים יותר הם נתונים המאוחסנים ב
זיכרון כלשהו של אסא. יש לו גישה באופן ספורדי וזהו
מאוחסנים ברמת פירוט התואמת ל- נתונים מְפוֹרָט
זרמים. אמנם לא חובה לאחסן על
זיכרון חלופי, בגלל הנפח הגדול של נתונים מאוחדת עם
גישה ספורדית של נתונים, מדיום הזיכרון עבור נתונים di
פרט ישן יותר בדרך כלל אינו מאוחסן בדיסק.
I נתונים מסוכמים בקלילות הם נתונים אשר מזוקקים מלמטה
רמת פירוט שנמצאת ברמת הפירוט הנוכחית. זֶה
רמת DW מאוחסנת כמעט תמיד בזיכרון הדיסק. ה
בעיות העיצוב המוצגות בפני אדריכל המשרד נתונים
בבניית רמה זו של DW הם:
▪ איזו יחידת זמן היא הסיכום שנעשה לעיל
▪ איזה תוכן, תכונות יסכם מעט את
תוכן של נתונים
הרמה הבאה של נתונים נמצא ב- DW הוא של נתונים מְאוֹד
תמצה. ה נתונים מסוכמים מאוד הם קומפקטיים ובקלות
נגיש. ה נתונים מסוכמים מאוד נמצאים לפעמים
בסביבת DW ובמקרים אחרים i נתונים מסוכמים מאוד הם
נמצא מחוץ לקירות המיידיים של הטכנולוגיה המארחת את DW.
(בכל מקרה, אני נתונים מסוכמים מאוד הם חלק מה- DW
ללא קשר למקום בו אני נתונים שוכנים פיזית).
המרכיב הסופי של ה- DW הוא של מטא נתונים. במובנים רבים
מטא נתונים יושבים בממד שונה מאחרים נתונים
של ה- DW, מכיוון שהמטא-נתונים אינם מכילים כאלה נתתי direttamente
נלקח מסביבת ההפעלה. למטא נתונים יש תפקיד מיוחד e
חשוב מאוד ב- DW. מטא נתונים משמשים כ:
▪ מדריך שיעזור לאנליסט DSS לאתר את
תוכן ה- DW,
▪ מדריך למיפוי של נתונים איך אני נתונים הם היו
הפך מסביבת ההפעלה לסביבת DW,
▪ מדריך לאלגוריתמים המשמשים לסיכום בין נתונים di
פרט נוכחי ei נתונים מסוכם מעט, אני נתונים מְאוֹד
סיכומים,
מטא נתונים ממלאים תפקיד חשוב הרבה יותר בסביבת DW
בהשוואה למה שהיה להם אי פעם בסביבת ההפעלה
מדיה אחסון ישנה
ניתן להשתמש בקלטת מגנטית לאחסון סוג זה
נתונים. למעשה יש מגוון רחב של כלי שינון ש
יש לשקול אותם לשימור זקנים נתונים di
פרט.
תלוי בנפח ה- נתונים, תדירות הגישה, העלות
של הכלים וסוג הגישה, סביר לחלוטין
שכלים אחרים יזדקקו לרמת הפירוט הישנה
ב- DW.
זרימת נתונים
יש זרם אלים רגיל וצפוי נתונים בתוך ה- DW.
I נתונים היכנס ל- DW מסביבת ההפעלה. (הערה: יש
כמה יוצאי דופן מעניינים לכלל זה. עם זאת, כמעט
כל ה נתונים היכנס ל- DW מסביבת ההפעלה). דאטו ש נתונים
להיכנס ל- DW מסביבת ההפעלה, הוא הופך כפי שהיה
מתואר לעיל. בתנאי שתכנס ל- DW, אני נתונים להיכנס ל
רמת הפירוט הנוכחית, כפי שמוצג. הוא שוכן שם ומשמש
עד שמתרחש אחד משלושת האירועים:
▪ מטוהר,
מסכם ▪ ו / או
▪ הוא
תהליך מיושן בתוך מהלך DW i נתונים פרטים עדכניים
a נתונים בפירוט ישן, על פי גיל נתונים. התהליך
סיכום משתמש בפירוט של נתונים לחשב i נתונים
רמות מסוכמות מעט ומסוכמות מאוד של נתונים. יש
כמה יוצאים מן הכלל לזרימה המוצגת (יידונו בהמשך).
עם זאת, בדרך כלל, עבור הרוב המכריע של נתונים מצאתי
בתוך DW, הזרימה של נתונים הוא כמו בתמונה.
שימוש במחסן הנתונים
באופן לא מפתיע הרמות השונות של נתונים בתוך ה- DW לא
הם מקבלים רמות שונות של שימוש. ככלל, ככל שרמת ה-
סיכום, בתוספת i נתונים הם משומשים.
שימושים רבים מתרחשים ב נתונים מסוכם מאוד, בעוד הישן
נתונים כמעט ולא נעשה שימוש בפרטים. יש סיבה טובה ב
להעביר את הארגון לפרדיגמת השימוש במשאבים. ליותר יש
סיכום i נתונים, כמה שיותר מהר ויעיל להגיע אל נתונים. עצמו
un חנות לגלות שהיא עושה תהליכים רבים ברמת הפרטים של ה- DW,
ואז כמות מקבילה גדולה של משאבי מכונה
נצרך. טובת כולם להעמיד לדין
כמו ברמת סיכום גבוהה בהקדם האפשרי.
עבור חנויות רבות, נעשה שימוש באנליסט DSS ב- DW לפני הסביבה
נתונים ברמת הפירוט. במובנים רבים ההגעה א נתונים מְפוֹרָט
דומה לשמיכת אבטחה, גם כאשר הם זמינים
רמות סיכום אחרות. אחת הפעילויות של האדריכל של נתונים è
לא להרגיל את משתמש ה- DSS משימוש מתמיד ב- נתונים ברמת הפלוס
פרט נמוך. ישנן שתי סיבות זמינות
מאת האדריכל של נתונים:
▪ על ידי התקנת מערכת החזר חיוב, שם משתמש הקצה משלם את
משאבים שנצרכים ה
▪ שמצביעים על כך שזמן התגובה יכול להיות טוב מאוד
הושג כאשר ההתנהגות עם i נתונים זה ברמה גבוהה
של סיכום, בעוד שזמן התגובה הלקוי נובע מה-
התנהגות של נתונים ברמה נמוכה של
שיקולים אחרים
יש עוד כמה שיקולי בנייה וניהול
סיומת DW.
השיקול הראשון הוא של מדדים. ה נתונים ברמות הגבוהות יותר של
סיכום ניתן לאינדקס באופן חופשי, בעוד שאני נתונים
ברמות הפירוט הנמוכות הם כל כך מגושמים שהם יכולים להיות
באינדקס בחסכנות. מאותו אסימון, אני נתונים ברמות הגבוהות של
ניתן לשפץ בקלות יחסית,
ואילו הנפח של נתונים ברמות הנמוכות הוא כל כך גדול ש- i נתונים לֹא
ניתן לשפץ אותם בקלות. כתוצאה מכך, המודל
של נתונים והעבודה הרשמית שנעשתה על ידי העיצוב קבעה את
הבסיס ל- DW הוחל כמעט אך ורק על הרמה
פירוט הנוכחי. במילים אחרות, פעילויות הדוגמנות של
נתונים הם כמעט ואינם חלים על רמות סיכום.
שיקול מבני נוסף הוא של החלוקה של
נתונים מאת DW.
חלוקה יכולה להיעשות בשתי רמות - ברמה של dbms וכדי
רמת יישום. בחטיבה ברמה dbms, dbms è
הודיע על האגפים ובודק אותם בהתאם. במקרה של
חלוקה ברמת היישום, רק המתכנת הוא
הודיע על החלוקות והאחריות לגביהם
הממשל נותר לו
מתחת לרמה dbms, הרבה עבודה נעשית באופן אוטומטי. יש
חוסר גמישות רב הקשור לניהול אוטומטי של
חטיבות. במקרה של חלוקה ברמת היישום של נתונים דל
מחסן נתונים, עבודה רבה על המתכנת, אבל ה
התוצאה הסופית היא גמישות בניהול נתונים בתאריך
מחסן
חריגות אחרות
בעוד המרכיבים של ה מחסן נתונים לעבוד כמתואר
כמעט לכולם נתונים, ישנם כמה יוצאים מן הכלל שחייבים
יידונו. יוצא מן הכלל הוא זה של נתונים סיכומים פומביים
(נתוני סיכום פומבי). אלו הם נתונים סיכומים שהיו
מחושב מחוץ ל מחסן נתונים אבל הם משמשים את החברה. ה נתונים
סיכומים ציבוריים מאוחסנים ומנוהלים ב- מחסן נתונים,
אם כי כאמור לעיל הם מבינים. ה
רואי חשבון עובדים לייצר רבעוני כזה נתונים כמו
הכנסות, הוצאות רבעוניות, רווח רבעוני וכן הלאה. העבודה
שנעשה על ידי רואי החשבון הוא חיצוני ל מחסן נתונים. למרות זאת, אני נתונים סונו
בשימוש "פנימי" בתוך החברה - מ שיווק, מכירות וכו'.
אנומליה נוספת, שלא תידון עליה, היא של נתונים חיצוני.
עוד סוג נהדר של נתונים אשר ניתן למצוא בתאריך
המחסן הוא של נתוני פירוט קבועים. אלה גורמים ל
צריך לאחסן לצמיתות i נתונים ברמה אחת
מפורט מסיבות אתיות או משפטיות. אם חברה מציגה i
עובדים הקשורים לחומרים מסוכנים יש צורך נתונים
מפורט וקבוע. אם חברה מייצרת מוצר ש
זה כרוך בביטחון הציבור, באילו חלקים של מטוס יש
הצורך ל נתונים פרטים קבועים, כמו גם אם חברה
נכנס לחוזים מסוכנים.
החברה לא יכולה להרשות לעצמה להתעלם מהפרטים מדוע
במהלך השנים הבאות, במקרה של תביעה, ריקול, א
ליקוי בניה שנוי במחלוקת וכו '. החשיפה של החברה
זה יכול להיות נהדר. כתוצאה מכך יש סוג ייחודי של נתונים
ידועים כנתוני פירוט קבועים.
תקציר
Un מחסן נתונים הוא אובייקט מכוון, משולב, משתנה של
זמן, אוסף של נתונים לא תנודתי בתמיכה בצרכים של
החלטת הממשל. כל אחת מהפונקציות הבולטות של
un מחסן נתונים יש השלכות. בנוסף יש ארבעה
שלבים של נתונים דל מחסן נתונים:
▪ פרט ישן
▪ פרט נוכחי
▪ לתת לי מסוכם מעט
▪ לתת לי מסוכם מאוד
מטא נתונים הם גם חלק חשוב של מחסן נתונים.
תַקצִיר
הרעיון של אחסון של נתונים קיבל לאחרונה
הרבה תשומת לב וזה הפך למגמה של שנות ה 90. כלומר
בשל יכולתו של א מחסן נתונים להתגבר על
מגבלות של מערכות תמיכה בממשל כגון i
מערכות סיוע להחלטות (DSS) ומערכות מידע
מנהל (EIS).
למרות שהמושג של ה מחסן נתונים נראה מבטיח,
ליישם את i מחסן נתונים זה יכול להיות בעייתי בגלל
תהליכי אחסון בקנה מידה גדול. למרות ה
מורכבות פרויקטים של אחסון נתונים, ספקים רבים
ויועצים המאחסנים נתונים הם טוענים זאת
האחסון של נתונים הנוכחי אינו כרוך בבעיות.
עם זאת, בתחילת פרויקט מחקר זה, כמעט אף אחד מהם
נערך מחקר עצמאי, קפדני ושיטתי. שֶׁל
כתוצאה מכך, קשה לומר מה באמת קורה
בתעשייה כשהם בנויים מחסן נתונים.
מחקר זה בחן את תרגול האחסון של נתונים
בני זמננו שמטרתם לפתח הבנה עשירה יותר
של תרגול אוסטרלי. ניתוח הספרות סיפק את
הקשר והבסיס למחקר אמפירי.
ישנן מספר תוצאות מחיפוש זה. ראשון
במקום, מחקר זה חשף את הפעילויות שהתרחשו
במהלך הפיתוח של מחסן נתונים. בתחומים רבים, אני נתונים נאסף
אישר את הנוהג המדווח בספרות. בשנייה
אתר, בעיות ונושאים שעלולים להשפיע
פיתוח של מחסן נתונים זוהו ממחקר זה.
לבסוף, הטבות שמקורן בארגונים האוסטרלים הקשורים ל
השימוש של מחסן נתונים נחשפו.
פרק 1
הקשר מחקרי
הרעיון של אחסון נתונים זכה לפופולריות רחבה
חשיפה והפך למגמה מתפתחת ב
שנות התשעים (מקפדן 90, TDWI 1996, שאה ומילשטיין 1996,
שאנקס ואחרים. 1997, אקרסון 1998, אדלמן ואוטס 2000). זֶה
ניתן לראות על ידי מספר הולך וגדל של מאמרים בתאריך
אחסנה בפרסומים מסחריים (ליטל וגיבסון 1999).
מאמרים רבים (ראו, למשל, פישר 1995, האקתורן 1995,
מוריס 1995a, ברמבלט וקינג 1996, גרהאם ואח '. 1996,
סקאגוצ'י ופרוליק 1996, אלווארז 1997, ברוסל 1997, קלארק
1997, מקארתי 1997, O 'Donnell 1997, Edwards 1998, TDWI
1999) דיווחו על יתרונות משמעותיים לארגונים
אשר מיישמים את i מחסן נתונים. הם תמכו בתיאוריה שלהם
עם עדויות אנקדוטליות ליישומים מוצלחים, התשואה הגבוהה
על נתוני השקעות (ROI) וגם מתן הנחיות
התייחסות או מתודולוגיות לפיתוח של מחסן נתונים
(Shanks et al. 1997, Seddon and Benjamin 1998, Little and Gibson
1999). במקרה קיצוני, גרהם ואח '. (1996) יש
דיווחה על תשואה ממוצעת על השקעה לשלוש שנים של 401%.
אולם חלק גדול מהספרות הנוכחית התעלמו
מורכבות הכרוכה בביצוע פרויקטים כאלה. הפרויקטים של
מחסן נתונים הם בדרך כלל מורכבים ובקנה מידה גדול e
לכן הם מרמזים על סבירות גבוהה להיכשל אם הם לא
נשלט בקפידה (שאה ומילשטיין 1997, אקרסון 1997,
פולי 1997b, צימר 1997, בורט 1998, גיבס וקליימר 1998, ראו
1998). הם דורשים כמויות אדירות של משאבי אנוש ומשאבים
פיננסי, זמן ומאמץ לבנות אותם (Hill 1998, Crofts 1998). ה
הזמן האופייני והאמצעים הכספיים הדרושים הם בהתאמה
כשנתיים ושנתיים-שלוש מיליון דולר (בראלי 1995, פולי
1997b, Bort 1998, Humphries et al. 1999). זמנים ואמצעים אלו
הכספים נדרשים לבקרה ולגיבוש היבטים רבים
אחסון נתונים מסוגים שונים (Cafasso 1995, Hill 1998). לצד
שיקולי חומרה ותוכנה, פונקציות אחרות המשתנות
מהמיצוי של נתונים לתהליכי הטעינה של נתונים, על ידי
יכולת זיכרון לניהול עדכונים ומטא נתונים
לצורך הכשרת משתמשים, עליהם להתחשב.
בזמן תחילת פרויקט המחקר הזה היה מעט מאוד
מחקר אקדמי שנערך בתחום אחסון נתונים,
במיוחד באוסטרליה. הדבר ניכר ממחסור במאמרים
פורסם באחסון נתונים מעיתונים או כתבים אחרים
אקדמאים של אז. רבים מהכתבים האקדמיים
זמין תיאר את החוויה בארה"ב. המחסור ב
מחקרים אקדמיים באזור אחסון הנתונים sl גרמו ל
דרישה למחקרים קפדניים ולמחקרים אמפיריים (מקפדן 1996,
שאנקס ואחרים. 1997, ליטל וגיבסון 1999). בפרט, הלימודים
מחקר על תהליך היישום של מחסן נתונים
הם צריכים להיעשות כדי להרחיב את הידע
כללי על יישום מחסן נתונים e
הם ישמשו בסיס למחקר עתידי (Shanks ed
אחרים. 1997, ליטל וגיבסון 1999).
מטרת המחקר, אם כן, היא ללמוד מה באמת
זה קורה כאשר ארגונים מתחזקים נתונים ומשתמשים בהם
מחסן באוסטרליה. באופן ספציפי, מחקר זה יכלול
ניתוח של תהליך פיתוח שלם של א מחסן נתונים,
החל מייזום ותכנון דרך תכנון ו
יישום ושימוש לאחר מכן בארגונים
אוסטרלי. בנוסף המחקר יתרום גם לתרגול קיים
זיהוי אזורים שבהם התרגול יכול להיות רחוק יותר
ניתן למזער שיפור ויעילות וסיכונים
נמנע. בנוסף, הוא ישמש בסיס למחקרים נוספים בנושא מחסן נתונים in
אוסטרליה ותמלא את החסר הקיים כיום בספרות.
שאלות מחקר
מטרת המחקר היא ללמוד את הפעילויות הכרוכות בכך
ביישום של מחסן נתונים והשימוש בהם על ידי
ארגונים אוסטרליים. בפרט נלמדים היסודות
לגבי תכנון פרויקטים, פיתוח, אל
תפעול, שימוש וסיכונים המדוברים. מכאן השאלה
מחקר זה הוא:
"איך הנוהג הנוכחי של מחסן נתונים באוסטרליה?"
כדי לענות ביעילות על בעיה זו, א
מספר מסוים של שאלות מחקר בת. בפרט שלוש
שאלות משנה זוהו מהספרות, כלומר
המוצג בפרק 2, להנחיית פרויקט מחקר זה:
איך אני מחסן נתונים על ידי ארגונים
אוסטרלי? מהן הבעיות שנתקלו בהן?
מהם היתרונות שחווים?
במענה לשאלות אלו נעשה שימוש בציור
מחקר חקר המעסיק חקירה. כמחקר
חקרני, התשובות לשאלות הנ"ל אינן שלמות
(Shanks et al. 1993, Denscombe 1998). במקרה זה, כן
משולש נדרש כדי לשפר את התגובות לאלו
שאלות. עם זאת, החקירה תספק בסיס איתן ל
עבודה עתידית לבחינת שאלות אלה. אחד מפורט
דיון על הצדקת שיטת המחקר ועל העיצוב
מוצג בפרק 3.
מבנה פרויקט המחקר
פרויקט מחקר זה מחולק לשני חלקים: המחקר ההקשר
הרעיון של אחסון נתונים ומחקר אמפירי (ראה
איור 1.1), שכל אחד מהם נדון להלן.
חלק א ': לימוד הקשר
החלק הראשון של המחקר כלל בחינה מחדש של ה-
ספרות עדכנית על סוגים שונים של אחסון נתונים כולל i
מערכות סיוע להחלטות (DSS), מערכות מידע
executive (EIS), מקרי המקרה של מחסן נתונים ומושגי תאריכים
מַחסָן. יתר על כן, התוצאות של foum sui מחסן נתונים ו
קבוצות פגישות למומחים ואנשי מקצוע בהובלת הקבוצה של
מחקר ה- Monash DSS תרם לשלב זה של המחקר
שנועדה להשיג מידע על פרקטיקת הנתונים
מחסן ולזהות את הסיכונים הכרוכים באימוץ שלהם.
בתקופה זו של לימוד הקשר, הבנה
אזור הבעיה הוקם כדי לספק ידע על
בסיס לחקירות אמפיריות עוקבות. עם זאת, זה
היה תהליך מתמשך במהלך ביצוע המחקר של
מחקר.
חלק ב ': מחקר אמפירי
הרעיון החדש יחסית של אחסון נתונים, במיוחד
באוסטרליה זה יצר את הצורך לערוך חקירה עבור
קבל תמונה גדולה של חווית השימוש. זֶה
החלק נעשה ברגע שתחום הבעיה היה
הוקמה באמצעות סקירת ספרות מקיפה. הרעיון
של אחסון נתונים שנוצר בשלב המחקר ההקשר הוא
שימש כקלט לשאלון הראשוני של מחקר זה.
לאחר מכן נבדק השאלון. שישה מומחים לדייטים
מחסן השתתף במבחן. מטרת המבחן של
השאלון הראשוני היה לבדוק שלמות ודיוק
מספר שאלות. על סמך תוצאות הבדיקה, השאלון הוא
שונתה והגרסה שהשתנתה נשלחה אל
משתתפי הסקר. שאלונים שהוחזרו אז היו
נותח עבור i נתונים בטבלאות, דיאגרמות ופורמטים אחרים. ה
תוצאות ניתוח של נתונים ליצור תמונת מצב של
תרגול של אחסון נתונים באוסטרליה.
סקירת אחסון נתונים
הרעיון של אחסון נתונים התפתח עם השיפורים
של טכנולוגיית המחשב.
היא מכוונת להתגבר על הבעיות בהן נתקלים קבוצות
תמיכה ביישומים כגון מערכת תומכת החלטות (DSS) ה
מערכת מידע מנהלים (EIS).
בעבר היה המכשול הגדול ביותר ביישומים אלה
חוסר היכולת של יישומים אלה לספק א מאגר מידע
הכרחי לניתוח.
זה נגרם בעיקר על ידי אופי העבודה של
מַנהִיגוּת. האינטרסים של הנהלת החברה משתנים
תלוי כל הזמן באזור המטופל. לכן אני נתונים
בסיסי עבור יישומים אלה חייב להיות מסוגל
שינוי מהיר בהתאם לחלק שיש לטפל בו.
זה אומר שאני נתונים הם חייבים להיות זמינים בצורה
נאות לניתוחים הנדרשים. למעשה, קבוצות התמיכה של
יישומים מצאו קשיים רבים בעבר לאיסוף ו
השתלבות נתונים ממקורות מורכבים ומגוונים.
בהמשך חלק זה מוצג סקירה כללית של המושג
מחסני נתונים ועוסקים כיצד ה מחסן נתונים יכול לחרוג מ-i
סוגיות בקבוצות תמיכה ביישומים.
המונח "מחסן נתונים"שוחרר על ידי וויליאם אינמון ב-1990.
ההגדרה המצוטטת לעתים קרובות רואה את מחסן נתונים איך
אוסף של נתונים נושא מכוון, משולב, לא נדיף ומשתנה
לאורך זמן, לתמיכה בהחלטות ההנהלה.
באמצעות הגדרה זו אינמון מציין כי i נתונים תושבים
בתוך מחסן נתונים חייב להחזיק ב-4 הבאים
תכונות:
▪ מכוון לנושא
▪ משולב
▪ לא נדיף
▪ משתנה לאורך זמן
לפי נושא מונחה אינמון פירושו שאני נתונים בתאריך
מחסן באזורים הארגוניים הגדולים ביותר שהיו
מוגדר במודל נתונים. למשל הכל נתונים הנוגע ל לקוחות
כלולים בתחום הנושא לקוחות. כמו כן כולם
נתונים הקשורים למוצרים כלולים בתחום הנושא
מוצרים.
על ידי אינטגרטי אינמון פירושו שאני נתונים מגיע משונה
פלטפורמות, מערכות ומיקומים משולבים ומאוחסנים ב
המקום היחיד. כתוצאה מכך נתונים דומה צריך להפוך
בפורמטים עקביים שיש להוסיף ולהשוות
בְּקַלוּת.
למשל מין הגבר והנקבה מיוצגים
באותיות M ו- F במערכת אחת, ועם 1 ו- 0 במערכת אחרת. ל
לשלב אותם בצורה הנכונה, על פורמט אחד או שניהם להיות חייבים
להפוך כך ששני הפורמטים שווים. בזה
במקרה שנוכל לשנות את M ל- 1 ו- F ל- 0 או להיפך. מכוונת ל
נושא ומשלב מצביעים על כך שה מחסן נתונים מיועד ל
לספק ראייה פונקציונאלית ורוחבית של נתונים בַּצַד
חברה.
לא נדיף פירושו שאני נתונים Nel מחסן נתונים רימנגונו
עקבי ועדכון של נתונים זה לא נחוץ. במקום זאת, כל אחד
שינוי ב נתונים מסמכים מקוריים מתווספים אל מסד נתונים דל נתונים
מַחסָן. משמעות הדבר היא כי ההיסטוריון של נתונים כלול ב
מחסן נתונים.
עבור משתנים לאורך זמן אינמון מציין כי אני נתונים Nel מחסן נתונים
תמיד מכילים סמני זמן ו- i נתונים בדרך כלל
הם חוצים אופק זמן מסוים. לדוגמא א
מחסן נתונים יכול להכיל 5 שנים של ערכים היסטוריים של לקוחות דאל
1993 עד 1997. זמינותו של ההיסטוריון וסדרת זמנים
של נתונים מאפשר לך לנתח מגמות.
Un מחסן נתונים הוא יכול לאסוף את שלו נתונים ממערכות
OLTP; ממקורות נתונים חיצוני לארגון ו / או על ידי מומחים אחרים
לכידת פרויקטים של מערכת נתונים.
I נתונים תמציות יכולות לעבור תהליך ניקוי, בתוך
המקרה הזה אני נתונים הם הופכים ומשולבים לפני שהם
מאוחסן ב מסד נתונים דל מחסן נתונים. ואז אני נתונים
מתגוררים בתוך מסד נתונים דל מחסן נתונים מוגשים
כניסות למשתמשי קצה וכלי שחזור. באמצעות
כלים אלה המשתמש הקצה יכול לגשת לתצוגה המשולבת
של ארגון נתונים.
I נתונים מתגוררים בתוך מסד נתונים דל מחסן נתונים סונו
מאוחסנים בפירוט ובתבניות סיכום.
רמת הסיכום עשויה להיות תלויה באופי ה - נתונים. אני נתונים
מפורט עשוי לכלול נתונים הנוכחי ו נתונים היסטוריונים
I נתונים אמיתיים אינם כלולים ב מחסן נתונים עד שאני נתונים
Nel מחסן נתונים מתרעננים.
בנוסף לאחסון i נתונים עצמם, א מחסן נתונים יכול גם
לאחסן סוג אחר של נתתי נקרא METADATA אשר
לתאר אני נתונים מתגורר בשלו מסד נתונים.
ישנם שני סוגים של מטא נתונים: מטא נתונים פיתוח ו-
אָנָלִיזָה.
מטא נתונים של פיתוח משמשים לניהול ואוטומציה
תהליכי מיצוי, ניקוי, מיפוי וטעינה של נתונים Nel
מחסן נתונים.
המידע הכלול במטא נתונים של פיתוח עשוי להכיל
פרטי מערכות הפעלה, פרטי האלמנטים שיש לחלץ,
modello נתונים דל מחסן נתונים וכללי תאגיד עבור
המרה של נתונים.
הסוג השני של מטה-נתונים, המכונה מטה-נתונים
מאפשר למשתמש הקצה לחקור את תוכן הנתונים
מחסן למצוא את נתונים זמין ומשמעותם במונחים
ברור ולא טכני.
לכן מטא נתונים של ניתוח מתפקדים כגשר בין הנתונים
יישומי מחסן ומשתמשי קצה. מטא נתונים אלה יכולים
מכילים את המודל העסקי, תיאורים של נתונים כתבים
למודל העסקי, לשאילתות ולדוחות שהוגדרו מראש,
מידע עבור כניסות משתמשים ואינדקס.
יש לשלב את מטא הנתונים של ניתוח ופיתוח לאחד
מטא נתונים של כליאה משולבים לעבוד כראוי.
לרוע המזל, לרבים מהכלים הקיימים יש משלהם
מטא נתונים וכרגע אין סטנדרטים קיימים ש
לאפשר לכלי אחסון נתונים לשלב אותם
מטא נתונים. כדי לתקן את המצב הזה סוחרים רבים של
הכלים העיקריים לאחסון נתונים יצרו Meta Data
מועצה שהפכה מאוחר יותר לקואליציית מטא נתונים.
מטרת הקואליציה הזו היא לבנות מערך מטא-נתונים
תקן המאפשר כלי אחסון נתונים שונים של
להמיר מטא נתונים
מאמציהם הביאו להולדת המטא
מפרט חילופי נתונים (MDIS) שיאפשר את ההחלפה
מידע בין ארכיונים של מיקרוסופט לקבצי MDIS קשורים.
קיומו של נתונים הן נותנות מסוכמות / מוספות ומפורטות
למשתמש האפשרות לבצע DRILL DROWN
(קידוחים) יאללה נתונים באינדקס לפרטים ולהיפך.
קיומו של נתונים היסטוריות מפורטות מאפשרות ליצור
ניתוח מגמות לאורך זמן. בנוסף המטא נתונים לניתוח יכולים
לשמש כספרייה של ה- מסד נתונים דל מחסן נתונים עבור
לעזור למשתמשי הקצה לאתר את i נתונים נחוץ.
בהשוואה למערכות OLTP, עם יכולתן לתמוך
ניתוח של נתונים ודיווח, ה מחסן נתונים זה נתפס כמערכת
מתאים יותר לתהליכי מידע כגון ביצוע e
לענות על שאילתות ולהפיק דוחות. החלק הבא
ידגיש את ההבדלים בין שתי המערכות בפירוט.
מחסן נתונים נגד מערכות OLTP
רבות ממערכות המידע בארגונים
הם נועדו לתמוך בפעילות השוטפת. אלה
מערכות המכונות OLTP SYSTEMS, לכידת עסקאות
מתעדכן ברציפות כל יום.
I נתונים במערכות אלה הם משתנים לעתים קרובות, מוסיפים או
נמחק. למשל כתובת לקוח רק משתנה
הוא עובר ממקום למקום אחר. במקרה זה הכתובת החדשה
יירשם על ידי שינוי שדה הכתובת של מסד נתונים.
המטרה העיקרית של מערכות אלה היא להפחית את העלויות של
עסקאות ובמקביל להפחית את זמני העיבוד.
דוגמאות למערכות OLTP כוללות פעולות קריטיות כגון כתיבה
חשבונאות של הזמנות, שכר עבודה, חשבוניות, ייצור, שירותי איי לקוחות.
בשונה ממערכות OLTP, שנבנו לתהליכים
בהתבסס על עסקאות ואירועים, כלומר מחסן נתונים נוצרו
לספק תמיכה בתהליכים מבוססי ניתוח של נתונים ועל
תהליכי החלטה.
זה מושג בדרך כלל על ידי שילוב i נתונים ממערכות שונות
OLTP וחיצוני ב"מכולה "אחת של נתונים,כפי שנדון
בסעיף הקודם.
מודל תהליך אחסון נתונים מונאש
מודל התהליך עבור מחסן נתונים Monash פותחה על ידי ה
חוקרים מקבוצת המחקר DSS של מונש, מבוססים על
ספרות של מחסן נתונים, על הניסיון בתמיכה ב
פיתוח שדות מערכות, בדיונים עם ספקים של
יישומים לשימוש ב מחסן נתונים, על קבוצת מומחים
בשימוש ב מחסן נתונים.
השלבים הם: ייזום, תכנון, פיתוח, תפעול ו
הסברים. התרשים מסביר את האופי האיטרטיבי o
התפתחות אבולוציונית של א מחסן נתונים תהליך באמצעות
חצים דו כיווניים המוצבים בין השלבים השונים. בזה
ההקשר "איטרטיבי" ו"אבולוציוני "פירושו שלכל אחד מהם
בשלב התהליך, ניתן לבצע פעילויות יישום
תמיד מתפשט חזרה לשלב הקודם. זה
בשל אופי הפרויקט של א מחסן נתונים שבו
בקשות נוספות מהחלק משתלטות בכל עת
משתמש קצה. לדוגמא, בשלב הפיתוח של א
תהליך של מחסן נתונים, אחד נדרש על ידי משתמש הקצה
ממד או אזור נושא חדש, שלא נוגע ל
תוכנית מקורית, יש להוסיף זאת למערכת. זֶה
גורם לשינוי בפרויקט. התוצאה היא שה-
על העיצוב לשנות את דרישות המסמכים שנוצרו עד כה
בשלב התכנון. במקרים רבים, המצב הנוכחי של
הפרויקט חייב לחזור לשלב התכנון שבו
יש להוסיף ולתעד את הבקשה החדשה. המשתמש
final צריך להיות מסוגל לראות את התיעוד הספציפי המתוקן ו
שינויים שבוצעו בשלב הפיתוח. בסוף
במהלך מחזור פיתוח זה על הפרויקט לקבל משוב מצוין
שני הצוותים, צוות הפיתוח וצוות המשתמשים. ה
לאחר מכן נעשה שימוש חוזר במשוב כדי לשפר פרויקט עתידי.
תכנון קיבולת
DWs נוטים להיות גדולים מאוד לגדול ולצמוח
במהירות רבה (Best 1995, Rudin 1997a) בעקבות
כמות של נתונים היסטוריונים שהם שומרים משנות חייהם. שם
צמיחה יכולה להיגרם גם על ידי נתונים נוסף הנדרש על ידי
משתמשים כדי להגדיל את הערך של נתונים שכבר יש להם. שֶׁל
בהתאם, דרישות האחסון עבור נתונים פחית
להיות משופר באופן משמעותי (Eckerson 1997). ככה זה
חיוני להבטחה, ביצוע תכנון של
יכולת, שהמערכת שתיבנה תוכל לצמוח איתה
צרכים הולכים וגדלים (Best 1995, LaPlante 1996, Lang 1997,
אקרסון 1997, רודין 1997 א ', פולי 1997 א).
בתכנון למדרגיות dw, יש לדעת את
צמיחה צפויה בגודל המחסן, סוגי השאלות
ככל הנראה יבוצע, ומספר משתמשי הקצה הנתמכים (הטוב ביותר
1995, רודין 1997 ב ', פולי 1997 א). בנה יישומים ניתנים להרחבה
דורש שילוב של טכנולוגיות שרת ניתנות להרחבה וטכניות
תכנון יישומים מדרגי (Best 1995, Rudin 1997b.
שניהם נדרשים ביצירת יישום
מדרגי במיוחד. טכנולוגיות שרת ניתנות להרחבה יכולות
לעשות את זה קל ורווחי להוסיף אחסון, זיכרון ו
מעבד ללא ביצועים משפילים (לאנג 1997, טלפוניה 1997).
ישנן שתי טכנולוגיות שרת ניתנות להרחבה: חישוב
מכפיל סימטרי (SMP) ועיבוד מסיבי
מקבילית (MPP)) (IDC 1997, Humphries et al. 1999). שרת אחד
ל- SMP יש בדרך כלל מספר מעבדים שמשתפים זיכרון,
מערכת אוטובוסים ומשאבים אחרים (IDC 1997, Humphries et al. 1999).
ניתן להוסיף מעבדים נוספים להגדלתם
לה סואה Potenza חישובי. שיטה נוספת להגדלת ה
Potenza חישובי של שרת SMP, אתה משלב מספר
מכונות SMP. טכניקה זו מכונה אשכולות (האמפריז
ואח '. 1999). לעומת זאת, בשרת MPP יש מספר מעבדים כל אחד
עם זיכרון משלו, מערכת אוטובוסים ומשאבים אחרים (IDC 1997,
המפריס ואח '. 1999). כל מעבד נקרא צומת. א
גידול ב Potenza ניתן להשיג חישוב
הוספת צמתים נוספים לשרתי MPP (Humphries et al.
1999).
חולשה של שרתי SMP היא שיותר מדי פעולות קלט-פלט
(קלט / פלט) יכול לפקוק את מערכת האוטובוסים (IDC 1997). זֶה
הבעיה אינה מתרחשת בשרתי MPP מאז כל אחד מהם
למעבד מערכת אוטובוסים משלו. עם זאת, הקשרים ההדדיים
בין כל צומת הם בדרך כלל איטיים בהרבה ממערכת האוטובוסים
של ה- SMP. בנוסף, שרתי MPP יכולים להוסיף שכבה
מורכבות נוספת למפתחי יישומים (IDC
1997). לפיכך, ניתן להשפיע על הבחירה בין שרתי SMP ו- MPP
על ידי גורמים רבים, כולל מורכבות השאלות, הקשר
מחיר / ביצועים, יכולת העיבוד הנדרשת,
יישומי dw נמנעו והגידול בגודל מסד נתונים
של dw ובמספר משתמשי הקצה.
טכניקות רבות לעיצוב יישומים מדרגיים
ניתן להשתמש בהם בתכנון קיבולת. אחד
משתמש בתקופות הודעה שונות כגון ימים, שבועות, חודשים ושנים.
לאחר תקופות הודעה שונות, מסד נתונים יכול להתחלק ל
חתיכות מקובצות בניהול (Inmon et al. 1997). עוד אחד
הטכניקה היא להשתמש בטבלאות סיכום הבנויות
סיכום נתונים da נתונים מְפוֹרָט. לפיכך, אני נתונים סיכומים הם יותר
קומפקטי ממפורט, מה שדורש פחות מקום בזיכרון.
אז ה נתונים ניתן לאחסן פרטים ביחידה של
אחסון זול יותר, מה שחוסך עוד יותר אחסון.
למרות ששימוש בטבלאות סיכום יכול לחסוך מקום ב-
זיכרון, הם דורשים מאמץ רב כדי לעדכן אותם ולהיכנס אליהם
בהתאם לצרכים המסחריים. עם זאת, טכניקה זו היא
בשימוש נרחב ומשמש לעתים קרובות בשילוב עם הטכניקה
הקודם (Best 1995, Inmon 1996a, Chauduri and Dayal
1997).
מגדיר מחסן נתונים טכני
ארכיטקטורות הגדרת טכניקות
אדריכלות מאת dw
המאמצים הראשוניים של אחסון נתונים נוצרו בעיקר
יישום מרכזי של dw שבו הכל נתונים, כולל
i נתונים חיצוני, שולבו באחד,
מאגר פיזי (Inmon 1996a, Bresnahan 1996, Peacock 1998).
היתרון העיקרי בגישה זו הוא שמשתמשי הקצה
אני מסוגל לגשת לתצוגה בקנה מידה יזמי
(מבט כולל על הארגון) של נתונים ארגוני (Ovum 1998). אַחֵר
היתרון הוא שהוא מציע סטנדרטיזציה של נתונים דרך
הארגון, כלומר יש רק גרסה אחת או
הגדרה לכל מינוח המשמש במאגר dw
מטא נתונים (reposity) (Flanagan and Safdie 1997, Ovum 1998). ה
לעומת זאת החיסרון בגישה זו הוא שהיא יקרה וקשה
להיבנות (Flanagan and Safdie 1997, Ovum 1998, Inmon et al.
1998). זמן לא רב אחרי ארכיטקטורת האחסון נתונים
ריכוזית הפכה פופולרית, מושג החילוץ התפתח
מקבוצות המשנה הקטנות יותר של נתונים כדי לתמוך בצרכים של
יישומים ספציפיים (ורני 1996, IDC 1997, ברסון וסמית '
1997, טווס 1998). מערכות קטנות אלה נגזרות מיותר
גדול מחסן נתונים מְרוּכָּז. הם נקראים תאריך
מחסני מחלקה תלויים או הצעדות נתונים תלויות.
ארכיטקטורת הנתונים המותאמת מכונה
ארכיטקטורה בת שלוש שכבות בה השורה הראשונה מורכבת מהתאריך
מחסן מרכזי, השני מורכב ממחסני נתונים
המחלקה והשלישית מורכבת מגישה אל נתונים והכלים של
ניתוח (Demarest 1994, Inmon et al. 1997).
Data March בנויים בדרך כלל לאחר ה- מחסן נתונים
ריכוזית נבנתה כדי לענות על הצרכים של
מפרט היחידה (White 1995, Varney 1996).
חנות מארס נתונים i נתונים רלוונטי מאוד ביחס לפרטים
יחידות (Inmon et al. 1997, Inmon et al. 1998, IA 1998).
היתרון בשיטה זו הוא שלא תהיה כזו נתתי לֹא
משולב וכי אני נתונים הם יהיו מיותרים פחות בנתונים
צעדות מאז הכל נתונים מגיעים מהפקדה של נתונים משולב.
יתרון נוסף הוא שיהיו מעט קישורים בין כל אחד מהם
נתונים מרץ ומקורות קשורים של נתונים כי לכל נתונים מארט יש רק
מקור של נתונים. בנוסף עם הארכיטקטורה הזו במקום, משתמשים
סיומות עדיין יכולות לגשת לסקירה הכללית של נתונים
ארגוני ארגוני. שיטה זו ידועה בשם
שיטת מלמעלה למטה, בה נבנים מארטי הנתונים לאחר התאריך
מחסן (טווס 1998, גוף 1998).
הגברת הצורך להציג תוצאות מוקדם, חלקן
ארגונים החלו לבנות צעדים עצמאיים של נתונים
(פלנגן וספדי 1997, לבן 2000). במקרה זה, הנתונים מתעלמים
הם לוקחים את שלהם נתונים ישירות מהיסודות של נתונים OLTP ולא מאז
אחסון מרכזי ומשולב, ובכך מבטל את הצורך
יש את המחסן המרכזי במקום.
כל מידע נתונים דורש קישור אחד לפחות למקורותיו
di נתונים. חסרון שיש מספר קישורים לכל תאריך
mart הוא שלעומת שני הארכיטקטורות הקודמות,
שפע יתר של נתונים עולה משמעותית.
כל נתונים נתונים חייבים לאחסן הכל נתונים נדרש מקומי עבור
אין השפעה על מערכות OLTP. זה גורם ל נתונים
הם מאוחסנים בביצועי נתונים שונים (Inmon et al. 1997).
חסרון נוסף של אדריכלות זו הוא שהיא מובילה ל
יצירת קשרי גומלין מורכבים בין מארטי נתונים לשלהם
מקורות של נתונים שקשה לבצע ולשלוט (Inmon ed
אחרים. 1997).
חסרון נוסף הוא שמשתמשי הקצה אינם יכולים להפעיל כוח
לגשת לסקירת המידע על החברה מאז i נתונים
של מארס הנתונים השונים אינם משולבים (Ovum 1998).
חסרון נוסף הוא שיכול להיות שיש יותר מאחד
הגדרה לכל טרמינולוגיה המשמשת בביצועי הנתונים שהיא מייצרת
חוסר עקביות של נתונים בארגון (Ovum 1998).
למרות החסרונות שנדונו לעיל, נתונים עצמאיים מתבצעים
הם עדיין מושכים עניין של ארגונים רבים (IDC 1997).
גורם אחד שהופך אותם למושכים הוא שהם מהירים יותר להתפתח
ודורשים פחות זמן ומשאבים (Bresnahan 1996, Berson e
סמית '1997, ביצית 1998). כתוצאה מכך הם משרתים בעיקר
כפרויקטים הוכחתיים שניתן להשתמש בהם לזיהוי
במהירות את היתרונות ו / או הפגמים בפרויקט (Parsaye
1995, בראלי 1995, ניוינג 1996). במקרה זה, מן החלק
יישום בפרויקט הפיילוט חייב להיות קטן אך חשוב
לארגון (Newing 1996, Mansell-Lewis 1996).
על ידי בחינת האב-טיפוס, משתמשי הקצה והניהול יכולים
להחליט אם להמשיך או להפסיק את הפרויקט (פלנגן וספדי
1997).
אם ההחלטה היא להמשיך, הנתונים מועברים למגזרים אחרים
הם צריכים להיבנות בזה אחר זה. ישנן שתי אפשרויות עבור
משתמשי קצה בהתבסס על צרכיהם בבניית נתונים
מטבעות עצמאיים: משולבים / מאוחדים ולא משולבים (Ovum
1998)
בשיטה הראשונה, כל בניין נתונים חדש צריך להיבנות
בהתבסס על מדד הנתונים הנוכחי והמודל נתונים בשימוש
מהמשרד (ורני 1996, ברסון וסמית '1997, פיקוק 1998).
הצורך להשתמש במודל נתונים של החברה עושה את זה הכרחי
ודא שיש רק הגדרה אחת לכל טרמינולוגיה
נעשה שימוש באמצעות צעדות נתונים, זה גם כדי לוודא תאריך זה
ניתן להצטרף לצעדות שונות בכדי לתת סקירה של
מידע תאגידי (ברסנהאן 1996). שיטה זו היא
המכונה מלמטה למעלה והוא הטוב ביותר כשיש אילוץ
אמצעים וזמן פיננסיים (Flanagan and Safdie 1997, Ovum 1998,
טווס 1998, גוף 1998). בשיטה השנייה הנתונים מתמזגים
בנוי יכול לענות רק על הצרכים של יחידה ספציפית.
גרסה של שוק הנתונים המאוחד הוא מחסן נתונים מופץ
שבו ה- מסד נתונים תוכנת התיווך של מרכז השרת משמשת להצטרפות לרבים
הפצת נתונים בהפקדה אחת של נתונים מופץ (לבן 1995). ב
המקרה הזה, אני נתונים חברות מופצות בכמה מארטי נתונים.
בקשות של משתמשי קצה מועברות אל מסד נתונים
תוכנת רכזת שרתים, המחלצת הכל נתונים נדרש לפי הנתונים
מריח ומחזיר את התוצאות ליישומי משתמשי הקצה. זֶה
השיטה מספקת מידע עסקי למשתמשי הקצה. למרות זאת,
הבעיות של צעדות הנתונים עדיין לא בוטלו
עצמאי. יש ארכיטקטורה אחרת שניתן להשתמש בה שהיא
נקרא ה מחסן נתונים וירטואלי (White 1995). עם זאת, זה
אדריכלות, המתוארת באיור 2.9, אינה אדריכלות
של אחסון של נתונים אמיתי מכיוון שהוא לא מזיז את העומס
ממערכות OLTP ועד מחסן נתונים (Demarest 1994).
למעשה, הבקשות ל נתונים משתמשי הקצה עברו את
מערכות OLTP שמחזירות תוצאות לאחר עיבוד
בקשות משתמש. למרות שארכיטקטורה זו מאפשרת למשתמשים
להפיק דוחות ולגבש בקשות, לא יכול לספק i
נתונים היסטוריה וסקירה של מידע על החברה מאז i נתונים
ממערכות ה- OLTP השונות אינן משולבות. אז, זה
אדריכלות אינה יכולה לספק את הניתוח של נתונים מורכב איזו מודעה
דוגמת תחזית.
בחירת יישום הגישה ו-
התאוששות של נתונים
מטרת בניית א מחסן נתונים הוא להעביר
מידע למשתמשי קצה (Inmon et al 1997, Poe 1996,
מקפדן 1996, שאנקס ואח '1997, המרגרן 1998); אחד או
יישומי גישה ושחזור מרובים נתונים חייב להיות מסופק. ל
כיום, יש מגוון רחב של יישומים אלה, ביניהם המשתמש יכול
בחר (Hammergren 1998, Humphries et al 1999). ה
יישומים נבחרים קובעים את הצלחת המאמץ
של אחסון של נתונים בארגון כי ה
יישומים הם החלק הגלוי ביותר של מחסן נתונים למשתמש
גמר (Inmon et al 1997, Poe 1996). לדייט מוצלח
המחסן, חייב להיות מסוגל לתמוך בפעילות הניתוח של נתונים
משתמש קצה (פו 1996, סדון ובנג'מין 1998, אקרסון
1999). אז "הרמה" של מה שמשתמש הקצה רוצה צריכה להיות
זוהו (Poe 1996, Mattison 1996, Inmon et al 1997,
האמפריס ואח '1999).
באופן כללי, ניתן לקבץ משתמשי קצה לשלושה
קטגוריות: משתמשים בכירים, אנליסטים עסקיים ומשתמשי כוח (פו
1996, האמפריס ואח '1999). משתמשים במנהלים צריכים
גישה נוחה לקבוצות דוחות מוגדרות מראש (Humphries ed
אחרים 1999). ניתן להשיג קשרים אלה בקלות עם
ניווט בתפריטים (פו 1996). בנוסף, צריך לדווח
להציג מידע באמצעות ייצוג גרפי
כמו טבלאות ותבניות להעברה מהירה
מידע (Humphries et al 1999). אנליסטים עסקיים, שלא
יתכן שיש להם את היכולות הטכניות לבנות מהם מערכות יחסים
אפס בפני עצמם, צריך להיות מסוגל לשנות את היחסים הנוכחיים עבור
לענות על צרכיהם הספציפיים (Poe 1996, Humphries et al
1999). לעומת זאת, משתמשי כוח הם מסוג משתמשי הקצה
יש להם את היכולת ליצור ולכתוב בקשות ודוחות
אפס (Poe 1996, Humphries et al 1999). הם אלה ש
לפתח דוחות עבור סוגים אחרים של משתמשים (פו 1996, האמפריס
ואח '1999).
לאחר שנקבעו דרישות משתמש הקצה יש לעשות זאת
מבחר יישומי גישה ואחזור נתונים בין כולם
אלה זמינים (Poe 1996, Inmon et al 1997).
גישה ל נתונים וכלי אחזור יכולים להיות
מסווג לארבעה סוגים: כלי OLAP, כלי EIS / DSS, כלי שאילתה ו
כלי דיווח וכריית נתונים.
כלי OLAP מאפשרים למשתמשים ליצור שאילתות אד-הוק וכן
אלה שנעשו על מסד נתונים דל מחסן נתונים. בנוסף למוצרים האלה
לאפשר למשתמשים להתעמק מ- נתונים כללי לאלה
מְפוֹרָט.
כלי EIS / DSS מספקים דיווח מנהלים כניתוח "מה אם"
וגישה לדוחות המאורגנים בתפריטים. דיווחים חייבים להיות
מוגדר מראש וממוזג עם תפריטים לצורך ניווט קל יותר.
כלי שאילתה ודיווח מאפשרים למשתמשים להפיק דוחות
מוגדר מראש וספציפי.
משתמשים בכלי כריית נתונים לזיהוי קשרים ש
יכול לשפוך אור חדש על פעולות נשכחות ב נתונים דל
מחסן נתונים.
לצד מיטוב הדרישות של כל סוג משתמש, אני
הכלים שנבחרו חייבים להיות אינטואיטיביים, יעילים וקלים לשימוש.
הם גם צריכים להיות תואמים לחלקים אחרים בארכיטקטורה
מסוגלים לעבוד עם מערכות קיימות. זה גם הציע
בחר בכלי גישה ושליפה לנתונים עם מחירים וביצועים
סביר. קריטריונים אחרים שיש לקחת בחשבון כוללים את המחויבות של
ספק הכלי בתמיכה במוצר שלהם ובפיתוחים שעושים אותו
יהיה לזה במהדורות עתידיות. כדי להבטיח מעורבות משתמשים
בשימוש במחסן הנתונים, צוות הפיתוח כולל את
משתמשים בתהליך בחירת הכלים. במקרה הזה
יש לבצע הערכת משתמשים מעשית.
כדי לשפר את הערך של מחסן הנתונים יכול צוות הפיתוח
מספקים גם גישה לאינטרנט למחסני הנתונים שלהם. א
מחסן נתונים מאופשר באינטרנט מאפשר למשתמשים לגשת נתונים
ממקומות מרוחקים או בזמן נסיעה. גם המידע יכול
להינתן בעלויות נמוכות יותר על ידי הפחתת עלויות
של אימון.
2.4.3 מחסן נתונים שלב המבצע
שלב זה מורכב משלוש פעילויות: הגדרת אסטרטגיות תאריך
רענון, בקרה על פעילויות מחסן נתונים וניהול של
אבטחת מחסן נתונים.
הגדרת אסטרטגיות רענון נתונים
לאחר ההעלאה הראשונית, i נתונים Nel מסד נתונים של מחסן הנתונים
עליהם לרענן מעת לעת כדי להתרבות
שינויים שנעשו בתאריך נתונים מקוריות. לכן יש צורך להחליט
מתי לרענן, באיזו תדירות צריך
לרענן ואיך לרענן את נתונים. מוצע לעשות את
רענון של נתונים כאשר ניתן לקחת את המערכת במצב לא מקוון. שם
קצב הרענון נקבע על ידי צוות הפיתוח הנסמך
על דרישות המשתמש. ישנן שתי גישות לרענון ה-
Datawarehouse: רענון מלא וטעינה רציפה של
שינויים.
הגישה הראשונה, רענון מלא, מחייבת טעינה מחדש של
כל ה נתונים מאפס. זה אומר שכולם נתונים חובה חובה
להיחלץ, לנקות, להפוך ולשלב בכל רענון. זֶה
יש להימנע ככל האפשר מגישה משום
זה לוקח הרבה זמן ומשאבים.
גישה חלופית היא לטעון ברציפות את
שינויים. זה מוסיף i נתונים ששונו
ממחזור הרענון האחרון של מחסן הנתונים. הזיהוי של
רשומות חדשות או שינויים מקטינות משמעותית את כמות
נתונים אשר חייבים להפיץ למחסן הנתונים בכל אחד מהם
עדכן מכיוון שרק אלה נתונים יתווסף ל מסד נתונים
של מחסן הנתונים.
ישנן לפחות 5 גישות בהן ניתן להשתמש כדי לסגת
i נתונים חדש או שונה. להשיג אסטרטגיה יעילה של
רענון של נתונים תערובת של גישות אלה עשויה להיות שימושית
לאסוף את כל השינויים במערכת.
הגישה הראשונה, המשתמשת בחותמות זמן, מניחה שהיא מגיעה
מוקצה לכולם נתונים שונה ועדכן חותמת זמן כך
להיות מסוגל לזהות הכל בקלות נתונים שונה וחדש.
גישה זו, לעומת זאת, לא הייתה בשימוש נרחב ברובם
חלק ממערכות ההפעלה של ימינו.
הגישה השנייה היא להשתמש בקובץ דלתא שנוצר על ידי
יישום המכיל רק את השינויים שבוצעו ב- נתונים.
השימוש בקובץ זה מגביר גם את מחזור העדכון.
עם זאת, אפילו בשיטה זו לא נעשה שימוש ברבים
יישומים.
הגישה השלישית היא סריקת קובץ יומן, אשר
הוא מכיל בעצם מידע הדומה לקובץ הדלתא. היחיד
ההבדל הוא כי נוצר קובץ יומן עבור תהליך השחזור
זה יכול להיות קשה להבין.
הגישה הרביעית היא שינוי קוד היישום.
עם זאת רוב קוד היישום הוא ישן ו
שָׁבִיר; לכן יש להימנע מטכניקה זו.
הגישה האחרונה היא להשוות בין נתונים מקורות עם הקובץ
עיקרי של נתונים.
שליטה בפעילות מחסן הנתונים
ברגע שמחסן הנתונים שוחרר למשתמשים, זה כן
הכרחי כדי לפקח על זה לאורך זמן. במקרה זה, מנהל המערכת
של מחסן הנתונים יכול להשתמש בכלי ניהול אחד או יותר e
שליטה לניטור השימוש במחסן הנתונים. באופן מיוחד
ניתן לאסוף מידע על אנשים וזמן
אליהם הם ניגשים למחסן הנתונים. בחייך נתונים נאסף ניתן ליצור
פרופיל של העבודה שבוצעה שיכול לשמש כקלט
ביישום החזר החזר של המשתמש. החזר החזר
מאפשר למשתמשים לקבל מידע על עלות העיבוד
מחסן נתונים.
בנוסף, ניתן להשתמש גם בבקרת מחסן הנתונים
לזהות את סוגי השאילתות, גודלן, מספר השאילתות לכל
יום, זמני תגובה לשאילתות, מגזרים שהושגו וכמות
di נתונים מעובד. מטרה נוספת של ביצוע בדיקת ה-
Datawarehouse הוא לזהות את נתונים שאינם בשימוש. אלה נתונים
ניתן להסיר אותם ממחסן הנתונים כדי לשפר את הזמן
תגובה לביצוע שאילתות ולשלוט בצמיחה של
נתונים השוכנים בתוך ה מאגר מידע של מחסן הנתונים.
ניהול אבטחת מחסן נתונים
מחסן נתונים מכיל נתונים משולב, קריטי, רגיש זה
ניתן להגיע בקלות. מסיבה זו זה צריך
להיות מוגן מפני משתמשים לא מורשים. דרך אחת ל
אבטחת יישום היא להשתמש בפונקציה של DBMS
להקצות הרשאות שונות לסוגים שונים של משתמשים. בזה
דרך, יש לשמור פרופיל לכל סוג משתמשים
גִישָׁה. דרך נוספת לאבטח את מחסן הנתונים היא להצפין אותו
כפי שכתוב ב מאגר מידע של מחסן הנתונים. גישה ל
נתונים וכלי האחזור חייבים לפענח את נתונים לפני הצגת i
תוצאות למשתמשים.
2.4.4 מחסן נתונים שלב הפריסה
זהו השלב האחרון במחזור יישום מחסן הנתונים. ה
הפעילויות המתבצעות בשלב זה כוללות הכשרה של
המשתמשים להשתמש במחסן הנתונים ולבצע ביקורות
של מחסן הנתונים.
הכשרת משתמשים
אימון משתמשים צריך להיעשות תחילה
גישה ל נתונים של מחסן הנתונים והשימוש ב
שְׁלִיפָה. באופן כללי, הפעלות צריכות להתחיל עם
המבוא לתפיסת האחסון של נתונים, כדי
תוכן מחסן הנתונים, למטא נתונים והתכונות הבסיסיות
של כלים. לאחר מכן, משתמשים מתקדמים יותר יוכלו גם ללמוד את
טבלאות פיזיות ותכונות המשתמשים בגישה לנתונים ובכלים של
שְׁלִיפָה.
ישנן גישות רבות להכשרת משתמשים. אחד מ
אלה מספקים מבחר של משתמשים רבים או אנליסטים שנבחרו על ידי
מערך משתמשים, תוך הסתמכות על מנהיגותם וכישוריהם
תִקשׁוֹרֶת. אלה מאומנים בתפקיד אישי ב
כל מה שהם צריכים לדעת כדי להכיר את
מערכת. לאחר ההדרכה הם חוזרים לעבודתם ה
הם מתחילים ללמד משתמשים אחרים כיצד להשתמש במערכת. עַל
על סמך מה שלמדו, משתמשים אחרים יכולים להתחיל
לחקור את מחסן הנתונים.
גישה אחרת היא להכשיר משתמשים רבים באותו
זמן, כאילו אתה עובר קורס בכיתה. השיטה הזאת
זה מתאים כשיש משתמשים רבים שצריכים להכשיר אותם
באותו הזמן. שיטה אחרת היא להתאמן
כל משתמש בנפרד, אחד אחד. שיטה זו היא
מתאים כשיש מעט משתמשים.
מטרת אימון המשתמשים היא להכיר את עצמם
עם גישה אל נתונים וכלי האחזור כמו גם תוכן ה -
מחסן נתונים. עם זאת, חלק מהמשתמשים יכולים להיות המומים
כמות המידע שנמסרה במהלך הפגישה
הַדְרָכָה. אז חייבים לעשות מספר
לעדכן סיוע שוטף למפגשים ולהגיב
לשאלות ספציפיות. בחלק מהמקרים קבוצה של
המשתמשים לספק תמיכה מסוג זה.
איסוף משוב
לאחר שמאגד הנתונים הושק, משתמשים יכולים
השתמש ב- i נתונים מתגוררים במחסן הנתונים למטרות שונות.
בעיקר, אנליסטים או משתמשים משתמשים ב- נתונים Nel
מחסן נתונים עבור:
1 זיהוי מגמות החברה
2 ניתוח פרופילי הרכישה של לקוחות
3 חלקי i לקוחות ו -
4 ספק את השירותים הטובים ביותר ל- לקוחות - התאמה אישית של שירותים
5 ניסוח אסטרטגיות שיווק
6 ערוך הערכות תחרותיות לניתוח עלויות ועזרה
לִשְׁלוֹט
7 תמוך בקבלת החלטות אסטרטגיות
8 זהה הזדמנויות להופיע
9 שפר את איכות התהליכים העסקיים השוטפים
10 בדוק את הרווח
בעקבות כיוון הפיתוח של מחסן הנתונים, הם יכולים
לערוך סדרה של תיקונים למערכת כדי לקבל משוב
הן מצוות הפיתוח והן מהקהילה
משתמשי קצה.
ניתן לקחת בחשבון את התוצאות שהושגו
מחזור הפיתוח הבא.
מכיוון שלמחסן הנתונים יש גישה מצטברת,
חיוני ללמוד מההצלחות והטעויות של הקודמות
התפתחויות.
2.5 סיכום
בפרק זה, הגישות שנמצאו ב
סִפְרוּת. סעיף 1 דן במושג
Datawarehouse ותפקידה במדעי ההחלטות. ב
סעיף 2 תיאר את ההבדלים העיקריים בין
מחסן נתונים ומערכות OLTP. סעיף 3 דן ב
מודל מחסן הנתונים של מונש ששימש
בסעיף 4 לתיאור הפעילויות הכרוכות בתהליך
התפתחות מחסן נתונים, עבודות אלה לא התבססו על
מחקר קפדני. מה שקורה במציאות יכול להיות
שונה מאוד ממה שהספרות מדווחת, אולם אלה
ניתן להשתמש בתוצאות כדי ליצור מטען בסיסי ש
הדגישו את הרעיון של מחסן נתונים למחקר זה.
פרק 3
שיטות מחקר ועיצוב
פרק זה עוסק בשיטות מחקר ועיצוב עבור
מחקר זה. החלק הראשון מציג מבט כללי על השיטות
זמין גם לאחזור מידע
נדון בקריטריונים לבחירת השיטה הטובה ביותר עבור אחת
מחקר מסוים. שתי שיטות נדונות אז בסעיף 2
נבחר עם הקריטריונים המפורטים לעיל; מאלה ייבחר ו
אימצה אחת מהסיבות המפורטות בסעיף 3 היכן שהן
הוצגו גם הסיבות להחרגת הקריטריון האחר. שם
סעיף 4 מציג את פרויקט המחקר ואת סעיף 5 לה
מסקנות.
3.1 מחקר במערכות מידע
מחקר במערכות מידע אינו מוגבל לפשטות
לתחום הטכנולוגי אך יש להרחיב אותו גם לכלול
מטרות הקשורות להתנהגות וארגון.
אנו חייבים זאת לתזות של תחומים שונים החל מ
מדעי החברה למדעי הטבע; זה מוביל לצורך ב-
ספקטרום מסוים של שיטות מחקר הכוללות שיטות כמותיות
ואיכותי שישמש למערכות מידע.
כל שיטות המחקר הקיימות חשובות, למעשה מגוונות
חוקרים כמו Jenkins (1985), Nunamaker et al. (1991) וגליארס
(1992) טוענים כי אין שיטה ספציפית אוניברסלית
לערוך מחקר בתחומים שונים של מערכות מידע; אכן
שיטה עשויה להתאים לחיפוש מסוים אך לא
בשביל אחרים. זה מוביל אותנו לצורך בבחירת שיטה אשר
מתאים לפרויקט המחקר הספציפי שלנו: לשם כך
בחירה Benbasat et al. (1987) קובעים שיש להתחשב בהם
אופי ומטרת המחקר.
3.1.1 אופי המחקר
שיטות שונות המבוססות על אופי המחקר יכולות להיות
מסווג לשלוש מסורות ידועות במדע
מידע: מחקר פוזיטיביסטי, פרשני וביקורתי.
3.1.1.1 מחקר פוזיטיביסטי
מחקר פוזיטיביסטי מכונה גם מחקר מדעי או
אֶמפִּירִי. זה מנסה: "להסביר ולחזות מה יקרה ב
עולם חברתי המתבונן בסדירות וביחסי סיבה ותוצאה
בין מרכיביה המרכיבים "(Shanks et al 1993).
המחקר הפוזיטיביסט מאופיין גם בהישנות חוזרת,
פשטות והפרכות. יתר על כן מודה במחקר פוזיטיביסטי
קיומם של יחסים אפריוריים בין התופעות הנחקרות.
לפי Galliers (1992) טקסונומיה היא שיטת מחקר
כלול בפרדיגמה הפוזיטיביסטית, אשר עם זאת אינה מוגבלת לכך,
למעשה ישנם ניסויים במעבדה, ניסויים בשטח,
מחקרי מקרה, הוכחות משפט, חיזויים וסימולציות.
באמצעות שיטות אלה החוקרים מודים כי התופעות
ניתן ללמוד באופן אובייקטיבי וקפדני.
3.1.1.2 מחקר פרשני
מחקר פרשני, שלרוב מכונה פנומנולוגיה או
האנטי-פוזיטיביזם מתואר על ידי נוימן (1994) כ"ניתוח
שיטתי של המשמעות החברתית של פעולה באמצעות ה ישיר
תצפית מפורטת על אנשים במצבים טבעיים לפי הסדר
להגיע להבנה ולפרשנות כיצד
אנשים יוצרים ומתחזקים את עולמם החברתי ". לימודים
פרשנית דוחה את ההנחה שהתופעות הנצפות
ניתן לצפות בצורה אובייקטיבית. אכן הם מבוססים
על פרשנויות סובייקטיביות. יתר על כן, חוקרים פרשניים לא
הם מטילים משמעויות אפריוריות על התופעות שהם חוקרים.
שיטה זו כוללת מחקרים סובייקטיביים / ויכוחים, פעולות של
מחקר, מחקרים תיאוריים / פרשניים, מחקר עתידי ומשחקים של
תַפְקִיד. בנוסף לסקרים אלו ולימודי מקרה יכולים להיות
כלולים בגישה זו כיוון שהם נוגעים למחקרים על
אנשים או ארגונים במצבים מורכבים
של העולם האמיתי.
3.1.1.3 מחקר קריטי
מחקר ביקורתי הוא הגישה הפחות מוכרת במדעים
חברתית אך לאחרונה קיבלה את תשומת לבם של החוקרים
בתחום מערכות המידע. ההנחה הפילוסופית כי
המציאות החברתית מיוצרת ומשוחזרת היסטורית על ידי אנשים,
כמו גם מערכות חברתיות עם פעולותיהן ואינטראקציות ביניהן. שֶׁלָהֶם
עם זאת, מיומנות מתווכת על ידי מספר שיקולים
חברתית, תרבותית ופוליטית.
כמו גם מחקר פרשני, מחקר ביקורתי טוען כי
למחקר פוזיטיביסטי אין שום קשר לקונטקסט החברתי ומתעלם מה-
השפעתה על מעשי האדם.
מחקר ביקורתי, לעומת זאת, מותח ביקורת על מחקר פרשני עבור
להיות סובייקטיבי מדי ומכיוון שהוא לא מכוון לעזור
אנשים כדי לשפר את חייהם. ההבדל הגדול ביותר בין
המחקר הביקורתי ושתי הגישות האחרות הוא המימד ההערכתי שלו.
בעוד שהאובייקטיביות של המסורות הפוזיטיביסטיות והפרשניות נועדה
לחזות או להסביר את המצב הקיים או את המציאות החברתית, מחקר ביקורתי
מטרתו להעריך באופן ביקורתי ולהפוך את המציאות החברתית להלן
אולפן.
חוקרים ביקורתיים בדרך כלל מתנגדים לסטטוס קוו על מנת
להסיר הבדלים חברתיים ולשפר את התנאים החברתיים. שם
למחקר ביקורתי יש מחויבות לראייה פרוצדוראלית של
תופעות מעניינות ולכן הן בדרך כלל אורכיות.
דוגמאות לשיטות מחקר הן מחקרים היסטוריים ארוכי טווח ו
מחקרים אתנוגרפיים. מחקר ביקורתי, לעומת זאת, לא היה
נמצא בשימוש נרחב במחקר מערכות מידע
3.1.2 מטרת המחקר
יחד עם אופי המחקר ניתן להשתמש במטרתו
להנחות את החוקר בבחירת שיטה מסוימת
מחקר. מטרת פרויקט מחקר קשורה קשר הדוק
מיקום החיפוש ביחס למחזור החיפוש המורכב מ
שלושה שלבים: בניית התיאוריה, מבחן התיאוריה ועידון ה
תֵאוֹרִיָה. לפיכך, בהסתמך על הרגע ביחס למחזור המחקר, א
לפרויקט המחקר יכול להיות מטרה הסברתית, תיאורית
חקר או ניבוי.
3.1.2.1 מחקר חקרני
מחקר חקר מכוון לחקירת נושא
חדשים לגמרי ומנסחים שאלות והשערות למחקר
עתיד. סוג זה של מחקר משמש לבניית ה-
תיאוריה להשגת אזכורים ראשוניים באזור חדש.
בדרך כלל משתמשים בשיטות מחקר איכותניות, כגון מקרים
לימודים או מחקרים פנומנולוגיים.
עם זאת, ניתן גם להשתמש בטכניקות כמותיות כגון
חקירות חקר או ניסויים.
3.1.3.3 מחקר תיאורי
מחקר תיאורי מכוון לניתוח ותיאור נהדר
לפרט מצב או פרקטיקה ארגונית מסוימת. זֶה
הוא מתאים לבניית תיאוריות וניתן להשתמש בו גם ל
לאשר או לערער על השערות. מחקר תיאורי בדרך כלל
כולל שימוש במדידות ובדגימות. שיטות המחקר המתאימות ביותר
הם כוללים חקירה וניתוח רקע.
3.1.2.3 מחקר הסברתי
מחקר הסברתי מנסה להסביר מדוע הדברים קורים.
הוא בנוי על עובדות שכבר נחקרו ומנסה למצוא
הסיבות לעובדות אלה.
לכן מחקר הסבר בנוי בדרך כלל על מחקר
חקרני או תיאורי והוא נלווה על מנת לבדוק ולשכלל
התיאוריות. מחקרי הסבר משתמשים בדרך כלל במחקרי מקרה
o שיטות מחקר מבוססות סקר.
3.1.2.4 מחקר מונע
מחקר מונע מטרתו לחזות אירועים והתנהגויות
בתצפית שהם נחקרים (מרשל ורוסמן
1995). חיזוי הוא המבחן המדעי הסטנדרטי של האמת.
סוג זה של מחקר בדרך כלל משתמש בחקירה או ניתוח
נתונים היסטוריונים. (יין 1989)
הדיון לעיל מראה כי ישנם מספר
שיטות מחקר אפשריות שניתן להשתמש בהן במחקר
מיוחד. עם זאת, חייבת להיות שיטה ספציפית שמתאימה יותר
אחרים לסוג מסוים של פרויקט מחקר. (Galliers
1987, יין 1989, דה ואוס 1991). לכן, לכל חוקר יש
צריך להעריך היטב את נקודות החוזק והחולשה של
שיטות שונות, על מנת לאמץ את שיטת המחקר המתאימה ביותר ה
תואם לפרויקט המחקר. (ג'נקינס 1985, פרבן וקלאס
1992, בונומיה 1985, יין 1989, הימילטון ואיבס 1992).
3.2. שיטות מחקר אפשריות
מטרת פרויקט זה הייתה ללמוד את החוויה ב
ארגונים אוסטרליים עם i נתונים מאוחסן עם אחד
פיתוח של מחסן נתונים. דאטו אשר, כרגע, יש אחד
היעדר מחקר בתחום אחסון נתונים באוסטרליה,
פרויקט מחקר זה נמצא עדיין בשלב התיאורטי של המחזור
מחקר ויש לו מטרת חקר. חקר החוויה ב
ארגונים אוסטרליים המאמצים אחסון נתונים
זה דורש פרשנות של החברה האמיתית. כתוצאה מכך,
ההנחה הפילוסופית העומדת בבסיס פרויקט המחקר נובעת מכך
הפרשנות המסורתית.
לאחר סקירה קפדנית של השיטות הקיימות, הן זוהו
שתי שיטות מחקר אפשריות: סקרים ומחקרי מקרה
(מחקרי מקרה), בהם ניתן להשתמש למחקר
חקרני (Shanks et al. 1993). Galliers (1992) טוען זאת
התאמתן של שתי שיטות אלה למחקר ספציפי זה
הטקסונומיה שלו חזרה ואמרה שהם מתאימים לבנייה
תֵאוֹרֵטִי. שני סעיפי המשנה הבאים דנים בכל שיטה ב
פרט.
3.2.1 שיטת מחקר חקירה
שיטת מחקר החקירה מגיעה מהשיטה העתיקה של
מִפקָד. מפקד אוכלוסין מורכב מאיסוף מידע מ
אוכלוסייה שלמה. שיטה זו היא יקרה ולא מעשית, בתוך
במיוחד אם האוכלוסייה גדולה. אז, בהשוואה ל
מפקד, סקר מתמקד בדרך כלל ב
לאסוף מידע עבור מספר קטן, או מדגם, של ה-
נציגי האוכלוסייה (Fowler 1988, Neuman 1994). א
מדגם משקף את האוכלוסייה ממנה הוא נמשך, עם שונה
רמות הדיוק, על פי מבנה המדגם,
גודל ושיטת הבחירה הנהוגה (Fowler 1988, Babbie
1982, נוימן 1994).
שיטת הסקר מוגדרת כ"תמונות של פרקטיקות,
מצבים או השקפות בנקודת זמן מסוימת, המתבצעת באמצעות
שאלונים או ראיונות, שמהם ניתן להגיע למסקנות
עשה "(Galliers 1992: 153) [תמונת מצב של הקבצים,
מצבים או השקפות בנקודת זמן מסוימת, המתבצעת באמצעות
שאלונים או ראיונות, שמהם ניתן להסיק]. ה
סקרים עוסקים באיסוף מידע על היבטים מסוימים
של המחקר, על ידי מספר משתתפים, ביצוע
שאלות (פאולר 1988). אפילו שאלונים וראיונות אלה, אשר
לכלול ראיונות טלפוניים פנים אל פנים וראיונות מובנים,
הם טכניקות האיסוף של נתונים הנפוץ ביותר בשימוש ב
חקירות (Blalock 1970, נחמיאס ונחמיאס 1976, פאולר
1988), ניתן להשתמש בתצפיות וניתוחים (גייבל
1994). מכל שיטות האיסוף הללו של נתונים, השימוש ב-
שאלון הוא הטכניקה הפופולרית ביותר, מכיוון שהוא מבטיח כי אני נתונים
נאספים בנויים ומעוצבים, וכך מאפשרים את
סיווג מידע (Hwang 1987, de Vaus 1991).
בניתוח ה נתונים, אסטרטגיית חקירה משתמשת לעתים קרובות
טכניקות כמותיות, כגון ניתוח סטטיסטי, אך הן יכולות להיות
נעשה שימוש בטכניקות איכותיות (Galliers 1992, Pervan
וקלאס 1992, גייבל 1994). בדרך כלל, אני נתונים נאספים הם
משמש לניתוח הפצות ומודלים של שיוך
(פאולר 1988).
למרות שסקרים בדרך כלל מתאימים למחקר
עוסק בשאלה 'מה?' (מה) או ממנו
כתוצאה מכך, 'קוונטית' (כמה) ו'כמות '(כמה), esse
ניתן לשאול באמצעות השאלה 'מדוע' (Sonquist ו-
דונקלברג 1977, יין 1989). לדברי סונקוויסט ודונקלברג
(1977), חקירת המחקר מצביעה על השערות קשות, תוכנית של
הערכה, תיאור האוכלוסייה ופיתוח מודלים של
התנהגות אנושית. כמו כן, ניתן להשתמש בסקרים
ללמוד דעה מסוימת על האוכלוסייה, התנאים,
דעות עבר, מאפיינים, ציפיות ואפילו התנהגויות
או בהווה (Neuman 1994).
החקירות מאפשרות לחוקר לגלות את היחסים בין
האוכלוסייה והתוצאות בדרך כלל כלליות יותר מאשר
שיטות אחרות (Sonquist and Dunkelberg 1977, Gable 1994). ה
סקרים מאפשרים לחוקרים להתייחס לאזור גיאוגרפי
רחב יותר ולהגיע לנרשמים רבים (בלוק 1970,
Sonquist and Dunkelberg 1977, Hwang and Lin 1987, גייבל 1994,
נוימן 1994). לבסוף, סקרים יכולים לספק את המידע
שאינם זמינים במקום אחר או בצורה הנדרשת לניתוח
(פאולר 1988).
עם זאת, קיימות מגבלות בביצוע חקירה. אחד
החיסרון הוא שהחוקר אינו יכול לקבל מידע רב
על האובייקט שנחקר. זאת בשל העובדה כי
חקירות מתבצעות רק בזמן מסוים, ולכן
יש מספר מוגבל של משתנים ואנשים שהחוקר יכול
מחקר (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998).
חסרון נוסף הוא מה ביצוע סקר יכול להיות
יקר מאוד מבחינת זמן ומשאבים, במיוחד אם
כרוך בראיונות פנים אל פנים (פאולר 1988).
3.2.2. שיטת מחקר חקירה
שיטת מחקר החקירה כוללת לימוד מעמיק על
מצב מסוים בהקשר האמיתי שלו בא
פרק זמן מוגדר, ללא כל התערבות מצד
חוקר (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985).
בעיקר משתמשים בשיטה זו לתיאור היחסים בין
המשתנים הנלמדים במצב מסוים
(Galliers 1992). חקירות עשויות לכלול מקרים בודדים או
תלוי בתופעה שניתחה (פרנץ ורובי 1987,
אייזנהרדט 1989, יין 1989).
שיטת חקירת החקירה מכונה "חקירה
מחקר אמפירי החוקר תופעה עכשווית בתוך
ההקשר האמיתי שלו, תוך שימוש במקורות מרובים שנאספו מאחד או
ישויות מרובות כגון אנשים, קבוצות או ארגונים "(יין 1989).
אין הפרדה ברורה בין התופעה להקשר שלה ה
אין שליטה ניסיונית או מניפולציה של המשתנים (יין
1989, Benbasat et al 1987).
יש מגוון טכניקות לאיסוף נתונים שהם יכולים
להיות מועסקים בשיטת החקירה, הכוללת את
תצפיות ישירות, ביקורות על רשומות הארכיון, שאלונים,
סקירת תיעוד וראיונות מובנים. שיש
מגוון מגוון של טכניקות איסוף נתונים, הבירורים
לאפשר לחוקרים להתמודד עם שניהם נתונים איכותי זה
כמותית בעת ובעונה אחת (בונומה 1985, אייזנהרדט 1989, יין
1989, גייבל 1994). כמו שקורה בשיטת הסקר, א
חוקר חוקר פועל כצופה או חוקר ולא
כמשתתף פעיל בארגון הנחקר.
Benbasat et al. (1987) טוענים כי שיטת החקירה היא
מתאים במיוחד לבניית תיאוריית המחקר, אשר
זה מתחיל בשאלת מחקר וממשיך בהדרכה
של תיאוריה במהלך תהליך האיסוף נתונים. להיות
מתאים גם לבמה
של תורת הבנייה, פרנץ ורובי (1987) מציעים זאת
ניתן להשתמש בשיטת החקירה גם למתחם
שלב התיאוריה. במקרה זה, על סמך הראיות שנאספו, אחת
תיאוריה או השערה נתונה מאומתת או מופרכת. בנוסף, החקירה היא
מתאים גם למחקר העוסק בשאלות 'כמו' או
'למה' (יין 1989).
בהשוואה לשיטות אחרות, חקירות מאפשרות לחוקר
תפוס מידע חיוני בפירוט רב יותר (Galliers
1992, Shanks et al. 1993). בנוסף, החקירות מאפשרות
חוקר כדי להבין את טיבם ומורכבותם של התהליכים הנחקרים
(Benbasat et al 1987).
ישנם ארבעה חסרונות עיקריים הקשורים לשיטה
חֲקִירָה. הראשון הוא היעדר ניכויים מבוקרים. שם
הסובייקטיביות של החוקר יכולה להטות את התוצאות והמסקנות
של המחקר (יין 1989). החיסרון השני הוא היעדר
תצפית מבוקרת. בשונה משיטות ניסיוניות, ה
חוקר חוקר אינו יכול לשלוט בתופעות שנחקרו
מכיוון שהם נבחנים בהקשרם הטבעי (גייבל 1994). ה
החיסרון השלישי הוא היעדר שכפול. זה נובע מהעובדה
שלא סביר שהחוקר יצפה באותם אירועים, למשל
אינו יכול לאמת את תוצאות מחקר מסוים (Lee 1989).
לבסוף, כתוצאה מאי-שכפול, זה קשה
להכליל את התוצאות שהתקבלו מחקירה אחת או יותר (Galliers
1992, Shanks et al. 1993). אולם כל הבעיות הללו נכשלות
אינם ניתנים להתגברות וניתן למעשה למזער אותם באמצעות
חוקר מיישם פעולות מתאימות (Lee 1989).
3.3. נימק את מתודולוגיית המחקר
מְאוּמָץ
משתי שיטות המחקר האפשריות למחקר זה,
הסקר נחשב המתאים ביותר. זה של חקירה הוא
הושלך בעקבות התייחסות מדוקדקת של קרוב המשפחה
מעלות וחולשות. הנוחות או אי ההתאמה של כל אחד מהם
להלן נדון בשיטה למחקר זה.
3.3.1. שיטת מחקר בלתי הולמת
של חקירה
שיטת החקירה דורשת מחקר מעמיק על אחת מהן
מצב מסוים בתוך ארגון אחד או יותר עבור א
פרק זמן (אייזנהרדט 1989). במקרה זה, התקופה יכולה
יחרוג ממסגרת הזמן שניתנה למחקר זה. אַחֵר
הסיבה לאי אימוץ שיטת החקירה היא שהתוצאות
הם יכולים לסבול מחוסר קפדנות (יין 1989). סובייקטיביות
של החוקר יכול להשפיע על התוצאות והמסקנות. אַחֵר
הסיבה היא ששיטה זו מתאימה יותר למחקר על שאלות
מהסוג 'איך' או 'למה' (יין 1989), בעוד שאלת המחקר
למחקר זה הוא מסוג 'מה'. אחרון חביב
חשוב לציין, שקשה להכליל את התוצאות מ- o בלבד
מעט חקירות (Galliers 1992, Shanks et al. 1993). על בסיס
הרציונל הזה, שיטת מחקר החקירה אינה
נבחר כלא מתאים למחקר זה.
3.3.2. נוחות שיטת המחקר
חֲקִירָה
כאשר מחקר זה נערך, התרגול של אחסון נתונים
זה לא אומץ באופן נרחב על ידי
ארגונים אוסטרליים. אז לא היה הרבה מידע
לגבי יישומם בתוך
ארגונים אוסטרליים. המידע הזמין הגיע
על ידי ארגונים שיישמו נתונים או השתמשו בהם
מַחסָן. במקרה זה, שיטת מחקר הסקר היא הרבה ביותר
מתאים מכיוון שהוא מאפשר להשיג מידע שאינו
זמין במקום אחר או בצורה הנדרשת לניתוח (Fowler 1988).
בנוסף, שיטת מחקר הסקר מאפשרת לחוקר
קבל תובנה טובה בנושאים, מצבים או מצבים
נראה בזמן נתון (Galliers 1992, Denscombe 1998).
התבקש סקירה כללית לתוספת
ידע על החוויה האוסטרלית של אחסון נתונים.
שוב, Sonquist and Dunkelberg (1977) קובעים כי התוצאות של
מחקר הסקר כללי יותר משיטות אחרות.
3.4. תכנון מחקר סקר
החקירה בנושאי אחסון נתונים בוצעה בשנת 1999.

אוכלוסיית היעד כללה ארגונים
אוסטרלים שמעוניינים במחקרי אחסון נתונים, כפי שהם היו
כנראה כבר הודיע על i נתונים שהם מאחסנים,
לכן הוא יכול לספק מידע שימושי למחקר זה. שם
אוכלוסיית היעד זוהתה עם סקר ראשוני של
כל החברים האוסטרלים של 'מכון אחסון הנתונים' (Tdwiaap).
חלק זה דן בתכנון שלב המחקר
ניתוח אמפירי של מחקר זה.
3.4.1. טכניקת איסוף של נתונים
משלוש הטכניקות הנפוצות במחקר הסקר
(כלומר שאלון בדואר, ראיון טלפוני וראיון
אישי) (נחמיאס 1976, פאולר 1988, דה ואוס 1991), פר
מחקר זה אומץ לשאלון בדואר. הראשון
הסיבה לאימוץ האחרונה היא שהיא יכולה להשיג א
אוכלוסייה מפוזרת גיאוגרפית (Blalock 1970, נחמיאס ה
נחמיאס 1976, הוואנג ולין 1987, דה ואוס 1991, גייבל 1994).
שנית, שאלון הדיוור מתאים למשתתפים
משכיל מאוד (פאולר 1988). השאלון בדואר לשם כך
המחקר הופנה לנותני חסות פרויקטים של אחסון נתונים,
מנהלים ו / או מנהלי פרויקטים. שלישית, השאלונים דולקים
דואר מתאים כאשר יש לך רשימה בטוחה של
כתובות (Salant and Dilman 1994). TDWI, במקרה זה, א
איגוד אחסון הנתונים המהימן סיפק את רשימת התפוצה
מחבריה האוסטרלים. יתרון נוסף של השאלון
בדואר ביחס לשאלון הטלפוני או לראיונות
האישי הוא שזה מאפשר לנרשמים להגיב עם יותר
דיוק, במיוחד כאשר הנרשמים צריכים להתייעץ
מתעד או דן בשאלות עם אנשים אחרים (פאולר
1988).
חסרון פוטנציאלי עשוי להיות הזמן שלוקח לו
ערוך שאלונים בדואר. בדרך כלל, שאלון מופעל
דואר מתנהל ברצף זה: שלח מכתבים, המתן להם
עונה ושולח אישור (פאולר 1988, ביינברידג '1989).
לפיכך, הזמן הכולל עשוי להיות ארוך מהזמן הדרוש לו
ראיונות אישיים או ראיונות טלפוניים. אולם, ה
ניתן לדעת זמן כולל מראש (פאולר 1988,
Denscombe 1998). הזמן המושקע בניהול הראיונות
אי אפשר לדעת מראש כי הוא משתנה מ
ראיון עם האחר (פאולר 1988). ראיונות טלפוניים
יכול להיות מהיר יותר משאלוני דיוור ו
אך ראיונות אישיים יכולים להיות בעלי כישלונות גבוהים
תגובה עקב חוסר הזמינות של אנשים מסוימים (Fowler 1988).
בנוסף, ראיונות טלפוניים מוגבלים בדרך כלל לרשימות של
שאלות קצרות יחסית (ביינברידג '1989).
חולשה נוספת של שאלון דואר היא השיעור הגבוה של
חוסר תגובה (Fowler 1988, Bainbridge 1989, Neuman
1994). עם זאת, אמצעי נגד ננקטו על ידי שיוך
מחקר זה עם מוסד מהימן בתחום הנתונים
אחסנה (כלומר TDWI) (ביינברידג '1989, נוימן 1994),
אשר שולח שני מכתבי תזכורת למי שלא ענה
(פאולר 1988, נוימן 1994) וכולל גם מכתב
המסביר את מטרת המחקר (Neuman 1994).
3.4.2. יחידת ניתוח
מטרת מחקר זה היא להשיג את המידע אודות
יישום אחסון הנתונים והשימוש בו
בתוך ארגונים אוסטרליים. אוכלוסיית היעד
מורכב מכל הארגונים האוסטרלים שיש להם
מיושם, או מיישמים, i מחסן נתונים. ב
לאחר מכן רשומים הארגונים הבודדים. השאלון
הוא נשלח בדואר לארגונים המעוניינים באימוץ
di מחסן נתונים. שיטה זו מבטיחה כי המידע
אוספים מגיעים מהמשאבים המתאימים ביותר של כל ארגון
מִשׁתַתֵף.
3.4.3. מדגם הסקר
רשימת התפוצה של משיבי הסקר התקבלה מ-
TDWI. מרשימה זו, 3000 ארגונים אוסטרליים
נבחרו כבסיס לדגימה. א
מכתב נוסף הסביר את הפרויקט ואת מטרת החקירה,
יחד עם כרטיס מענה ומעטפה ששולמה מראש עבור
החזירו את השאלון שהושלם נשלחו לדוגמא.
מתוך 3000 הארגונים, 198 הסכימו להשתתף ב
לימוד. היה צפוי מספר כה קטן של תגובות נתתי il
מספר גדול של ארגונים אוסטרלים שהיו להם אז
חיבקו או חיבקו את אסטרטגיית הדייטים
אחסנה בארגונים שלהם. אז ה
אוכלוסיית היעד למחקר זה כללה 198 בלבד
ארגונים.
3.4.4. תוכן השאלון
מבנה השאלון התבסס על מודל התאריך
מחסן מונאש (נדון קודם לכן בחלק 2.3). ה
תוכן השאלון התבסס על ניתוח
ספרות המוצגת בפרק 2. עותק של השאלון
ניתן למצוא בדואר למשתתפי הסקר
בנספח ב 'השאלון מורכב משישה סעיפים, אשר
עקוב אחר שלבי המודל שטופל. שש הפסקאות הבאות
סיכמו בקצרה את התוכן של כל קטע.
חלק א ': מידע בסיסי על הארגון
חלק זה מכיל שאלות הקשורות לפרופיל של
ארגונים המשתתפים. בנוסף, חלק מהשאלות הן
המתייחס למצב פרויקט אחסון הנתונים של
מִשׁתַתֵף. מידע סודי כגון שם
של הארגון לא נחשפו בניתוח הסקר.
סעיף ב ': התחל
השאלות בסעיף זה קשורות לפעילות התחלתית של
אחסון נתונים. נשאלו שאלות לכמה זמן
מדובר ביוזמי פרויקטים, נותני חסות, מיומנויות וידע
דרישות, המטרות של פיתוח אחסון נתונים וה
ציפיות של משתמשי הקצה.
פרק ג ': עיצוב
חלק זה מכיל שאלות הקשורות לפעילויות של
תכנון של מחסן נתונים. ספציפית, השאלות הן
ציין לגבי היקף הביצוע, משך הפרויקט, העלות
של הפרויקט וניתוח העלות / תועלת.
פרק ד ': פיתוח
בחלק הפיתוח ישנן שאלות הקשורות לפעילויות של
פיתוח של מחסן נתונים: אוסף של דרישות משתמש
סופית, מקורות נתונים, המודל ההגיוני של נתונים, אבות טיפוס, ה
תכנון יכולות, ארכיטקטורות טכניות ובחירת
כלי פיתוח אחסון נתונים.
קטע ה ': מבצע
שאלות מבצע שקשורות למבצע ed
הרחבה של מחסן נתונים, כפי שהוא מתפתח ל-
שלב הפיתוח הבא. שם איכות מידע, האסטרטגיות של
רענון של נתונים, גרעיניותו של נתונים, מדרגיות נתונים
מחסן ובעיות האבטחה של מחסן נתונים הם היו ביניהם
סוגי השאלות שנשאלו.
סעיף ו ': פיתוח
חלק זה מכיל שאלות הקשורות לשימוש בתאריך
מחסן על ידי משתמשי קצה. החוקר התעניין
למטרה ולתועלת של ה מחסן נתונים, סקירה ואסטרטגיות
נהלי הכשרה ואסטרטגיית בקרת הנתונים
מחסן שאומץ.
3.4.5. שיעור תגובה
אף על פי שסקרי דואר זוכים לביקורת על כך שיש להם
בתגובה נמוכה, ננקטו צעדים להגדלת ה -
שיעור תשואה (כפי שנדון קודם לכן בחלק
3.4.1). המונח 'אחוז תגובה' מתייחס לאחוז של
אנשים במדגם מסקר מסוים העונה על
שאלון (Denscombe 1998). נעשה שימוש הבא
נוסחה לחישוב שיעור התגובה למחקר זה:
מספר האנשים שהגיבו
שיעור תגובה =
———————————————————————————– X 100
המספר הכולל של שאלונים שנשלחו
3.4.6. מבחן טייס
לפני שליחת השאלון לדוגמא, השאלות הן
נבדקו על ידי ביצוע מבחני טייס, כפי שהציע המזל
ורובין (1987), ג'קסון (1988) ודה-ואוס (1991). מטרת ה
בדיקת פיילוט היא לחשוף את כל הביטויים הלא נוחים, המשמעותיים והבוטים
שאלות קשות לפרשנות, להבהרת כל אחת מהן
הגדרות ומונחים המשמשים לזיהוי זמן משוער
נדרש למילוי השאלון (Warwick and Lininger 1975,
ג'קסון 1988, סלנט ודילמן 1994). מבחני הטייס היו
מבוצע על ידי בחירת נושאים בעלי מאפיינים דומים לאלה
מבין מקצועות הגמר, כמו דייוויס ה קוסנזה (1993). בתוך
במחקר זה, שישה אנשי מקצוע בתחום אחסון הנתונים היו
נבחרו כנושאי הפיילוט. אחרי כל מבחן טייס, הם כן
בוצעו התיקונים הדרושים. ממבחני הפיילוט שבוצעו, א
המשתתפים עזרו בשיפוץ ובאיפוס
הגרסה הסופית של השאלון.
3.4.7. שיטות ניתוח Di לתת לי
I נתונים של הסקר שנאסף משאלונים סגורים הם
נותחו באמצעות חבילת תוכנה סטטיסטית
נקרא SPSS. רבות מהתגובות נותחו
באמצעות סטטיסטיקה תיאורית. מספר שאלונים
הם חזרו שלמים. אלה טופלו במייג'ור
תשומת לב לוודא שאני נתונים חסרים לא היו אחד
תוצאה של שגיאות הזנת נתונים, אך מדוע השאלות אינן
הם היו מתאימים למצהיר, או שהמצהיר החליט שלא
לענות על שאלה ספציפית אחת או יותר. תשובות אלו
חסרים התעלמו במהלך הניתוח של נתונים והיו
מקודד כ- - 9 'כדי לברר את הכללתם מהתהליך
אָנָלִיזָה.
בהכנת השאלון היו השאלות הסגורות
קודן על ידי הקצאת מספר לכל אפשרות. המספר
ואז הוא שימש להכנת נתונים במהלך הניתוח
(דנסקומב 1998, ספספורד וג'ופ 1996). למשל, היו
שש אפשרויות המופיעות בשאלה 1 בסעיף ב ': ייעוץ
מינהל, מנהל בכיר, מחלקת IT, יחידה
של עסקים, יועצים ועוד. בתיק של נתונים של SPSS, הוא
נוצר משתנה המציין 'יוזם הפרויקט',
עם שש תווי ערך: '1' ל'דירקטוריון ',' 2 '
עבור 'המנהל ברמה הגבוהה' וכן הלאה. השימוש בסולם ליקרטין
בחלק מהשאלות הסגורות מותר
זיהוי שאינו מצריך מאמץ בהתחשב בשימוש בערכים
המספרים המתאימים שהוזנו ב- SPSS. לשאלות עם
תשובות לא ממצות, שלא היו בלעדיות זו לזו,
כל אופציה התייחסה כמשתנה יחיד עם שניים
תוויות ערך: '1' עבור 'מסומן' ו- '2' עבור 'לא מסומן'.
התייחסו לשאלות פתוחות באופן שונה משאלות
סָגוּר. התשובות לשאלות אלה לא פורסמו
SPSS. להפך, הם נותחו ביד. השימוש בזה
סוג השאלות מאפשר לך לקבל מידע על הרעיונות
חוויות מפורשות ואישיות של נרשמים
(ביינברידג '1989, דנסקומב 1998). במידת האפשר זה נעשה
סיווג תגובות.
לניתוח של נתונים, נעשה שימוש בשיטות ניתוח סטטיסטי פשוט,
כתדירות התשובות, הממוצע, הסטייה בריבוע
ממוצע וחציוני (Argyrous 1996, Denscombe 1998).
מבחן הגמא ביצע להשגת מדידות כמותיות
אסוציאציות בין נתונים מסדרים (Norusis 1983, Argyrous 1996).
בדיקות אלו היו מתאימות מכיוון שהסולמות הרגילים שהיו בשימוש לא היו
היו להם קטגוריות רבות וניתן היה להציג אותם בטבלה
(נורוסיס 1983).
3.5 סיכום
בפרק זה מתודולוגיית המחקר וה-
עיצובים שאומצו למחקר זה.
בחירת שיטת החיפוש המתאימה ביותר עבור a
מחקר מסוים לוקח
שקול מספר כללים, כולל אופי וסוג
מחקר, כמו גם היתרונות והחולשות של כל אחד אפשרי
שיטה (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987,
yin 1989, Hamilton and ives 1992, Galliers 1992, neuman 1994). נוף
היעדר הידע והתיאוריה הקיימים בנושא
אימוץ אחסון נתונים באוסטרליה, מחקר זה מאת
המחקר דורש שיטת מחקר פרשנית עם מיומנות
חקרני כדי לחקור את חוויות הארגונים
אוסטרלי. נבחרה שיטת החיפוש שנבחרה עבור
לאסוף מידע בנוגע לאימוץ תפיסת התאריך
דיור מחסן על ידי ארגונים אוסטרלים. א
שאלון הדואר נבחר כטכניקת האיסוף נתונים.
הצדקות לשיטת המחקר וטכניקת האיסוף נתונים
נבחר יסופק בפרק זה. זה גם היה
הציג דיון על יחידת הניתוח, המדגם
בשימוש, אחוזי התשובות, תוכן השאלון,
מבחן מקדים של השאלון ושיטת הניתוח נתונים.

תכנון א מחסן נתונים:
שילוב של יחסי ישות ומידול ממדי
תקציר
חנות i נתונים זו בעיה עכשווית גדולה עבור רבים
ארגונים. בעיה מרכזית בפיתוח
של האחסון של נתונים זה העיצוב שלו.
על התכנון לתמוך בזיהוי מושגים בנתונים
מחסן מערכת מדור קודם ומקורות אחרים של נתונים וגם אחד
הבנה קלה ויעילות ביישום נתונים
מַחסָן.
הרבה מספרות האחסון נתונים מוּמלָץ
השימוש במודלים של יחסי ישות או דוגמנות מימד עבור
מייצגים את הציור של מחסן נתונים.
בעיתון זה אנו מראים כיצד שניהם
ניתן לשלב ייצוגים בגישה עבור
ציור של מחסן נתונים. הגישה הנהוגה היא באופן שיטתי
נבדק במחקר מקרה ומזוהה במספר
השלכות חשובות על אנשי מקצוע.
אחסון נתונים
Un מחסן נתונים זה בדרך כלל מוגדר כ"מכוון נושא,
איסוף נתונים משולב, משתנה בזמן ואינו נדיף בתמיכה
החלטות ההנהלה "(אינמון והקת'ורן, 1994).
מונחה נושא ומשולב מצביע על כך שה מחסן נתונים è
תוכנן לחצות את הגבולות הפונקציונליים של מערכת הלגסי לפי
להציע נקודת מבט משולבת של נתונים.
גרסת זמן משפיעה על האופי ההיסטורי או סדרת הזמן של נתונים in
un מחסן נתונים, המאפשר ניתוח מגמות.
לא נדיף מציין כי מחסן נתונים זה לא ברציפות
עודכן כ- מסד נתונים של OLTP. במקום זאת הוא מעודכן
מעת לעת, עם נתונים ממקורות פנימיים וחיצוניים. ה
מחסן נתונים הוא תוכנן במיוחד למחקר
ולא בשל תקינות העדכונים וביצועי ה-
פעולות.
הרעיון לאחסן את i נתונים זה לא חדש, זו הייתה אחת המטרות
הנהלה של נתונים מאז שנות השישים (איל מרטין, 1982).
I מחסן נתונים הם מציעים את התשתית נתונים לניהול
מערכות תמיכה. מערכות תמיכה ניהוליות כוללות החלטה
מערכות תמיכה (DSS) ומערכות מידע מבצעות (EIS).
DSS היא מערכת מידע מבוססת מחשב שכן
נועד לשפר את התהליך וכתוצאה מכך את האחיזה של
החלטה אנושית. EIS היא בדרך כלל מערכת מסירה של
נתונים המאפשר למנהלי העסקים לגשת בקלות לתצוגה
של נתונים.
הארכיטקטורה הכללית של א מחסן נתונים מדגיש את התפקיד של
מחסן נתונים בתמיכה בניהול. בנוסף להציע
התשתית נתונים עבור EIS ו-DSS, al מחסן נתונים זה אפשרי
לגשת אליו ישירות באמצעות שאילתות. ה נתונים כלול בתאריך
המחסן מבוסס על ניתוח דרישות המידע של
ניהול ומתקבלים משלושה מקורות: מערכות מורשת פנימיות,
מערכות לכידת נתונים למטרה מיוחדת ומקורות נתונים חיצוניים. ה
נתונים במערכות מורשת פנימיות הם מיותרים לעתים קרובות,
לא עקבי, באיכות נמוכה ומאוחסן בפורמטים שונים
אז הם חייבים להתפייס ולנקות אותם לפני שניתן יהיה להעמיס אותם
מחסן נתונים (אינמון, 1992; מקפאדן, 1996). ה נתונים מ
ממערכות אחסון נתונים אד הוק וממקורות נתונים
חיצוני מבלים משמשים להגדלה (עדכון, החלפה) i
נתונים ממערכות מדור קודם.
ישנן סיבות משכנעות רבות לפתח א מחסן נתונים,
הכוללים קבלת החלטות טובה יותר באמצעות שימוש
מידע נוסף בפועל (Ives 1995), תמיכה במיקוד
על העסק השלם (גרהם 1996), והוזלת העלויות בסך
אספקה של נתונים עבור EIS ו- DSS (גרהם 1996, מקפדן
1996).
מחקר אמפירי שנערך לאחרונה מצא, בממוצע, חזרה של
השקעות עבור i מחסן נתונים 401% לאחר שלוש שנים (גרהם,
1996). עם זאת, מחקרים אמפיריים אחרים של מחסן נתונים יש
מצא בעיות משמעותיות כולל קושי במדידה ו
הקצאת הטבות, חסרת מטרה ברורה, מזלזל בה
המטרה והמורכבות של תהליך האחסון i נתוניםב
במיוחד ביחס למקורות ולניקיון ה נתונים.
חנות i נתונים יכול להיחשב כפתרון
לבעיית הניהול נתונים בין ארגונים. שם
מניפולציה של נתונים כמשאב חברתי הוא נותר אחד
נושאים מרכזיים בניהול מערכות מידע ברחבי העולם
העולם במשך שנים רבות (Brancheau et al. 1996, Galliers et al. 1994,
נידרמן ואח '. 1990, פרבן 1993).
גישה פופולרית לניהול נתונים בשנות השמונים זה היה
פיתוח מודל נתונים חֶברָתִי. דֶגֶם נתונים חברתי זה היה
נועד להציע בסיס יציב לפיתוח מערכות חדשות
יישומים ו מסד נתונים ושיקום ושילוב מורשת
מערכות (Brancheau et al.
1989, Goodhue et al. 1988: 1992, קים ואוורסט 1994).
עם זאת, ישנן בעיות רבות בגישה זו, ב-
בפרט, המורכבות והעלות של כל משימה, והזמן הארוך
נדרש לתוצאות מוחשיות (ביינון-דייויס 1994, ארל
1993, Goodhue et al. 1992, פריאסמי 1994, שאנקס 1997).
Il מחסן נתונים זהו מסד נתונים נפרד שמתקיים במקביל עם מורשת
מאגרי מידע במקום להחליף אותם. לכן זה מאפשר לך
לכוון את ניהול נתונים ולהימנע מבנייה מחודשת יקרה
של מערכות מדור קודם.
גישות קיימות לתאריך הציור
חדר כושר
תהליך הבנייה והשכלול של א מחסן נתונים
צריך להבין את זה יותר כתהליך אבולוציוני ולא כ-
מחזור החיים של פיתוח מערכות מסורתיות (דסיו, 1995, שאנקס,
אודונל וארנוט 1997 א). ישנם תהליכים רבים המעורבים ב
פרויקט של מחסן נתונים כגון אתחול, תזמון;
מידע שנרכש מהדרישות המבוקשות ממנהלי החברה;
מקורות, טרנספורמציות, ניקוי של נתונים וסנכרון ממורשת
מערכות ומקורות אחרים של נתונים; מערכות אספקה בפיתוח;
ניטור של מחסן נתונים; ושטויות של התהליך
אבולוציוני ובנייה של א מחסן נתונים (שין, אודונל
וארנוט 1997 ב). בכתב העת הזה אנו מתמקדים כיצד
לצייר אני נתונים מאוחסנים בהקשר של תהליכים אחרים אלה.
ישנן מספר גישות המוצעות לארכיטקטורת נתונים
מחסן בספרות (אינמון 1994, אייבס 1995, קימבול 1994
מקפדן 1996). לכל אחת מהמתודולוגיות הללו יש סיכום קצר
סקירה עם ניתוח חוזקותיהם ולא.
גישת אינמון (1994) עבור מחסן נתונים
עיצוב
אינמון (1994) הציע ארבעה צעדים איטרטיביים לתכנון תאריך
מחסן (ראה איור 2). השלב הראשון הוא לעצב מודל
נתונים חברתי כדי להבין איך אני נתונים ניתן לשלב
על פני אזורים פונקציונליים בארגון
על ידי חלוקת ה- נתונים חנות באזורים. דֶגֶם נתונים הוא מיועד ל
לאחסן נתונים המתייחס לקבלת החלטות, כולל נתונים
היסטורי, וכלול נתונים נגזר ומצטבר. השלב השני הוא
לזהות תחומי נושא ליישום. אלה מבוססים
על סדרי עדיפויות שנקבעים על ידי ארגון מסוים. השלישי
שלב כולל ציור א מסד נתונים לאזור הנושא, תנוחות
תשומת לב מיוחדת מוקדשת לכלול רמות פירוט מתאימות.
אינמון ממליץ להשתמש בישות ובמודל היחסים. רביעי
השלב הוא זיהוי מערכות של מקורות נתונים נדרש ומתפתח
תהליכי טרנספורמציה לרכישה, ניקוי ועיצוב i נתונים.
נקודות החוזק של גישתו של אינמון הן שהמודל נתונים חברתי
מספק בסיס לשילוב של נתונים בתוך הארגון
ותכנון תומכים לפיתוח איטרטיבי של תאריך
מַחסָן. פגמיו הם הקושי והעלות לציור
דֶגֶם נתונים חברתי, הקושי בהבנת דפוסי ישויות ה
מערכות יחסים המשמשות בשני הדגמים, זאת נתונים חברתית ושל נתונים
מאוחסן לפי אזור הנושא, והמתאימות של נתונים דל
ציור של מחסן נתונים למימוש מסד נתונים
יחסיים אבל לא בשביל מסד נתונים רַב מֵמָדִים.
הגישה של Ives (1995) ל מחסן נתונים
עיצוב
אייבס (1995) מציע גישה בת ארבעה שלבים לציור a
מערכת מידע שלדעתו חלה על עיצוב תאריך
מחסן (ראה איור 3). הגישה מבוססת מאוד על
הנדסת מידע לפיתוח מערכות מידע
(מרטין 1990). השלב הראשון הוא קביעת היעדים, הגורמים
מדדי ביצוע קריטיים ומוצלחים ומפתחיים. ה
תהליכים עסקיים מרכזיים ומידע נחוץ הם
מעוצב כדי להוביל אותנו למודל נתונים חֶברָתִי. השלב השני
זה כרוך בפיתוח ארכיטקטורה מגדירה נתונים
מאוחסן לפי אזורים, מסד נתונים di מחסן נתונים, הרכיבים
הטכנולוגיה הנדרשת, מכלול התמיכה הארגונית
נדרש ליישם ולפעול איתם מחסן נתונים. השלישי
שלב כולל בחירת חבילות תוכנה וכלים נדרשים.
השלב הרביעי הוא התכנון והבנייה המפורטים של
מחסן נתונים. Ives מציין את זה כדי לאחסן נתונים הוא מחויב
תהליך איטרטיבי.
כוחה של גישתו של אייבס הוא השימוש במפרט טכני עבור
לקבוע את דרישות המידע, השימוש במבנה מובנה
תהליך לתמיכה באינטגרציה של מחסן נתונים,
הבחירה המתאימה של חומרה ותוכנה ושימוש במספר רב
טכניקות ייצוג עבור מחסן נתונים. הפגמים שלה
הם טבועים במורכבות. אחרים כוללים קושי ב
לפתח רמות רבות של מסד נתונים all'interno del מחסן נתונים in
זמן ועלות סבירים.
הגישה של Kimball (1994) ל מחסן נתונים
עיצוב
קימבול (1994) הציע חמישה צעדים איטרטיביים לציון תאריך
מחסן (ראה איורים 4). גישתו היא במיוחד
מוקדש לציור סולו מחסן נתונים ועל השימוש בתבניות
ממדי בהעדפת מודלים של ישויות ומערכות יחסים. קימבול
לנתח את המודלים הממדיים האלה כי קל לי יותר להבין
מנהלים עסקיים יעילים יותר בהתמודדות
התייעצויות מורכבות, ועיצוב מסד נתונים פיזי זה יותר
יעיל (קימבול 1994). קימבול מכיר בכך שהתפתחותו של א
מחסן נתונים הוא איטרטיבי, וזה מחסן נתונים פחית מופרדת
להשתלב באמצעות החלוקה לטבלאות מידות
מְשׁוּתָף.
השלב הראשון הוא זיהוי תחום הנושא המסוים שיהיה
השתכלל. הצעד השני והשלישי נוגע לדוגמנות
מְמַדִי. בשלב השני המדידות מזהות דברים של
עניין בתחום הנושא וקובץ בטבלת עובדות.
לדוגמא, בתחום נושא המכירות מדדי העניין
הם יכולים לכלול את כמות הפריטים שנמכרו ואת הדולר
כמטבע מכירות. השלב השלישי כולל זיהוי
ממדים שהם הדרכים בהן ניתן לקבץ i
עובדות. בתחום נושא מכירות, מידות רלוונטיות
הם יכולים לכלול פריט, מיקום ותקופת זמן. שם
בטבלת עובדות יש מפתח רב חלקים לקישור לכל אחד מהם
של טבלאות מימד ובדרך כלל מכיל מספר גדול מאוד
מעולה למעשה. לעומת זאת, לוחות גודל מכילים
מידע תיאורי על הממדים ותכונות אחרות
בעזרתן ניתן לקבץ עובדות. טבלת העובדות ה
ממדים הקשורים להצעה מה שמכונה אחד
דפוס כוכבים בשל צורתו. השלב הרביעי כולל
בונה מסד נתונים רב מימדי כדי לשכלל את זה
תכנית כוכבים. השלב האחרון הוא זיהוי מערכות מקור נתונים
נדרש ולפתח תהליכי טרנספורמציה לרכישה, ניקיון
ולעצב i נתונים.
נקודות החוזק של גישתו של קימבול כוללות שימוש במודלים
ממדי לייצג את i נתונים מאוחסנים שהופכים אותו
קל להבנה ומוביל לתכנון פיזי יעיל. א
מודל ממדי המשתמש בקלות בשניהם
מערכות מסד נתונים ניתן לשכלל מערכות יחסיות או מערכות
מסד נתונים רַב מֵמָדִים. פגמיו כוללים חוסר
כמה טכניקות כדי להקל על תכנון או שילוב של
דפוסי כוכבים רבים בתוך אחד מחסן נתונים ו
קושי בעיצוב מהמבנה הקיצוני המנורמל
מודל ממדי א נתונים במערכת מורשת.
הגישה לנתונים של מקפדן (1996)
עיצוב מחסנים
מקפדן (1996) מציע גישה לחמישה שלבים ל
צייר מחסן נתונים (ראה איור 5).
גישתו מבוססת על סינתזה של רעיונות מהספרות
ומתמקד ברישום של סולו מחסן נתונים. הראשון
שלב כולל ניתוח דרישות. גם אם הספציפיות
טכניקות לא נקבעו, הערותיו של מקפדן מזהות את
יֵשׁוּת נתונים מפרטים ותכונותיהם, ומתייחס לקוראי ווטסון
ופרוליק (1993) לרכישת הדרישות.
בשלב השני, יחסי ישות מודל עבור
מחסן נתונים ולאחר מכן מאומת על ידי מנהלי עסקים. השלישי
שלב כולל קביעת המיפוי ממערכת המורשת
ומקורות חיצוניים של מחסן נתונים. השלב הרביעי כולל
תהליכים בפיתוח, הפצה וסנכרון של נתונים Nel
מחסן נתונים. בשלב האחרון, אספקת המערכת היא
פותח עם דגש מיוחד על ממשק משתמש.
מקפדן מציין שתהליך הציור הוא בדרך כלל
איטרטיבי.
נקודות החוזק של גישתו של מקפדן נשענות על השתתפות
על ידי מנהלי עסקים בקביעת הדרישות וגם
חשיבות המשאבים נתונים, הניקיון והאיסוף שלהם. שֶׁלָה
חסרונות מתייחסים להיעדר תהליך לפיצול א
פרויקט נהדר של מחסן נתונים בשלבים משולבים רבים, וה
קושי בהבנת הישויות ומודלים של מערכות יחסים המשמשות בתכנון
מחסן נתונים.

0/5 (0 ביקורות)

קבל מידע נוסף מסוכנות האינטרנט המקוונת

הירשם כדי לקבל את המאמרים האחרונים בדוא"ל.

מנהל מנכ"ל

👍סוכנות אינטרנט מקוונת | מומחה לסוכנות רשת בשיווק דיגיטלי וקידום אתרים. Web Agency Online היא סוכנות אינטרנט. For Agenzia Web Online הצלחה בטרנספורמציה דיגיטלית מבוססת על היסודות של Iron SEO גרסה 3. התמחויות: אינטגרציה של מערכת, שילוב יישומים ארגוניים, ארכיטקטורה מוכוונת שירות, מחשוב ענן, מחסן נתונים, בינה עסקית, Big Data, פורטלים, אינטראנטים, אפליקציות אינטרנט עיצוב וניהול מאגרי מידע יחסי ורב מימדיים עיצוב ממשקים למדיה דיגיטלית: שימושיות וגרפיקה. סוכנות אינטרנט מקוונת מציעה לחברות את השירותים הבאים: -SEO בגוגל, אמזון, בינג, Yandex; -Web Analytics: Google Analytics, Google Tag Manager, Yandex Metrica; -המרות משתמשים: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM ב-Google, Bing, Amazon Ads; -שיווק במדיה חברתית (פייסבוק, לינקדין, יוטיוב, אינסטגרם).

ראה ביוגרפיה מלאה

שיווק דיגיטלי מסד נתונים DBMS מחסן נתונים מדע נתונים פרסום באינטרנט טכנולוגיית מידע סוכנות האינטרנט משרד פרסום שיווק

מיקום:

אני אוהב:

קבל מידע נוסף מסוכנות האינטרנט המקוונת