https://unimib.academia.edu/stefanofantin

https://unimib.academia.edu/stefanofantin

doi:https://unimib.academia.edu/stefanofantin

מחסן נתונים ותכנון משאבים ארגוניים | DWH ו- ERP

ארכיון נתונים CENTRAL : היסטוריה אד אבולוציה

שני הנושאים הדומיננטיים של הטכנולוגיה הארגונית בשנות ה-90 היו i מחסן נתונים וה-ERP. במשך זמן רב שני הזרמים החזקים הללו היו חלק מה-IT הארגוני מבלי שהיה להם צומת. זה היה כמעט כאילו הם חומר ואנטי חומר. אבל הצמיחה של שתי התופעות הובילה בהכרח להצטלבות ביניהן. כיום חברות מתמודדות עם הבעיה של מה לעשות עם ERP ו מחסן נתונים. מאמר זה יסביר מהן הבעיות וכיצד הן מטופלות על ידי חברות.

בהתחלה…

בהתחלה היה ה מחסן נתונים. מחסן נתונים זה נולד כדי להתמודד עם מערכת הבקשה לעיבוד עסקאות. בימים הראשונים שינון של נתונים זה נועד להיות רק קונטרה ליישומים לעיבוד עסקאות. אבל בימינו יש חזונות הרבה יותר מתוחכמים של מה א מחסן נתונים. בעולם של היום ה מחסן נתונים הוא מוכנס בתוך מבנה שניתן לכנותו מפעל מידע תאגידי.

מפעל המידע התאגידי (CIF)

למפעל המידע הארגוני יש רכיבים אדריכליים סטנדרטיים: שכבת אינטגרציה וטרנספורמציה של קוד המשלבת i נתונים בעוד אני נתונים הם עוברים מסביבת האפליקציה לסביבת ה- מחסן נתונים של החברה; א מחסן נתונים של החברה שבה אני נתונים היסטוריות מפורטות ומשולבות. ה מחסן נתונים של המיזם משמש כבסיס שעליו ניתן לבנות את כל שאר חלקי הסביבה מחסן נתונים; מאגר נתונים תפעולי (ODS). ODS הוא מבנה היברידי המכיל היבט כלשהו של מחסן נתונים והיבטים אחרים של סביבת OLTP; data marts, שבו מחלקות שונות יכולות לקבל גרסה משלהן של מחסן נתונים; א מחסן נתונים חקר שבו הוגי חברה יכולים להגיש את השאילתות שלהם במשך 72 שעות ללא השפעה מזיקה על מחסן נתונים; וזיכרון קרוב לקו, שבו נתונים ישן ו נתונים ניתן לאחסן פרטים בכמות גדולה בזול.

איפה ש- ERP מתחבר עם ה- מפעל מידע תאגידי

ה-ERP מתמזג עם מפעל המידע הארגוני בשני מקומות. בעיקר כיישום בסיס המספק i נתונים של הבקשה ל מחסן נתונים. במקרה זה אני נתונים, שנוצרו כתוצר לוואי של תהליך עסקה, משולבים ונטענים ב- מחסן נתונים של החברה. הקישור השני בין ERP ל-CIF הוא ה-ODS. ואכן, בסביבות רבות משתמשים ב-ERP כ-ODS קלאסי.

במקרה שבו משתמשים ב-ERP כאפליקציה בסיסית, ניתן להשתמש באותו ERP גם ב-CIF בתור ODS. בכל מקרה, אם יש להשתמש ב-ERP בשני התפקידים, חייבת להיות הבחנה ברורה בין שתי הישויות. במילים אחרות, כאשר ERP משחק את התפקיד של יישום בסיס ו-ODS, יש להבחין בין שתי הישויות הארכיטקטוניות. אם יישום יחיד של ERP מנסה למלא את שני התפקידים בו זמנית, יהיו בהכרח בעיות בתכנון והטמעה של המבנה הזה.

הפרדות אפליקציות ויישומים בסיסיים

ישנן סיבות רבות המובילות לחלוקת מרכיבים אדריכליים. אולי הנקודה הבולטת ביותר בהפרדה בין המרכיבים השונים של ארכיטקטורה היא שלכל רכיב בארכיטקטורה יש השקפה משלו. יישום הבסיס משרת מטרה שונה מזו של ODS. נסה לחפף

השקפת יישום בסיסית על העולם של ODS או להיפך אינה דרך הוגנת לעבוד.

כתוצאה מכך, הבעיה הראשונה של ERP ב-CIF היא לוודא אם יש הבחנה בין יישומי הבסיס ל-ODS.

דגמי נתונים בחברה מפעל מידע

כדי להשיג לכידות בין המרכיבים השונים של ארכיטקטורת CIF, חייב להיות מודל של נתונים. הדגמים של נתונים הם משמשים כמקשר בין המרכיבים השונים של הארכיטקטורה כגון יישומי הבסיס וה-ODS. הדגמים של נתונים הם הופכים ל"מפת הדרכים האינטלקטואלית" כדי לקבל את המשמעות הנכונה מהמרכיבים האדריכליים השונים של ה-CIF.

הולך יד ביד עם הרעיון הזה, הרעיון הוא שצריך להיות דפוס אחד גדול ויחיד נתונים. ברור שחייב להיות דפוס של נתונים לכל אחד מהרכיבים ויתרה מכך חייב להיות נתיב הגיוני המחבר בין הדגמים השונים. כל רכיב בארכיטקטורה - ODS, יישומי בסיס, מחסן נתונים של החברה, וכן הלאה.. – צריך מודל משלה של נתונים. ולכן צריכה להיות הגדרה מדויקת של איך המודלים האלה של נתונים הם מתקשרים זה עם זה.

להזיז אני נתונים מתאריך ה- ERP חדר כושר

אם מקורו של נתונים הוא יישום בסיס ו/או ODS, כאשר ה-ERP מוסיף i נתונים Nel מחסן נתונים, הכנסה זו חייבת להתבצע ברמת ה"פירוט" הנמוכה ביותר. כל שעליך לעשות הוא לסכם או לצבור i נתונים כשהם יוצאים מאפליקציית ERP הבסיס או ERP ODS זה לא הדבר הנכון לעשות. ה נתונים יש צורך בפרטים ב מחסן נתונים להוות את הבסיס לתהליך ה-DSS. כגון נתונים הם יעוצבו מחדש במובנים רבים על ידי מחקר נתונים ומחקר מחסן נתונים.

העקירה של נתונים מסביבת היישום הבסיסי של ERP ועד ל- מחסן נתונים של החברה נעשה בצורה נינוחה למדי. מהלך זה מתרחש כ-24 שעות לאחר העדכון או היצירה ב-ERP. העובדה שיש תנועה "עצלה" של ה נתונים Nel מחסן נתונים של החברה מאפשרת נתונים מגיע מה-ERP כדי "להתיישב". פעם אני נתונים מאוחסנים ביישום הבסיס, אז אתה יכול להזיז בבטחה את נתונים של ה-ERP בארגון. מטרה נוספת שניתן להשיג הודות לתנועת ה"עצלן" של ה נתונים הוא הגבול הברור בין תהליכים תפעוליים ל-DSS. עם תנועה "מהירה" של ה נתונים הגבול בין DSS למבצעי נותר מעורפל.

התנועה של נתונים מה-ODS של ה-ERP ועד מחסן נתונים של החברה נעשה מעת לעת, בדרך כלל שבועי או חודשי. במקרה זה התנועה של נתונים זה מבוסס על הצורך "לנקות" את הישן נתונים היסטוריונים. באופן טבעי, ה-ODS מכיל i נתונים שהם הרבה יותר חדשים מה נתונים היסטוריונים שנמצאו ב מחסן נתונים.

העקירה של נתונים Nel מחסן נתונים זה כמעט אף פעם לא נעשה "סיטונאי" (באופן סיטונאי). העתק טבלה מסביבת ה-ERP אל מחסן נתונים זה לא הגיוני. גישה הרבה יותר ריאלית היא להעביר יחידות נבחרות של נתונים. רק ה נתונים אשר השתנו מאז העדכון האחרון של מחסן נתונים הם אלה שצריך להעביר ל- מחסן נתונים. דרך אחת לדעת אילו נתונים השתנו מאז העדכון האחרון הוא להסתכל על חותמות הזמן של נתונים נמצא בסביבת ERP. המעצב בוחר את כל השינויים שהתרחשו מאז העדכון האחרון. גישה נוספת היא שימוש בטכניקות לכידת שינויים נתונים. בעזרת טכניקות אלו מנתחים יומנים וקלטות יומן על מנת לקבוע אילו מהם נתונים יש להעביר מסביבת ה-ERP לזו של מחסן נתונים. טכניקות אלו הן הטובות ביותר שכן ניתן לקרוא יומנים וקלטות יומן מקובצי ERP ללא השפעה נוספת על משאבי ERP אחרים.

סיבוכים אחרים

אחת מבעיות ה-ERP ב-CIF היא מה שקורה למקורות יישומים אחרים או ל-AI נתונים של ה- ODS שחייב לתרום ל מחסן נתונים אך הם אינם חלק מסביבת ה-ERP. בהתחשב באופי הסגור של ERP, במיוחד SAP, מנסה לשלב מפתחות ממקורות חיצוניים של נתונים עם i נתונים שמגיעים מה-ERP בזמן המעבר i נתונים Nel מחסן נתונים, זה אתגר גדול. ומה בדיוק ההסתברויות שאני נתונים של יישומים או ODS מחוץ לסביבת ה-ERP ישולבו ב- מחסן נתונים? הסיכויים למעשה גבוהים מאוד.

למצוא נתונים היסטוריות מ ERP

בעיה נוספת עם נתונים של ERP הוא זה שנובע מהצורך שיש נתונים היסטורי בתוך ה מחסן נתונים. בדרך כלל ה מחסן נתונים הוא צריך נתונים היסטוריונים. וטכנולוגיית ERP בדרך כלל לא מאחסנת את אלה נתונים היסטורי, לפחות לא במידה שהוא הכרחי ב מחסן נתונים. כאשר כמות גדולה של נתונים יומנים מתחילים להצטבר בסביבת ה-ERP, יש לנקות את הסביבה הזו. לדוגמה, נניח א מחסן נתונים צריך להיות טעון עם חמש שנים של נתונים היסטורי בעוד שה-ERP שומר על שישה חודשים לכל היותר נתונים. כל עוד החברה מרוצה לאסוף מספר נתונים היסטורית ככל שעובר הזמן, אז אין בעיה להשתמש ב-ERP כמקור עבור מחסן נתונים. אבל כאשר ה מחסן נתונים חייב לחזור בזמן ולקחת אלים נתונים רשומות שטרם נאספו ונשמרו על ידי ה-ERP, אז סביבת ה-ERP הופכת ללא יעילה.

ERP ו- METADATA

שיקול נוסף שיש לעשות לגבי ERP ו מחסן נתונים הוא זה על המטא נתונים הקיימים בסביבת ה-ERP. בדיוק כפי שמטא נתונים עוברים מסביבת ה-ERP ל- מחסן נתונים, יש להעביר את המטא נתונים באותו אופן. בנוסף, יש להפוך את המטא נתונים לפורמט ולמבנה הנדרשים על ידי התשתית מחסן נתונים. יש הבדל גדול בין מטא נתונים תפעוליים למטא נתונים של DSS. מטא נתונים תפעוליים מיועדים בעיקר למפתח ול-

מְתַכנֵת. מטא נתונים של DSS מיועדים בעיקר למשתמש הקצה. יש להמיר מטא נתונים קיימים ביישומי ERP או ODSs וההמרה הזו לא תמיד קלה ופשוטה.

המקור לנתוני ה- ERP

אם ה- ERP משמש כספק של נתונים עבור מחסן נתונים חייב להיות ממשק יציב שמזיז i נתונים מסביבת ה-ERP לסביבה מחסן נתונים. הממשק חייב:

▪ להיות קל לשימוש
▪ לאפשר גישה ל נתונים של ה- ERP
▪ להרים את המשמעות של נתונים אשר מועברים אליהם מחסן נתונים
▪ לדעת את המגבלות של ה-ERP שעלולות להיווצר בעת גישה ל- נתונים של ה- ERP:
▪ יושרה התייחסותית
▪ יחסים היררכיים
▪ קשרים לוגיים מרומזים
▪ אמנת יישום
▪ כל המבנים של נתונים נתמך על ידי ה- ERP, וכן הלאה ...
▪ להיות יעיל בגישה נתונים, על ידי מתן:
▪ תנועה ישירה של נתונים
▪ רכישת שינוי נתונים
▪ תמיכה בגישה בזמן ל נתונים
▪ להבין את הפורמט של ה נתונים, וכולי… ממשק עם SAP הממשק יכול להיות משני סוגים, תוצרת בית או מסחרי. חלק מהממשקים המסחריים העיקריים כוללים:

▪ SAS
▪ פתרונות פריים
▪ D2k וכן הלאה... טכנולוגיות ERP מרובות התייחסות לסביבת ה-ERP כאילו הייתה טכנולוגיה יחידה היא טעות גדולה. ישנן טכנולוגיות ERP רבות, כל אחת עם החוזקות שלה. הספקים הידועים ביותר בשוק הם:

▪ SAP
▪ Oracle Financials
▪ PeopleSoft
ג'יי.די אדוארדס
▪ באנס SAP SAP היא תוכנת ה-ERP הגדולה והמקיפה ביותר. יישומי SAP כוללים סוגים רבים של יישומים בתחומים רבים. ל-SAP יש מוניטין של:

▪ גדול מאוד
▪ קשה מאוד ויקר ליישום
▪ זקוק להרבה אנשים ויועצים ליישום
▪ זקוק לאנשים מיוחדים ליישום
▪ צריך הרבה זמן ליישם גם ל-SAP יש מוניטין של שינון נתונים מקרוב, מה שמקשה על מישהו מחוץ לאזור SAP לגשת אליהם. החוזק של SAP הוא שהוא מסוגל ללכוד ולאחסן כמות גדולה של נתונים. SAP הודיעה לאחרונה על כוונתה להרחיב את היישומים שלה ל מחסן נתונים. יש הרבה יתרונות וחסרונות לשימוש ב-SAP כספק מחסן נתונים. יתרון הוא ש-SAP כבר מותקן ורוב היועצים כבר מכירים את SAP.
החסרונות של SAP כספק של מחסן נתונים הם רבים: SAP אין ניסיון בעולם של מחסן נתונים אם SAP היא הספקית של מחסן נתונים, יש צורך "להוציא" i נתונים מ-SAP אל מחסן נתונים. דאטו רקורד של SAP של מערכת סגורה, לא סביר שיהיה קל להשיג i מ-SAP בה (???). ישנן סביבות מדור קודם המפעילות את SAP, כגון IMS, VSAM, ADABAS, ORACLE, DB2 וכן הלאה. SAP מתעקש על גישת "לא הומצא כאן". SAP לא רוצה לשתף פעולה עם ספקים אחרים כדי להשתמש או ליצור את מחסן נתונים. SAP מתעקשת לייצר את כל התוכנה שלה בעצמה.

למרות ש-SAP היא חברה גדולה וחזקה, עובדת הניסיון לשכתב את הטכנולוגיה של ELT, OLAP, ניהול המערכת ואפילו את בסיס הקוד של dbms זה פשוט מטורף. במקום לנקוט בשיתוף פעולה עם הספקים מחסן נתונים במשך שנים רבות, SAP נקטה בגישה שהם "מכירים הכי טוב". גישה זו מעכבת את ההצלחה שיכולה להיות ל-SAP בתחום מחסן נתונים.
סירובה של SAP לאפשר לספקים חיצוניים לגשת במהירות ובחן לשלו נתונים. עצם השימוש ב- a מחסן נתונים גישה נוחה אליו נתונים. כל הסיפור של SAP מבוסס על הקשה על הגישה נתונים.
חוסר הניסיון של SAP בהתמודדות עם כמויות גדולות של נתונים; בשדה של מחסן נתונים יש כרכים של נתונים מעולם לא ראיתי מ-SAP וכדי לטפל בכמויות הגדולות הללו של נתונים אתה צריך את הטכנולוגיה הנכונה. SAP כנראה לא מודע למחסום הטכנולוגי הזה שקיים להיכנס לתחום מחסן נתונים.
התרבות הארגונית של SAP: SAP בנתה עסק בהשגת i נתונים מהמערכת. אבל כדי לעשות זאת אתה צריך להיות בעל מנטליות אחרת. באופן מסורתי, חברות תוכנה שהיו טובות בהכנסת נתונים לסביבה לא היו טובות בהשגת נתונים לכיוון אחר. אם SAP תצליח לבצע מעבר מסוג זה, היא תהיה החברה הראשונה שתעשה זאת.

בקיצור, השאלה אם חברה צריכה לבחור ב-SAP כספק של מחסן נתונים. יש סיכונים מאוד רציניים מצד אחד ומעט מאוד תגמולים מצד שני. אבל יש סיבה נוספת שמונעת מבחירה ב-SAP כספק מחסן נתונים. כי לכל חברה צריכה להיות אותו דבר מחסן נתונים מכל שאר החברות? ה מחסן נתונים זה הלב של היתרון התחרותי. אם כל חברה תאמצה אותו דבר מחסן נתונים יהיה קשה, אם כי לא בלתי אפשרי, להשיג יתרון תחרותי. נראה ש-SAP חושב שא מחסן נתונים ניתן לראות כעוגייה וזה עוד סימן למנטליות שלהם של "להכניס את הנתונים" ליישומים.

אין ספק ERP אחר דומיננטי כמו SAP. אין ספק שיהיו חברות שילכו בדרך ה-SAP עבורן מחסן נתונים אבל ככל הנראה אלה מחסן נתונים SAPs יהיו גדולים, יקרים ויצרכו זמן רב ליצירה.

סביבות אלו כוללות פעילויות כגון עיבוד פקידי בנק, תהליכי הזמנת חברות תעופה, תהליכי תלונות ביטוח וכן הלאה. ככל שמערכת העסקאות ביצעה ביצועים טובים יותר, כך היה ברור יותר הצורך בהפרדה בין התהליך התפעולי לבין ה-DSS (Decision Support System). עם זאת, עם מערכות משאבי אנוש וכוח אדם, אתה אף פעם לא מתמודד עם כמויות גדולות של עסקאות. וכמובן, כאשר אדם נשכר או עוזב את החברה זהו תיעוד של עסקה. אבל יחסית למערכות אחרות, למערכות משאבי אנוש וכוח אדם פשוט אין הרבה עסקאות. לכן, במערכות משאבי אנוש וכוח אדם לא לגמרי ברור שיש צורך ב-DataWarehouse. במובנים רבים מערכות אלו הן מיזוג של מערכות DSS.

אבל יש גורם נוסף שיש לקחת בחשבון כאשר עוסקים ב-datawarehouse ו- PeopleSoft. בחוגים רבים, אני נתונים משאבי אנוש ומשאבים אישיים הם משניים לעסק העיקרי של החברה. רוב החברות הינן בייצור, מכירה, מתן שירותים וכן הלאה. מערכות משאבי אנוש וכוח אדם הן בדרך כלל משניות (או תומכות) לתחום העסקים הראשי של החברה. לכן, זה מעורפל ולא נוח א מחסן נתונים נפרד לתמיכה במשאבים ובמשאבים אישיים.

PeopleSoft שונה מאוד מ-SAP מהבחינה הזו. עם SAP, חובה שיהיה א מחסן נתונים. עם PeopleSoft, זה לא כל כך ברור. מחסן נתונים הוא אופציונלי עם PeopleSoft.

הדבר הטוב ביותר שאפשר לומר עבור נתונים PeopleSoft זה מחסן נתונים יכול לשמש לארכיון i נתונים הנוגע למשאבים אנושיים ואישיים ישנים. סיבה שנייה מדוע חברה תרצה להשתמש ב- מחסן נתונים a

החיסרון של סביבת PeopleSoft הוא לאפשר גישה וגישה חופשית לכלי ניתוח, ai נתונים מאת PeopleSoft. אך מעבר לסיבות אלו, ייתכנו מקרים בהם עדיף שלא יהיה מחסן נתונים עבורו נתונים רכות אנשים.

לסיכום

ישנם רעיונות רבים הנוגעים לבניית א מחסן נתונים בתוך תוכנת ERP.
כמה מהם הם:

▪ הגיוני שיהיה א מחסן נתונים מי נראה כמו כל אחד אחר בתעשייה?
▪ עד כמה ה-ERP גמיש מחסן נתונים תוֹכנָה?
▪ ERP מחסן נתונים תוכנה יכולה להתמודד עם נפח של נתונים שנמצא ב"מחסן נתונים זִירָה"?
▪ מהי רישום המעקב שספק ה-ERP עושה מול קלה וזולה, גוזלת זמן, ai נתונים? (מהו הרקורד של ספקי ה-ERP באספקה של נתונים זולים, בזמן וקלים לגישה?)
▪ מהי ההבנה של ספק ה-ERP בארכיטקטורת ה-DSS ובמפעל המידע הארגוני?
▪ ספקי ERP מבינים איך להשיג נתונים בתוך הסביבה, אבל גם להבין איך לייצא אותם?
▪ עד כמה פתוח ספק ה-ERP לכלי אחסון נתונים?
כל השיקולים הללו חייבים להיעשות בעת קביעת היכן לשים את מחסן נתונים אשר יארח את i נתונים ERP ואחרים נתונים. באופן כללי, אלא אם יש סיבה משכנעת לעשות אחרת, מומלץ לבנות מחסן נתונים מחוץ לסביבת ספקי ה-ERP. פרק 1 סקירה כללית של ארגון ה-BI נקודות מפתח:
מאגרי מידע פועלים בצורה הפוכה מארכיטקטורת הבינה העסקית (BI):
תרבות ארגונית ו-IT יכולים להגביל את הצלחת בניית ארגוני BI.

הטכנולוגיה היא כבר לא הגורם המגביל עבור ארגוני BI. הבעיה של אדריכלים ומתכנני פרויקטים היא לא האם הטכנולוגיה קיימת, אלא האם הם יכולים ליישם ביעילות את הטכנולוגיה הזמינה.

עבור חברות רבות א מחסן נתונים הוא מעט יותר מפיקדון פסיבי שמפיץ i נתונים למשתמשים הזקוקים לכך. ה נתונים מופקים ממערכות מקור ומאוכלסים במבני יעד על ידי מחסן נתונים. אני נתונים ניתן גם לנקות אותם עם כל מזל. עם זאת, לא מתווסף או נאסף ערך נוסף על ידי נתונים במהלך תהליך זה.

בעיקרו של דבר, dw פסיבי, במקרה הטוב, מספק רק i נתונים נקי ותפעולי לעמותות משתמשים. יצירת מידע והבנה אנליטית תלויים לחלוטין במשתמשים. לשפוט אם ה-DW (מחסן נתונים) האם הצלחה היא סובייקטיבית. אם נשפוט הצלחה לפי היכולת לאסוף, לשלב ולנקות ביעילות את i נתונים תאגיד על בסיס צפוי, אז כן, ה-DW הוא הצלחה. מצד שני, אם נסתכל על איסוף, איחוד וניצול המידע של הארגון בכללותו, אז ה-DW הוא כישלון. DW מספק מעט או ללא ערך מידע. כתוצאה מכך, המשתמשים נאלצים להסתפק, וכך יוצרים ממגורות מידע. פרק זה מציג חזון מקיף לסיכום ארכיטקטורת ה-BI (Business Intelligence) הארגוני. אנו מתחילים בתיאור של BI ולאחר מכן עוברים לדיונים על עיצוב ופיתוח מידע, בניגוד פשוט לספק נתונים למשתמשים. לאחר מכן דיונים מתמקדים בחישוב הערך של מאמצי ה-BI שלך. אנו מסכמים בהגדרת האופן שבו IBM מתייחסת לדרישות הארכיטקטוניות של הארגון שלך.

תיאור הארכיטקטורה של ארגון BI

מערכות מידע עוצמתיות מוכוונות עסקאות הן כעת צו היום בכל ארגון גדול, ולמעשה מיישרות את מגרש המשחקים עבור תאגידים ברחבי העולם.

עם זאת, הישארות התחרותית דורשת כעת מערכות בעלות אוריינטציה אנליטית שיכולות לחולל מהפכה ביכולתה של החברה לגלות מחדש ולהשתמש במידע שכבר יש לה. מערכות אנליטיות אלו נובעות מהבנה מהעושר של נתונים זמין. BI יכול לשפר את הביצועים בכל המידע ברחבי הארגון. חברות יכולות לשפר את יחסי לקוח-ספק, לשפר את רווחיות המוצרים והשירותים, לייצר עסקאות חדשות וטובות יותר, לשלוט בסיכון, ובין רווחים רבים אחרים לקצץ באופן דרסטי בהוצאות. עם BI, החברה שלך סוף סוף מתחילה להשתמש במידע על לקוחות כנכס תחרותי הודות ליישומים שיש להם יעדי שוק.

האמצעי העסקי הנכון פירושו לקבל תשובות סופיות לשאלות מפתח כגון:

▪ איזה משלנו לקוחות האם הם גורמים לנו להרוויח יותר, או שהם גורמים לנו להפסיד כסף?
▪ היכן שהמיטב שלנו גרים לקוחות ביחס ל חנות/ מחסן שהם פוקדים?
▪ אילו מהמוצרים והשירותים שלנו יכולים להימכר בצורה היעילה ביותר ולמי?
▪ אילו מוצרים ניתן למכור בצורה היעילה ביותר ולמי?
▪ איזה מסע מכירות מצליח יותר ומדוע?
▪ אילו ערוצי מכירה הכי יעילים עבור אילו מוצרים?
▪ כיצד נוכל לשפר את היחסים עם הטובים ביותר שלנו לקוחות? לרוב החברות יש נתונים קשה לענות על שאלות אלו.
מערכות תפעול מייצרות כמויות גדולות של מוצר, לקוח ועלות נתונים מנקודות המכירה, ההזמנות, שירות הלקוחות והתמיכה הטכנית. האתגר הוא לחלץ ולנצל את המידע הזה. חברות רבות מרוויחות רק מחלקים קטנים שלהן נתונים לניתוחים אסטרטגיים.
I נתונים נשאר, לעתים קרובות הצטרף עם i נתונים שמקורם במקורות חיצוניים כגון דוחות ממשלתיים ומידע קנוי אחר, הם מכרה זהב שרק מחכה לחקור אותו, ו נתונים הם רק צריכים להיות מעודנים בהקשר האינפורמטיבי של הארגון שלך.

ניתן ליישם ידע זה בכמה דרכים, החל מעיצוב אסטרטגיה ארגונית כוללת לתקשורת אישית עם ספקים, דרך מוקדים טלפוניים, חשבוניות, אינטרנט ועוד נקודות. הסביבה העסקית של היום מכתיבה ש-DW ופתרונות BI קשורים מתפתחים מעבר להפעלת מבנים עסקיים מסורתיים. נתונים אשר אני נתונים מנורמל ברמה האטומית ו"חוות כוכבים/קוביות".

מה שנדרש כדי להישאר תחרותי הוא מיזוג של טכנולוגיות מסורתיות ומתקדמות במאמץ לתמוך בנוף אנליטי רחב.
לבסוף, הסביבה הכללית חייבת לשפר את הידע על החברה בכללותה, ולוודא שהפעולות הננקטות כתוצאה מהניתוחים שבוצעו יהיו שימושיות כך שכולם ירוויחו.

לדוגמא, נניח שאתה מדרג את שלך לקוחות בקטגוריות סיכון גבוה או נמוך.
בין אם המידע הזה נוצר על ידי מודל כרייה או אמצעי אחר, יש להכניס אותו ל-DW ולהפוך אותו לנגיש לכל אחד, באמצעות כל כלי גישה, כגון דוחות סטטיים, גיליונות אלקטרוניים, טבלאות או עיבוד אנליטי מקוון (OLAP).

עם זאת, נכון לעכשיו, חלק גדול מהסוג הזה של מידע נשאר בממגורות נתונים של האנשים או המחלקות שמייצרים את הניתוח. לארגון בכללותו יש מעט או ללא נראות להבנה. רק על ידי מיזוג סוג זה של תוכן מידע לתוך ה-DW הארגוני שלך תוכל לחסל ממגורות מידע ולהעלות את סביבת ה-DW שלך.
ישנם שני מכשולים עיקריים לפיתוח ארגון BI.
ראשית, יש לנו את הבעיה של הארגון עצמו והמשמעת שלו.
אמנם אנחנו לא יכולים לעזור בשינויי מדיניות ארגונית, אבל אנחנו יכולים לעזור להבין את מרכיבי ה-BI של הארגון, הארכיטקטורה שלו וכיצד הטכנולוגיה של IBM מקלה על פיתוחו.
המחסום השני שצריך להתגבר עליו הוא היעדר טכנולוגיה משולבת והכרת שיטה הקוראת לכל מרחב ה-BI בניגוד לרכיב קטן בלבד.

IBM מגיבה לשינויים בשילוב הטכנולוגיה. באחריותך לספק עיצוב מודע. ארכיטקטורה זו חייבת להיות מפותחת עם טכנולוגיה שנבחרה לאינטגרציה בלתי מוגבלת, או לכל הפחות, עם טכנולוגיה שדבקה בסטנדרטים פתוחים. כמו כן, הנהלת החברה שלך חייבת לוודא שמיזם Bi מבוצע על פי לוח זמנים ולא כזה של מתן אפשרות לפתח ממגורות מידע הנובעות מאג'נדות, או מטרות המשרתות את עצמן.
אין זה אומר שסביבת ה-BI אינה רגישה לתגובה לצרכים ולדרישות השונות של משתמשים שונים; במקום זאת, המשמעות היא שהיישום של אותם צרכים ודרישות אינדיבידואליות נעשה לטובת ארגון ה-BI כולו.
ניתן למצוא תיאור של ארכיטקטורת ארגון ה-BI בעמוד 9 באיור 1.1 הארכיטקטורה מדגימה שילוב עשיר של טכנולוגיות וטכניקות.
מהתפיסה המסורתית, הארכיטקטורה כוללת את מרכיבי המחסן הבאים

שכבה אטומית.

זהו הבסיס, הלב של ה-Dw כולו ולכן של הדיווח האסטרטגי.
I נתונים מאוחסנים כאן ישמרו על שלמות היסטורית, כך מדווחים נתונים וכוללים מדדים נגזרים, כמו גם ניקוי, שילוב ואחסנה באמצעות מודלים של כרייה.
כל השימוש שלאחר מכן באלה נתונים ומידע קשור נגזר מהמבנה הזה. זהו מקור מצוין לכרייה נתונים ולדוחות עם שאילתות SQL מובנות

פיקדון תפעולי של נתונים או בסיס דוחות של נתונים(מאגר נתונים תפעולי (ODS) או דיווח מסד נתונים.)

זהו מבנה של נתונים תוכנן במיוחד עבור דיווח טכני.

I נתונים מאוחסנים ומדווחים מעל מבנים אלה יכולים בסופו של דבר להתפשט לתוך המחסן דרך אזור ההיערכות, שם ניתן להשתמש בו לאיתות אסטרטגי.

אזור בימוי.

התחנה הראשונה לרוב נתונים המיועד לסביבת המחסן הוא אזור הארגון.
הנה אני נתונים הם משולבים, מנוקים והופכים אותם נתונים רווחים שיאכלסו את מבנה המחסן

צעדות תאריך.

חלק זה של האדריכלות מייצג את המבנה של נתונים משמש במיוחד עבור OLAP. הנוכחות של datamarts, אם אני נתונים הם מאוחסנים בסכימות הכוכבים שהם מכסים נתונים רב ממדי בסביבה יחסית, או בקבצים של נתונים קנייני בשימוש על ידי טכנולוגיית OLAP ספציפית, כגון DB2 OLAP Server, אינו רלוונטי.

האילוץ היחיד הוא שהארכיטקטורה מקלה על השימוש בה נתונים רַב מֵמָדִים.
הארכיטקטורה כוללת גם טכנולוגיות וטכניקות Bi קריטיות הנבדלות כ:

ניתוח מרחבי

החלל הוא רוח גבית עבור האנליסט והוא קריטי לרזולוציה מלאה. החלל יכול לייצג מידע על האנשים שחיים במיקום מסוים, כמו גם מידע על היכן נמצא אותו מיקום פיזית ביחס לשאר העולם.

כדי לבצע ניתוח זה, עליך להתחיל בקשירת המידע שלך לקואורדינטות קווי רוחב ואורך. זה מכונה "קידוד גיאוגרפי" והוא חייב להיות חלק מתהליך החילוץ, ההמרה והטעינה (ETL) ברמה האטומית של המחסן שלך.

כריית מידע.

החילוץ של נתונים מאפשר לחברות שלנו להגדיל את מספר לקוחות, כדי לחזות מגמות מכירות ולאפשר ניהול מערכות יחסים עם i לקוחות (CRM), בין יתר יוזמות BI.

החילוץ של נתונים לכן יש לשלב אותו במבנים של נתונים מחסן ונתמך בתהליכי מחסן כדי לוודא שימוש יעיל ויעיל בטכנולוגיה ובטכניקות נלוות.

כפי שצוין בארכיטקטורת ה-BI, הרמה האטומית Dwhouse, כמו גם datamarts, הם מקור מצוין של נתונים לחילוץ. אותם נכסים חייבים להיות גם נמענים של תוצאות חילוץ כדי להבטיח זמינות לקהל הרחב ביותר.

סוכנים.

ישנם "סוכנים" שונים לבחינת הלקוח לכל נקודה כגון, מערכות ההפעלה של החברה וה-dw עצמם. סוכנים אלה יכולים להיות רשתות עצביות מתקדמות שהוכשרו ללמוד על מגמות בכל נקודה, כגון ביקוש עתידי למוצר המבוסס על קידום מכירות, מנועים מבוססי כללים לתגובה ל נתתי מערכת נסיבות, או אפילו סוכנים פשוטים המדווחים על חריגים למנהלים הבכירים. תהליכים אלו מתרחשים בדרך כלל בזמן אמת, ולכן, חייבים להיות מחוברים באופן הדוק לתנועת התהליכים נתונים. כל המבנים האלה של נתונים, טכנולוגיות וטכניקות מבטיחות שלא תבלו את הלילה ביצירת ארגון של ה-BI שלכם.

פעילות זו תפתח בשלבים מצטברים, עבור נקודות קטנות.
כל שלב הוא מאמץ פרויקט עצמאי, והוא מכונה איטרציה ב-BI dw או ביוזמה שלך. איטרציות עשויות לכלול הטמעת טכנולוגיות חדשות, החל בטכניקות חדשות, הוספת מסגרות חדשות נתונים , טוען i נתונים נוסף , או עם הרחבת הניתוח של הסביבה שלך. פסקה זו נדונה ביתר פירוט בפרק 3.

בנוסף למסגרות DW מסורתיות וכלי BI, ישנם היבטים נוספים של ארגון ה-BI שלך שאתה צריך לעצב עבורם, כגון:

נקודות מגע של לקוח (מגע של לקוח נקודות).

כמו בכל ארגון מודרני, ישנן מספר נקודות מגע של לקוחות המצביעות על חוויה חיובית עבורכם לקוחות. ישנם ערוצים מסורתיים כמו סוחרים, מרכזייה, דיוור ישיר, מולטימדיה ופרסום בדפוס, כמו גם ערוצים עדכניים יותר כמו דואר אלקטרוני ואינטרנט, נתונים יש לרכוש, להעביר, לנקות, לעבד מוצרים עם נקודת מגע כלשהי, ולאחר מכן לאכלס אותם במתקנים נתונים של BI.

יסודות נתונים איגודים תפעוליים ומשתמשים

מאגרי מידע וקהילות משתמשים).
בסוף נקודות הקשר של לקוחות תוכלו למצוא את היסודות של נתונים יישום של החברה ושל קהילות המשתמשים. ה נתונים קיימים הם נתונים המסורתי שיש לאחד אותו ולמזג אותו עם נתונים זורם מנקודות המגע כדי לעמוד במידע הדרוש.

אנליסטים. (אנליסטים)

המרוויח העיקרי מסביבת ה-BI הוא האנליסט. הוא זה שמרוויח מהחילוץ הנוכחי של נתונים מבצעי, משולב עם מקורות שונים של נתונים , מתוגבר בתכונות כגון ניתוח גיאוגרפי (גיאוגרפי) ומוצג בטכנולוגיות BI המאפשרות כרייה, OLAP, דיווח SQL מתקדם וניתוח גיאוגרפי. הממשק העיקרי של האנליסט לסביבת הדיווח הוא פורטל ה-BI.

עם זאת, האנליסט אינו היחיד שמרוויח מארכיטקטורת ה-BI.
מנהלים, עמותות משתמשים גדולות ואפילו שותפים, ספקים ואני לקוחות הם צריכים למצוא יתרונות ב- BI ארגוני.

לולאת הזנה אחורית.

ארכיטקטורת BI היא סביבת למידה. עיקרון אופייני להתפתחות הוא לאפשר מבנים מתמשכים של נתונים להתעדכן על ידי טכנולוגיית BI בה נעשה שימוש ועל ידי פעולות המשתמש שננקטו. דוגמה לכך היא ניקוד לקוחות.

אם מחלקת המכירות עושה מודל כרייה של ציוני לקוחות כגון שימוש בשירות חדש, אז מחלקת המכירות לא צריכה להיות הקבוצה היחידה הנהנית מהשירות.

במקום זאת, כריית מודלים צריכה להתבצע כחלק טבעי מזרימת הנתונים בתוך הארגון וציוני הלקוחות צריכים להפוך לחלק משולב מהקשר המידע במחסן, גלוי לכל המשתמשים. Bi-bI-centric IBM Suite כולל DB2 UDB, DB2 OLAP Server כולל את רכיבי הטכנולוגיה החשובים ביותר, המוגדרים באיור 1.1.

אנו משתמשים בארכיטקטורה כפי שהיא מופיעה באיור זה מהספר כדי לתת לנו רמת המשכיות ולהדגים כיצד כל אחד מהמוצרים של IBM משתלב בסכמת ה-BI הכוללת.

אספקת תוכן המידע (מתן תוכן מידע)

עיצוב, פיתוח והטמעה של סביבת ה-BI שלך היא משימה לא פשוטה. העיצוב חייב לאמץ דרישות עסקיות נוכחיות ועתידיות כאחד. שרטוט האדריכלות חייב להיות מקיף כדי לכלול את כל המסקנות שנמצאו בשלב התכנון. הביצוע חייב להישאר מחויב למטרה אחת: לפתח את ארכיטקטורת ה-BI כפי שהוצגה באופן רשמי בתכנון ומבוססת על דרישות עסקיות.

קשה במיוחד לטעון שמשמעת תבטיח הצלחה יחסית.
זה פשוט כי אתה לא מפתח סביבת BI בבת אחת, אלא בצעדים קטנים לאורך זמן.

עם זאת, זיהוי רכיבי ה-BI של הארכיטקטורה שלך חשוב משתי סיבות: אתה תניע את כל החלטות הארכיטקטורה הטכנית הבאות.
תוכל לתכנן באופן מודע שימוש מסוים בטכנולוגיה למרות שאולי לא תזדקק לטכנולוגיה חוזרת במשך מספר חודשים.

הבנה מספקת של הדרישות העסקיות שלך תשפיע על סוג המוצרים שתרכוש עבור הארכיטקטורה שלך.
העיצוב והפיתוח של הארכיטקטורה שלך מבטיחים שהמחסן שלך כן

לא אירוע אקראי, אלא מודעה מחושבת היטב, שנבנתה בקפידה לפעול של אמנות כפסיפס של טכנולוגיה מעורבת.

תכנן את תוכן המידע

כל התכנון הראשוני חייב להתמקד ולזהות את רכיבי ה-BI העיקריים שיזדקקו לסביבה הכוללת כעת ובעתיד.
הכרת הדרישות העסקיות חשובה.

עוד לפני שהחל תכנון רשמי כלשהו, מתכנן הפרויקט יכול לעתים קרובות לזהות מרכיב אחד או שניים מיד.
עם זאת, לא ניתן למצוא בקלות את איזון הרכיבים שעשויים להידרש עבור הארכיטקטורה שלך. במהלך שלב התכנון, החלק העיקרי של הארכיטקטורה מקשר את סשן פיתוח האפליקציות (JAD) למחקר לזיהוי דרישות עסקיות.

לפעמים ניתן להפקיד את הדרישות הללו על כלי שאילתה ודיווח.
לדוגמה, משתמשים מצהירים שאם הם רוצים להפוך דוח עדכני לאוטומטי, עליהם להפיק ידנית על ידי שילוב שני דוחות נוכחיים והוספת החישובים שנגזרו מהשילוב של נתונים.
אמנם דרישה זו פשוטה, אך היא מגדירה פונקציונליות מסוימת של תכונה שעליך לכלול בעת רכישת כלי דיווח עבור הארגון שלך.

המעצב חייב גם לרדוף אחר דרישות נוספות כדי לקבל תמונה מלאה. האם משתמשים רוצים להירשם לדוח זה?
האם קבוצות משנה של דוחות נוצרות ונשלחות בדוא"ל למשתמשים שונים? רוצים לראות דוח זה בפורטל החברה? כל הדרישות הללו הן חלק מהצורך הפשוט להחליף דוח ידני לפי דרישות המשתמשים. היתרון של דרישות מסוג זה הוא שכולם, משתמשים ומעצבים, מכירים את המושג דוחות.

עם זאת, ישנם סוגים אחרים של עסקים שעלינו לתכנן עבורם. כאשר דרישות עסקיות מוצגות בצורה של שאלות עסקיות אסטרטגיות, קל למתכנן המנוסה להבחין בדרישות מימדיות ומדידות/עובדות.

אם משתמשי JAD לא יודעים להגדיר את הדרישות שלהם בצורה של בעיה עסקית, המעצב יספק לעתים קרובות דוגמאות כדי לדלג על הפעלת איסוף הדרישות.
המתכנן המומחה יכול לעזור למשתמשים להבין לא רק עסקים אסטרטגיים, אלא גם כיצד לעצב אותו.
גישת איסוף הדרישות נדונה בפרק 3; לעת עתה אנו רק רוצים להצביע על הצורך בעיצוב עבור כל מיני דרישות BI.

בעיה עסקית אסטרטגית היא לא רק דרישה עסקית, אלא גם רמז עיצובי. אם אתה צריך לענות על שאלה רב מימדית, אז אתה צריך לשנן, להציג את נתונים מידות, ואם אתה צריך לשנן את נתונים רב ממדי, אתה צריך להחליט איזה סוג של טכנולוגיה או טכניקה אתה הולך להשתמש.

האם אתה מיישם סכימת כוכב קובייה שמורה, או שניהם? כפי שניתן לראות, אפילו נושא עסקי פשוט יכול להשפיע רבות על העיצוב. אבל דרישות עסקיות מסוג זה הן דבר שבשגרה, וכמובן, לפחות על ידי מתכנני ומעצבי פרויקטים מנוסים.

היה מספיק ויכוח על טכנולוגיות ותמיכה של OLAP, ומגוון רחב של פתרונות זמינים. עד כה נגענו בצורך להפגיש דיווח פשוט עם דרישות עסקיות ממדיות, וכיצד דרישות אלו משפיעות על החלטות ארכיטקטורה טכנית.

אבל מהן הדרישות שאינן מובנות בקלות על ידי המשתמשים או צוות Dw? האם אי פעם תזדקק לניתוח מרחבי (ניתוח מרחבי)?
דגמי הכרייה של נתונים האם הם יהיו חלק הכרחי מהעתיד שלך? מי יודע?

חשוב לציין כי טכנולוגיות מסוג זה אינן מוכרות היטב על ידי קהילות המשתמשים הכלליות וחברי צוות DW, בין השאר, ייתכן שהסיבה לכך היא שהן מטופלות בדרך כלל על ידי מומחים טכניים פנימיים או צד שלישי. זהו מקרה קצה של הבעיות שסוגים אלה של טכנולוגיות מייצרות. אם משתמשים אינם יכולים לתאר דרישות עסקיות או למסגר אותן כדי לספק הנחיות למעצבים, הם יכולים להישאר מעיניהם או, גרוע מכך, פשוט להתעלם.

בעייתי יותר זה הופך כאשר המעצב והמפתח אינם יכולים לזהות את היישום של אחת מהטכנולוגיות המתקדמות אך הקריטיות הללו.
כפי ששמענו לעתים קרובות את המעצבים אומרים, "טוב, למה שלא נניח את זה עד שנקבל את הדבר האחר הזה? "האם הם באמת מתעניינים בסדרי עדיפויות, או שהם פשוט נמנעים מדרישות שהם לא מבינים? סביר להניח שזו ההנחה האחרונה. נניח שצוות המכירות שלך מסר דרישה עסקית, כפי שצוין באיור 1.3, כפי שאתה יכול לראות, הדרישה ממוסגרת בצורה של בעיה עסקית. ההבדל בין בעיה זו לבעיית הממדים האופיינית הוא המרחק. במקרה זה, צוות המכירות רוצה לדעת, על בסיס חודשי, את סך המכירות ממוצרים, מחסנים ו לקוחות שגרים בטווח של 5 מיילים מהמחסן שבו הם קונים.

למרבה הצער, מעצבים או אדריכלים יכולים פשוט להתעלם מהמרכיב המרחבי באומרו, "יש לנו את הלקוח, המוצר וה נתונים של הפיקדון. בואו נעצור את המרחק עד לאיטרציה נוספת.

"תשובה לא נכונה. בעיה עסקית מסוג זה עוסקת ב-BI. זה מייצג הבנה עמוקה יותר של העסק שלנו ומרחב אנליטי חזק עבור האנליסטים שלנו. BI הוא מעבר לשאילתות פשוטות או דיווח סטנדרטי, או אפילו OLAP. זה לא אומר שהטכנולוגיות האלה לא חשובות ל-BI שלך, אבל הן כשלעצמן אינן מייצגות את סביבת ה-BI.

תכנון להקשר המידע (תכנון לתוכן מידע)

כעת, לאחר שזיהינו את הדרישות העסקיות המבדילות בין מרכיבי ליבה שונים, יש לכלול אותן בשרטוט אדריכלי כולל. חלק ממרכיבי ה-BI הם חלק מהמאמצים הראשוניים שלנו, בעוד שחלקם לא יושמו במשך מספר חודשים.

עם זאת, כל הדרישות הידועות באות לידי ביטוי בתכנון כך שכאשר אנו צריכים ליישם טכנולוגיה מסוימת, אנו מוכנים לעשות זאת. משהו בפרויקט ישקף חשיבה מסורתית.

סט זה של נתונים משמש לתמיכה בשימושים מאוחרים יותר של נתונים ממדי מונע על ידי הבעיות העסקיות שזיהינו. ככל שנוצרים מסמכים נוספים, כגון פיתוח הפרויקט של ה נתונים, נתחיל בפורמליזציה כמו i נתונים הם מתפשטים בסביבה. ביררנו את הצורך לייצג את i נתונים בצורה ממדית, חלוקתם (לפי צרכים ספציפיים ספציפיים) ל-Data March.

השאלה הבאה שיש לענות עליה היא: כיצד ייבנו מחנות הנתונים הללו?
האם אתה בונה את הכוכבים כדי לתמוך בקוביות, או רק קוביות, או רק את הכוכבים? (או קוביות נכונות, או כוכבים נכונים). צור את הארכיטקטורה עבור נתונים תלויים המצריכים שכבה אטומית לכולם נתונים נרכש? אפשר לרכוש הצבעות נתונים עצמאיות נתונים ישירות ממערכות הפעלה?

איזו טכנולוגיית קוביות תנסה לתקנן?

יש לך כמויות אדירות של אלים נתונים נדרש לניתוח ממדים או האם אתה צריך קוביות של כוח המכירות הלאומי שלך על בסיס שבועי או שניהם? האם אתה בונה אובייקט רב עוצמה כמו DB2 OLAP Server למימון או קוביות Cognos PowerPlay עבור ארגון המכירות שלך או שניהם? אלו הן החלטות התכנון האדריכליות הגדולות שישפיעו על סביבת ה-BI שלך קדימה. כן, זיהית צורך ב-OLAP. עכשיו איך אתה מתכוון לבצע סוג כזה של טכניקה וטכנולוגיה?

כיצד משפיעות חלק מהטכנולוגיות המתקדמות יותר על העיצובים שלך? בוא נניח שזיהית צורך מרחבי בארגון שלך. כעת עליך להיזכר במהדורות השרטוט האדריכלי גם אם אינך מתכוון ליצור רכיבים מרחביים במשך מספר חודשים. על האדריכל לתכנן היום לפי מה שצריך. צפו את הצורך בניתוח מרחבי שיוצר, מאחסן, מתחזק ומספק גישה אליו נתונים מֶרחָבִי. זה בתורו אמור לשמש מגבלה לגבי סוג טכנולוגיית התוכנה ומפרטי הפלטפורמה שאתה יכול לשקול כעת. לדוגמה, מערכת הניהול של מאגר מידע יחסי (RDBMS) שאתה שומר עבור השכבה האטומית שלך חייב להיות בעל היקף מרחבי חזק. זה יבטיח ביצועים מקסימליים כאשר אתה משתמש בגיאומטריה ובאובייקטים מרחביים ביישומים האנליטיים שלך. אם ה-RDBMS שלך לא יכול להתמודד עם נתונים (מרכזי מרחבי) פנימית, אז תצטרך להקים א מאגר מידע (מרכזי מרחבי) חיצוני. זה מסבך את ניהול הבעיות ופוגע בביצועים הכוללים שלך, שלא לדבר על הבעיות הנוספות שזה יוצר עבור ה-DBAs שלך, מכיוון שסביר להניח שיש להם הבנה מינימלית של היסודות של נתונים גם מרחבית. מצד שני, אם מנוע ה-RDMBS שלך מטפל בכל הרכיבים המרחביים והמייעל שלו מודע לצרכים המיוחדים (לדוגמה, אינדקס) של אובייקטים מרחביים, אזי ה-DBAs שלך יכולים לטפל בקלות בבעיות ניהול ואתה יכול למקסם את הביצועים.

כמו כן, עליך להתאים את אזור ההיערכות ואת שכבת הסביבה האטומית כדי לכלול ניקוי כתובת (א

מרכיב מפתח לניתוח מרחבי), כמו גם השמירה שלאחר מכן של אובייקטים מרחביים. רצף מהדורות העיצוב נמשך כעת, לאחר שהצגנו את הרעיון של ניקיון כתובות. ראשית, יישום זה יכתיב את סוג התוכנה שאתה צריך עבור מאמץ ה-ETL שלך.

האם אתה צריך מוצרים כמו Trillium כדי לספק לך כתובת נקייה, או ספק ETL לבחירתך כדי לספק את הפונקציונליות הזו?
לעת עתה חשוב שתעריכו את רמת העיצוב שיש להשלים לפני שתתחילו לתחזק את המחסן שלכם. הדוגמאות לעיל צריכות להדגים את שלל החלטות העיצוב שצריכות לעקוב אחר הזיהוי של כל דרישה עסקית מסוימת. כאשר מתקבלות בצורה נכונה, החלטות עיצוב אלו מקדמות תלות הדדית בין המבנים הפיזיים של הסביבה שלך, בחירת הטכנולוגיה שבה נעשה שימוש וזרימת ההפצה של תוכן מידע. ללא ארכיטקטורת BI קונבנציונלית זו, הארגון שלך יהיה נתון לתמהיל כאוטי של טכנולוגיות קיימות, במקרה הטוב קשורות יחד באופן רופף כדי לספק יציבות לכאורה.

שמור על תוכן מידע

הבאת ערך המידע לארגון שלך היא משימה קשה מאוד. ללא הבנה וניסיון מספיקים, או הנדסה ותכנון נכון, אפילו הצוותים הטובים ביותר ייכשלו. מצד שני, אם יש לך אינטואיציה נהדרת ועיצוב מפורט אבל אין לך משמעת לביצוע, פשוט בזבזת את הכסף והזמן שלך כי המאמץ שלך נידון להיכשל. המסר צריך להיות ברור: אם חסר לך אחד או יותר מהמיומנויות הללו, הבנה/ניסיון או משמעת תכנון/עיצוב או יישום, הדבר יוביל לשתק או להרס המבנה של ארגון ה-BI.

האם הצוות שלך מוכן מספיק? האם מישהו בצוות ה-BI שלך מבין את הנוף האנליטי העצום הזמין בסביבות BI, ואת הטכניקות והטכנולוגיות הדרושות כדי לשמור על הנוף הזה? האם יש מישהו בצוות שלך שיכול להבחין בהבדל ביישום מתקדם

דיווח סטטי ו-OLAP, או ההבדלים בין ROLAP ל-OLAP? האם אחד מחברי הצוות שלך מזהה בבירור את דרך הכרייה וכיצד היא עשויה להשפיע על המחסן או כיצד המחסן יכול לתמוך בביצועי הכרייה? חבר צוות מבין את הערך של נתונים טכנולוגיה מבוססת חלל או סוכנים? האם יש לך מישהו שמעריך את יישום הכלים הייחודי של טכנולוגיית ETL vs Message Broker? אם אין לך אותו, קבל אחד. BI גדול בהרבה משכבה אטומית מנורמלת, OLAP, סכימות כוכבים ו-ODS.

ההבנה והניסיון לזהות את דרישות ה-BI והפתרונות שלהן חיונית ליכולת שלך לעצב כראוי את צורכי המשתמש ולתכנן וליישם את הפתרונות שלהם. אם קהילת המשתמשים שלך מתקשה לתאר דרישות, צוות המחסן צריך לספק את ההבנה הזו. אבל אם צוות המחסן

אינו מזהה את היישום הספציפי של BI - למשל, כריית נתונים - אז לא עדיף שסביבות BI מוגבלות לרוב להיות מאגרים פסיביים. עם זאת, התעלמות מטכנולוגיות אלו אינה מפחיתה מחשיבותן ומההשפעה שיש להן על הופעת יכולות הבינה העסקית של הארגון שלך, כמו גם על נכס המידע שאתה מתכנן לקדם.

עיצוב חייב לכלול את הרעיון של ציור, ושניהם דורשים אדם מוכשר. בנוסף, התכנון מצריך פילוסופיית washouse של צוות ועמידה בתקנים. לדוגמה, אם החברה שלך הקימה תקן פלטפורמה או זיהתה RDBMS מסוים שהיא רוצה לתקן על פני הפלטפורמה, הכרחי שכל אחד בצוות יעמוד בסטנדרטים הללו. בדרך כלל צוות מבטא את הצורך בסטנדרטיזציה (לקהילות משתמשים), אך הצוות עצמו אינו מוכן לדבוק בסטנדרטים שנקבעו בתחומים אחרים בחברה או אולי אפילו בחברות דומות. לא רק שזה צבוע, אלא שהוא קובע שהחברה אינה מסוגלת לנצל משאבים והשקעות קיימים. זה לא אומר שאין מצבים שמצדיקים פלטפורמה או טכנולוגיה לא סטנדרטית; עם זאת, המאמצים של המחסן

עליהם לשמור בקנאות על הסטנדרטים של הארגון עד שהדרישות העסקיות יקבעו אחרת.

מרכיב המפתח השלישי הדרוש לבניית ארגון BI הוא משמעת.
זה תלוי בסך הכל, באותה מידה ביחידים ובסביבה. מתכנני פרויקטים, נותני חסות, אדריכלים ומשתמשים חייבים להעריך את המשמעת הנדרשת לבניית נכסי המידע של החברה. מעצבים חייבים לכוון את מאמצי העיצוב שלהם כדי להשלים מאמצים אחרים הדרושים בחברה.

לדוגמה, נניח שהחברה שלך בונה אפליקציית ERP שיש לה רכיב מחסן.
לפיכך באחריותם של מעצבי ה-ERP לשתף פעולה עם צוות סביבת המחסן כדי לא להתחרות או לשכפל את העבודה שכבר החלה.

משמעת היא גם נושא שצריך להתייחס אליו על ידי הארגון כולו והוא בדרך כלל מבוסס ומחייב בדרג ביצועי.
האם מנהלים מוכנים לדבוק בגישה מעוצבת? גישה שמבטיחה ליצור תוכן מידע שבסופו של דבר יספק ערך לכל תחומי הארגון, אבל אולי יתפשר על אג'נדות אישיות או מחלקתיות? זכור את המשפט "לחשוב על הכל חשוב יותר מלחשוב על דבר אחד". האמירה הזו נכונה לארגוני BI.

למרבה הצער, מחסנים רבים ממקדים את מאמציהם בניסיון למקד ולספק ערך למחלקה מסוימת או למשתמשים ספציפיים, עם מעט התייחסות לארגון בכללותו. נניח שהמנהל מבקש סיוע מצוות המחסן. הצוות מגיב במאמץ של 90 יום שכולל לא רק אספקת דרישות ההודעה שהוגדרו על ידי ההנהלה אלא להבטיח שכל נתונים בסיס מעורבב לרמה האטומית לפני הכנסתם לטכנולוגיית הקובייה המוצעת.
תוספת הנדסית זו מבטיחה שמפעל המחסה ייהנה מה- נתונים הכרחי למנהל.
עם זאת, המנהל שוחח עם חברות ייעוץ חיצוניות שהציעו בקשה דומה עם מסירה תוך פחות מ-4 שבועות.

בהנחה שצוות המחסה הפנימי מוכשר, למנהל יש בחירה. מי יכול לתמוך בדיסציפלינה ההנדסית הנוספת הדרושה להגדלת נכס המידע הארגוני או יכול לבחור לבנות פתרון משלו במהירות. נראה שהאחרון נבחר לעתים קרובות מדי ורק משמש ליצירת מיכלים של מידע המועילים למעטים או ליחיד.

מטרות קצרות וארוכות טווח

אדריכלים ומתכנני פרויקטים חייבים לגבש חזון ארוך טווח של הארכיטקטורה הכוללת והתוכניות להגדלת ארגון BI. שילוב זה של רווח לטווח קצר ותכנון ארוך טווח הם שני הצדדים של מאמצי ה-BI. הכנסה לטווח קצר היא הפן של BI המשויך לאיטרציות של המחסן שלך.

זה המקום שבו מתכננים, אדריכלים ונותני חסות מתמקדים בעמידה בדרישות עסקיות ספציפיות. ברמה זו נבנים מבנים פיזיים, רוכשים טכנולוגיה ומיישמים טכניקות. הם בשום אופן לא נועדו לתת מענה לדרישות ספציפיות כפי שהוגדרו על ידי קהילות משתמש מסוימות. הכל נעשה במטרה לתת מענה לדרישות ספציפיות שהוגדרו על ידי קהילה מסוימת.
עם זאת, תכנון לטווח ארוך הוא הפן השני של BI. זה המקום שבו התוכניות והעיצובים הבטיחו שכל מבנה פיזי נבנה, הטכנולוגיות שנבחרו והטכניקות שהושגו עם עין כלפי הארגון. תכנון ארוך טווח הוא זה שמספק את הלכידות הדרושה כדי להבטיח שרווחים מוצקים ייגזרו מכל רווח קצר טווח שנמצא.

הצדק את מאמץ ה- BI שלך

Un מחסן נתונים כשלעצמו אין לו ערך מובנה. במילים אחרות, אין ערך מובנה בין טכנולוגיות מחסן וטכניקות יישום.

הערך של כל מאמץ במחסן נמצא בפעולות המתבצעות כתוצאה מסביבת המחסן ותכני המידע המטופחים לאורך זמן. זוהי נקודה קריטית שכדאי להבין לפני שתנסה אי פעם להעריך את הערך של יוזמה כלשהי.

לעתים קרובות מדי, אדריכלים ומתכננים מנסים ליישם ערך על המרכיבים הפיזיים והטכניים של המחסן כאשר למעשה הערך מבוסס על התהליכים העסקיים המושפעים לטובה מהמחסן ומהמידע שנלכד היטב.

כאן טמון האתגר להקמת BI: איך אתה מצדיק את ההשקעה? אם למחסן עצמו אין ערך מהותי, מתכנני הפרויקט חייבים לחקור, להגדיר ולעצב את היתרונות לאותם אנשים שישתמשו במחסן כדי לשפר תהליכים עסקיים ספציפיים או את הערך של מידע מוגן, או שניהם.

כדי לסבך את העניינים, כל תהליך עסקי המושפע ממאמצי המחסן יכול לספק יתרונות "מהותיים" או "קלים". יתרונות משמעותיים מספקים מדד מוחשי למדידת החזר על ההשקעה (ROI) - למשל, העברת מלאי זמן נוסף במהלך תקופה מסוימת או עבור עלות הובלה נמוכה יותר לכל משלוח. קשה יותר להגדיר יתרונות עדינים, כמו גישה משופרת למידע, במונחים של ערך מוחשי.

חבר את הפרויקט שלך כדי לדעת את בקשות עסקיות

לעתים קרובות מדי, מתכנני פרויקטים מנסים לקשר ערך מחסן עם יעדים אמורפיים ארגוניים. בהצהרה ש"ערך מחסן מבוסס על היכולת שלנו לספק בקשות אסטרטגיות" אנו פותחים את הדיון בצורה נעימה. אבל זה לבד לא מספיק כדי לקבוע אם ההשקעה במחסן הגיונית. עדיף לחבר נציגי מחסן עם פניות והערות עסקיות ספציפיות.

מדידת החזר ה- ROI

חישוב החזר ROI בהגדרת מחסן יכול להיות קשה במיוחד. זה קשה במיוחד אם להוביל

של חזרה מסוימת הוא משהו בלתי מוחשי או קל למדידה. מחקר אחד מצא שמשתמשים תופסים את שני היתרונות העיקריים של יוזמות BI:

▪ ליצור את היכולת לקבל החלטות
▪ יצירת גישה למידע
הטבות אלו הן הטבות רכות (או מתונות). קל לראות כיצד אנו יכולים לחשב החזר ROI על סמך תועלת קשה (או גדולה יותר) כמו עלות הובלה מופחתת, אך כיצד אנו מודדים את היכולת לקבל החלטות טובות יותר?
זהו בהחלט אתגר עבור מתכנני פרויקטים כאשר הם מנסים לגרום לחברה להשקיע במאמץ מסוים במחסן. הגדלת מכירות או ירידה בעלויות אינן עוד הנושאים המרכזיים המניעים את סביבת ה-BI.
במקום זאת, אתה מחפש בקשות עסקיות לגישה טובה יותר למידע כך שמחלקה מסוימת תוכל לקבל החלטות מהר יותר. אלו הם נהגים אסטרטגיים שבמקרה חשובים לא פחות לארגון אבל הם יותר מעורפלים וקשה יותר לאפיין במדד מוחשי. במקרה זה, חישוב החזר ROI יכול להיות מטעה, אם לא לא רלוונטי.
מעצבי פרויקט חייבים להיות מסוגלים להוכיח ערך מוחשי למנהלים כדי להחליט אם ההשקעה באיטרציה מסוימת שווה את זה. עם זאת, לא נציע שיטה חדשה לחישוב החזר ROI, וגם לא נעלה טיעונים בעד או נגדה.
ישנם מאמרים וספרים רבים זמינים הדנים ביסודות של חישוב החזר ROI. ישנן הצעות ערך מיוחדות כמו ערך על השקעה (VOI), המוצעות על ידי קבוצות כמו גרטנר, שתוכלו לחקור. במקום זאת, נתמקד בהיבטי הליבה של כל החזר ROI או הצעות ערך אחרות שאתה צריך לשקול. החלת ROI מעבר לטיעון לגבי היתרונות ה"קשים" לעומת ה"רכים" הקשורים למאמצי BI, ישנן סוגיות נוספות שיש לקחת בחשבון בעת יישום החזר ROI. לדוגמה:

ייחוס חיסכון רב מדי למאמצי DW שיגיעו בכל מקרה
נניח שהחברה שלך עברה מארכיטקטורת מיינפריים לסביבת UNIX מבוזרת. אז כל חיסכון שאולי (או לא) יתממש מהמאמץ הזה לא צריך להיות מיוחס אך ורק, אם בכלל (?), למחסן.

לא להתייחס לכל דבר זה יקר. ויש הרבה דברים שצריך לקחת בחשבון. שקול את הרשימה הבאה:

▪ עלות הפעלה, כולל היתכנות.
▪ עלות חומרה ייעודית עם אחסון ותקשורת נלווים
▪ עלות התוכנה, כולל ניהול של נתונים והרחבות לקוח/שרת, תוכנת ETL, טכנולוגיות DSS, כלי ויזואליזציה, יישומי תזמון וזרימת עבודה ותוכנות ניטור,.
▪ עלות עיצוב מבנה נתונים, עם היצירה והאופטימיזציה של
▪ עלות פיתוח תוכנה הקשורה ישירות למאמץ ה-BI
▪ עלות תמיכה ביתית, כולל אופטימיזציה של ביצועים, כולל בקרת גרסאות תוכנה ותפעול עזרה החל את ההחזר על ההשקעה "Big-Bang". בניית המחסן כמאמץ יחיד וענק נידונה לכישלון, אז גם לחשב את החזר ה-ROI עבור יוזמה ארגונית גדולה ההצעה מפתיעה, ושהמתכננים ממשיכים לעשות ניסיונות חלשים להעריך את ערך המאמץ כולו. מדוע מתכננים מנסים לתת ערך כספי ליוזמה עסקית אם ידוע ומקובל כי קשה להעריך איטרציות ספציפיות? איך זה אפשרי? זה לא אפשרי עם כמה יוצאי דופן. אל תעשה את זה. כעת, לאחר שקבענו מה לא לעשות בעת חישוב החזר ROI, הנה כמה נקודות שיעזרו לך לבסס תהליך אמין להערכת הערך של מאמצי ה-BI שלך.

קבלת הסכמת החזר ROI. ללא קשר לבחירתך בטכניקה להערכת הערך של מאמצי ה-BI שלך, היא חייבת להיות מוסכמת על ידי כל הצדדים, כולל מתכנני פרויקטים, נותני חסות ומנהלי תאגידים.

חלק את החזר ה-ROI לחלקים ניתנים לזיהוי. צעד הכרחי לקראת חישוב ROI סביר הוא למקד את החישוב הזה בפרויקט ספציפי. זה מאפשר לך להעריך ערך על סמך דרישות עסקיות ספציפיות שמתקיימות בהן

הגדירו את העלויות. כאמור, יש לקחת בחשבון עלויות רבות. בנוסף, העלויות חייבות לכלול לא רק את אלו הקשורות לאיטרציה הבודדת, אלא גם עלויות הקשורות להבטחת עמידה בתקנים הארגוניים.

הגדירו הטבות. על ידי קישור ברור של ROI לדרישות עסקיות ספציפיות, אנו אמורים להיות מסוגלים לזהות את היתרונות שיובילו לעמידה בדרישות.

הפחת עלויות ויתרונות ברווחים קרובים. זוהי הדרך הטובה ביותר לבסס את הערכות השווי שלך על ערך נוכחי נטו (NPV) בניגוד לניסיון לחזות ערך עתידי ברווחים עתידיים.

שמור את הזמן לפיצול ה-ROI שלך למינימום. זה מתועד היטב בטווח הארוך הוא שימש בהחזר ה-ROI שלך.

השתמש ביותר מנוסחת ROI אחת. ישנן שיטות רבות לחיזוי החזר ROI, ועליכם לתכנן להשתמש באחת או יותר מהן, כולל ערך נוכחי נקי, שיעור תשואה פנימי (IRR) והחזר.

הגדר תהליך שניתן לחזור עליו. זה חיוני לחישוב כל ערך לטווח ארוך. יש לתעד תהליך יחיד שניתן לחזור עליו עבור כל תת-רצפי הפרויקט הבאים.

הבעיות המפורטות הן הנפוצות ביותר שהוגדרו על ידי מומחי סביבת מגורים. ההתעקשות של ההנהלה לספק החזר ROI "ביג-באנג" היא מאוד מבלבלת. אם תתחיל את כל חישובי החזר ה-ROI שלך על ידי פירוקם לחלקים ניתנים לזיהוי, יש לך סיכוי טוב להעריך אומדן ROI מדויק.

שאלות לגבי היתרונות של החזר ה- ROI

יהיו היתרונות שלך אשר יהיו, רכים או קשים, אתה יכול להשתמש בכמה שאלות בסיסיות כדי לקבוע את ערכן. לדוגמה, באמצעות מערכת קנה מידה פשוטה, מ-1 עד 10, אתה יכול למדוד את ההשפעה של כל מאמץ באמצעות השאלות הבאות:

איך היית מדרג הבנה של נתונים בעקבות הפרויקט הזה של החברה שלך?
כיצד היית מדרג את שיפורי התהליך כתוצאה מהפרויקט הזה?
כיצד היית מודד את ההשפעה של תובנות והסקות חדשות שזמינות כעת באמצעות איטרציה זו
מה הייתה ההשפעה של סביבות מחשב חדשות וטובות יותר כתוצאה ממה שנלמד? אם התשובות לשאלות אלו מעטות, ייתכן שהמיזם אינו שווה את ההשקעה. שאלות בעלות ניקוד גבוה מצביעות על רווחי ערך משמעותיים וצריכות לשמש מנחים לחקירה נוספת. לדוגמה, ציון גבוה לשיפורי תהליכים אמור להוביל מעצבים לבחון כיצד תהליכים שופרו. אתה עשוי לגלות שחלק מהרווחים שנעשו או כולם מוחשיים ולכן ניתן ליישם בקלות ערך כספי. להפיק את המרב מהאיטרציה הראשונה של מחסן התמורה הגדולה ביותר של המאמץ הארגוני שלך היא לעתים קרובות באיטרציות הראשונות. מאמצים מוקדמים אלה מבססים באופן מסורתי את תוכן המידע השימושי ביותר לציבור ומסייעים לבסס את הבסיס הטכנולוגי ליישומי BI הבאים. בדרך כלל כל רצף עוקב של נתונים מפרויקטי מחסנים מביאים פחות ופחות ערך נוסף למפעל בכללותו. זה נכון במיוחד אם האיטרציה לא מוסיפה נושאים חדשים או עונה על הצרכים של קהילת משתמשים חדשה.

תכונת אחסון זו חלה גם על גידול ערימות של נתונים היסטוריונים. מאחר שהמאמצים הבאים דורשים יותר נתונים ואיך יותר נתונים מוזגים למחסן לאורך זמן נתונים זה הופך פחות רלוונטי לניתוח המשמש. אלה נתונים הם נקראים לעתים קרובות נתונים רדומים ותמיד יקר לשמור אותם כי כמעט ולא נעשה בהם שימוש.

מה זה אומר עבור נותני החסות של הפרויקט? בעיקרו של דבר, הספונסרים הראשונים חולקים יותר מעלויות ההשקעה. זה עיקרי מכיוון שהם מהווים את הדחף לייסוד השכבה הטכנולוגית והסביבתית הרחבה של המחסן, לרבות אורגנית.

אבל הצעדים הראשונים הללו נושאים את הערך הגדול ביותר ולכן מתכנני הפרויקט צריכים לעתים קרובות להצדיק את ההשקעה.
פרויקטים שנעשו לאחר יוזמת ה-BI שלך עשויים להיות בעלי עלויות נמוכות יותר (בהשוואה לראשון) וישיר, אך מביאים פחות ערך לארגון.

ובעלי ארגונים צריכים להתחיל לשקול לזרוק את ההצטברות נתונים ופחות טכנולוגיות רלוונטיות.

כריית נתונים: כרייה לתת לי

רכיבים ארכיטקטוניים רבים דורשים וריאציות של טכנולוגיות וטכניקות של כריית נתונים -
למשל, ה"סוכנים "השונים לבחינת נקודות העניין של לקוחות, מערכות ההפעלה של החברה ועבור אותו dw. סוכנים אלה יכולים להיות רשתות עצביות מתקדמות שהוכשרו על מגמות עצומות, כגון ביקוש עתידי למוצר המבוסס על קידום מכירות; מנועים מבוססי כללים לתגובה לסט נתתי של נסיבות, למשל, אבחון רפואי והמלצות טיפול; או אפילו סוכנים פשוטים עם התפקיד של דיווח חריגים למנהלים בכירים. בדרך כלל תהליכי מיצוי אלה נתונים si

לאמת בזמן אמת; לכן, הם חייבים להיות מאוחדים לחלוטין עם התנועה של נתונים סטסי.

עיבוד מקוון של עיבוד אנליטי

אנליטיקס מקוון

היכולת לחתוך, לחתוך לקוביות, לגלגל, לקדוח ולבצע ניתוח
מה-אם, נמצא בטווח, בהיקף של חבילת הטכנולוגיה של IBM. לדוגמה, פונקציות עיבוד אנליטי מקוון (OLAP) קיימות עבור DB2 אשר מביאה ניתוח ממדי לתוך המנוע של מסד נתונים אותו.

פונקציות מוסיפות תועלת ממדית ל-SQL תוך קצירת כל היתרונות של היותו חלק טבעי מ-DB2. דוגמה נוספת לאינטגרציה של OLAP היא כלי החילוץ, DB2 OLAP Analyzer Server. טכנולוגיה זו מאפשרת סריקה מהירה ואוטומטית של קוביות DB2 OLAP Server כדי לאתר ולדווח על הערכים של נתונים יוצא דופן או בלתי צפוי עבור כל קובייה לאנליסט המסחר. ולבסוף, הפונקציות של DW Center מספקות אמצעי לאדריכלים לבדוק, בין היתר, את הפרופיל של שרת קוביית DB2 OLAP כחלק טבעי מתהליכי ETL.

ניתוח מרחבי ניתוח מרחבי

החלל מייצג מחצית מהעוגנים האנליטיים (הולכות) הנחוצים לפנורמה
אנליטי רחב (הזמן מייצג את החצי השני). הרמה האטומית של המחסן, המיוצגת באיור 1.1, כוללת את היסודות הן לזמן והן לחלל. חותמות זמן עוגנים ניתוחים לפי זמן ומתייחסים לניתוח עוגן מידע לפי מרחב. חותמות זמן מבצעות את הניתוח לפי זמן, ומידע כתובת עורך את הניתוח לפי מרחב. הדיאגרמה מציגה קידוד גיאוגרפי - תהליך המרת כתובות לנקודות במפה או נקודות במרחב כך שניתן להשתמש במושגים כמו מרחק ופנים/חוץ בניתוח - שנערך ברמה האטומית וניתוח מרחבי עומד לרשות האנליטיקאי. IBM מספקת הרחבות מרחביות, שפותחו עם המכון לחקר המערכות הסביבתיות (ESRI), al מסד נתונים DB2 כך שניתן לשמור על אובייקטים מרחביים כחלק רגיל מה- מסד נתונים יחסיים. DB2

מרחיבים מרחביים, מספקים גם את כל הרחבות SQL כדי לנצל את היתרון של ניתוח מרחבי. לדוגמה, הרחבות SQL לשאילתה
מרחק בין כתובות או אם נקודה נמצאת בתוך או מחוץ לאזור מצולע מוגדר, הם תקן אנליטי עם Spatial Extender. ראה פרק 16 למידע נוסף.

מסד נתונים-כלי כלים לתושבות מסד נתונים-תוֹשָׁב

ל-DB2 יש הרבה תכונות תושבות SQL BI המסייעות בפעולת הניתוח. אלו כוללים:

פונקציות רקורסיה לביצוע ניתוח, כגון "מצא את כל נתיבי הטיסה האפשריים מ סן פרנסיסקו a ניו יורק".
פונקציות אנליטיות עבור פונקציות דירוג, מצטבר, קובייה ופונקציות רולאפ כדי להקל על משימות המתרחשות בדרך כלל רק עם טכנולוגיית OLAP, הן כעת חלק טבעי מהמנוע של מסד נתונים
היכולת ליצור טבלאות המכילות תוצאות
מוכרים של מסד נתונים מנהיגים מערבבים יותר מתכונות ה-BI ב- מסד נתונים עצמו.
הספקים העיקריים של מאגר מידע הם מערבבים יותר מתכונות BI ב- מסד נתונים עצמו.
זה מספק ביצועים טובים יותר ואפשרויות ביצוע רבות יותר עבור פתרונות BI.
התכונות והפונקציות של DB2 V8 נדונות בפירוט בפרקים הבאים:
ארכיטקטורה טכנית וניהול נתונים (פרק 5)

יסודות DB2 BI (פרק 6)
טבלאות שאילתות מתמשכות של DB2 (פרק 7)
פונקציות DB2 OLAP (פרק 13)
תכונות ופונקציות DB2 Enhanced BI (פרק 15) מערכת אספקת נתונים פשוטה מערכת אספקה של נתונים מְפוּשָׁט

הארכיטקטורה המתוארת באיור 1.1 כוללת מבנים רבים נתונים גוּפָנִי. האחד הוא המחסן של נתונים הפעלה. באופן כללי, ODS הוא מונחה עצמים, משולב ושוטף. היית בונה ODS כדי לתמוך, למשל, במשרד המכירות. מכירות ODS היו משלימות נתונים ממערכות רבות ושונות אבל ישמור רק, למשל, את העסקאות של היום. ניתן גם לעדכן את ה-ODS פעמים רבות ביום. במקביל, התהליכים דוחפים את i נתונים משולבים ביישומים אחרים. מבנה זה תוכנן במיוחד לשילוב נתונים עדכני ודינמי ויהיה מועמד סביר לתמוך בניתוח בזמן אמת, כגון מתן סוכני שירות לקוחות מידע מכירות נוכחי של לקוח על ידי חילוץ מידע על מגמת מכירות מהמלאי עצמו. מבנה נוסף המוצג באיור 1.1 הוא מצב פורמלי עבור dw. לא רק שזה המקום לביצוע של האינטגרציה הדרושה, של האיכות של נתונים, ושל הטרנספורמציה של נתונים של מחסן נכנס, אבל הוא גם אזור אחסון אמין וזמני עבור נתונים שכפולים שניתן להשתמש בהם בניתוח בזמן אמת. אם תחליט להשתמש ב-ODS או באזור היערכות, אחד הכלים הטובים ביותר לאכלוס מבנים אלה נתונים שימוש במקורות תפעוליים שונים היא השאילתה המבוזרת הטרוגנית של DB2. יכולת זו מסופקת על ידי תכונת DB2 האופציונלית הנקראת DB2 Relational Connect (שאילתות בלבד) ודרך DB2 DataJoiner (מוצר נפרד המספק יכולת שאילתה, הוספה, עדכון ומחיקה למערכות RDBMS מבוזרות הטרוגניות).

טכנולוגיה זו מאפשרת לאדריכלים נתונים לקשור נתונים של ייצור עם תהליכים אנליטיים. לא רק שהטכנולוגיה יכולה להסתגל כמעט לכל אחת מדרישות השכפול שעלולות להתעורר עם ניתוח בזמן אמת, אלא שהיא גם יכולה להתחבר למגוון רחב של נתונים הפופולריים ביותר, כולל DB2, Oracle, Sybase, SQL Server, Informix ואחרים. ניתן להשתמש ב-DB2 DataJoiner כדי לאכלס מבנה נתונים רשמי כגון ODS או אפילו טבלה קבועה המיוצגת במחסן המיועדת לשחזור מהיר של עדכונים מיידיים או למכירה. כמובן, המבנים האלה עצמם נתונים ניתן לאכלס באמצעות

טכנולוגיה מרכזית נוספת המיועדת לשכפול של נתונים, IBM DataPropagator Relational. (DataPropagator הוא מוצר נפרד למערכות מרכזיות. DB2 UNIX, Linux, Windows ו-OS/2 כוללים שירותי שכפול של נתונים כתכונה סטנדרטית).
שיטה נוספת להעברת ה- נתונים הפועל ברחבי הארגון הוא אינטגרטור יישומים ארגוני המכונה גם מתווך מסרים. טכנולוגיה ייחודית זו מאפשרת שליטה ללא תחרות למיקוד והנעה נתונים סביב החברה. ל-IBM יש את מתווך ההודעות הנפוץ ביותר, MQSeries, או וריאציה של המוצר הכוללת את הדרישות עבור מסחר אלקטרוני, IBM WebSphere MQ.
לדיון נוסף על איך למנף את MQ לתמיכה במחסן ובסביבת BI, בקר אתר אינטרנט מהספר. לעת עתה, די לומר שטכנולוגיה זו היא אמצעי מצוין ללכוד ולשנות (באמצעות MQSeries Integrator) נתונים פעילים ממוקדים שגויסו לפתרונות BI. טכנולוגיית MQ שולבה וארוזה ב-UDB V8, מה שאומר שכעת ניתן לנהל תורי הודעות כאילו היו טבלאות DB2. הרעיון של הודעות תור ריתוך והיקום של מסד נתונים התייחסות מכוונת לסביבה עוצמתית של אספקה של נתונים.

אפס חביון אפס חביון

המטרה האסטרטגית הסופית עבור IBM היא ניתוח אפס-חביון. כפי שהוגדר על ידי
גרטנר, מערכת BI חייבת להיות מסוגלת להסיק, להטמיע ולספק מידע לאנליסטים לפי דרישה. האתגר, כמובן, הוא איך לערבב נתונים עדכני ובזמן אמת עם מידע היסטורי הכרחי, כגון i נתונים מגמה/דפוס קשור, או תובנות שחולצו, כגון פרופיל לקוחות.

מידע כזה כולל, למשל, זיהוי של לקוחות סיכון גבוה או נמוך או אילו מוצרים i לקוחות סביר להניח שהם יקנו אם כבר יש להם גבינה בעגלות הקניות שלהם.

קבלת אפס השהייה תלויה למעשה בשני מנגנונים בסיסיים:

איחוד שלם של נתונים אשר מנותחים עם הטכניקות המבוססות ועם הכלים שנוצרו על ידי ה-BI
מערכת מסירה של נתונים יעיל כדי להבטיח שניתוח בזמן אמת זמין באמת תנאים מוקדמים אלה לאפס השהייה אינם שונים משתי היעדים שנקבעו על ידי IBM ומתוארים לעיל. הצימוד ההדוק של ה נתונים זה חלק מתוכנית האינטגרציה החלקה של IBM. וליצור מערכת מסירה של נתונים efficient תלויה לחלוטין בטכנולוגיה הזמינה אשר מפשטת את תהליך האספקה נתונים. כתוצאה מכך, שניים משלושת היעדים של IBM הם קריטיים להשגת השלישית. IBM מפתחת במודע את הטכנולוגיה שלה כדי להבטיח שאפס חביון הוא מציאות עבור מאמצי המחסן. סיכום / סינתזה ארגון ה-BI שלך מספק מפת דרכים לבניית הסביבה שלך
באופן איטרטיבי. זה חייב להיות מותאם כך שישקף את הצרכים של העסק שלך, הן הנוכחיות והן העתידיות. ללא חזון ארכיטקטוני רחב, איטרציות של מחסנים הן מעט יותר מיישומים אקראי של המחסן המרכזי, שעושים מעט כדי ליצור מפעל גדול ואינפורמטיבי. המכשול הראשון עבור מובילי פרויקטים הוא כיצד להצדיק את ההשקעה הדרושה להגדלת ארגון ה-BI. אמנם חישובי החזר ROI נותרו עמוד התווך של הישגי המלאי, אך נהיה קשה יותר לחזות בדיוק. זה הוביל לשיטות אחרות כדי לקבוע אם אתה מקבל תמורה לכספך. Value on Investment2 (VOI), למשל, נרכש כפתרון. זה מוטל על האדריכלים של נתונים ועל מתכנני פרויקטים בכוונה לייצר ולספק מידע לאגודות משתמשים ולא רק לתת שירות על נתונים. יש הבדל עצום בין השניים. מידע הוא משהו שעושה הבדל בקבלת החלטות וביעילות; יחסית, אני נתונים הם מהווים אבני בניין להפקת מידע זה.

אם כי קריטי למקור נתונים כדי לתת מענה לדרישות העסקיות, סביבת ה-BI צריכה למלא תפקיד גדול יותר ביצירת תוכן מידע. עלינו לנקוט בצעדים הנוספים כדי לנקות, לשלב, לשנות או ליצור תוכן מידע אחר שמשתמשים יכולים לפעול לפיו, ולאחר מכן עלינו להבטיח שפעולות והחלטות אלה, היכן שהן סבירות, ישתקפו בסביבת ה-BI. אם נדחה את המחסן לשרת רק בו נתונים, היה סמוך ובטוח שאיגודי משתמשים ייצרו את תוכן המידע הדרוש כדי לנקוט בפעולה. זה מבטיח שהקהילה שלהם תוכל לקבל החלטות טובות יותר, אבל המיזם סובל מחוסר ידע שהם ניצלו. דאטו שאדריכלים ומתכנני פרויקטים יוזמים פרויקטים ספציפיים בסביבת ה-BI, הם נשארים אחראים לארגון בכללותו. דוגמה פשוטה לתכונה דו-צדדית זו של איטרציות BI נמצאת במקור נתונים. כל ה נתונים המתקבלות עבור בקשות מסחריות ספציפיות חייבות להיות מאוכלסות בשכבה האטומית הראשונה. זה מבטיח את הפיתוח של נכס המידע הארגוני, כמו גם לנהל, לטפל בבקשות המשתמש הספציפיות שהוגדרו באיטרציה.

מהו מחסן נתונים?

מחסן נתונים היא לב ליבה של ארכיטקטורת מערכות המידע מאז 1990 ותומכת בתהליכי מידע על ידי הצעת פלטפורמה משולבת מוצקה של נתונים היסטוריה שנלקחה כבסיס לניתוחים הבאים. ה מחסן נתונים הם מציעים שילוב קל בעולם של מערכות יישומים לא תואמות. מחסן נתונים זה התפתח להיות אופנה. מחסן נתונים מארגן ומחסן i נתונים הכרחי למידע ותהליכים אנליטיים על בסיס פרספקטיבה היסטורית זמנית ארוכה. כל זה כרוך במאמץ ניכר ומתמיד בהקמה ותחזוקה של ה מחסן נתונים.

אז מה זה א מחסן נתונים? מחסן נתונים הוא:

▪ מוכווני נושא
▪ מערכת משולבת
▪ שינוי זמן
▪ לא נדיף (לא מבטל)

אוסף של נתונים משמש לתמיכה בהחלטות ניהוליות ביישום תהליכים.
I נתונים מוכנס פנימה מחסן נתונים הם נובעים ברוב המקרים מסביבות תפעוליות. ה מחסן נתונים הוא עשוי מיחידת אחסון, נפרדת פיזית משאר המערכת, שהיא מכילה נתונים עבר טרנספורמציה על ידי יישומים הפועלים על מידע הנובע מסביבת ההפעלה.

ההגדרה המילולית של א מחסן נתונים זה ראוי להסבר יסודי שכן יש מניעים חשובים ומשמעויות בסיסיות שמתארות את המאפיינים של מחסן.

הכוונת נושא נוֹשְׂאִי

התכונה הראשונה של א מחסן נתונים הוא שהוא מכוון לנושאים העיקריים של חברה. המדריך של התהליכים דרך ה נתונים זה בניגוד לשיטה הקלאסית יותר המספקת כיוון של יישומים לתהליכים ופונקציות, שיטה המשותפת לרוב לרוב מערכות הניהול הפחות עדכניות.

עולם ההפעלה מעוצב סביב יישומים ופונקציות כגון הלוואות, חסכונות, כרטיסי בנק ונאמנות למוסד פיננסי. עולם dw מאורגן סביב נושאים עיקריים כמו הלקוח, המוכר, המוצר והפעילות. יישור סביב נושאים משפיע על העיצוב והיישום של נתונים נמצא ב-dw. והכי חשוב, הנושא העיקרי משפיע על החלק החשוב ביותר במבנה המפתח.

עולם האפליקציות מושפע הן מעיצוב מסד הנתונים והן מעיצוב תהליכים. העולם של dw מתמקד אך ורק בדוגמנות וידאו נתונים ועל העיצוב של ה מסד נתונים. עיצוב תהליך (בצורתו הקלאסית) אינו חלק מסביבת dw.

ההבדלים בין בחירת יישום תהליך/פונקציה לבין בחירת הנושא מתגלים גם כהבדלים בתוכן של נתונים ברמה מפורטת. ה נתונים del dw אינם כוללים את i נתונים אשר לא ישמש לעיבוד DSS בזמן יישומים

מכוונת מבצעית ל נתונים להכיל את i נתונים לספק באופן מיידי דרישות פונקציונליות/עיבוד שעשויות להועיל או לא למנתח ה-DSS.
דרך חשובה נוספת שיישומים מוכווני תפעול עבור נתונים שונה מ נתונים של dw נמצא בדוחות של נתונים. אני נתונים מפעילים מקיימים מערכת יחסים מתמשכת בין שני טבלאות או יותר המבוסס על כלל עסקי פעיל. ה נתונים של dw משתרע על ספקטרום של זמן והדיווחים שנמצאו ב-dw הם רבים. כללי סחר רבים (ובהתאמה, דיווחים רבים על נתונים מיוצגים במחסן של נתונים בין שני שולחנות או יותר.

(להסבר מפורט כיצד מערכות היחסים בין נתונים מנוהלים ב-DW, אנא עיין בנושא הטכנולוגיה בנושא זה.)
מנקודת מבט אחרת מלבד זו של ההבדל המהותי בין בחירת יישום פונקציונלי/תהליך לבין בחירת נושא, האם יש הבדל מהותי בין מערכות הפעלה נתונים וה- DW.

אינטגרציה אינטגרציה

ההיבט החשוב ביותר בסביבת dw הוא כי אני נתונים שנמצאים בתוך dw משולבים בקלות. תמיד. ללא יוצא מן הכלל. עצם המהות של סביבת dw היא שאני נתונים הכלולים בגבולות המחסן משולבים.

האינטגרציה מתגלה בדרכים רבות ושונות - במוסכמות מזוהות עקביות, במדידה עקבית של משתנים, במבנים מקודדים עקביים, בתכונות פיזיקליות של נתונים עקבי, וכן הלאה.

במהלך השנים המעצבים של אפליקציות שונות קיבלו החלטות רבות לגבי אופן פיתוח האפליקציה. הסגנון והחלטות העיצוב האישיות של יישומי המעצבים מתגלים במאה דרכים: בהבדלים בקידוד, מבנה מפתח, מאפיינים פיזיים, מוסכמות זיהוי וכו'. היכולת הקולקטיבית של מעצבי יישומים רבים ליצור יישומים לא עקביים היא אגדית. איור 3 חושף כמה מההבדלים החשובים ביותר באופן שבו יישומים מתוכננים.

קידוד: קידוד:

מעצבי אפליקציות בחרו בקידוד שדה - מגדר - בכמה דרכים. מעצב מייצג את המגדר בתור "m" ו-"f". מעצב אחר מייצג את המגדר בתור "1" ו-"0". מעצב אחר מייצג את המגדר בתור "x" ו-"y". מעצב אחר מייצג את המגדר כ"זכר" ו"נקבה". זה באמת לא משנה איך המין נכנס ל-DW. ה-"M" וה-"F" כנראה טובים כמו כל ייצוג.

מה שחשוב הוא שלא משנה מה מקור שממנו מגיע שדה המין, השדה הזה מגיע ל-DW במצב משולב עקבי. כתוצאה מכך, כאשר השדה נטען ל-DW מאפליקציה שבה הוא מיוצג בחוץ בפורמט "M" ו- "F", נתונים יש להמיר לפורמט DW.

מדידת תכונות: מדידת תכונות:

מעצבי אפליקציות בחרו למדוד צנרת במגוון דרכים לאורך השנים. חנויות מעצבים i נתונים של הצינור בסנטימטרים. מעצב אפליקציות אחר מאחסן את נתונים של הצינור במונחים של אינצ'ים. מעצב אפליקציות אחר מאחסן את נתונים של הצינור במיליון רגל מעוקב לשנייה. ומעצב אחר אוגר מידע על צינורות במונחים של מטרים. לא משנה מה המקור, כאשר מידע צינור מגיע ל-DW יש למדוד אותו באותו אופן.

כפי שמוצג באיור 3, בעיות אינטגרציה משפיעות כמעט על כל היבט של הפרויקט - המאפיינים הפיזיים של הפרויקט נתונים, הדילמה שיש יותר ממקור אחד של נתונים, הנושא של דגימות מזוהות לא עקביות, פורמטים של נתונים לא עקבי, וכן הלאה.

לא משנה מה הטיעון העיצובי, התוצאה זהה - כלומר נתונים חייב להיות מאוחסן ב-DW באופן ייחודי ומקובל בכל העולם גם כאשר מערכות ההפעלה הבסיסיות מאחסנות i נתונים.

כאשר אנליסט ה-DSS מסתכל על ה-DW, המוקד של האנליסט צריך להיות ניצול נתונים שנמצאים במחסן,

במקום לתהות לגבי האמינות או העקביות של נתונים.

זמן שונות

כל נתונים ב-DW הם מדויקים לרגע מסוים בזמן. תכונה בסיסית זו של נתונים ב- DW זה שונה מאוד מ- נתונים נמצא בסביבת ההפעלה. ה נתונים של סביבת ההפעלה מדויקים כמו בזמן הגישה. במילים אחרות, בסביבת ההפעלה כאשר מתבצעת גישה ליחידה נתונים, הוא צפוי לשקף ערכים מדויקים כמו בזמן הגישה. למה אני נתונים ב-DW מדויקים כמו בנקודת זמן מסוימת (כלומר, לא "כרגע"), כלומר נתונים שנמצאו ב-DW הם "שונות זמן".
שונות הזמן של נתונים DW מכונה בדרכים רבות.
הדרך הפשוטה ביותר היא שאני נתונים של DW מייצג נתונים על פני אופק זמן ארוך - חמש עד עשר שנים. אופק הזמן המתואר עבור סביבת ההפעלה קצר בהרבה מהערכים הנוכחיים של היום עד שישים תשעים
אפליקציות שצריכות לעבוד היטב וצריכות להיות זמינות לעיבוד עסקה צריכות להביא את הכמות המינימלית של נתונים אם הם מאפשרים מידה כלשהי של גמישות. אז ליישומים תפעוליים יש אופק זמן קצר, כמו נושא עיצוב יישומי אודיו.
הדרך השנייה שבה מופיעה 'שונות זמן' ב-DW היא במבנה המפתח. כל מבנה מפתח ב-DW מכיל, באופן מרומז או מפורש, אלמנט זמן, כגון יום, שבוע, חודש וכו'. אלמנט הזמן נמצא כמעט תמיד בתחתית המפתח המשורשר שנמצא ב-DW. בהזדמנויות אלו, אלמנט הזמן יתקיים באופן מרומז, כגון המקרה שבו קובץ שלם משוכפל בסוף החודש או הרבעון.
הדרך השלישית להופעת שונות היא כי אני נתונים של ה-DW, רק רשום נכון, לא ניתן לעדכן. ה נתונים של DW הם, לכל המטרות המעשיות, סדרה ארוכה של צילומי מצב. כמובן שאם תמונת המצב צולמה בצורה שגויה, ניתן לשנות את התמונות. אבל בהנחה שצילומי המצב צולמו כהלכה, הם לא משתנים ברגע שצולמו. בחלק

במקרים שזה עלול להיות לא אתי או אפילו לא חוקי שתצלומי המצב ב-DW משתנים. ה נתונים תפעולי, בהיותו מדויק כמו בזמן הגישה, ניתן לעדכן לפי הצורך.

לא תנודתי

המאפיין הרביעי החשוב של DW הוא שהוא אינו נדיף.
עדכונים, הוספות, מחיקות ושינויים מתבצעים באופן קבוע בסביבות התפעוליות על בסיס רשומה לרשומה. אבל המניפולציה הבסיסית של נתונים הדרוש ב-DW הוא הרבה יותר קל. ישנם רק שני סוגים של פעולות המתרחשות ב-DW - הטעינה הראשונית של ה- נתונים וגישה ל נתונים. אין עדכון של נתונים (במובן הכללי של עדכון) ב-DW כפעולת עיבוד רגילה. ישנן כמה השלכות חזקות מאוד של ההבדל הבסיסי הזה בין עיבוד תפעולי לעיבוד DW. ברמת התכנון, הצורך להיות זהיר לגבי עדכון התרסקות אינו פקטור ב-DW, שכן העדכון של נתונים זה לא מתבצע. המשמעות היא שברמה הפיזית של העיצוב, ניתן לקחת חירויות כדי לייעל את הגישה אליהן נתונים, במיוחד בהתמודדות עם נושאים של נורמליזציה ודנורמליזציה פיזית. תוצאה נוספת של פשטות הפעולה של DW היא בטכנולוגיה הבסיסית המשמשת להפעלת סביבת DW. הצורך לתמוך בעדכוני רשומה אחר רשומה מקוונים (כפי שקורה לעתים קרובות בעיבוד תפעולי) מחייב את הטכנולוגיה בעלת בסיס מורכב מאוד מתחת לפשטות לכאורה.
הטכנולוגיה התומכת בגיבוי ושחזור, עסקאות ושלמות נתונים נתונים וזיהוי מבוי סתום ותיקון הוא די מורכב ומיותר עבור עיבוד DW. המאפיינים של DW, אוריינטציה עיצובית, אינטגרציה של נתונים בתוך ה-DW, שונות זמן וקלות הניהול של נתונים, הכל מוביל לסביבה שהיא מאוד מאוד שונה מסביבת ההפעלה הקלאסית. המקור של כמעט כולם נתונים של DW הם סביבת ההפעלה. מפתה לחשוב שיש יתירות מסיבית של נתונים בין שתי הסביבות.
אכן הרושם הראשוני שיש לאנשים רבים הוא של יתירות גדולה נתונים בין סביבת ההפעלה לבין

סיומת DW. פרשנות כזו היא שטחית ומדגימה חוסר הבנה של המתרחש ב-DW.
למעשה יש מינימום יתירות של נתונים בין סביבת ההפעלה לבין i נתונים של ה-DW. שקול את הדברים הבאים: I נתונים מסוננים נתתי שאתה עובר מסביבת ההפעלה לסביבת DW. רב נתונים הם אף פעם לא יוצאים אל מחוץ לסביבת ההפעלה. רק שאני נתונים אשר נדרשים לעיבוד DSS מוצאים את הכיוון שלהם בסביבה

▪ אופק הזמן של נתונים זה שונה מאוד מסביבה אחת לאחרת. ה נתונים בסביבת ההפעלה הם טריים מאוד. ה נתונים ב-DW הם הרבה יותר מבוגרים. רק מנקודת מבט של אופק זמן, יש מעט מאוד חפיפה בין סביבת ההפעלה ל-DW.

▪ ה-DW מכיל נתונים סיכום שאף פעם לא נמצא בסביבה

▪ אני נתונים עוברים שינוי מהותי כשהם עוברים לאיור 3 ממחיש שרוב ה נתונים משתנים באופן משמעותי בתנאי שהם נבחרים ומועברים ל-DW. במילים אחרות, רוב נתונים הוא משתנה פיזית ורדיקלית כאשר הוא מועבר ל-DW. מנקודת מבט של אינטגרציה הם לא זהים נתונים מתגוררים בסביבת ההפעלה. בהתחשב בגורמים אלה, היתירות של נתונים בין שתי הסביבות הוא אירוע נדיר, המוביל לפחות מ-1% יתירות בין שתי הסביבות. מבנה המחסן ל-DWs יש מבנה מובחן. ישנן רמות שונות של סיכום ופירוט התוחמות את ה-DWs.
המרכיבים השונים של DW הם:

מידע נוסף
לתת לי פרטים עדכניים
לתת לי של פרט ישן
לתת לי מסוכם מעט
לתת לי מסוכם מאוד

ללא ספק הדאגה העיקרית היא עבור i נתונים פרטים עדכניים. זה הדאגה העיקרית כי:

I נתונים פרטים עדכניים משקפים את האירועים האחרונים, שתמיד מעוררים עניין רב ו
i נתונים נתוני הפרטים הנוכחיים הם נפחיים מכיוון שהם מאוחסנים ברמת הפירוט הנמוכה ביותר ו
i נתונים הפרטים הנוכחיים מאוחסנים כמעט תמיד בזיכרון הדיסק, שאליו ניתן לגשת במהירות, אך יקר ומורכב מ-I נתונים פרטים ישנים יותר הם נתונים אשר מאוחסנים בזיכרון כלשהו של אסא. הוא נגיש באופן ספורדי ומאוחסן ברמת פירוט התואמת נתונים פרטים עדכניים. אמנם אין חובה לאחסן על מצע אחסון חלופי, בשל הנפח הגדול של נתונים מאוחדת עם הגישה הספורדית של נתונים, מדיום הזיכרון עבור נתונים פרטים ישנים יותר אינם מאוחסנים בדרך כלל בדיסק. ה נתונים מסוכמים בקלילות הם נתונים אשר מזוקקים מרמת הפירוט הנמוכה שנמצאה לרמת הפירוט הנוכחית. רמה זו של DW מאוחסנת כמעט תמיד בזיכרון הדיסק. בעיות העיצוב שמציגות את עצמן בפני האדריכל של ה נתונים בבניית רמה זו של DW הם:

באיזו יחידת זמן נעשה הסיכום למעלה
איזה תוכן, תכונות יסכמו מעט את התוכן של נתונים הרמה הבאה של נתונים נמצא ב- DW הוא של נתונים מסוכמים מאוד. ה נתונים מסוכמים מאוד הם קומפקטיים ונגישים בקלות. ה נתונים מסוכמים מאוד נמצאים לפעמים בסביבת DW ובמקרים אחרים i נתונים מופשטים מאוד נמצאים מחוץ לקירות המיידיים של הטכנולוגיה המארחת את ה-DW. (בכל מקרה, אני נתונים מסוכמים מאוד הם חלק מה-DW ללא קשר למקום שבו אני נתונים מאוכסנים פיזית). הרכיב האחרון של ה-DW הוא רכיב המטא נתונים. מבחינות רבות המטא נתונים יושבים בממד שונה מאחרים נתונים של ה- DW, מכיוון שהמטא-נתונים אינם מכילים כאלה נתתי נלקח ישירות מסביבת ההפעלה. למטא נתונים יש תפקיד מיוחד וחשוב מאוד ב-DW. מטא נתונים משמשים כ:

ספרייה שתעזור לאנליסט ה-DSS לאתר את התוכן של ה-DW,
מדריך למיפוי נתונים איך אני נתונים הפכו מסביבת ההפעלה לסביבת DW,
מדריך לאלגוריתמים המשמשים לסיכום בין i נתונים פרטים עדכניים אי נתונים מסוכם מעט, אני נתונים לסיכום, מטא נתונים ממלאים תפקיד הרבה יותר גדול בסביבת DW מאשר אי פעם בסביבה התפעולית מדיה אחסון ישנה ניתן להשתמש בקלטת מגנטית לאחסון סוג זה נתונים. אכן ישנו מגוון רחב של אמצעי אחסון שיש לקחת בחשבון לאחסון ישנים נתונים של פירוט. תלוי בנפח של נתונים, תדירות הגישה, עלות הכלים וסוג הגישה, סביר לחלוטין שכלים אחרים יזדקקו לרמת הפירוט הישנה ב-DW. זרימת נתונים יש זרם אלים רגיל וצפוי נתונים בתוך ה- DW.
I נתונים הם נכנסים ל-DW מסביבת ההפעלה. (הערה: ישנם כמה חריגים מאוד מעניינים לכלל זה. עם זאת, כמעט כולם נתונים היכנס ל- DW מסביבת ההפעלה). דאטו ש נתונים הם נכנסים ל-DW מסביבת ההפעלה, הוא משתנה כמתואר לעיל. בתנאי שאתה מזין את ה-DW, כלומר נתונים הזן את רמת הפירוט הנוכחית, כפי שמוצג. הוא שוכן שם ומשמש עד שמתרחש אחד משלושה אירועים:

מטוהר,
מסוכם, ו/או ▪הוא התהליך המיושן בתוך DW נע i נתונים פרטים עדכניים א נתונים בפירוט ישן, על פי גיל נתונים. התהליך

סיכום משתמש בפירוט של נתונים לחשב i נתונים רמות מסוכמות מעט ומסוכמות מאוד של נתונים. ישנם כמה חריגים לזרימה המוצגת (עליו נדון בהמשך). עם זאת, בדרך כלל, עבור הרוב המכריע של נתונים נמצא בתוך DW, הזרם של נתונים הוא כמו בתמונה.

שימוש במחסן הנתונים

באופן לא מפתיע הרמות השונות של נתונים בתוך ה-DW הם לא מקבלים רמות שונות של שימוש. ככלל, ככל שרמת הסיכום גבוהה יותר, כך i נתונים הם משומשים.
שימושים רבים מתרחשים ב נתונים מסוכם מאוד, בעוד הישן נתונים הפרטים כמעט ולא בשימוש. יש סיבה טובה להעביר את הארגון לפרדיגמת ניצול המשאבים. יותר סיכם אני נתונים, כמה שיותר מהר ויעיל להגיע אל נתונים. אם חנות מגלה שהוא עושה הרבה עיבוד ברמת הפרטים של ה-DW, ואז נצרכת כמות גדולה בהתאם של משאבי מכונה. האינטרס של כולם הוא לעבד סיכום כה גבוה בהקדם האפשרי.

עבור חנויות רבות, נעשה שימוש באנליסט DSS ב- DW לפני הסביבה נתונים ברמת הפירוט. במובנים רבים ההגעה א נתונים מפורט נראה כמו שמיכת אבטחה, גם כאשר רמות אחרות של סיכום זמינות. אחת הפעילויות של האדריכל של נתונים הוא לגמול את משתמש ה-DSS משימוש מתמיד ב נתונים ברמת הפירוט הנמוכה ביותר. יש שני מניעים העומדים לרשות האדריכל נתונים:

התקנת מערכת חיוב חוזר, שבה משתמש הקצה משלם עבור המשאבים שנצרכו ה
מה שמצביע על כך שניתן לקבל זמן תגובה טוב מאוד כאשר ההתנהגות עם i נתונים נמצא ברמת סיכום גבוהה, בעוד שזמן התגובה הירוד נובע מההתנהגות של ה נתונים ברמה נמוכה של שיקולים אחרים יש עוד כמה שיקולי בנייה וניהול של DW.
השיקול הראשון הוא של מדדים. ה נתונים ברמות גבוהות יותר של סיכום ניתן להוסיף אותם לאינדקס באופן חופשי, בעוד i נתונים

ברמות נמוכות יותר של פירוט הם כל כך נפחיים שאפשר להוסיף אותם לאינדקס במשורה. מאותו היגיון, אני נתונים ברמות גבוהות של פירוט ניתן לבנות מחדש בקלות יחסית, בעוד הנפח של נתונים ברמות הנמוכות הוא כל כך גדול ש- i נתונים לא ניתן לשפץ אותם בקלות. כתוצאה מכך, המודל של נתונים והעבודה הרשמית שנעשתה על ידי התכנון מניחה את הבסיס ל-DW המיושמת כמעט אך ורק ברמת הפירוט הנוכחית. במילים אחרות, פעילויות הדוגמנות של ה נתונים הם לא חלים על רמות סיכום, כמעט בכל מקרה. שיקול מבני נוסף הוא של חלוקת המשנה של נתונים מאת DW.

חלוקה יכולה להיעשות בשתי רמות - ברמה של dbms וברמת היישום. בחטיבה ברמה dbms, dbms מיודע על החטיבות ושולט בהן בהתאם. במקרה של חלוקה ברמת האפליקציה, רק המתכנת מודע לחטיבות והאחריות לניהולן מוטלת עליו.

מתחת לרמה dbms, עבודה רבה נעשית באופן אוטומטי. יש הרבה חוסר גמישות הקשורה לניהול עצמי של חטיבות. במקרה של יישום ברמת החלוקה של ה נתונים דל מחסן נתונים, הרבה מהעבודה נופלת על המתכנת, אבל התוצאה הסופית היא גמישות בניהול של נתונים Nel מחסן נתונים

חריגות אחרות

בעוד המרכיבים של ה מחסן נתונים עבודה כמתואר כמעט לכולם נתונים, יש כמה חריגים שימושיים שצריך לדון בהם. יוצא מן הכלל הוא זה של נתונים סיכומים ציבוריים (נתוני סיכום פומבי). אלו הם נתונים סיכומים שחושבו מתוך מחסן נתונים אבל הם משמשים את החברה. ה נתונים סיכומים ציבוריים מאוחסנים ומנוהלים ב- מחסן נתונים, למרות שכאמור לעיל הם הובאו. רואי חשבון פועלים להפקת כזו מדי רבעון נתונים כגון הכנסה, הוצאות רבעוניות, רווח רבעוני וכן הלאה. העבודה שנעשתה על ידי רואי חשבון היא חיצונית ל מחסן נתונים. למרות זאת, אני נתונים משמשים "פנימי" בתוך החברה - מ שיווק, מכירות וכו'. אנומליה נוספת, שלא נדון בה, היא של נתונים חיצוני.

עוד סוג נהדר של נתונים אשר ניתן למצוא ב א מחסן נתונים הוא של נתוני פירוט קבועים. אלה גורמים לצורך לאחסן לצמיתות את נתונים ברמה מפורטת מסיבות אתיות או משפטיות. אם חברה חושפת את עובדיה לחומרים מסוכנים יש בכך צורך נתונים מפורט וקבוע. אם חברה מייצרת מוצר הכרוך בבטיחות הציבור, כמו חלקים למטוס, יש צורך בכך נתונים פרטים קבועים, וכן אם חברה מתקשרת בחוזים מסוכנים.

החברה אינה יכולה להרשות לעצמה להתעלם מהפרטים שכן במהלך השנים הקרובות, במקרה של תביעה, ריקול, ליקויי בנייה במחלוקת וכו'. החשיפה של החברה עשויה להיות גדולה. כתוצאה מכך יש סוג ייחודי של נתונים ידועים כנתוני פירוט קבועים.

תקציר

Un מחסן נתונים זהו וריאנט מונחה עצמים, משולב, מתוח, אוסף של נתונים לא נדיף לתמיכה בצרכי קבלת ההחלטות של המינהל. כל אחת מהפונקציות הבולטות של א מחסן נתונים יש השלכות. בנוסף יש ארבע רמות של נתונים דל מחסן נתונים:

פרטים ישנים
פרט עדכני
לתת לי מסוכם מעט
לתת לי מטא נתונים מסוכמים מאוד הם גם חלק חשוב מה- מחסן נתונים. תַקצִיר הרעיון של אחסון של נתונים לאחרונה הוא זכה לתשומת לב רבה והפך לטרנד של שנות ה-90. זאת בשל היכולת של מחסן נתונים להתגבר על המגבלות של מערכות תומכות ניהול כגון מערכות תומכות החלטות (DSS) ומערכות מידע מנהלים (EIS). למרות שהמושג של ה מחסן נתונים נראה מבטיח, יישם את i מחסן נתונים יכול להיות בעייתי בגלל תהליכי אחסנה בקנה מידה גדול. למרות המורכבות של פרויקטי אחסנה של נתונים, ספקים ויועצים רבים המחזיקים במלאי נתונים טוענים כי האחסון של נתונים להציג אין בעיה. עם זאת, בתחילת פרויקט המחקר הזה, כמעט ולא נעשה מחקר עצמאי, קפדני ושיטתי. כתוצאה מכך קשה לומר, מה באמת קורה בתעשייה כשהם נבנים מחסן נתונים. מחקר זה חקר את פרקטיקת האחסון של נתונים בני זמננו שמטרתם לפתח הבנה עשירה יותר של הפרקטיקה האוסטרלית. סקירת הספרות סיפקה את ההקשר והבסיס למחקר האמפירי. ישנן מספר תוצאות ממחקר זה. ראשית, מחקר זה חשף את הפעילויות שהתרחשו במהלך הפיתוח של מחסן נתונים. בתחומים רבים, אני נתונים שנאספו אישרו את הנוהג המדווח בספרות. שנית, הבעיות והבעיות שעשויות להשפיע על התפתחות ה- מחסן נתונים זוהו על ידי מחקר זה. לבסוף, הטבות שהושגו על ידי ארגונים אוסטרליים הקשורים לשימוש ב מחסן נתונים נחשפו.

פרק 1

הקשר מחקרי

הרעיון של מחסני נתונים זכה לחשיפה נרחבת והפך למגמה מתפתחת בשנות ה-90 (McFadden 1996, TDWI 1996, Shah and Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman and Oates 2000). ניתן לראות זאת ממספר גדל והולך של מאמרים על אחסון נתונים בפרסומי מסחר (Little and Gibson 1999). מאמרים רבים (ראו, למשל, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett and King 1996, Graham et al. 1996, Sakaguchi and Frolick 1996, Alvarez 1997, Brousell 1997, Clarke 1997, 1997 McCarthy, 1997'1998 Edwards 1999, TDWI XNUMX) דיווחו על יתרונות משמעותיים לארגונים המיישמים מחסן נתונים. הם גיבו את התיאוריה שלהם בראיות אנקדוטיות ליישומים מוצלחים, נתוני החזר גבוה על השקעה (ROI), וכן, על ידי מתן קווים מנחים או מתודולוגיות לפיתוח מחסן נתונים

(Shanks et al. 1997, Seddon and Benjamin 1998, Little and Gibson 1999). במקרה קיצוני, Graham et al. (1996) דיווחו על תשואה ממוצעת על השקעה של שלוש שנים של 401%.

עם זאת, חלק ניכר מהספרות הנוכחית התעלם מהמורכבות הכרוכה בביצוע פרויקטים כאלה. הפרויקטים של מחסן נתונים הם בדרך כלל מורכבים ובקנה מידה גדול ולכן נושאים סבירות גבוהה לכישלון אם לא נשלטים בקפידה (Shah and Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs and Clymer 1998, Rao 1998). הם דורשים כמויות עצומות של משאבים אנושיים ופיננסיים כאחד, זמן ומאמץ כדי לבנות אותם (Hill 1998, Crofts 1998). הזמן הטיפוסי והאמצעים הכספיים הנדרשים הם כשנתיים ושני עד שלושה מיליון דולר, בהתאמה (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). זמן זה ואמצעים כספיים נדרשים כדי לשלוט ולאחד היבטים רבים ושונים של אחסון נתונים (Cafasso 1995, Hill 1998). לצד שיקולי החומרה והתוכנה, פונקציות נוספות, המשתנות מהחילוץ של נתונים לתהליכי הטעינה של נתונים, קיבולת הזיכרון לניהול עדכונים והמטא נתונים לצורך הכשרת משתמשים, עליהם להתחשב.

בזמן שפרויקט המחקר הזה התחיל, היה מעט מאוד מחקר אקדמי שנערך בתחום מחסני הנתונים, במיוחד באוסטרליה. הדבר התברר ממיעוט המאמרים שפורסמו על אחסון נתונים בכתבי עת או כתבים אקדמיים אחרים באותה תקופה. רבים מהכתבים האקדמיים הזמינים תיארו את הניסיון האמריקאי. היעדר מחקר אקדמי בתחום מחסני הנתונים גרם לדרישה למחקר קפדני ומחקרים אמפיריים (McFadden 1996, Shanks et al. 1997, Little and Gibson 1999). בפרט, מחקרי מחקר על תהליך היישום של מחסן נתונים צריך להיעשות כדי להרחיב את הידע הכללי על היישום של מחסן נתונים ותשמש בסיס למחקר מחקר עתידי (Shanks et al. 1997, Little and Gibson 1999).

מטרת מחקר זה, אם כן, היא לחקור מה קורה בפועל כאשר ארגונים מיישמים ומשתמשים ב-i מחסן נתונים באוסטרליה. באופן ספציפי, מחקר זה יכלול ניתוח של תהליך שלם של פיתוח א מחסן נתונים, החל מיוזמה ועיצוב דרך עיצוב ויישום ושימוש לאחר מכן בתוך ארגונים אוסטרליים. בנוסף, המחקר יתרום גם לפרקטיקה הנוכחית על ידי זיהוי תחומים שבהם ניתן לשפר עוד יותר את התרגול ולצמצם או להימנע מחוסר יעילות וסיכונים. יתר על כן, הוא ישמש בסיס למחקרים אחרים בנושא מחסן נתונים באוסטרליה וימלא את החסר שקיים כיום בספרות.

שאלות מחקר

מטרת מחקר זה היא לחקור את הפעילויות הכרוכות ביישום של מחסן נתונים והשימוש בהם על ידי ארגונים אוסטרליים. בפרט, נלמדים אלמנטים הנוגעים לתכנון, פיתוח, תפעול, שימוש והסיכונים הכרוכים בפרויקט. אז השאלה של המחקר הזה היא:

"איך הנוהג הנוכחי של מחסן נתונים באוסטרליה?"

כדי לענות ביעילות על שאלה זו, נדרשות מספר שאלות מחקר משנה. בפרט, זוהו שלוש שאלות משנה מהספרות, המוצגת בפרק 2, כדי להנחות את פרויקט המחקר הזה: כיצד מחסן נתונים על ידי ארגונים אוסטרליים? מהן הבעיות שנתקל בהן?

מהם היתרונות שחווים?
בתשובה לשאלות אלו, נעשה שימוש בתכנון מחקר חקרני המשתמש בסקר. כמחקר חקרני, התשובות לשאלות לעיל אינן מלאות (Shanks et al. 1993, Denscombe 1998). במקרה זה, נדרשת טריאנגולציה מסוימת כדי לשפר את התשובות לשאלות אלו. עם זאת, החקירה תספק בסיס איתן לעבודה עתידית בבחינת שאלות אלו. דיון מפורט בהצדקה ובתכנון של שיטות מחקר מובא בפרק 3.

מבנה פרויקט המחקר

פרויקט מחקר זה מחולק לשני חלקים: המחקר ההקשרי של תפיסת מחסני הנתונים והמחקר האמפירי (ראה איור 1.1), שכל אחד מהם נדון להלן.

חלק א ': לימוד הקשר

החלק הראשון של המחקר כלל סקירה של הספרות העדכנית על סוגים שונים של מחסני נתונים כולל מערכות תומכות החלטות (DSS), מערכות מידע מנהלים (EIS), מקרי מקרים של מחסן נתונים והמושגים של מחסן נתונים. כמו כן, התוצאות של הפורומים על מחסן נתונים וקבוצות מפגש של מומחים ומתרגלים בראשות קבוצת המחקר של מונש DSS, תרמו לשלב זה של המחקר שנועד לקבל תובנה לגבי הפרקטיקה של מחסן נתונים ולזהות את הסיכונים הכרוכים באימוץ. במהלך תקופה זו של מחקר הקשרי, נוצרה הבנה של אזור הבעיה כדי לספק את בסיס הידע לחקירות אמפיריות עוקבות. עם זאת, זה היה תהליך מתמשך בזמן שהמחקר נערך.

חלק ב ': מחקר אמפירי

התפיסה החדשה יחסית של אחסון נתונים, במיוחד באוסטרליה, יצרה צורך בסקר כדי לקבל תמונה רחבה של חווית השימוש. חלק זה בוצע לאחר הקמת תחום הבעיה באמצעות סקירת ספרות מקיפה. תפיסת מחסני הנתונים שנוצרה בשלב המחקר ההקשרי שימשה כקלט עבור השאלון הראשוני של מחקר זה. לאחר מכן, נבדק השאלון. האם אתה מומחה בנושא מחסן נתונים השתתפו במבחן. מטרת בדיקת השאלון הראשוני הייתה לבדוק את שלמות השאלות ודיוקן. בהתבסס על תוצאות הבדיקה, השאלון שונה והגרסה המתוקנת נשלחה למשתתפי הסקר בדואר. לאחר מכן נותחו השאלונים שהוחזרו עבור i נתונים בטבלאות, דיאגרמות ופורמטים אחרים. ה

תוצאות ניתוח של נתונים ליצור תמונת מצב של שיטות מחסני נתונים באוסטרליה.

סקירת אחסון נתונים

הרעיון של מחסני נתונים התפתח עם שיפורים בטכנולוגיית המחשבים.
הוא נועד להתגבר על הבעיות בהן נתקלות קבוצות תמיכה ביישומים כגון Decision Support System (DSS) ו-Executive Information System (EIS).

בעבר המכשול הגדול ביותר של יישומים אלה היה חוסר היכולת של יישומים אלה לספק א מאגר מידע הכרחי לניתוח.
הדבר נגרם בעיקר מאופי עבודת ההנהלה. האינטרסים של הנהלת החברה משתנים ללא הרף בהתאם לתחום המכוסה. לכן אני נתונים היסוד ליישומים אלה חייב להיות מסוגל להשתנות במהירות בהתאם לחלק שיש לטפל בו.
זה אומר שאני נתונים חייב להיות זמין בצורה המתאימה עבור הניתוחים הנדרשים. למעשה, קבוצות תמיכה ביישומים התקשו מאוד בעבר לאסוף ולשלב נתונים ממקורות מורכבים ומגוונים.

שאר חלק זה מציג סקירה כללית של הרעיון של מחסן נתונים ודן כיצד מחסן נתונים יכול להתגבר על הבעיות של קבוצות תמיכה ביישומים.
המונח "מחסן נתוניםזכה לפופולריות על ידי וויליאם אינמון ב-1990. ההגדרה שלו המצוטטת לעתים קרובות רואה את מחסן נתונים כאוסף של נתונים מונחה נושא, משולב, לא נדיף ומשתנה לאורך זמן, לתמיכה בהחלטות ההנהלה.

באמצעות הגדרה זו אינמון מציין כי i נתונים מתגוררים בא מחסן נתונים חייב להיות בעל 4 המאפיינים הבאים:

▪ מוכווני נושא
▪ משולב
▪ לא נדיף
▪ משתנה לאורך זמן לפי Inmon מונחה נושא פירושו שאני נתונים Nel מחסן נתונים בתחומים הארגוניים הגדולים ביותר שהיו

מוגדר במודל נתונים. למשל הכל נתונים הנוגע ל לקוחות כלולים בתחום הנושא לקוחות. כמו כן כולם נתונים המתייחסים למוצרים כלולים באזור הנושא מוצרים.

על ידי אינטגרטי אינמון פירושו שאני נתונים מפלטפורמות שונות, מערכות ומיקומים משולבים ומאוחסנים במקום אחד. כתוצאה מכך נתונים יש להפוך את הדומים לפורמטים עקביים כדי להוסיף אותם ולהשוות אותם בקלות.
לדוגמה, מגדר זכר ונקבה מיוצגים על ידי האותיות M ו-F במערכת אחת, ועל ידי 1 ו-0 במערכת אחרת. כדי לשלב אותם כראוי, יש לשנות את אחד הפורמטים או את שניהם כך ששני הפורמטים יהיו שווים. במקרה זה נוכל לשנות את M ל-1 ואת F ל-0 או להיפך. מוכווני נושא ומשולבים מצביעים על כך שה מחסן נתונים נועד לספק ראייה פונקציונלית ורוחבית של נתונים על ידי החברה.

לא נדיף פירושו שאני נתונים Nel מחסן נתונים להישאר עקבי ולעדכן נתונים זה לא נחוץ. במקום זאת, כל שינוי ב- נתונים מסמכים מקוריים מתווספים אל מסד נתונים דל מחסן נתונים. משמעות הדבר היא כי ההיסטוריון של ה נתונים כלול ב מחסן נתונים.

עבור משתנים לאורך זמן אינמון מציין כי אני נתונים Nel מחסן נתונים תמיד מכילים סמני זמן ו- i נתונים בדרך כלל הם חוצים אופק זמן מסוים. למשל א
מחסן נתונים יכול להכיל 5 שנים של ערכים היסטוריים של לקוחות מ-1993 עד 1997. הזמינות של סדרת הזמן ההיסטורית ושל סדרת הזמן של נתונים מאפשר לך לנתח מגמות.

Un מחסן נתונים הוא יכול לאסוף את שלו נתונים ממערכות OLTP; ממקורות נתונים חיצוני לארגון ו/או מפרויקטים אחרים של מערכת לכידה מיוחדת נתונים.
I נתונים תמציות יכולות לעבור תהליך ניקוי, במקרה זה אני נתונים משתנים ומשולבים לפני שהם מאוחסנים ב מסד נתונים דל מחסן נתונים. ואז אני נתונים

מתגוררים בתוך מסד נתונים דל מחסן נתונים זמינים לכניסות משתמשי קצה ולכלי שחזור. באמצעות כלים אלה, משתמש הקצה יכול לגשת לתצוגה המשולבת של הארגון של נתונים.

I נתונים מתגוררים בתוך מסד נתונים דל מחסן נתונים הם מאוחסנים בפורמטים מפורטים וגם בפורמט סיכום.
רמת הסיכום עשויה להיות תלויה באופי ה - נתונים. אני נתונים מפורט עשוי לכלול נתונים הנוכחי ו נתונים היסטוריונים
I נתונים אמיתיים אינם כלולים ב מחסן נתונים עד שאני נתונים Nel מחסן נתונים מתרעננים.
בנוסף לאחסון i נתונים עצמם, א מחסן נתונים זה יכול גם לאחסן סוג אחר של נתתי נקרא METADATA המתאר i נתונים מתגורר בשלו מסד נתונים.
ישנם שני סוגים של מטא נתונים: מטא נתונים של פיתוח ומטא נתונים של ניתוח.
מטא נתונים של פיתוח משמשים לניהול ואוטומציה של תהליכי החילוץ, הניקוי, המיפוי וההעלאה נתונים Nel מחסן נתונים.
המידע הכלול במטא נתונים של הפיתוח יכול להכיל פרטים של מערכות הפעלה, פרטים של האלמנטים שיש לחלץ, המודל נתונים דל מחסן נתונים וכללים עסקיים להמרת נתונים נתונים.

הסוג השני של מטא נתונים, המכונה מטא נתונים אנליטיים מאפשר למשתמש הקצה לחקור את התוכן של מחסן נתונים למצוא את נתונים זמינים ומשמעותם במונחים ברורים ולא טכניים.

לפיכך המטא-נתונים האנליטיים פועלים כגשר בין מחסן נתונים ויישומי משתמש קצה. מטא נתונים זה יכול להכיל את המודל העסקי, תיאורים של נתונים בהתאמה למודל העסקי, שאילתות ודוחות מוגדרים מראש, מידע לגישה למשתמש והאינדקס.

יש לשלב מטא-נתונים של ניתוח ופיתוח למטא-נתונים משולבים של הכלה כדי לתפקד כראוי.

לרוע המזל, לרבים מהכלים הקיימים יש מטא נתונים משלהם וכרגע אין סטנדרטים קיימים

לאפשר לכלי אחסון נתונים לשלב מטא נתונים אלה. כדי לתקן מצב זה יצרנים רבים של כלי אחסון נתונים מובילים הקימו את מועצת Meta Data שלימים הפכה לקואליציית Meta Data.

המטרה של קואליציה זו היא לבנות מערך מטא נתונים סטנדרטי המאפשר לכלי מחסני נתונים שונים להמיר מטא נתונים
מאמציהם הביאו להולדתו של מפרט חילוף הנתונים של Meta Data (MDIS) שיאפשר החלפת מידע בין ארכיוני מיקרוסופט וקבצי MDIS קשורים.

קיומו של נתונים הן מסוכמות/אינדקס והן מפורטות, זה נותן למשתמש את האפשרות לבצע DRILL DROWN (קידוח) מ נתונים באינדקס לפרטים ולהיפך. קיומו של נתונים היסטוריה מפורטת מאפשרת יצירת ניתוחי מגמות לאורך זמן. בנוסף ניתן להשתמש במטא-נתונים של הניתוח כ-del directory מסד נתונים דל מחסן נתונים כדי לעזור למשתמשי קצה לאתר את i נתונים נחוץ.

בהשוואה למערכות OLTP, עם יכולתן לתמוך בניתוח של נתונים ודיווח, ה מחסן נתונים היא נתפסת כמערכת מתאימה יותר לתהליכי מידע כגון ביצוע ומענה לשאילתות והפקת דוחות. החלק הבא ידגיש את ההבדלים בין שתי המערכות בפירוט.

מחסן נתונים נגד מערכות OLTP

רבות ממערכות המידע בארגונים נועדו לתמוך בפעילות השוטפת. מערכות אלו הידועות בשם OLTP SYSTEMS, לוכדות עסקאות יומיות המתעדכנות באופן רציף.

I נתונים בתוך מערכות אלו הם משתנים, מוסיפים או נמחקים לעתים קרובות. לדוגמה, כתובתו של לקוח משתנה ככל שהוא עובר ממקום למקום. במקרה זה הכתובת החדשה תירשם על ידי שינוי שדה הכתובת של מסד נתונים. המטרה העיקרית של מערכות אלו היא להפחית את עלויות העסקאות ובמקביל להפחית את זמני העיבוד. דוגמאות למערכות OLTP כוללות פעולות קריטיות כגון רישום הזמנות, שכר, חשבוניות, ייצור, שירות לקוחות לקוחות.

בניגוד למערכות OLTP, שנוצרו עבור תהליכים מבוססי עסקאות ואירועים, כלומר מחסן נתונים נוצרו כדי לספק תמיכה בתהליך מבוסס ניתוח נתונים ועל תהליכי קבלת החלטות.

זה מושג בדרך כלל על ידי שילוב i נתונים ממערכות OLTP שונות ומערכות חיצוניות ב"מיכל" בודד של נתונים, כפי שנדון בסעיף הקודם.

מודל תהליך אחסון נתונים מונאש

מודל התהליך עבור מחסן נתונים מונש פותחה על ידי חוקרים מקבוצת המחקר של מונש DSS ומבוססת על הספרות של מחסן נתונים, ניסיון בתחומי מערכות תמיכה בפיתוח, דיונים עם ספקי יישומים לשימוש ב מחסן נתונים, על קבוצת מומחים בשימוש ב מחסן נתונים.

השלבים הם: ייזום, תכנון, פיתוח, תפעול והסבר. התרשים מסביר את האופי האיטרטיבי או האבולוציוני של פיתוח א מחסן נתונים תהליך באמצעות חיצים דו-כיוונים הממוקמים בין השלבים השונים. בהקשר זה "איטרטיבי" ו"אבולוציוני" פירושם שבכל שלב בתהליך, פעילויות יישום תמיד יכולות להתפשט לאחור לשלב הקודם. זה נובע מאופיו של פרויקט מחסן נתונים שבהן מתרחשות בקשות נוספות של משתמש הקצה בכל עת. למשל, בשלב הפיתוח של תהליך מחסן נתוניםאם מתבקש גודל נושא או שטח חדש על ידי משתמש הקצה, שלא היה חלק מהתוכנית המקורית, יש להוסיף אותו למערכת. זה גורם לשינוי בפרויקט. התוצאה היא שצוות התכנון צריך לשנות את הדרישות של המסמכים שנוצרו עד כה במהלך שלב התכנון. במקרים רבים, המצב הנוכחי של הפרויקט צריך לחזור כל הדרך חזרה לשלב התכנון בו יש להוסיף ולתעד את הדרישה החדשה. על משתמש הקצה להיות מסוגל לראות את התיעוד הספציפי שנסקר ואת השינויים שבוצעו בשלב הפיתוח. בסוף מחזור הפיתוח הזה, הפרויקט צריך לקבל משוב טוב גם מצוותי הפיתוח וגם מהמשתמשים. לאחר מכן נעשה שימוש חוזר במשוב כדי לשפר פרויקט עתידי.

תכנון קיבולת
dw נוטים להיות גדולים מאוד בגודלם ולגדול מהר מאוד (Best 1995, Rudin 1997a) בגלל כמות נתונים היסטורי שהם משמרים מתקופתם. צמיחה יכולה להיגרם גם על ידי נתונים תוספות שמשתמשים ביקשו להגדיל את הערך של נתונים שכבר יש להם. כתוצאה מכך, דרישות האחסון עבור נתונים ניתן לשפר באופן משמעותי (Eckerson 1997). לפיכך, חיוני להבטיח, על ידי ביצוע תכנון קיבולת, שהמערכת שתיבנה תוכל לצמוח ככל שהצרכים גדלים (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
בתכנון מדרגיות של מחסני נתונים, יש לדעת את הגידול הצפוי בגודל המחסן, את סוגי השאלות שצפויות להופיע ואת מספר משתמשי הקצה הנתמכים (Best 1995, Rudin 1997b, Foley 1997a). בניית יישומים ניתנים להרחבה דורשת שילוב של טכנולוגיות שרת ניתנות להרחבה וטכניקות עיצוב יישומים ניתנות להרחבה (Best 1995, Rudin 1997b. שניהם נחוצים בבניית אפליקציה ניתנת להרחבה. טכנולוגיות שרת ניתנות להרחבה יכולות להקל וחסכוני להוסיף אחסון, זיכרון ו-CPU ללא ביצועים משפילים (Lang 1997, Telephony 1997).

ישנן שתי טכנולוגיות שרתים עיקריות להרחבה: עיבוד מרובה סימטרי (SMP) ועיבוד מקבילי מאסיבי (MPP)) (IDC 1997, Humphries et al. 1999). לשרת SMP יש בדרך כלל מספר מעבדים החולקים זיכרון, אפיקי מערכת ומשאבים אחרים (IDC 1997, Humphries et al. 1999). ניתן להוסיף מעבדים נוספים כדי להגביר את זה Potenza חישובי. שיטה נוספת להגדלת ה Potenza חישוב של שרת SMP, הוא שילוב של מכונות SMP רבות. טכניקה זו ידועה בשם clustering (Humphries et al. 1999). לשרת MPP, לעומת זאת, יש מספר מעבדים שלכל אחד מהם זיכרון משלו, מערכת אוטובוס ומשאבים אחרים (IDC 1997, Humphries et al. 1999). כל מעבד נקרא צומת. עלייה ב Potenza ניתן להשיג חישוב

הוספת צמתים נוספים לשרתי MPP (Humphries et al. 1999).

נקודת התורפה של שרתי SMP היא שיותר מדי פעולות קלט-פלט (I/O) עלולות לעמוס את מערכת האוטובוסים (IDC 1997). בעיה זו אינה מתרחשת בתוך שרתי MPP מכיוון שלכל מעבד יש מערכת אפיק משלו. עם זאת, החיבורים בין כל צומת הם בדרך כלל הרבה יותר איטיים ממערכת האוטובוסים SMP. יתר על כן, שרתי MPP יכולים להוסיף שכבה נוספת של מורכבות למפתחי יישומים (IDC 1997). לפיכך, הבחירה בין שרתי SMP ו-MPP יכולה להיות מושפעת מגורמים רבים, לרבות מורכבות האפליקציות, יחס המחיר/ביצועים, התפוקה הנדרשת, יישומי dw שנמנעו והגדלת הגודל של האפליקציה. מסד נתונים של dw ובמספר משתמשי הקצה.

ניתן להשתמש במספר טכניקות עיצוב יישומים ניתנות להרחבה בתכנון קיבולת. אחד משתמש בתקופות דיווח שונות כגון ימים, שבועות, חודשים ושנים. לאחר תקופות הודעה שונות, ה מסד נתונים ניתן לחלק לחלקים מקובצים בצורה ניהולית (Inmon et al. 1997). טכניקה נוספת היא להשתמש בטבלאות סיכום שנבנות על ידי סיכום נתונים da נתונים מְפוֹרָט. לפיכך, אני נתונים תקצירים הם יותר קומפקטיים מאשר מפורטים, מה שדורש פחות שטח זיכרון. אז ה נתונים ניתן לאחסן פרטים בארכיון ליחידת אחסון זולה יותר, מה שחוסך עוד יותר אחסון. בעוד ששימוש בטבלאות סיכום יכול לחסוך מקום אחסון, הן דורשות מאמץ רב כדי לשמור אותן עדכניות ובהתאם לצרכים העסקיים. עם זאת, טכניקה זו נמצאת בשימוש נרחב ולעתים קרובות נעשה בה שימוש בשילוב עם הטכניקה הקודמת (Best 1995, Inmon 1996a, Chauduri and Dayal
1997).

מגדיר מחסן נתונים ארכיטקטורות טכניות הגדרה של טכניקות ארכיטקטורה dw

המאמצים המוקדמים של מחסני נתונים חזו בראש ובראשונה יישום מחסן נתונים מרכזי שבו הכל נתונים, כולל I נתונים חיצוני, שולבו באחד,
מאגר פיזי (Inmon 1996a, Bresnahan 1996, Peacock 1998).

היתרון העיקרי של גישה זו הוא שמשתמשי קצה יכולים לגשת לתצוגה הכלל-ארגונית של נתונים ארגוני (Ovum 1998). יתרון נוסף הוא שהוא מציע סטנדרטיזציה של נתונים ברחבי הארגון, מה שאומר שיש רק גרסה אחת או הגדרה אחת לכל מינוח המשמש במטא נתונים של המאגר (Flanagan and Safdie 1997, Ovum 1998). החיסרון של גישה זו, לעומת זאת, הוא שהיא יקרה וקשה לבנייה (Flanagan and Safdie 1997, Ovum 1998, Inmon et al. 1998). זמן לא רב לאחר ארכיטקטורת האחסון נתונים הריכוזיות הפכה לפופולרית, הרעיון של כריית תת-הקבוצות הקטנות ביותר של האלים התפתח נתונים לתמוך בצרכים של יישומים ספציפיים (Varney 1996, IDC 1997, Berson and Smith 1997, peacock 1998). מערכות קטנות אלו נגזרות מהגדולה יותר מחסן נתונים מְרוּכָּז. הם נקראים בשם מחסן נתונים נתונים מחלקים לעובדים או עובדים. ארכיטקטורת מאגר הנתונים התלויה ידועה כארכיטקטורה תלת-שכבתית כאשר הרובד הראשון מורכב מה- מחסן נתונים מרוכז, השני מורכב מהפקדות של נתונים המחלקה והשלישית מורכבת מגישה אל נתונים ועל ידי כלי ניתוח (Demarest 1994, Inmon et al. 1997).

Data March בנויים בדרך כלל לאחר ה- מחסן נתונים centralized נבנה כדי לענות על הצרכים של יחידות ספציפיות (White 1995, Varney 1996).
חנות מארס נתונים i נתונים רלוונטי ליחידות מסוימות (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

היתרון בשיטה זו הוא שלא תהיה כזו נתתי לא משולב וכי אני נתונים יהיה פחות מיותר בתוך הנתונים marts מאז כל נתונים מגיעים מהפקדה של נתונים מְשׁוּלָב. יתרון נוסף הוא שיהיו פחות קישורים בין כל מאגר נתונים למקורותיו נתונים כי לכל מאגר נתונים יש רק מקור אחד של נתונים. בנוסף עם הארכיטקטורה הזו, משתמשי קצה עדיין יכולים לגשת ל נתונים

ארגונים ארגוניים. שיטה זו ידועה בתור השיטה מלמעלה למטה, שבה נתונים מרטים בנויים לאחר ה- מחסן נתונים (טווס 1998, גופ 1998).
הודות להגברת הצורך להציג תוצאות מוקדם, חלק מהארגונים החלו בבניית מחנות נתונים עצמאיים (Flanagan and Safdie 1997, White 2000). במקרה זה, ה-Data March מקבלים את שלהם נתונים ישירות מהיסודות של נתונים OLTP ולא OLTP מהמאגר המרכזי והמשולב, ובכך מבטל את הצורך במאגר המרכזי במקום.

כל מאגר נתונים דורש לפחות קישור אחד למקורותיו נתונים. חיסרון אחד של קישורים מרובים לכל מתקן נתונים הוא שבהשוואה לשתי הארכיטקטורות הקודמות, שפע היתר של נתונים עולה משמעותית.

כל נתונים נתונים חייבים לאחסן הכל נתונים נדרש באופן מקומי ללא השפעה על מערכות OLTP. זה גורם ל-i נתונים הם מאוחסנים במרץ נתונים שונים (Inmon et al. 1997). חיסרון נוסף של ארכיטקטורה זו הוא שהיא מובילה ליצירת חיבורים מורכבים בין נתונים מרטים ומקורות הנתונים שלהם. נתונים שקשה ליישם ולשליטה (Inmon et al. 1997).

חיסרון נוסף הוא שמשתמשי קצה לא יוכלו לגשת לסקירת המידע של החברה מכיוון שאני נתונים של מארס הנתונים השונים אינם משולבים (Ovum 1998).
חיסרון נוסף הוא שייתכן שיש יותר מהגדרה אחת לכל מינוח המשמש ב-Data Marts שיוצר חוסר עקביות בנתונים. נתונים בארגון (Ovum 1998).
למרות החסרונות שנדונו לעיל, מחנות נתונים עצמאיים עדיין מושכים את העניין של ארגונים רבים (IDC 1997). גורם אחד שהופך אותם לאטרקטיביים הוא שהם מהירים יותר להתפתח ודורשים פחות זמן ומשאבים (Bresnahan 1996, Berson and Smith 1997, Ovum 1998). כתוצאה מכך, הם משמשים בעיקר כעיצובי בדיקה שניתן להשתמש בהם כדי לזהות במהירות יתרונות ו/או חסרונות בתכנון (Parsaye 1995, Braly 1995, Newing 1996). במקרה זה, החלק שייושם בפרויקט הפיילוט חייב להיות קטן אך חשוב לארגון (Newing 1996, Mansell-Lewis 1996).

על ידי בחינת אב הטיפוס, משתמשי הקצה וההנהלה יכולים להחליט אם להמשיך או להפסיק את הפרויקט (Flanagan and Safdie 1997).
אם ההחלטה תימשך, יש לבנות מרץ נתונים לתעשיות אחרות בזה אחר זה. ישנן שתי אפשרויות עבור משתמשי קצה בהתבסס על צרכיהם בבניית מטרי נתונים עצמאיים: משולבים/מאוחדים ובלתי משולבים (Ovum 1998)

בשיטה הראשונה, כל מרץ נתונים חדש צריך להיבנות על בסיס ה-Data March והמודל הנוכחיים נתונים בשימוש הפירמה (Varney 1996, Berson and Smith 1997, Peacock 1998). הצורך להשתמש במודל נתונים של הארגון פירושו שחייבים להבטיח שיש רק הגדרה אחת לכל מינוח המשמש ב-Data Marts, גם כדי להבטיח שניתן למזג נתונים מרקטים שונים כדי לתת סקירה כללית של מידע ארגוני (Bresnahan 1996). שיטה זו נקראת שיטת מלמטה למעלה והיא משמשת בצורה הטובה ביותר כאשר יש מגבלה על אמצעים וזמן פיננסיים (Flanagan and Safdie 1997, Ovum 1998, peacock 1998, Goff 1998). בשיטה השנייה, מאגר הנתונים הבנויים יכול לספק רק את הצרכים של יחידה ספציפית. גרסה של שוק הנתונים המאוחד הוא מחסן נתונים מופץ שבו ה מסד נתונים תוכנת האמצע של שרת הרכז משמשת למיזוג נתונים רבים למאגר אחד נתונים מופץ (White 1995). במקרה זה, אני נתונים העסקים מופצים במספר נתונים מרטים. בקשות של משתמשי קצה מועברות אל מסד נתונים תוכנת רכזת שרתים, המחלצת הכל נתונים מבוקש על ידי Data March ולהחזיר את התוצאות ליישומי משתמש קצה. שיטה זו מספקת מידע עסקי למשתמשי הקצה. עם זאת, הבעיות של מחנות נתונים עצמאיים עדיין לא בוטלו. ישנה ארכיטקטורה נוספת שניתן להשתמש בה הנקראת מחסן נתונים וירטואלי (White 1995). עם זאת, ארכיטקטורה זו, המתוארת באיור 2.9, אינה ארכיטקטורת אחסון נתונים נתונים אמיתי מכיוון שהוא לא מעביר את העומס ממערכות OLTP אל מחסן נתונים (Demarest 1994).

למעשה, הבקשות ל נתונים על ידי משתמשי קצה הם מועברים למערכות OLTP אשר מחזירות תוצאות לאחר עיבוד בקשות משתמשים. אמנם ארכיטקטורה זו מאפשרת למשתמשי קצה להפיק דוחות ולהגיש בקשות, אך היא אינה יכולה לספק i

נתונים היסטוריה וסקירה של מידע על החברה מאז i נתונים מכיוון שמערכות ה-OLTP השונות אינן משולבות. לכן, ארכיטקטורה זו אינה יכולה לספק את הניתוח של נתונים כגון תחזיות.

מבחר יישומי גישה ושחזור נתונים נתונים

מטרת בניית א מחסן נתונים הוא העברת מידע למשתמשי קצה (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); יישום גישה ושחזור אחד או יותר נתונים חייב להיות מסופק. נכון להיום, קיים מגוון רחב של יישומים כאלה לבחירת המשתמש (Hammergren 1998, Humphries et al. 1999). האפליקציות הנבחרות קובעות את הצלחת מאמץ האחסנה נתונים בארגון מכיוון שהיישומים הם החלק הגלוי ביותר של מחסן נתונים למשתמש הקצה (Inmon et al. 1997, Poe 1996). כדי להצליח א מחסן נתונים, חייב להיות מסוגל לתמוך בפעילויות ניתוח נתונים נתונים של משתמש הקצה (Poe 1996, Seddon and Benjamin 1998, Eckerson 1999). לפיכך יש לזהות את ה"רמה" של מה שמשתמש הקצה רוצה (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

באופן כללי, ניתן לקבץ את משתמשי הקצה לשלוש קטגוריות: משתמשים מנהלים, אנליסטים עסקיים ומשתמשי כוח (Poe 1996, Humphries et al. 1999). משתמשים מנהלים זקוקים לגישה נוחה לקבוצות מוגדרות מראש של דוחות (Humphries et al. 1999). ניתן לגשת לדוחות אלו בקלות באמצעות ניווט בתפריט (Poe 1996). בנוסף, דוחות צריכים להציג מידע באמצעות ייצוג גרפי כגון טבלאות ותבניות כדי להעביר את המידע במהירות (Humphries et al. 1999). אנליסטים עסקיים, שאולי אין להם את היכולות הטכניות לפתח דוחות מאפס בעצמם, צריכים להיות מסוגלים לשנות דוחות נוכחיים כדי לענות על הצרכים הספציפיים שלהם (Poe 1996, Humphries et al. 1999). משתמשי כוח, לעומת זאת, הם סוג משתמשי הקצה שיש להם את היכולת ליצור ולכתוב בקשות ודוחות מאפס (Poe 1996, Humphries et al. 1999). הם אלה ש

הם בונים מערכות יחסים עבור סוגים אחרים של משתמשים (Poe 1996, Humphries et al. 1999).

לאחר שנקבעו דרישות משתמש הקצה, יש לבצע מבחר של יישומי גישה ושחזור נתונים בין כל אלה הזמינים (Poe 1996, Inmon et al. 1997).
גישה ל נתונים וכלי אחזור יכולים להיות מסווגים ל-4 סוגים: כלי OLAP, כלי EIS/DSS, כלי שאילתות ודיווח וכלי כריית נתונים.

כלי OLAP מאפשרים למשתמשים ליצור שאילתות אד-הוק כמו גם שאילתות שנעשו ב- מסד נתונים דל מחסן נתונים. בנוסף, מוצרים אלה מאפשרים למשתמשים להתעמק בהם נתונים כללי עד מפורט.

כלי EIS/DSS מספקים דיווח מנהלים כגון ניתוח "מה אם" וגישה לדוחות מונחי תפריט. יש להגדיר מראש דוחות ולמזג אותם עם תפריטים לניווט קל יותר.
כלי שאילתה ודיווח מאפשרים למשתמשים להפיק דוחות מוגדרים וספציפיים מראש.

כלי כריית נתונים משמשים לזיהוי קשרים שיכולים לשפוך אור חדש על פעולות שנשכחו נתונים של מחסן הנתונים.

לצד אופטימיזציה של הדרישות של כל סוג של משתמש, הכלים שנבחרו חייבים להיות אינטואיטיביים, יעילים וקלים לשימוש. הם גם צריכים להיות תואמים לחלקים אחרים של הארכיטקטורה ויכולים לעבוד עם מערכות קיימות. כמו כן, מומלץ לבחור בכלי גישה ואחזור נתונים עם מחיר וביצועים סבירים. קריטריונים נוספים שיש לקחת בחשבון כוללים את המחויבות של ספק הכלים לתמוך במוצר שלהם והפיתוחים שיהיו לו במהדורות עתידיות. כדי להבטיח מעורבות משתמשים בשימוש במחסן הנתונים, צוות הפיתוח מערב את המשתמשים בתהליך בחירת הכלים. במקרה זה, יש לבצע הערכה מעשית של המשתמש.

כדי לשפר את הערך של מחסן הנתונים, צוות הפיתוח יכול גם לספק גישה לאינטרנט למחסני הנתונים שלהם. מחסן נתונים המותאם לאינטרנט מאפשר למשתמשים לגשת ל נתונים ממקומות מרוחקים או בזמן נסיעה. גם המידע יכול

להינתן בעלות נמוכה יותר באמצעות ירידה בעלויות ההדרכה.

2.4.3 מחסן נתונים שלב המבצע

שלב זה מורכב משלוש פעילויות: הגדרת אסטרטגיות רענון נתונים, בקרה על פעילות מחסני הנתונים וניהול אבטחת מחסני הנתונים.

הגדרת אסטרטגיות רענון נתונים

לאחר ההעלאה הראשונית, i נתונים Nel מסד נתונים של מחסן הנתונים יש לרענן מעת לעת כדי לשחזר את השינויים שנעשו ב נתונים מקוריים. אז אתה צריך להחליט מתי לרענן, באיזו תדירות יש לתזמן את הרענון וכיצד לרענן את נתונים. מומלץ לרענן את נתונים כאשר המערכת יכולה להיות במצב לא מקוון. קצב הרענון נקבע על ידי צוות הפיתוח בהתאם לדרישות המשתמש. ישנן שתי גישות לרענון מחסן הנתונים: רענון מלא והעלאה רציפה של שינויים.

הגישה הראשונה, רענון מלא, דורשת טעינה מחדש של הכל נתונים מאפס. זה אומר שכולם נתונים יש לחלץ, לנקות, להפוך ולשלב בכל רענון. יש להימנע מגישה זו במידת האפשר מכיוון שהיא גוזלת זמן ומשאבים.

גישה חלופית היא העלאת שינויים ללא הרף. זה מוסיף אני נתונים שהשתנו מאז מחזור הרענון האחרון של מחסן הנתונים. זיהוי רשומות חדשות או שהשתנו מפחית באופן משמעותי את הכמות של נתונים אשר יש להפיץ למחסן הנתונים בכל עדכון כאלו בלבד נתונים יתווסף ל מסד נתונים של מחסן הנתונים.

ישנן לפחות 5 גישות שניתן להשתמש בהן כדי לבטל את i נתונים חדש או שונה. כדי להשיג אסטרטגיית רענון וידאו יעילה נתונים תערובת של גישות אלו שמביאות את כל השינויים במערכת עשויה להיות שימושית.

הגישה הראשונה, המשתמשת בחותמות זמן, מניחה שכולם מוקצים נתונים ערכת ועדכנה חותמת זמן כדי שתוכל לזהות את כולם בקלות נתונים שונה וחדשה. עם זאת, גישה זו לא הייתה בשימוש נרחב ברוב מערכות ההפעלה כיום.
הגישה השנייה היא להשתמש בקובץ דלתא שנוצר על ידי יישום המכיל רק את השינויים שבוצעו ב- נתונים. השימוש בקובץ זה גם מגביר את מחזור העדכון. עם זאת, אפילו בשיטה זו לא נעשה שימוש ביישומים רבים.
הגישה השלישית היא סריקת קובץ יומן, שבעצם מכיל מידע דומה לקובץ הדלתא. ההבדל היחיד הוא שקובץ יומן נוצר עבור תהליך השחזור ויכול להיות קשה להבנה.
הגישה הרביעית היא לשנות את קוד היישום. עם זאת, רוב קוד היישומים ישן ושביר; לכן יש להימנע מטכניקה זו.
הגישה האחרונה היא להשוות בין נתונים מקורות עם הקובץ הראשי dei נתונים.

שליטה בפעילות מחסן הנתונים

לאחר שחרור מחסן הנתונים למשתמשים, יש לנטר אותו לאורך זמן. במקרה זה, מנהל מחסן הנתונים יכול להשתמש בכלי ניהול ובקרה אחד או יותר כדי לפקח על השימוש במחסן הנתונים. בפרט, ניתן לאסוף מידע על אנשים ועל זמן הגישה למחסן הנתונים. בחייך נתונים שנאסף, ניתן ליצור פרופיל של העבודה שבוצעה אשר יכול לשמש כקלט ליישום החיוב חוזר של המשתמש. חיוב חוזר מאפשר למשתמשים לקבל מידע על עלות עיבוד מחסן הנתונים.

בנוסף, ניתן להשתמש בביקורת מחסני נתונים גם כדי לזהות סוגי שאילתות, גודלן, מספר השאילתות ביום, זמני תגובה לשאילתות, סקטורים שהגיעו אליהם וכמות נתונים מעובד. מטרה נוספת של ביצוע ביקורת מחסני נתונים היא לזהות את נתונים שאינם בשימוש. אלה נתונים ניתן להסיר אותם ממחסן הנתונים כדי לשפר את הזמן

תגובה לביצוע שאילתות ולשלוט בצמיחה של נתונים השוכנים בתוך ה מאגר מידע של מחסן הנתונים.

ניהול אבטחת מחסן נתונים

מחסן נתונים מכיל נתונים משולב, קריטי, רגיש שניתן להגיע אליו בקלות. מסיבה זו יש להגן עליו מפני משתמשים לא מורשים. אחת הדרכים ליישם אבטחה היא להשתמש בפונקציית del DBMS להקצות הרשאות שונות לסוגים שונים של משתמשים. באופן זה, יש לשמור על פרופיל גישה לכל סוג משתמש. דרך נוספת לאבטח את מחסן הנתונים היא להצפין אותו כפי שכתוב ב- מאגר מידע של מחסן הנתונים. גישה ל נתונים וכלי האחזור חייבים לפענח את נתונים לפני הצגת התוצאות למשתמשים.

2.4.4 מחסן נתונים שלב הפריסה

זהו השלב האחרון במחזור ההטמעה של מחסן הנתונים. הפעילויות שיתבצעו בשלב זה כוללות הדרכת משתמשים לשימוש במחסן הנתונים וביצוע סקירות של מחסן הנתונים.

הכשרת משתמשים

יש לבצע הדרכת משתמשים לפני הגישה נתונים של מחסן הנתונים ושימוש בכלי אחזור. בדרך כלל, המפגשים צריכים להתחיל עם היכרות עם מושג האחסון נתונים, התוכן של מחסן הנתונים, המטא נתונים והתכונות הבסיסיות של הכלים. לאחר מכן, משתמשים מתקדמים יותר עשויים ללמוד גם את הטבלאות הפיזיות והתכונות של משתמשים בכלי גישה ואחזור נתונים.

ישנן גישות רבות לבצע הדרכת משתמשים. אחד מהם כולל מבחר של משתמשים או אנליסטים רבים שנבחרו מתוך מאגר משתמשים, על סמך כישורי המנהיגות והתקשורת שלהם. אלה עוברים הכשרה אישית בכל מה שהם צריכים לדעת כדי להכיר את המערכת. לאחר ההכשרה, הם חוזרים לעבודתם ומתחילים ללמד משתמשים אחרים כיצד להשתמש במערכת. על

בהתבסס על מה שהם למדו, משתמשים אחרים יכולים להתחיל לחקור את מחסן הנתונים.
גישה נוספת היא להכשיר משתמשים רבים בו-זמנית, כאילו אתה מתאמן בכיתה. שיטה זו מתאימה כאשר יש הרבה משתמשים שצריך להכשיר בו זמנית. שיטה נוספת היא להכשיר כל משתמש בנפרד, אחד אחד. שיטה זו מתאימה כאשר יש מעט משתמשים.

מטרת הדרכת המשתמש היא להכיר את הגישה נתונים וכלי אחזור וכן תכולת מחסני נתונים. עם זאת, חלק מהמשתמשים עשויים להיות המום מכמות המידע שסופק במהלך האימון. לאחר מכן יש לבצע מספר מפגשי רענון לתמיכה שוטפת וכדי לענות על שאלות ספציפיות. במקרים מסוימים נוצרת קבוצת משתמשים כדי לספק תמיכה מסוג זה.

איסוף משוב

לאחר השקת מחסן הנתונים, משתמשים יכולים להשתמש ב-i נתונים מגורים במחסן הנתונים למטרות שונות. לרוב, אנליסטים או משתמשים משתמשים ב-i נתונים במחסן הנתונים עבור:

1 זיהוי מגמות בחברה
2 נתח את פרופילי הרכישה של לקוחות
3 פיצול i לקוחות ו -
4 לספק את השירותים הטובים ביותר ל לקוחות - התאמה אישית של שירותים
5 ניסוח אסטרטגיות שיווק
6 בצע הצעות מחיר תחרותיות עבור ניתוחי עלויות ועזרה בשליטה
7 תמיכה בקבלת החלטות אסטרטגית
8 זהה הזדמנויות להופיע
9 שפר את איכות התהליכים העסקיים הנוכחיים
10 בדוק את הרווח

בעקבות כיוון הפיתוח של מחסן הנתונים, ניתן לערוך סדרה של סקירות של המערכת כדי לקבל משוב

הן על ידי צוות הפיתוח והן על ידי קהילת משתמשי הקצה.
ניתן לקחת בחשבון את התוצאות שהתקבלו למחזור הפיתוח הבא.

מכיוון שלמחסן הנתונים יש גישה אינקרמנטלית, חיוני ללמוד מההצלחות והטעויות של פיתוחים קודמים.

2.5 סיכום

בפרק זה נדונו הגישות הקיימות בספרות. בסעיף 1 נדון הרעיון של מחסן נתונים ותפקידו במדע ההחלטות. סעיף 2 תיאר את ההבדלים העיקריים בין מחסני נתונים ומערכות OLTP. סעיף 3 דן במודל מחסן הנתונים של מונש אשר שימש בסעיף 4 לתיאור הפעילויות הכרוכות בתהליך פיתוח מחסן נתונים, טענות אלו לא התבססו על מחקר קפדני. מה שקורה במציאות יכול להיות שונה מאוד ממה שהספרות מדווחת, אולם ניתן להשתמש בתוצאות אלו ליצירת מטען בסיסי המדגיש את הרעיון של מחסן נתונים עבור מחקר זה.

פרק 3

שיטות מחקר ועיצוב

פרק זה עוסק בשיטות המחקר והעיצוב למחקר זה. החלק הראשון מציג מבט כללי על שיטות המחקר הזמינות לאחזור מידע, בנוסף נדונים הקריטריונים לבחירת השיטה הטובה ביותר למחקר מסוים. בסעיף 2 נדונות לאחר מכן שתי שיטות שנבחרו עם הקריטריונים לעיל; אחד מאלה ייבחר ויאומץ מהטעמים המפורטים בסעיף 3 שבו מפורטים גם הסיבות להחרגת הקריטריון האחר. סעיף 4 מציג את פרויקט המחקר וסעיף 5 את המסקנות.

3.1 מחקר במערכות מידע

מחקר מערכות מידע אינו מוגבל רק לתחום הטכנולוגי אלא יש להרחיב אותו כך שיכלול יעדים התנהגותיים וארגוניים.
אנו חייבים זאת לתזות של דיסציפלינות שונות, החל ממדעי החברה ועד לטבע; זה מוביל לצורך בספקטרום מסוים של שיטות מחקר הכוללות שיטות כמותיות ואיכותיות שישמשו עבור מערכות מידע.
כל שיטות המחקר הזמינות חשובות, למעשה מספר חוקרים כמו Jenkins (1985), Nunamaker et al. (1991), ו-Galliers (1992) טוענים כי אין שיטה אוניברסלית ספציפית לביצוע מחקר בתחומים השונים של מערכות המידע; למעשה שיטה עשויה להתאים למחקר מסוים אך לא עבור אחרים. זה מוביל אותנו לצורך לבחור שיטה שמתאימה לפרויקט המחקר הספציפי שלנו: לבחירה זו Benbasat et al. (1987) קובעים כי יש לשקול את אופיו ומטרתו של המחקר.

3.1.1 אופי המחקר

ניתן לסווג את שיטות המחקר השונות המבוססות על הטבע לשלוש מסורות ידועות במדעי המידע: מחקר פוזיטיביסטי, פרשני וביקורתי.

3.1.1.1 מחקר פוזיטיביסטי

מחקר פוזיטיביסטי ידוע גם כמחקר מדעי או אמפירי. הוא מבקש: "להסביר ולחזות מה יקרה בעולם החברתי על ידי התבוננות בקביעות וביחסי סיבה-תוצאה בין האלמנטים המרכיבים אותו" (Shanks et al 1993).

המחקר הפוזיטיביסטי מאופיין גם בחזרות, הפשטות והפרכות. יתר על כן, המחקר הפוזיטיביסטי מודה בקיומם של קשרים אפריוריים בין התופעות שנחקרו.
לפי Galliers (1992) טקסונומיה היא שיטת מחקר הנכללת בפרדיגמה הפוזיטיביסטית, אשר עם זאת אינה מוגבלת לכך, למעשה ישנם ניסויי מעבדה, ניסויי שטח, מקרי מקרה, הדגמות משפטים, ניבויים וסימולציות. באמצעות שיטות אלו, החוקרים מודים שניתן לצפות בתופעות שנחקרו בצורה אובייקטיבית וקפדנית.

3.1.1.2 מחקר פרשני

מחקר פרשני, המכונה לעתים קרובות פנומנולוגיה או אנטי-פוזיטיביזם מתואר על ידי נוימן (1994) כ"ניתוח שיטתי של המשמעות החברתית של פעולה באמצעות התבוננות ישירה ומפורטת של אנשים במצבים טבעיים, על מנת להגיע להבנה הפרשנות של האופן שבו אנשים יוצרים ומשמרים את עולמם החברתי". מחקרים פרשניים דוחים את ההנחה שניתן לצפות בתופעות שנצפו באופן אובייקטיבי. למעשה הם מבוססים על פרשנויות סובייקטיביות. יתר על כן, חוקרים פרשניים אינם כופים משמעויות אפריוריות על התופעות שהם חוקרים.

שיטה זו כוללת מחקרים סובייקטיביים/טיעונים, מחקר פעולה, מחקרים תיאוריים/פרשניים, מחקר עתידי ומשחקי תפקידים. בנוסף לסקרים אלו ותיאורי מקרה עשויים להיכלל בגישה זו מכיוון שהם נוגעים למחקרים של אנשים או ארגונים בתוך מצבים מורכבים בעולם האמיתי.

3.1.1.3 מחקר קריטי

חיפוש ביקורתי הוא הגישה הפחות מוכרת במדעי החברה אך לאחרונה זוכה לתשומת לבם של חוקרים בזירת מערכות המידע. ההנחה הפילוסופית שהמציאות החברתית מיוצרת ומשוכפלת היסטורית על ידי אנשים, כמו גם מערכות חברתיות עם הפעולות והאינטראקציות שלהם. היכולת שלהם, לעומת זאת, מתווכת על ידי מספר שיקולים חברתיים, תרבותיים ופוליטיים.

כמו מחקר פרשני, מחקר ביקורתי טוען שלמחקר הפוזיטיביסטי אין שום קשר להקשר החברתי ומתעלם מהשפעתו על פעולות האדם.
מחקר ביקורתי, לעומת זאת, מותח ביקורת על מחקר פרשני על היותו סובייקטיבי מדי ועל כך שאינו מתכוון לעזור לאנשים לשפר את חייהם. ההבדל הגדול ביותר בין מחקר ביקורתי לשתי הגישות האחרות הוא הממד ההערכה שלו. בעוד שהאובייקטיביות של המסורות הפוזיטיביסטיות והפרשניות היא לחזות או להסביר את המצב הקיים או המציאות החברתית, מחקר ביקורתי נועד להעריך באופן ביקורתי ולשנות את המציאות החברתית הנחקרת.

חוקרים ביקורתיים מתנגדים בדרך כלל לסטטוס קוו על מנת להסיר הבדלים חברתיים ולשפר את התנאים החברתיים. למחקר הביקורתי יש מחויבות להשקפה תהליכית של תופעות העניין, ולכן הוא בדרך כלל אורכי. דוגמאות לשיטות מחקר הן מחקרים היסטוריים ארוכי טווח ומחקרים אתנוגרפיים. עם זאת, חיפוש ביקורתי לא היה בשימוש נרחב במחקר מערכות מידע

3.1.2 מטרת המחקר

יחד עם אופי המחקר, ניתן להשתמש במטרתו להנחות את החוקר בבחירת שיטת מחקר מסוימת. היקף פרויקט מחקר קשור קשר הדוק למיקומו של המחקר ביחס למחזור המחקר המורכב משלושה שלבים: בניית תיאוריה, בחינת תיאוריה וחידוד תיאוריה. לפיכך, בהתבסס על מומנטום ביחס למחזור המחקר, לפרויקט מחקר יכול להיות מטרה מסבירה, תיאורית, חקרנית או מנבאת.

3.1.2.1 מחקר חקרני

מחקר חקר נועד לחקור נושא חדש לחלוטין ולגבש שאלות והשערות למחקר עתידי. סוג זה של מחקר משמש בבניית תיאוריה כדי להשיג הפניות ראשוניות בתחום חדש. בדרך כלל נעשה שימוש בשיטות מחקר איכותניות, כגון תיאורי מקרה או מחקרים פנומנולוגיים.

עם זאת, ניתן גם להשתמש בטכניקות כמותיות כגון סקרים גישושים או ניסויים.

3.1.3.3 מחקר תיאורי

מחקר תיאורי נועד לנתח ולתאר בפירוט רב מצב מסוים או פרקטיקה ארגונית. זה מתאים לבניית תיאוריות וניתן להשתמש בו גם כדי לאשש או לערער על השערות. מחקר תיאורי כולל בדרך כלל שימוש במדידות ובדגימות. שיטות מחקר מתאימות כוללות סקרים וניתוחי רקע.

3.1.2.3 מחקר הסברתי

מחקר הסברה מנסה להסביר מדוע דברים קורים. הוא מתבסס על עובדות שכבר נחקרו ומנסה למצוא את הסיבות של אותן עובדות.
לפיכך מחקר הסבר נבנה בדרך כלל על מחקר חקרני או תיאורי והוא נלווה לבדיקה וחידוד תיאוריות. מחקר הסברה משתמש בדרך כלל במחקרי מקרה או שיטות מחקר מבוססות סקרים.

3.1.2.4 מחקר מונע

מחקר מנע נועד לחזות את האירועים וההתנהגויות הנצפים שנחקרים (Marshall and Rossman 1995). חיזוי הוא המבחן המדעי הסטנדרטי של האמת. סוג זה של מחקר משתמש בדרך כלל בסקרים או בניתוח נתונים נתונים היסטוריונים. (יין 1989)

הדיון לעיל מדגים שישנן מספר שיטות מחקר אפשריות שניתן להשתמש בהן במחקר מסוים. עם זאת, חייבת להיות שיטה ספציפית שמתאימה יותר מהאחרות לסוג מסוים של פרויקט מחקר. (Galliers 1987, Yin 1989, De Vaus 1991). לכן, כל חוקר צריך להעריך היטב את החוזקות והחולשות של שיטות שונות, על מנת לאמץ את שיטת המחקר המתאימה ביותר התואמת את פרויקט המחקר. (Jenkins 1985, Pervan and Klass 1992, Bonomia 1985, Yin 1989, Himilton and Ives 1992).

3.2. שיטות מחקר אפשריות

מטרת פרויקט זה הייתה ללמוד את הניסיון של ארגונים אוסטרליים עם i נתונים מאוחסן עם פיתוח של מחסן נתונים. דאטו שכרגע קיים חוסר במחקר בתחום מחסני הנתונים באוסטרליה, פרויקט המחקר הזה עדיין נמצא בשלב התיאורטי של מחזור המחקר ויש לו מטרה חקרנית. חקר הניסיון בארגונים אוסטרליים המאמצים מחסני נתונים דורש פרשנות של החברה האמיתית. כתוצאה מכך, ההנחה הפילוסופית העומדת בבסיס פרויקט המחקר עוקבת אחר הפרשנות המסורתית.

לאחר בחינה קפדנית של שיטות זמינות, זוהו שתי שיטות מחקר אפשריות: סקרים ומקרי מקרים, שניתן להשתמש בהם למחקר חקרני (Shanks et al. 1993). Galliers (1992) טוען את התאמתן של שתי שיטות אלו למחקר מסוים זה בטקסונומיה המתוקנת שלו באומרו שהן מתאימות לבנייה תיאורטית. שני הסעיפים הבאים דנים בכל שיטה בפירוט.

3.2.1 שיטת מחקר חקירה

שיטת מחקר הסקר מגיעה משיטת המפקד העתיקה. מפקד אוכלוסין עוסק באיסוף מידע מאוכלוסיה שלמה. שיטה זו יקרה ואינה מעשית, במיוחד אם האוכלוסייה גדולה. לפיכך, בהשוואה למפקד אוכלוסין, סקר מתמקד בדרך כלל באיסוף מידע עבור מספר קטן, או מדגם, של נציגי האוכלוסייה (Fowler 1988, Neuman 1994). מדגם משקף את האוכלוסייה ממנה הוא נלקח, בדרגות שונות של דיוק, בהתאם למבנה המדגם, גודלו ושיטת הבחירה בה נעשה שימוש (Fowler 1988, Babbie 1982, Neuman 1994).

שיטת הסקר מוגדרת כ"תצלומי מצב של פרקטיקות, מצבים או השקפות בנקודת זמן מסוימת, שנעשו באמצעות שאלונים או ראיונות, שמהם ניתן להסיק מסקנות
made" (Galliers 1992:153) [צילום תמונת מצב של פרקטיקות, מצבים או השקפות בנקודת זמן מסוימת, שצולמו באמצעות שאלונים או ראיונות, מהם ניתן להסיק מסקנות]. סקרים עוסקים באיסוף מידע על היבטים מסוימים של המחקר ממספר משתתפים על ידי שאילת שאלות (Fowler 1988). שאלונים וראיונות אלה, הכוללים ראיונות טלפוניים פנים אל פנים וראיונות מובנים, הם גם טכניקות איסוף נתונים בשימוש בסקרים (Blalock 1970, Nachmias and Nachmias 1976, Fowler 1988), ניתן להשתמש בתצפיות וניתוחים (Gable 1994). מכל השיטות הללו של איסוף אלים נתונים, השימוש בשאלון הוא הטכניקה הפופולרית ביותר, שכן היא מבטיחה כי אני נתונים

שנאספו מובנים ומעוצבים, ובכך מקלים על סיווג המידע (Hwang 1987, de Vaus 1991).

בניתוח ה נתונים, אסטרטגיית סקר משתמשת לעתים קרובות בטכניקות כמותיות, כגון ניתוח סטטיסטי, אך ניתן להשתמש גם בטכניקות איכותיות (Galliers 1992, Pervan

וקלאס 1992, גייבל 1994). בדרך כלל, אני נתונים שנאספו משמשים לניתוח התפלגות ודפוסים של אסוציאציות (Fowler 1988).

למרות שבדרך כלל סקרים מתאימים לחיפושים העוסקים בשאלה 'מה?' (מה) או נובעים ממנו, כגון 'קוונטו' (כמה) ו-'quant'è' (כמה), ניתן לשאול אותם באמצעות השאלה 'למה' (Sonquist and Dunkelberg 1977, Yin 1989). לפי Sonquist and Dunkelberg (1977), חקר המחקר מכוון להשערות קשות, תוכניות הערכה, תיאור האוכלוסייה ופיתוח מודלים של התנהגות אנושית. יתר על כן, ניתן להשתמש בסקרים כדי לחקור את דעתה, התנאים, האמונות, המאפיינים, הציפיות של אוכלוסייה מסוימת ואף התנהגויות בעבר או בהווה (Neuman 1994).

סקרים מאפשרים לחוקר לגלות קשרי אוכלוסיה והתוצאות בדרך כלל כלליות יותר משיטות אחרות (Sonquist and Dunkelberg 1977, Gable 1994). סקרים מאפשרים לחוקרים לכסות אזור גיאוגרפי רחב יותר ולהגיע למספר רב של נשאלים (Blalock 1970, Sonquist and Dunkelberg 1977, Hwang and Lin 1987, Gable 1994, Neuman 1994). לבסוף, סקרים יכולים לספק מידע שאינו זמין במקומות אחרים או בצורה הנדרשת לניתוחים (Fowler 1988).

עם זאת, יש כמה מגבלות לעריכת סקר. החיסרון הוא שהחוקר אינו יכול להשיג מידע רב על האובייקט הנחקר. זאת בשל העובדה שהסקרים מבוצעים רק בזמן מסוים ולכן, יש מספר מוגבל של משתנים ואנשים שהחוקר יכול

מחקר (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). חיסרון נוסף הוא שביצוע סקר עשוי להיות יקר מאוד מבחינת זמן ומשאבים, במיוחד אם הוא כולל ראיונות פנים אל פנים (Fowler 1988).

3.2.2. שיטת מחקר חקירה

שיטת חקר החקירה כוללת מחקר מעמיק של מצב מסוים בתוך ההקשר הממשי שלו על פני פרק זמן מוגדר, ללא כל התערבות מצד החוקר (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). בעיקר משתמשים בשיטה זו לתיאור הקשרים בין המשתנים הנלמדים במצב מסוים (Galliers 1992). החקירות יכולות לכלול מקרים בודדים או מרובים, בהתאם לתופעה המנותחת (Franz and Robey 1987, Eisenhardt 1989, Yin 1989).

שיטת חקר החקירה מוגדרת כ"חקירה אמפירית החוקרת תופעה עכשווית בהקשרה הממשי, תוך שימוש במספר מקורות שנאספו מישות אחת או יותר כגון אנשים, קבוצות או ארגונים" (Yin 1989). אין הפרדה ברורה בין התופעה להקשר שלה ואין בקרה או מניפולציה נסיונית של המשתנים (Yin 1989, Benbasat et al. 1987).

יש מגוון טכניקות לאיסוף נתונים שניתן להשתמש בשיטת החקירה, הכוללת תצפיות ישירות, סקירות רשומות ארכיוניות, שאלונים, סקירת תיעוד וראיונות מובנים. בעל מגוון מגוון של טכניקות קציר נתונים, סקרים מאפשרים לחוקרים להתמודד עם שניהם נתונים איכותי וכמותי בו זמנית (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). כפי שקורה בשיטת הסקר, חוקר סקר משמש כצופה או חוקר ולא כמשתתף פעיל בארגון הנחקר.

Benbasat וחב' (1987) טוענים כי שיטת החקירה מתאימה במיוחד לבניית תורת המחקר, שמתחילה בשאלת מחקר וממשיכה בהדרכה.

של תיאוריה במהלך תהליך האיסוף נתונים. מתאים גם לבמה

של בניית התיאוריה, Franz and Robey (1987) מציעים שניתן להשתמש בשיטת החקירה גם לשלב התיאוריה המורכבת. במקרה זה, בהתבסס על העדויות שנאספו, תיאוריה או השערה נתונה מאומתת או מופרכת. בנוסף, החקירה מתאימה גם למחקר העוסק בשאלות 'איך' או 'למה' (Yin 1989).

בהשוואה לשיטות אחרות, סקרים מאפשרים לחוקר ללכוד מידע חיוני ביתר פירוט (Galliers 1992, Shanks et al. 1993). יתר על כן, חקירות מאפשרות לחוקר להבין את טיבם ומורכבותם של התהליכים הנלמדים (Benbasat et al. 1987).

ישנם ארבעה חסרונות עיקריים הקשורים לשיטת החקירה. הראשון הוא היעדר ניכויים מבוקרים. הסובייקטיביות של החוקר יכולה לשנות את התוצאות והמסקנות של המחקר (Yin 1989). החיסרון השני הוא היעדר התבוננות מבוקרת. בניגוד לשיטות ניסוי, חוקר החקירה אינו יכול לשלוט בתופעות שנחקרו מאחר שהן נבדקות בהקשר הטבעי שלהן (Gable 1994). החיסרון השלישי הוא חוסר העתקות. זאת בשל העובדה שהחוקר לא צפוי לצפות באותם אירועים, ואינו יכול לאמת את התוצאות של מחקר מסוים (Lee 1989). לבסוף, כתוצאה מאי-השכפול, קשה להכליל את התוצאות שהתקבלו מסקר אחד או יותר (Galliers 1992, Shanks et al. 1993). עם זאת, כל הבעיות הללו אינן בלתי פתירות ולמעשה ניתן למזער אותן על ידי החוקר על ידי הפעלת פעולות מתאימות (Lee 1989).

3.3. נימק את מתודולוגיית המחקר מְאוּמָץ

משתי שיטות המחקר האפשריות למחקר זה, שיטת הסקר נחשבת למתאימה ביותר. החקירה נדחתה בעקבות בדיקה מדוקדקת של הקשורים

יתרונות וחולשות. הנוחות או חוסר ההתאמה של כל שיטה למחקר זה נדון להלן.

3.3.1. שיטת מחקר בלתי הולמת של חקירה

שיטת החקירה מחייבת מחקר מעמיק של מצב מסוים בתוך ארגון אחד או יותר לאורך תקופה (Eisenhardt 1989). במקרה זה, התקופה עשויה לחרוג ממסגרת הזמן שניתנה למחקר זה. סיבה נוספת לא לאמץ את שיטת החקירה היא שהתוצאות עלולות לסבול מחוסר קפדנות (Yin 1989). הסובייקטיביות של החוקר יכולה להשפיע על התוצאות והמסקנות. סיבה נוספת היא ששיטה זו מתאימה יותר לשאלות מחקר מסוג 'איך' או 'למה' (Yin 1989), בעוד שאלת המחקר למחקר זה היא מסוג 'מה'. אחרון חביב, קשה להכליל ממצאים מסקר אחד או כמה סקרים בלבד (Galliers 1992, Shanks et al. 1993). בהתבסס על רציונל זה, שיטת המחקר של הסקר לא נבחרה מכיוון שהיא לא מתאימה למחקר זה.

3.3.2. נוחות שיטת המחקר חֲקִירָה

כאשר מחקר זה נערך, הפרקטיקה של אחסון נתונים לא אומצה באופן נרחב על ידי ארגונים אוסטרליים. לפיכך, לא היה מידע רב בנוגע ליישום שלהם בתוך ארגונים אוסטרליים. המידע הזמין הגיע מארגונים שהטמיעו או השתמשו ב-a מחסן נתונים. במקרה זה, שיטת מחקר הסקר היא המתאימה ביותר שכן היא מאפשרת קבלת מידע שאינו זמין במקום אחר או בצורה הנדרשת לניתוח (Fowler 1988). בנוסף, שיטת מחקר החקירה מאפשרת לחוקר לקבל תובנה טובה לגבי פרקטיקות, מצבים או השקפות בזמן נתון (Galliers 1992, Denscombe 1998). התבקשה סקירה כללית כדי להעלות את המודעות לחוויית מחסני הנתונים האוסטרלית.

יתר על כן, Sonquist and Dunkelberg (1977) קובעים כי תוצאות מחקר הסקר כלליות יותר משיטות אחרות.

3.4. תכנון מחקר סקר

סקר שיטות מחסני הנתונים נערך בשנת 1999. אוכלוסיית היעד הייתה מורכבת מארגונים אוסטרליים המעוניינים במחקרי מחסני נתונים, מכיוון שהם כנראה כבר היו מודעים ל- נתונים שהם מאחסנים ולכן יכולים לספק מידע שימושי למחקר זה. אוכלוסיית היעד זוהתה עם סקר ראשוני של כל החברים האוסטרלים ב-'The Data Warehousing Institute' (Tdwi-aap). חלק זה דן בעיצוב שלב המחקר האמפירי של מחקר זה.

3.4.1. טכניקת איסוף של נתונים

משלוש הטכניקות הנפוצות במחקר סקר (כלומר שאלון בדואר, ראיון טלפוני וראיון אישי) (Nachmias 1976, Fowler 1988, de Vaus 1991), שאלון הדואר אומץ למחקר זה. הסיבה הראשונה לאימוץ האחרון היא שהוא יכול להגיע לאוכלוסייה מפוזרת גיאוגרפית (Blalock 1970, Nachmias and Nachmias 1976, Hwang and Lin 1987, de Vaus 1991, Gable 1994). שנית, שאלון הדואר מתאים למשתתפים בעלי השכלה גבוהה (Fowler 1988). השאלון בדואר למחקר זה הופנה לנותני החסות, המנהלים ו/או מנהלי הפרויקטים של מחסני נתונים. שלישית, שאלוני דואר מתאימים כאשר יש רשימה מאובטחת של כתובות (Salant and Dilman 1994). TDWI, במקרה זה, איגוד אמין למחסני נתונים סיפק את רשימת התפוצה של חבריה האוסטרלים. יתרון נוסף של שאלון הדואר על פני שאלונים טלפוניים או ראיונות אישיים הוא שהוא מאפשר למשיבים להגיב בצורה מדויקת יותר, במיוחד כאשר המשיבים צריכים לעיין ברשומות או לדון בשאלות עם אנשים אחרים (Fowler 1988).

חיסרון פוטנציאלי עשוי להיות הזמן הנדרש לביצוע שאלונים בדואר. בדרך כלל, שאלון דואר מתנהל ברצף זה: דואר מכתבים, המתן לתגובות ושליחת אישור (Fowler 1988, Bainbridge 1989). לפיכך, הזמן הכולל עשוי להיות ארוך יותר מהזמן הנדרש לראיונות פנים אל פנים או לראיונות טלפוניים. עם זאת, ניתן לדעת מראש את הזמן הכולל (Fowler 1988, Denscombe 1998). לא ניתן לדעת מראש את הזמן המושקע בביצוע הראיונות האישיים שכן הוא משתנה מראיון לראיון (Fowler 1988). ראיונות טלפוניים יכולים להיות מהירים יותר מאשר שאלונים בדואר וראיונות אישיים, אך יכולים להיות להם שיעור גבוה ללא מענה בגלל חוסר זמינות של אנשים מסוימים (Fowler 1988). בנוסף, ראיונות טלפוניים מוגבלים בדרך כלל לרשימות קצרות יחסית של שאלות (Bainbridge 1989).

חולשה נוספת של שאלון שנשלח בדואר היא שיעור אי היענות גבוה (Fowler 1988, Bainbridge 1989, Neuman 1994). עם זאת, צעדי נגד ננקטו על ידי שיוך מחקר זה למוסד למחסני נתונים מהימן (כלומר TDWI) (Bainbridge 1989, Neuman 1994), המוציא שני מכתבי תזכורת למי שאינם מגיבים (Fowler 1988, Neuman 1994) וכולל גם מכתב נוסף המסביר מטרת המחקר (Neuman 1994).

3.4.2. יחידת ניתוח

מטרת מחקר זה היא לקבל מידע על יישום מחסני מידע והשימוש בו בתוך ארגונים אוסטרליים. אוכלוסיית היעד היא כל הארגונים האוסטרליים שיישמו, או מיישמים, כלומר מחסן נתונים. לאחר מכן נרשמים הארגונים הפרטיים. השאלון נשלח בדואר לארגונים המעוניינים לאמץ מחסן נתונים. שיטה זו מבטיחה שהמידע שנאסף מגיע מהמשאבים המתאימים ביותר של כל ארגון משתתף.

3.4.3. מדגם הסקר

רשימת התפוצה של משתתפי הסקר התקבלה מ-TDWI. מתוך רשימה זו, 3000 ארגונים אוסטרליים נבחרו כבסיס לדגימה. למדגם נשלחו מכתב המשך המסביר את הפרויקט ומטרת הסקר בצירוף טופס תגובה ומעטפה בתשלום מראש להחזרת השאלון המלא. מתוך 3000 ארגונים, 198 הסכימו להשתתף במחקר. היה צפוי מספר כה קטן של תגובות נתתי המספר הגדול של ארגונים אוסטרליים שאימצו אז או אימצו את אסטרטגיית מחסני הנתונים בתוך הארגונים שלהם. לפיכך, אוכלוסיית היעד למחקר זה מורכבת מ-198 ארגונים בלבד.

3.4.4. תוכן השאלון

עיצוב השאלון התבסס על מודל אחסון הנתונים של מונש (שנדונו קודם לכן בחלק 2.3). תוכן השאלון התבסס על סקירת הספרות שהוצגה בפרק 2. עותק של השאלון שנשלח למשתתפי הסקר ניתן למצוא בנספח ב'. השאלון מורכב משישה חלקים, העוקבים אחר שלבי המודל המכוסה. שש הפסקאות הבאות מסכמות בקצרה את התוכן של כל חלק.

חלק א ': מידע בסיסי על הארגון
חלק זה מכיל שאלות הנוגעות לפרופיל הארגונים המשתתפים. בנוסף, חלק מהשאלות נוגעות למצב של פרויקט מחסני הנתונים של המשתתף. מידע סודי כמו שם הארגון לא נחשף בניתוח הסקר.

סעיף ב ': התחל
השאלות בסעיף זה קשורות לתחילת העבודה עם אחסון נתונים. נשאלו שאלות לגבי יוזמי הפרויקט, נותני החסות, הכישורים והידע הנדרשים, יעדי פיתוח מחסני הנתונים והציפיות של משתמשי הקצה.

פרק ג ': עיצוב
חלק זה מכיל שאלות הקשורות לפעילויות התכנון של ה מחסן נתונים. בפרט, השאלות היו לגבי היקף הביצוע, משך הפרויקט, עלות הפרויקט וניתוח עלות/תועלת.

פרק ד ': פיתוח
בסעיף הפיתוח ישנן שאלות הקשורות לפעילויות הפיתוח של ה מחסן נתונים: אוסף של דרישות משתמש קצה, מקורות של נתונים, המודל ההגיוני של נתונים, אבות טיפוס, תכנון קיבולת, ארכיטקטורות טכניות ובחירת כלי פיתוח למחסני נתונים.

קטע ה ': מבצע
שאלות תפעוליות הקשורות לתפעול ולהרחבה של ה מחסן נתונים, כפי שהוא מתפתח בשלב הבא של הפיתוח. שם איכות מידע, אסטרטגיות הרענון של ה נתונים, גרעיניותו של נתונים, מדרגיות של מחסן נתונים ובעיות אבטחה מחסן נתונים היו בין סוגי השאלות שנשאלו.

סעיף ו ': פיתוח
חלק זה מכיל שאלות הקשורות לשימוש ב- מחסן נתונים על ידי משתמשי קצה. החוקר התעניין במטרה ובתועלת של מחסן נתונים, אסטרטגיות הסקירה וההדרכה שננקטו ואסטרטגיית הבקרה של ה מחסן נתונים מְאוּמָץ.

3.4.5. שיעור תגובה

למרות שסקרי דואר זוכים לביקורת על שיעור היענות נמוך, ננקטו צעדים להגדלת שיעור ההחזר (כפי שנדון לעיל בסעיף 3.4.1). המונח 'שיעור תגובה' מתייחס לאחוז האנשים במדגם סקר מסוים אשר משיבים לשאלון (Denscombe 1998). הנוסחה הבאה שימשה לחישוב שיעור התגובה למחקר זה:

מספר האנשים שהגיבו
שיעור תגובה = —————————————————————————– X 100 סך השאלונים שנשלחו

3.4.6. מבחן טייס

לפני שליחת השאלון למדגם, השאלות נבדקו על ידי ביצוע ניסויי פיילוט, כפי שהוצעו על ידי Luck and Rubin (1987), Jackson (1988) ודה Vaus (1991). מטרת ניסויי הפיילוט היא לחשוף כל ביטוי מביך, מעורפל ושאלות קשות לפירוש, להבהיר את כל ההגדרות והמונחים בהם נעשה שימוש, ולזהות את הזמן המשוער הנדרש למילוי השאלון (Warwick and Lininger 1975, Jackson 1988, Salant ודילמן 1994). ניסויי הפיילוט בוצעו על ידי בחירת נבדקים בעלי מאפיינים דומים לאלו של הנבדקים הסופיים, כפי שהציע דייוויס ה. קוסנזה (1993). במחקר זה, נבחרו שישה אנשי מקצוע בתחום מחסני הנתונים כנבדקי הפיילוט. לאחר כל מבחן טייס בוצעו התיקונים הנדרשים. מבדיקות הפיילוט שבוצעו, המשתתפים תרמו לעיצוב מחדש ואיפוס הגרסה הסופית של השאלון.

3.4.7. שיטות ניתוח Di לתת לי

I נתונים נתוני הסקר שנאספו מהשאלונים הסגורים נותחו באמצעות חבילת תוכנה סטטיסטית בשם SPSS. רבות מהתשובות נותחו באמצעות סטטיסטיקה תיאורית. מספר שאלונים חזרו לא מלאים. אלה טופלו בזהירות רבה יותר כדי לוודא שאני נתונים החסרים לא היו תוצאה של שגיאות בהזנת נתונים, אלא בגלל שהשאלות לא התאימו לנרשם, או שהנרשם החליט שלא לענות על שאלה ספציפית אחת או יותר. התעלמו מהתשובות החסרות הללו בעת ניתוח הנתונים נתונים וקודדו כ-'-9' כדי להבטיח הדרתם מתהליך הניתוח.

בהכנת השאלון, השאלות הסגורות קוידו מראש על ידי הקצאת מספר לכל אפשרות. המספר שימש אז לאימון i נתונים במהלך הניתוח (Denscombe 1998, Sapsford and Jupp 1996). לדוגמה, היו שש אפשרויות המפורטות בשאלה 1 של סעיף ב': דירקטוריון, מנהל בכיר, מחלקת IT, יחידה עסקית, יועצים ואחרים. בקובץ של נתונים של SPSS, נוצר משתנה עבור 'יזם פרויקט', עם שש תוויות ערכים: '1' עבור 'לוח', '2' עבור 'מנהל בכיר', וכן הלאה Street. השימוש בסולם ליקרטין בחלק מהשאלות הסגורות אפשר גם זיהוי ללא מאמץ על ידי שימוש בערכים המספריים המתאימים שהוכנסו ל-SPSS. לשאלות עם תשובות לא ממצות, שלא היו סותרות זו את זו, כל אפשרות טופלה כמשתנה יחיד עם שתי תוויות ערך: '1' עבור 'בדוק' ו-'2 ' עבור 'לא מסומן'.

שאלות פתוחות טופלו בצורה שונה משאלות סגורות. התשובות לשאלות אלו לא הוכנסו ל-SPSS. במקום זאת, הם נותחו ביד. השימוש בשאלות מסוג זה מאפשר לרכוש מידע על רעיונות והתנסויות אישיות המובעים באופן חופשי אצל הנשאלים (Bainbridge 1989, Denscombe 1998). במידת האפשר, נעשה סיווג של תגובות.

לניתוח של נתוניםנעשה שימוש בשיטות של ניתוח סטטיסטי פשוט, כגון תדירות התגובות, הממוצע, סטיית התקן והחציון (Argyrous 1996, Denscombe 1998).
מבחן ה-Gamma בוצע להשגת מדדים כמותיים של הקשרים ביניהם נתונים ordinals (Norusis 1983, Argyrous 1996). מבחנים אלו היו מתאימים מכיוון שלסולמות הסידורים שבהם נעשה שימוש לא היו הרבה קטגוריות וניתן היה להציג אותם בטבלה (Norusis 1983).

3.5 סיכום

בפרק זה נדונו מתודולוגיית המחקר והעיצוב שאומץ למחקר זה.

בחירת שיטת המחקר המתאימה ביותר למחקר מסוים לוקחת
התחשבות במספר כללים, כולל אופי וסוג המחקר, כמו גם היתרונות והחולשות של כל שיטה אפשרית (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987, yin 1989, Hamilton and ives 1992, Galliers 1992, נוימן 1994). בהתחשב בחוסר הידע והתיאוריה הקיימים לגבי אימוץ מחסני נתונים באוסטרליה, מחקר זה קורא לשיטת מחקר פרשנית עם יכולת חקרנית לחקור את החוויות של ארגונים אוסטרליים. שיטת המחקר שנבחרה נבחרה לאיסוף מידע בנוגע לאימוץ תפיסת מחסני הנתונים על ידי ארגונים אוסטרליים. כטכניקת האיסוף נבחר שאלון דואר נתונים. ההצדקות לשיטת המחקר וטכניקת האיסוף נתונים בחירות יסופקו בפרק זה. כמו כן, הוצג דיון על יחידת הניתוח, המדגם בו נעשה שימוש, אחוזי התשובות, תוכן השאלון, מבחן הקדם של השאלון ושיטת הניתוח של השאלון. נתונים.

תכנון א מחסן נתונים:

שילוב של יחסי ישות ומידול ממדי

תקציר
חנות i נתונים הוא נושא עכשווי מרכזי עבור ארגונים רבים. בעיה מרכזית בפיתוח מחסנים נתונים זה העיצוב שלו.
הציור חייב לתמוך בזיהוי מושגים ב מחסן נתונים למערכת מדור קודם ומקורות אחרים של נתונים וגם הבנה קלה ויעילות ביישום של מחסן נתונים.
הרבה מספרות האחסון נתונים ממליצה להשתמש במודלים של קשרי ישות או במודלים ממדיים כדי לייצג את העיצוב של מחסן נתונים.
במאמר זה אנו מראים כיצד ניתן לשלב את שני הייצוגים בגישה לעיצוב של מחסן נתונים. הגישה הנהוגה היא באופן שיטתי

נבחן במחקר מקרה ומזוהה במספר השלכות חשובות עם אנשי מקצוע.

אחסון נתונים

Un מחסן נתונים הוא מוגדר בדרך כלל כ"אוסף נתונים מכוון נושא, משולב, משתנה בזמן ולא נדיף של נתונים לתמיכה בהחלטות ההנהלה" (Inmon and Hackathorn, 1994). מונחה נושא ומשולב מצביע על כך שה מחסן נתונים נועד לחצות את הגבולות הפונקציונליים של מערכות מדור קודם כדי להציע פרספקטיבה משולבת של נתונים.
גרסת זמן משפיעה על האופי ההיסטורי או סדרת הזמן של נתונים בתוך מחסן נתונים, המאפשר ניתוח מגמות. לא נדיף מציין כי מחסן נתונים זה לא מתעדכן ברציפות כמו א מסד נתונים של OLTP. במקום זאת הוא מתעדכן מעת לעת, עם נתונים ממקורות פנימיים וחיצוניים. ה מחסן נתונים הוא תוכנן במיוחד למחקר ולא לעדכון שלמות וביצועי פעולה.
הרעיון לאחסן את i נתונים אינו חדש, זו הייתה אחת ממטרות הניהול נתונים מאז שנות השישים (איל מרטין, 1982).
I מחסן נתונים הם מציעים את התשתית נתונים למערכות תומכות ניהול. מערכות תומכות ניהול כוללות מערכות תומכות החלטות (DSS) ומערכות מידע מנהלים (EIS). DSS היא מערכת מידע מבוססת מחשב שנועדה לשפר את תהליך קבלת ההחלטות, ובעקבות כך אנושי. EIS הוא בדרך כלל מערכת מסירה נתונים המאפשרת למנהלי עסקים לגשת בקלות לתצוגה של נתונים.
הארכיטקטורה הכללית של א מחסן נתונים מדגיש את התפקיד של מחסן נתונים בתמיכה בניהול. בנוסף להצעת התשתית נתונים עבור EIS ו-DSS, al מחסן נתונים ניתן לגשת אליו ישירות דרך שאילתות. ה נתונים נכלל ב א מחסן נתונים מבוססים על ניתוח של דרישות מידע ניהולי ומתקבלים משלושה מקורות: מערכות פנימיות מדור קודם, מערכות ללכידת נתונים למטרות מיוחדות ומקורות נתונים חיצוניים. ה נתונים במערכות פנימיות מדור קודם הם לעתים קרובות מיותרים, לא עקביים, באיכות נמוכה, ומאוחסנים בפורמטים שונים ולכן יש ליישב אותם ולנקות אותם לפני שניתן יהיה לטעון אותם לתוך

מחסן נתונים (אינמון, 1992; מקפאדן, 1996). ה נתונים ממערכות אחסון נתונים אד הוק וממקורות נתונים חיצוני מבלים משמשים להגדלה (עדכון, החלפה) i נתונים ממערכות מדור קודם.

ישנן סיבות משכנעות רבות לפתח א מחסן נתונים, הכוללים קבלת החלטות משופרת באמצעות שימוש יעיל במידע נוסף (Ives 1995), תמיכה בהתמקדות בעניינים שלמים (Graham 1996) והפחתה בעלויות קבלת החלטות נתונים עבור EIS ו-DSS (Graham 1996, McFadden 1996).

מחקר אמפירי שנערך לאחרונה מצא, בממוצע, החזר על השקעה עבור i מחסן נתונים ב-401% לאחר שלוש שנים (Graham, 1996). עם זאת, מחקרים אמפיריים אחרים של מחסן נתונים נמצאו בעיות משמעותיות כולל קושי במדידה והקצאת הטבות, חוסר מטרה ברורה, חוסר הערכת היקף ומורכבות תהליך האחסון נתונים, במיוחד לגבי המקורות וניקיון ה נתונים. חנות i נתונים יכול להיחשב כפתרון לבעיית הניהול נתונים בין ארגונים. המניפולציה של נתונים כמשאב חברתי היא נותרה אחת מהבעיות המרכזיות בניהול מערכות מידע ברחבי העולם במשך שנים רבות (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

גישה פופולרית לניהול נתונים בשנות השמונים היה פיתוח של מודל נתונים חֶברָתִי. דֶגֶם נתונים social תוכנן להציע בסיס יציב לפיתוח מערכות יישומים חדשות ו מסד נתונים ושחזור ואינטגרציה של מערכות מדור קודם (Brancheau et al.

1989, Goodhue et al. 1988:1992, קים ואוורסט 1994). עם זאת, ישנן מספר בעיות בגישה זו, בפרט, המורכבות והעלות של כל משימה, והזמן הארוך הנדרש להשגת תוצאות מוחשיות (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997 ).

Il מחסן נתונים זהו מסד נתונים נפרד שמתקיים במקביל עם מסדי הנתונים הישנים במקום להחליף אותם. לכן זה מאפשר לך לכוון את הניהול של נתונים ולהימנע מבנייה מחדש יקרה של מערכות מדור קודם.

גישות קיימות לתאריך הציור

חדר כושר

תהליך הבנייה והשכלול של א מחסן נתונים צריך להבין יותר כתהליך אבולוציוני ולא כמחזור חיים מסורתי של פיתוח מערכות (דסיו, 1995, Shanks, O'Donnell and Arnott 1997a). ישנם תהליכים רבים המעורבים בפרויקט מחסן נתונים כגון אתחול, תזמון; מידע שנרכש מהדרישות שנתבקשו ממנהלי החברה; מקורות, טרנספורמציות, ניקוי של נתונים ולסנכרן ממערכות מדור קודם וממקורות אחרים נתונים; מערכות אספקה בפיתוח; ניטור של מחסן נתונים; וחוסר טעם של התהליך האבולוציוני ושל בניית א מחסן נתונים (Stinchi, O'Donnell and Arnott 1997b). ביומן זה, אנו מתמקדים כיצד לצייר i נתונים מאוחסן בהקשר של תהליכים אחרים אלה. ישנן מספר גישות מוצעות לארכיטקטורת וידאו מחסן נתונים בספרות (Inmon 1994, Ives 1995, Kimball 1994, McFadden 1996). לכל אחת מהמתודולוגיות הללו יש סקירה קצרה עם ניתוח של נקודות החוזק והחולשה שלהן.

גישת אינמון (1994) עבור מחסן נתונים עיצוב

Inmon (1994) הציע ארבעה שלבים איטרטיביים לעיצוב א מחסן נתונים (ראה איור 2). השלב הראשון הוא עיצוב תבנית נתונים חברתי כדי להבין איך אני נתונים ניתן לשלב בין תחומים פונקציונליים בתוך ארגון על ידי חלוקת משנה i נתונים חנות באזורים. דֶגֶם נתונים זה מיועד לאחסון נתונים המתייחס לקבלת החלטות, כולל נתונים היסטורי, וכלול נתונים נוכה ומצטבר. השלב השני הוא זיהוי תחומי נושא ליישום. אלה מבוססים על סדרי עדיפויות שנקבעו על ידי ארגון מסוים. השלב השלישי כולל ציור א מסד נתונים עבור תחום הנושא, שימו לב במיוחד לכלול רמות מתאימות של פירוט. אינמון ממליצה להשתמש במודל הישות והיחסים. השלב הרביעי הוא זיהוי מערכות מקור נתונים נדרש ולפתח תהליכי טרנספורמציה ללכידה, ניקוי ועיצוב i נתונים.

נקודות החוזק של גישתו של אינמון הן שהמודל נתונים חברתית מציעה את הבסיס לשילוב של נתונים בתוך הארגון ותכנון תומכים לפיתוח איטרטיבי של מחסן נתונים. החסרונות שלו הם הקושי והעלות של עיצוב הדגם נתונים חברתי, הקושי בהבנת מודלים של ישויות ויחסים המשמשים בשני המודלים, כי נתונים חברתית ושל נתונים מאוחסן לפי אזור הנושא, והמתאימות של נתונים של הציור של מחסן נתונים למימוש מסד נתונים יחסיים אבל לא בשביל מסד נתונים רַב מֵמָדִים.

הגישה של Ives (1995) ל מחסן נתונים עיצוב

Ives (1995) מציע גישה בת ארבעה שלבים לתכנון מערכת מידע שלדעתו ישימה לעיצוב של מחסן נתונים (ראה איור 3). הגישה מבוססת מאוד על הנדסת מידע לפיתוח מערכות מידע (Martin 1990). הצעד הראשון הוא לקבוע את היעדים שלך, ההצלחה והגורמים הקריטיים, ומדדי ביצועים מרכזיים. תהליכים עסקיים מרכזיים והמידע הדרוש מעוצבים כדי להוביל אותנו למודל נתונים חֶברָתִי. השלב השני כולל פיתוח ארכיטקטורה מגדירה נתונים מאוחסן לפי אזורים, מסד נתונים di מחסן נתונים, רכיבי הטכנולוגיה הנדרשים, מערך התמיכה הארגונית הנדרשת ליישום ולפעול איתם מחסן נתונים. השלב השלישי כולל את בחירת חבילות התוכנה והכלים הנדרשים. השלב הרביעי הוא התכנון והבנייה המפורטים של מחסן נתונים. Ives מציין את זה כדי לאחסן נתונים זהו תהליך איטרטיבי מוגבל.

החוזקות של גישת Ives הן השימוש במפרטים טכניים לקביעת דרישות מידע, שימוש בתהליך מובנה לתמיכה באינטגרציה של מחסן נתונים, בחירת החומרה והתוכנה המתאימה, והשימוש בטכניקות ייצוג מרובות עבור מחסן נתונים. הפגמים שלו טבועים במורכבות. אחרים כוללים קושי בפיתוח רמות רבות של מסד נתונים all'interno del מחסן נתונים בזמן ובעלות סבירים.

הגישה של Kimball (1994) ל מחסן נתונים עיצוב

Kimball (1994) הציע חמישה שלבים איטרטיביים לתכנון א מחסן נתונים (ראה איורים 4). גישתו מוקדשת במיוחד לציור סולו מחסן נתונים ועל השימוש במודלים ממדיים על פני מודלים של ישות ויחסים. קימבל מנתח את המודלים הממדיים הללו מכיוון שלמנהיגים עסקיים קל יותר להבין עסקים, הוא יעיל יותר כאשר מתמודדים עם התייעצויות מורכבות ועיצוב של מסד נתונים פיזי יעיל יותר (Kimball 1994). קימבל מכיר בכך שפיתוח א מחסן נתונים הוא איטרטיבי, וזה מחסן נתונים ניתן לשלב מופרדים באמצעות חלוקה לטבלאות של מידות נפוצות.

הצעד הראשון הוא לזהות את תחום הנושא המסוים שיש לשכלל. הצעד השני והשלישי כוללים עיצוב ממדי. בשלב השני המדדים מזהים דברים מעניינים בתחום הנושא ומקבצים אותם לטבלת עובדות. לדוגמה, בתחום נושא המכירות מדדי הריבית עשויים לכלול את כמות הפריטים שנמכרו ואת הדולר כמטבע מכירה. השלב השלישי כולל זיהוי מימדים שהם הדרכים שבהן ניתן לקבץ עובדות. בתחום מכירות, מאפיינים רלוונטיים עשויים לכלול פריט, מיקום ותקופת זמן. לטבלת העובדות יש מפתח מרובה חלקים כדי לקשר אותה לכל אחת מטבלאות הממדים ובדרך כלל מכילה מספר רב מאוד של עובדות. לעומת זאת, טבלאות ממדים מכילות מידע תיאורי על ממדים ותכונות אחרות שניתן להשתמש בהן כדי לקבץ עובדות. טבלת העובדות והממדים המשויכות המוצעת יוצרת מה שנקרא סכימת כוכבים בשל צורתה. השלב הרביעי כולל בניית א מסד נתונים רב ממדי כדי לשכלל את תבנית הכוכב. השלב האחרון הוא זיהוי מערכות מקור נתונים נדרש ולפתח תהליכי טרנספורמציה ללכידה, ניקוי ועיצוב i נתונים.

יתרונות הגישה של קימבל כוללים שימוש במודלים ממדיים לייצוג i נתונים מאוחסן מה שמקל על ההבנה ומוביל לעיצוב פיזי יעיל. מודל ממדי שגם משתמש בקלות בשתי המערכות מסד נתונים ניתן לשכלל מערכות יחסיות או מערכות מסד נתונים רַב מֵמָדִים. הפגמים שלו כוללים היעדר כמה טכניקות להקל על התכנון או השילוב של תוכניות כוכבים רבות בתוך מחסן נתונים והקושי לתכנן מהמבנה הדה-נורמל הקיצוני במודל ממדי א נתונים במערכת מורשת.

הגישה לנתונים של מקפדן (1996) עיצוב מחסנים

McFadden (1996) מציע גישה בת חמישה שלבים לציור א מחסן נתונים (ראה איור 5).
גישתו מבוססת על סינתזה של רעיונות מהספרות ומתמקדת בעיצוב של סינגל מחסן נתונים. השלב הראשון כולל ניתוח דרישות. בעוד שמפרטים טכניים אינם קבועים, ההערות של מקפאדן מזהות ישויות נתונים מפרטים ותכונותיהם, ומפנה את הקוראים Watson ו-Frolick (1993) להבנת הדרישות.
בשלב השני, יחסי ישות מודל עבור מחסן נתונים ולאחר מכן מאומת על ידי בכירי החברה. השלב השלישי כולל קביעת המיפוי ממערכות מדור קודם וממקורות חיצוניים של מחסן נתונים. השלב הרביעי כולל תהליכים בפיתוח, פריסה וסנכרון נתונים Nel מחסן נתונים. בשלב האחרון פותחת אספקת המערכת בדגש על ממשק משתמש. מקפאדן מציין שתהליך הציור הוא בדרך כלל איטרטיבי.

החוזקות של הגישה של מקפאדן הן מעורבותם של מנהיגים עסקיים בקביעת הדרישות וכן חשיבות המשאבים נתוניםהניקוי והאיסוף שלהם. החסרונות שלו הם היעדר תהליך לחלוקת פרויקט גדול מחסן נתונים בשלבים משולבים רבים, וה

קושי בהבנת הישויות ומודלים של מערכות יחסים המשמשות בתכנון מחסן נתונים.

לא רק הקרובים אלינו הם שבוחרים בנו.

0/5 (0 ביקורות)

קבל מידע נוסף מסוכנות האינטרנט המקוונת

הירשם כדי לקבל את המאמרים האחרונים בדוא"ל.

מנהל מנכ"ל

👍סוכנות אינטרנט מקוונת | מומחה לסוכנות רשת בשיווק דיגיטלי וקידום אתרים. Web Agency Online היא סוכנות אינטרנט. For Agenzia Web Online הצלחה בטרנספורמציה דיגיטלית מבוססת על היסודות של Iron SEO גרסה 3. התמחויות: אינטגרציה של מערכת, שילוב יישומים ארגוניים, ארכיטקטורה מוכוונת שירות, מחשוב ענן, מחסן נתונים, בינה עסקית, Big Data, פורטלים, אינטראנטים, אפליקציות אינטרנט עיצוב וניהול מאגרי מידע יחסי ורב מימדיים עיצוב ממשקים למדיה דיגיטלית: שימושיות וגרפיקה. סוכנות אינטרנט מקוונת מציעה לחברות את השירותים הבאים: -SEO בגוגל, אמזון, בינג, Yandex; -Web Analytics: Google Analytics, Google Tag Manager, Yandex Metrica; -המרות משתמשים: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM ב-Google, Bing, Amazon Ads; -שיווק במדיה חברתית (פייסבוק, לינקדין, יוטיוב, אינסטגרם).

ראה ביוגרפיה מלאה

שיווק דיגיטלי מסד נתונים DBMS מחסן נתונים מדע נתונים פרסום באינטרנט טכנולוגיית מידע סוכנות האינטרנט משרד פרסום שיווק

מיקום:

אני אוהב:

קבל מידע נוסף מסוכנות האינטרנט המקוונת