https://unimib.academia.edu/stefanofantin

https://unimib.academia.edu/stefanofantin

doi:https://unimib.academia.edu/stefanofantin

მონაცემთა საწყობი და საწარმოთა რესურსების დაგეგმვა | DWH და ERP

არქივი დათი CENTRAL: HISTORY ED ევოლუციები

90-იან წლებში კორპორატიული ტექნოლოგიების ორი დომინანტური თემა იყო ი მონაცემთა საწყობი და ERP. დიდი ხნის განმავლობაში ეს ორი მძლავრი დინება იყო კორპორატიული IT-ის ნაწილი, კვეთების გარეშე. თითქმის თითქოს მატერია და ანტიმატერია ყოფილიყო. მაგრამ ორივე ფენომენის ზრდამ აუცილებლად გამოიწვია მათი გადაკვეთა. დღეს კომპანიებს ექმნებათ პრობლემა, თუ რა უნდა გააკეთონ ERP და მონაცემთა საწყობი. ამ სტატიაში აღწერილი იქნება რა პრობლემებია და როგორ უმკლავდებიან კომპანიები მათ.

ᲓᲐᲡᲐᲬᲧᲘᲡᲗᲐᲜ…

დასაწყისში იყო მონაცემთა საწყობი. მონაცემთა საწყობი შეიქმნა ტრანზაქციის დამუშავების აპლიკაციის სისტემის დასაპირისპირებლად. პირველ ხანებში დამახსოვრება მონაცემები ის გამიზნული იყო მხოლოდ კონტრაპუნქტი ყოფილიყო ტრანზაქციის დამუშავების აპლიკაციებისთვის. მაგრამ დღესდღეობით არსებობს ბევრად უფრო დახვეწილი შეხედულებები იმის შესახებ, თუ რა ა მონაცემთა საწყობი. დღევანდელ სამყაროში მონაცემთა საწყობი ის ჩასმულია სტრუქტურაში, რომელსაც შეიძლება ეწოდოს კორპორატიული ინფორმაციის ქარხანა.

კორპორატიული ინფორმაციის ქარხანა (CIF)

კორპორატიული ინფორმაციის ქარხანას აქვს სტანდარტული არქიტექტურული კომპონენტები: ტრანსფორმაციის დონე და კოდის ინტეგრაცია, რომელიც აერთიანებს მონაცემები სანამ მე მონაცემები ისინი გადაადგილდებიან განაცხადის გარემოდან გარემოში მონაცემთა საწყობი კომპანიის; ა მონაცემთა საწყობი იმ კომპანიის, სადაც მონაცემები დეტალური და ინტეგრირებული ისტორიკოსები. The მონაცემთა საწყობი კომპანიის საფუძველია, რომელზედაც შეიძლება აშენდეს გარემოს ყველა სხვა ნაწილი მონაცემთა საწყობი; ოპერატიული მონაცემთა მაღაზია (ODS). ODS არის ჰიბრიდული სტრუქტურა, რომელიც შეიცავს ზოგიერთ ასპექტს მონაცემთა საწყობი და OLTP გარემოს სხვა ასპექტები; მონაცემთა მარტები, სადაც სხვადასხვა დეპარტამენტს შეუძლია ჰქონდეს საკუთარი ვერსია მონაცემთა საწყობი; ა მონაცემთა საწყობი საძიებო სამუშაოები, რომლებშიც კომპანიის „ფილოსოფოსებს“ შეუძლიათ თავიანთი შეკითხვები 72 საათის განმავლობაში წარუდგინონ მათზე მავნე ზემოქმედების გარეშე. მონაცემთა საწყობი; და ახლო ხაზის მეხსიერება, რომელშიც მონაცემები ძველი და მონაცემები ნაყარი დეტალების შენახვა შესაძლებელია იაფად.

სად ერწყმის ERP-ს კორპორატიული ინფორმაციის ქარხანა

ERP ორ ადგილას ერწყმის კორპორატიული ინფორმაციის ქარხანას. პირველი, როგორც ძირითადი აპლიკაცია (საბაზისო), რომელიც უზრუნველყოფს ი მონაცემები განაცხადის მიმართ მონაცემთა საწყობი. ამ შემთხვევაში ი მონაცემები, გენერირებული როგორც ტრანზაქციის პროცესის ქვეპროდუქტი, ინტეგრირებულია და იტვირთება მასში მონაცემთა საწყობი კომპანიის. ERP-სა და CIF-სა და ODS-ს შორის გაერთიანების მეორე წერტილი. სინამდვილეში, ბევრ გარემოში ERP გამოიყენება როგორც კლასიკური ODS.

იმ შემთხვევაში, თუ ERP გამოიყენება როგორც ძირითადი აპლიკაცია, იგივე ERP ასევე შეიძლება გამოყენებულ იქნას CIF-ში, როგორც ODS. ნებისმიერ შემთხვევაში, თუ ERP უნდა იქნას გამოყენებული ორივე როლში, უნდა არსებობდეს მკაფიო განსხვავება ორ ერთეულს შორის. სხვა სიტყვებით რომ ვთქვათ, როდესაც ERP ასრულებს ძირითადი აპლიკაციისა და ODS-ის როლს, უნდა გამოიყოს ორი არქიტექტურული ერთეული. თუ ერთი ERP დანერგვა შეეცდება ორივე როლის ერთდროულად შესრულებას, აუცილებლად იქნება პრობლემები ამ სტრუქტურის დიზაინსა და განხორციელებაში.

ცალკეული ODS და ძირითადი აპლიკაციები

მრავალი მიზეზი არსებობს, რაც იწვევს არქიტექტურული კომპონენტების დაყოფას. არქიტექტურის სხვადასხვა კომპონენტების განცალკევების ყველაზე მნიშვნელოვანი საკითხია ის, რომ არქიტექტურის თითოეულ კომპონენტს აქვს საკუთარი შეხედულება. საბაზისო განაცხადი ემსახურება განსხვავებულ მიზანს, ვიდრე ODS. სცადეთ გადახურვა

ODS-ის სამყაროს საბაზისო აპლიკაციის ხედვა ან პირიქით არ არის მუშაობის სწორი გზა.

შესაბამისად, ERP-ის პირველი პრობლემა CIF-ში არის იმის შემოწმება, არის თუ არა განსხვავება საბაზისო აპლიკაციებსა და ODS-ს შორის.

მონაცემთა მოდელები კორპორატიულში საინფორმაციო ქარხანა

CIF არქიტექტურის სხვადასხვა კომპონენტებს შორის თანმიმდევრობის მისაღწევად, უნდა არსებობდეს მოდელი მონაცემები. -ის მოდელები მონაცემები ისინი ემსახურებიან კავშირს არქიტექტურის სხვადასხვა კომპონენტებს შორის, როგორიცაა საბაზისო აპლიკაციები და ODS. -ის მოდელები მონაცემები ისინი გახდებიან „ინტელექტუალური საგზაო რუკა“, რათა მიიღონ სწორი მნიშვნელობა CIF-ის სხვადასხვა არქიტექტურული კომპონენტებისგან.

ამ ცნებასთან ერთად, იდეა ისაა, რომ უნდა არსებობდეს ერთი დიდი და ერთიანი მოდელი მონაცემები. ცხადია, უნდა არსებობდეს მოდელი მონაცემები თითოეული კომპონენტისთვის და ასევე უნდა არსებობდეს გონივრული გზა, რომელიც აკავშირებს სხვადასხვა მოდელებს. არქიტექტურის თითოეული კომპონენტი - ODS, საბაზისო აპლიკაციები, მონაცემთა საწყობი კომპანიის და ა.შ.. – სჭირდება საკუთარი მოდელი მონაცემები. ასე რომ, უნდა არსებობდეს ზუსტი განმარტება, თუ როგორია ეს მოდელები მონაცემები ისინი ურთიერთობენ ერთმანეთთან.

გადაადგილება I დათი ERP მონაცემებში საწყობი

თუ წარმოშობა მონაცემები არის საბაზისო აპლიკაცია და/ან ODS, როდესაც ERP ათავსებს მონაცემები in მონაცემთა საწყობი, ეს ჩასმა უნდა მოხდეს „გრანულარობის“ ყველაზე დაბალ დონეზე. უბრალოდ შეაჯამეთ ან შეკრიბეთ ი მონაცემები რადგან ისინი გამოდიან ERP საბაზისო აპლიკაციიდან ან ERP ODS არ არის სწორი გასაკეთებელი. THE მონაცემები საჭიროა დეტალები მონაცემთა საწყობი ჩამოყალიბდეს DSS პროცესის საფუძველი. ასეთი მონაცემები შეიცვლება მრავალი თვალსაზრისით მონაცემთა მარტისა და გამოკვლევებით მონაცემთა საწყობი.

გადაადგილება მონაცემები ERP საბაზისო განაცხადის გარემოდან მონაცემთა საწყობი კომპანია კეთდება გონივრულად მოდუნებულ რეჟიმში. ეს ნაბიჯი ხდება ERP-ში განახლებიდან ან შექმნიდან დაახლოებით 24 საათის შემდეგ. „ზარმაცი“ მოძრაობის ფაქტი მონაცემები in მონაცემთა საწყობი კომპანიის საშუალებას იძლევა მონაცემები მოდის ERP-დან „დეპოზიტზე“. ერთხელ მე მონაცემები ინახება საბაზისო აპლიკაციაში, მაშინ შეგიძლიათ უსაფრთხოდ გადაიტანოთ მონაცემები ERP საწარმოში. კიდევ ერთი მიზანი მისაღწევი "ზარმაცი" მოძრაობის წყალობით მონაცემები ეს არის მკაფიო გამიჯვნა ოპერაციულ პროცესებსა და DSS-ს შორის. „სწრაფი“ მოძრაობით მონაცემები გამყოფი ხაზი DSS-სა და ოპერაციულს შორის ბუნდოვანი რჩება.

მოძრაობა მონაცემები ERP-ის ODS-დან მონაცემთა საწყობი კომპანია კეთდება პერიოდულად, როგორც წესი, ყოველკვირეულად ან ყოველთვიურად. ამ შემთხვევაში მოძრაობა მონაცემები ის ეფუძნება ძველთა „გაწმენდის“ აუცილებლობას მონაცემები ისტორიკოსები. რა თქმა უნდა, ODS შეიცავს ი მონაცემები რომლებიც ბევრად უფრო ახალია ვიდრე მონაცემები ისტორიკოსებმა აღმოაჩინეს მონაცემთა საწყობი.

გადაადგილება მონაცემები in მონაცემთა საწყობი იგი თითქმის არასოდეს კეთდება "საბითუმო ვაჭრობით" (ბითუმად). დააკოპირეთ ცხრილი ERP გარემოდან მონაცემთა საწყობი აზრი არ აქვს. ბევრად უფრო რეალისტური მიდგომაა შერჩეული ერთეულების გადატანა მონაცემები. Მხოლოდ მონაცემები რომლებიც შეიცვალა ბოლო განახლების შემდეგ მონაცემთა საწყობი ისინი არიან, ვინც უნდა გადავიდნენ მონაცემთა საწყობი. ერთი გზა იმის გასაგებად, რომელი მონაცემები შეიცვალა მას შემდეგ, რაც ბოლო განახლება იყო დროის ნიშნულების ნახვა მონაცემები ნაპოვნია ERP გარემოში. დიზაინერი ირჩევს ყველა ცვლილებას, რომელიც მოხდა ბოლო განახლების შემდეგ. კიდევ ერთი მიდგომა არის ცვლილებების დაჭერის ტექნიკის გამოყენება მონაცემები. ამ ტექნიკით, ჟურნალები და ჟურნალის ფირები ანალიზდება, რათა დადგინდეს რომელი მონაცემები უნდა გადავიდეს ERP გარემოდან მონაცემთა საწყობი. ეს ტექნიკა საუკეთესოა, რადგან ჟურნალების და ჟურნალის ლენტების წაკითხვა შესაძლებელია ERP ფაილებიდან სხვა ERP რესურსებზე ზემოქმედების გარეშე.

სხვა გართულებები

CIF-ში ERP-ის ერთ-ერთი პრობლემა არის ის, თუ რა ემართება აპლიკაციის სხვა წყაროებს ან მას მონაცემები ODS-ს, რომელშიც მათ უნდა შეიტანონ წვლილი მონაცემთა საწყობი მაგრამ ისინი არ არიან ERP გარემოს ნაწილი. ERP-ის, განსაკუთრებით SAP-ის დახურული ბუნების გათვალისწინებით, ცდილობს გასაღებების ინტეგრირებას გარე წყაროებიდან მონაცემები ი მონაცემები რომლებიც მოდის ERP-დან გადაადგილებისას მონაცემები in მონაცემთა საწყობი, ეს დიდი გამოწვევაა. და ზუსტად რა არის იმის ალბათობა, რომ ი მონაცემები ERP გარემოს გარეთ არსებული აპლიკაციები ან ODS ინტეგრირებული იქნება მონაცემთა საწყობი? შანსები რეალურად ძალიან მაღალია.

იპოვეთ დათი ისტორიული ERP-დან

კიდევ ერთი პრობლემა ი მონაცემები ERP არის ის, რაც გამომდინარეობს არსებობის საჭიროებიდან მონაცემები ისტორიკოსები შიგნით მონაცემთა საწყობი. ჩვეულებრივ, მონაცემთა საწყობი საჭიროებებს მონაცემები ისტორიკოსები. და ERP ტექნოლოგია ჩვეულებრივ არ ინახავს მათ მონაცემები ისტორიული, ყოველ შემთხვევაში არა იმდენად, რამდენადაც ეს აუცილებელია მონაცემთა საწყობი. როდესაც დიდი რაოდენობით მონაცემები ისტორია იწყებს ERP გარემოში დამატებას, ეს გარემო უნდა გაიწმინდოს. მაგალითად, დავუშვათ, რომ ა მონაცემთა საწყობი უნდა იყოს დატვირთული ხუთი წლით მონაცემები ისტორიული, ხოლო ERP ინახავს მათგან მაქსიმუმ ექვს თვეს მონაცემები. სანამ კომპანია კმაყოფილია სერიის შეგროვებით მონაცემები ისტორიკოსები რაც დრო გადის, მაშინ პრობლემა არ არის ERP-ის წყაროდ გამოყენებაში მონაცემთა საწყობი. მაგრამ როცა მონაცემთა საწყობი მან უნდა დაბრუნდეს დრო და ღმერთები მოიპოვოს მონაცემები ისტორიები, რომლებიც ადრე არ იყო შეგროვებული და შენახული ERP-ის მიერ, მაშინ ERP გარემო ხდება არაეფექტური.

ERP და მეტამონაცემები

კიდევ ერთი მოსაზრება ERP ე მონაცემთა საწყობი არის ERP გარემოში არსებული მეტამონაცემების შესახებ. ისევე როგორც მეტამონაცემები მიედინება ERP გარემოდან მონაცემთა საწყობი, მეტამონაცემები უნდა გადავიდეს იმავე გზით. გარდა ამისა, მეტამონაცემები უნდა გარდაიქმნას ინფრასტრუქტურისთვის საჭირო ფორმატში და სტრუქტურაში მონაცემთა საწყობი. ოპერაციულ მეტამონაცემებსა და DSS მეტამონაცემებს შორის დიდი განსხვავებაა. ოპერატიული მეტამონაცემები ძირითადად განკუთვნილია დეველოპერისთვის და

პროგრამისტი. DSS მეტამონაცემები ძირითადად განკუთვნილია საბოლოო მომხმარებლისთვის. ERP აპლიკაციებში ან ODS-ებში არსებული მეტამონაცემების კონვერტაცია საჭიროა და ეს კონვერტაცია ყოველთვის არ არის ადვილი და მარტივი.

ERP მონაცემების მოპოვება

თუ ERP გამოიყენება როგორც მიმწოდებელი მონაცემები იმ მონაცემთა საწყობი უნდა იყოს მყარი ინტერფეისი, რომელიც მოძრაობს მონაცემები ERP გარემოდან გარემომდე მონაცემთა საწყობი. ინტერფეისი უნდა:

▪ იყოს მარტივი გამოსაყენებელი
▪ დაუშვით წვდომა მონაცემები ERP-ის
▪ მიიღეთ მნიშვნელობა მონაცემები რომლებიც გადასატანია მონაცემთა საწყობი
▪ იცოდეთ ERP შეზღუდვები, რომლებიც შეიძლება წარმოიშვას წვდომისას მონაცემები ERP:
▪ რეფერენციალური მთლიანობა
▪ იერარქიული ურთიერთობები
▪ იმპლიციტური ლოგიკური ურთიერთობები
▪ განაცხადის კონვენცია
▪ ყველა სტრუქტურა მონაცემები მხარდაჭერილი ERP და ასე შემდეგ…
▪ იყოს ეფექტური წვდომისას მონაცემები, მიწოდებით:
▪ პირდაპირი მოძრაობა მონაცემები
▪ ცვლილების შეძენა მონაცემები
▪ მხარი დაუჭირეთ დროულ წვდომას მონაცემები
▪ გაიგოს ფორმატი მონაცემები, და ასე შემდეგ… ინტერფეისი SAP-თან ინტერფეისი შეიძლება იყოს ორი ტიპის, საშინაო ან კომერციული. ზოგიერთი ძირითადი სავაჭრო ინტერფეისი მოიცავს:

▪ SAS
▪ Prims Solutions
▪ D2k და ასე შემდეგ… მრავალჯერადი ERP ტექნოლოგიები ERP გარემოს ისე მოპყრობა, თითქოს ეს ერთი ტექნოლოგია იყოს, დიდი შეცდომაა. არსებობს მრავალი ERP ტექნოლოგია, თითოეულს აქვს საკუთარი ძლიერი მხარეები. ბაზარზე ყველაზე ცნობილი გამყიდველები არიან:

▪ SAP
▪ Oracle Financials
▪ PeopleSoft
▪ JD Edwards
▪ ბაანი SAP SAP არის ყველაზე დიდი და ყველაზე სრულყოფილი ERP პროგრამა. SAP აპლიკაციები მოიცავს მრავალ ტიპის აპლიკაციას ბევრ სფეროში. SAP-ს აქვს რეპუტაცია, როგორც:

▪ ძალიან დიდი
▪ ძალიან რთული და ძვირადღირებული განხორციელება
▪ სჭირდება ბევრი ადამიანი და კონსულტანტი დასანერგად
▪ განსახორციელებლად საჭიროებს სპეციალიზებულ ადამიანებს
▪ დანერგვას დიდი დრო სჭირდება. გარდა ამისა, SAP-ს აქვს მისი დამახსოვრების რეპუტაცია მონაცემები ძალიან ფრთხილად, რაც ართულებს მათზე წვდომას SAP-ის ფარგლებს გარეთ. SAP-ის სიძლიერე იმაში მდგომარეობს, რომ მას შეუძლია დიდი რაოდენობის დაჭერა და შენახვა მონაცემები. ცოტა ხნის წინ SAP-მა გამოაცხადა თავისი განზრახვა გააგრძელოს თავისი განაცხადები მონაცემთა საწყობი. SAP-ის მომწოდებლად გამოყენებას ბევრი დადებითი და უარყოფითი მხარე აქვს მონაცემთა საწყობი. უპირატესობა ის არის, რომ SAP უკვე დაინსტალირებულია და კონსულტანტების უმეტესობამ უკვე იცის SAP.
SAP-ის მიმწოდებლის არსებობის უარყოფითი მხარეები მონაცემთა საწყობი ბევრია: SAP-ს არ აქვს გამოცდილება მსოფლიოში მონაცემთა საწყობი თუ SAP არის მიმწოდებელი მონაცემთა საწყობი, აუცილებელია „გამოტანა“ ი მონაცემები SAP-დან მონაცემთა საწყობი. დათო SAP-ის ჩანაწერი დახურული სისტემის შესახებ, ნაკლებად სავარაუდოა, რომ იოლი იყოს SAP-დან მასში მოხვედრა (???). არსებობს მრავალი მემკვიდრეობითი გარემო, რომელიც აძლიერებს SAP-ს, როგორიცაა IMS, VSAM, ADABAS, ORACLE, DB2 და ა.შ. SAP დაჟინებით მოითხოვს "აქ არ არის გამოგონილი" მიდგომას. SAP-ს არ სურს სხვა მომწოდებლებთან პარტნიორობა გამოიყენოს ან შექმნას მონაცემთა საწყობი. SAP დაჟინებით მოითხოვს მთელი თავისი პროგრამული უზრუნველყოფის გენერირებას.

მიუხედავად იმისა, რომ SAP არის დიდი და ძლიერი კომპანია, რომელიც ცდილობს გადაწეროს ELT, OLAP, სისტემის ადმინისტრირების ტექნოლოგია და თუნდაც ძირითადი კოდი. დბმ უბრალოდ გიჟია. მომწოდებლებთან კოოპერატიული დამოკიდებულების ნაცვლად მონაცემთა საწყობი დიდი ხნის განმავლობაში, SAP მიჰყვებოდა მიდგომას „მათ უკეთ იციან“. ეს დამოკიდებულება ხელს უშლის იმ წარმატებას, რომელიც SAP-ს შეეძლო მოეპოვებინა ამ სფეროში მონაცემთა საწყობი.
SAP-მა უარი თქვა გარე მოვაჭრეებს დაუყონებლივ და მოხდენილი წვდომის უფლებაზე მონაცემები. გამოყენების არსი ა მონაცემთა საწყობი არის მარტივი წვდომა მონაცემები. SAP-ის მთელი ისტორია ეფუძნება წვდომის გაძნელებას მონაცემები.
SAP-ს არ აქვს გამოცდილება დიდი მოცულობის საქმეში მონაცემები; რაიმე საქმიანობის სფეროში მონაცემთა საწყობი არის ტომები მონაცემები არასოდეს უნახავს SAP-ს და მართოს ამ დიდი რაოდენობით მონაცემები თქვენ უნდა გქონდეთ შესაბამისი ტექნოლოგია. როგორც ჩანს, SAP-მა არ იცის ამ ტექნოლოგიური ბარიერის შესახებ, რომელიც არსებობს ამ სფეროში შესასვლელად მონაცემთა საწყობი.
SAP-ის კორპორატიული კულტურა: SAP-მა გააკეთა ბიზნესი მისი მიღების მიზნით მონაცემები სისტემიდან. მაგრამ ამისათვის თქვენ უნდა გქონდეთ განსხვავებული მენტალიტეტი. ტრადიციულად, პროგრამული უზრუნველყოფის კომპანიებს, რომლებიც კარგად ახერხებდნენ მონაცემების გარემოში შეყვანას, არ იყვნენ კარგი მონაცემების სხვა გზით წასვლისას. თუ SAP მოახერხებს ამ ტიპის შეცვლას, ის პირველი კომპანია იქნება, ვინც ამას გააკეთებს.

მოკლედ, კითხვის ნიშნის ქვეშ დგას, უნდა აირჩიოს თუ არა კომპანიამ SAP თავის მიმწოდებლად მონაცემთა საწყობი. არის ერთი მხრივ ძალიან სერიოზული რისკები და მეორეს მხრივ ძალიან ცოტა ჯილდოები. მაგრამ არის კიდევ ერთი მიზეზი, რომელიც ხელს უშლის SAP-ის მიმწოდებლად არჩევას მონაცემთა საწყობი. რადგან ყველა კომპანიას უნდა ჰქონდეს იგივე მონაცემთა საწყობი ყველა სხვა კომპანიისგან? The მონაცემთა საწყობი ეს არის კონკურენტული უპირატესობის გული. თუ ყველა კომპანიამ იგივე მიიღო მონაცემთა საწყობი რთული იქნება, თუმცა არა შეუძლებელი, კონკურენტული უპირატესობის მიღწევა. SAP, როგორც ჩანს, ფიქრობს, რომ ა მონაცემთა საწყობი ის შეიძლება ჩაითვალოს ქუქი-ფაილად და ეს არის მათი აპლიკაციების მენტალიტეტის „მიიღეთ მონაცემები“ კიდევ ერთი ნიშანი.

არცერთი სხვა ERP გამყიდველი არ არის ისეთი დომინანტი, როგორც SAP. ეჭვგარეშეა, იქნებიან კომპანიები, რომლებიც SAP-ის გზას გაუყვებათ მონაცემთა საწყობი მაგრამ სავარაუდოდ ესენი მონაცემთა საწყობი SAP იქნება დიდი, ძვირი და შრომატევადი შექმნა.

ეს გარემო მოიცავს ისეთ საქმიანობას, როგორიცაა ბანკის გამყიდველის დამუშავება, ავიაკომპანიის დაჯავშნის პროცესები, სადაზღვევო პრეტენზიების პროცესები და ა.შ. რაც უფრო ეფექტური იყო ტრანზაქციის სისტემა, მით უფრო აშკარა იყო ოპერაციული პროცესისა და DSS-ის (გადაწყვეტილების მხარდაჭერის სისტემა) გამიჯვნის საჭიროება. თუმცა, HR და პერსონალის სისტემებთან, თქვენ არასოდეს შეგხვდებათ დიდი მოცულობის ტრანზაქციები. და, რა თქმა უნდა, როდესაც ადამიანი დაქირავებულია ან ტოვებს კომპანიას, ეს არის გარიგების ჩანაწერი. მაგრამ სხვა სისტემებთან შედარებით, HR და პერსონალის სისტემებს უბრალოდ არ აქვთ ბევრი ტრანზაქცია. აქედან გამომდინარე, HR და პერსონალის სისტემებში არ არის სრულიად აშკარა, რომ არსებობს DataWarehouse-ის საჭიროება. მრავალი თვალსაზრისით, ეს სისტემები წარმოადგენს DSS სისტემების გაერთიანებას.

მაგრამ არის კიდევ ერთი ფაქტორი, რომელიც გასათვალისწინებელია, თუ საქმე გაქვთ მონაცემთა საწყობებთან და PeopleSoft-თან. ბევრ გარემოში, ე.ი მონაცემები ადამიანური და პირადი რესურსები მეორეხარისხოვანია კომპანიის პირველადი ბიზნესისთვის. კომპანიების უმეტესობა ეწევა წარმოებას, გაყიდვებს, მომსახურების მიწოდებას და ა.შ. ადამიანური რესურსები და პერსონალის სისტემები, როგორც წესი, მეორეხარისხოვანია (ან მხარდამჭერი) კომპანიის ძირითადი ბიზნესის მიმართულებისთვის. ამიტომ, ეს ორაზროვანი და მოუხერხებელია მონაცემთა საწყობი ცალკე ადამიანური რესურსებისა და პერსონალის მხარდაჭერისთვის.

PeopleSoft ამ მხრივ ძალიან განსხვავდება SAP-ისგან. SAP-თან ერთად, სავალდებულოა, რომ არსებობს ა მონაცემთა საწყობი. PeopleSoft-თან ერთად, ეს არც ისე ნათელია. მონაცემთა საწყობი არჩევითია PeopleSoft-თან ერთად.

საუკეთესო რამ, რაც შეიძლება ითქვას ამისთვის მონაცემები PeopleSoft არის ის, რომ მონაცემთა საწყობი შეიძლება გამოყენებულ იქნას ი მონაცემები ძველ ადამიანურ და პირად რესურსებთან დაკავშირებით. მეორე მიზეზი, რის გამოც კომპანიას სურს გამოიყენოს ა მონაცემთა საწყობი a

PeopleSoft გარემოს საზიანოა ანალიზის ინსტრუმენტებზე წვდომისა და თავისუფალი წვდომის დაშვება მონაცემები PeopleSoft-ის მიერ. მაგრამ ამ მიზეზების გარდა, შეიძლება იყოს შემთხვევები, როდესაც სასურველია არ გქონდეთ მონაცემთა საწყობი მონაცემები PeopleSoft.

ჯამში

მრავალი იდეა არსებობს ა-ს მშენებლობასთან დაკავშირებით მონაცემთა საწყობი ERP პროგრამული უზრუნველყოფის ფარგლებში.
ზოგიერთი მათგანია:

▪ აზრი აქვს ა მონაცემთა საწყობი ეს არის რაიმე სხვა ინდუსტრიაში?
▪ რამდენად მოქნილია ERP მონაცემთა საწყობი პროგრამული უზრუნველყოფა?
▪ ERP მონაცემთა საწყობი პროგრამულ უზრუნველყოფას შეუძლია გაუმკლავდეს მოცულობას მონაცემები რომელიც მდებარეობს ამონაცემთა საწყობი არენაზე"?
▪ რა არის კვალის ჩაწერა, რომელსაც აკეთებს ERP გამყიდველი მარტივი და იაფი დროის თვალსაზრისით, მონაცემები? (რა არის ERP მოვაჭრეების ჩანაწერი იაფი, დროულად, ადვილად მისადგომი მონაცემების მიწოდებაზე?)
▪ როგორია ERP გამყიდველის გაგება DSS არქიტექტურისა და კორპორატიული ინფორმაციის ქარხნის შესახებ?
▪ ERP მომწოდებლებს ესმით, როგორ მიაღწიონ მონაცემები გარემოს ფარგლებში, მაგრამ ასევე გესმით, როგორ უნდა მოხდეს მათი ექსპორტი?
▪ რამდენად ღიაა ERP გამყიდველი მონაცემთა შენახვის ხელსაწყოებისთვის?
ყველა ეს მოსაზრება გასათვალისწინებელია იმის განსაზღვრისას, თუ სად უნდა დააყენოთ მონაცემთა საწყობი რომელიც მასპინძლობს ი მონაცემები ERP და სხვა მონაცემები. ზოგადად, თუ არ არსებობს დამაჯერებელი მიზეზი სხვაგვარად გასაკეთებლად, რეკომენდირებულია მშენებლობა მონაცემთა საწყობი ERP გამყიდველის გარემოს გარეთ. ᲗᲐᲕᲘ 1 BI ორგანიზაციის ძირითადი პუნქტების მიმოხილვა:
ინფორმაციის საცავი მუშაობს ბიზნეს ინტელექტის (BI) არქიტექტურის საპირისპიროდ:
კორპორატიულ კულტურას და IT-ს შეუძლია შეზღუდოს წარმატება BI ორგანიზაციების მშენებლობაში.

ტექნოლოგია აღარ არის შემზღუდველი ფაქტორი BI ორგანიზაციებისთვის. არქიტექტორებისა და პროექტების დამგეგმავებისთვის კითხვა არ არის, არსებობს თუ არა ტექნოლოგია, არამედ შეუძლიათ თუ არა მათ ეფექტურად დანერგონ ხელმისაწვდომი ტექნოლოგია.

მრავალი კომპანიისთვის ა მონაცემთა საწყობი ეს არის ცოტა მეტი, ვიდრე პასიური დეპოზიტი, რომელიც ანაწილებს მონაცემები მომხმარებლებისთვის, რომლებსაც ეს სჭირდებათ. THE მონაცემები ისინი ამოღებულია წყაროს სისტემებიდან და დასახლებულია სამიზნე სტრუქტურებში მონაცემთა საწყობი. მე მონაცემები ისინი ასევე შეიძლება გაიწმინდოს ნებისმიერი იღბლით. თუმცა დამატებითი ღირებულება არ არის დამატებული ან შეგროვებული მონაცემები ამ პროცესის დროს.

არსებითად, პასიური Dw, საუკეთესო შემთხვევაში, მხოლოდ i მონაცემები სუფთა და მოქმედი მომხმარებელთა ასოციაციებისთვის. ინფორმაციის შექმნა და ანალიტიკური გაგება მთლიანად დამოკიდებულია მომხმარებლებზე. განსაჯეთ DW (მონაცემთა საწყობი) წარმატება სუბიექტურია. თუ ჩვენ ვიმსჯელებთ წარმატებაზე ეფექტურად შეგროვების, ინტეგრაციისა და გაწმენდის უნარზე მონაცემები კორპორატიული პროგნოზირებადი საფუძველზე, მაშინ დიახ, DW არის წარმატებული. მეორე მხრივ, თუ გადავხედავთ ორგანიზაციის მიერ ინფორმაციის შეგროვებას, კონსოლიდაციას და ექსპლუატაციას მთლიანობაში, მაშინ DW არის წარუმატებელი. DW იძლევა მცირე ინფორმაციის მნიშვნელობას. შედეგად, მომხმარებლები იძულებულნი არიან დაკავდნენ, რითაც ქმნიან საინფორმაციო სილოებს. ეს თავი წარმოგიდგენთ ყოვლისმომცველ ხედვას კომპანიის BI (ბიზნესი დაზვერვის) არქიტექტურის შეჯამებისთვის. ჩვენ ვიწყებთ BI-ს აღწერით და შემდეგ გადავდივართ ინფორმაციის დიზაინისა და განვითარების დისკუსიებზე, უბრალოდ ინფორმაციის მიწოდებისგან განსხვავებით. მონაცემები მომხმარებლებს. შემდეგ დისკუსიები ფოკუსირებულია თქვენი BI ძალისხმევის ღირებულების გამოთვლაზე. ჩვენ ვასრულებთ იმის განსაზღვრით, თუ როგორ პასუხობს IBM თქვენი ორგანიზაციის BI არქიტექტურულ მოთხოვნებს.

არქიტექტურის აღწერა BI ორგანიზაცია

ტრანზაქციებზე ორიენტირებული ძლიერი საინფორმაციო სისტემები ახლა უკვე ჩვეულებრივია ყველა დიდ საწარმოში, რაც ეფექტურად ასწორებს სათამაშო ველს კორპორაციებს მთელს მსოფლიოში.

თუმცა, კონკურენტუნარიანობის შენარჩუნება ახლა მოითხოვს ანალიტიკურ ორიენტირებულ სისტემებს, რომლებსაც შეუძლიათ რევოლუცია მოახდინოს კომპანიის უნარში ხელახლა აღმოაჩინოს და გამოიყენოს ის ინფორმაცია, რომელიც უკვე ფლობს. ეს ანალიტიკური სისტემები გამომდინარეობს სიმდიდრის გაგებიდან მონაცემები ხელმისაწვდომი. BI-ს შეუძლია გააუმჯობესოს შესრულება მთელს საწარმოში. კომპანიებს შეუძლიათ გააუმჯობესონ მომხმარებელ-მიმწოდებლის ურთიერთობა, გააუმჯობესონ პროდუქტებისა და სერვისების მომგებიანობა, შექმნან ახალი და უკეთესი შეთავაზებები, გააკონტროლონ რისკი და სხვა მრავალი მოგებასთან ერთად, მკვეთრად შეამცირონ ხარჯები. BI-ით თქვენი კომპანია საბოლოოდ იწყებს მომხმარებლის ინფორმაციის გამოყენებას, როგორც კონკურენტუნარიან აქტივს, აპლიკაციების წყალობით, რომლებსაც აქვთ ბაზრის მიზნები.

სწორი ბიზნეს ინსტრუმენტების ქონა ნიშნავს საკვანძო კითხვებზე საბოლოო პასუხების მიღებას, როგორიცაა:

▪ რომელი ჩვენი მომხმარებელს უფრო მეტს გვაძლევენ, თუ ფულს გვაკარგვინებენ?
▪ სადაც ჩვენი საუკეთესოები ცხოვრობენ მომხმარებელს მიმართებაში მაღაზია/ საწყობი, სადაც ისინი ხშირად არიან?
▪ ჩვენი პროდუქტებისა და სერვისებიდან რომელი შეიძლება გაიყიდოს ყველაზე ეფექტურად და ვის?
▪ რომელი პროდუქტების გაყიდვა შეიძლება ყველაზე ეფექტურად და ვის?
▪ რომელი გაყიდვების კამპანიაა ყველაზე წარმატებული და რატომ?
▪ გაყიდვების რომელი არხებია ყველაზე ეფექტური რომელი პროდუქტებისთვის?
▪ როგორ შეგვიძლია გავაუმჯობესოთ ურთიერთობა ჩვენს საუკეთესო ადამიანებთან მომხმარებელს? კომპანიების უმეტესობას აქვს მონაცემები ამ კითხვებზე პასუხის უხეში გზები.
ოპერაციული სისტემები წარმოქმნის დიდი რაოდენობით პროდუქტს, მომხმარებელს და მონაცემები ბაზარი გაყიდვების, დაჯავშნის, მომხმარებელთა მომსახურებისა და ტექნიკური მხარდაჭერის სისტემებიდან. გამოწვევა არის ამ ინფორმაციის მოპოვება და გამოყენება. ბევრი კომპანია მხოლოდ მათი მცირე ფრაქციებიდან იღებს სარგებელს მონაცემები სტრატეგიული ანალიზისთვის.
I მონაცემები დარჩენილი, ხშირად შერწყმული ი მონაცემები მიღებული გარე წყაროებიდან, როგორიცაა სამთავრობო ანგარიშები და სხვა შეძენილი ინფორმაცია, არის ოქროს მაღარო, რომელიც მხოლოდ შესწავლას ელოდება და მონაცემები ისინი უბრალოდ უნდა დაიხვეწოს თქვენი ორგანიზაციის საინფორმაციო კონტექსტში.

ამ ცოდნის გამოყენება შესაძლებელია რამდენიმე გზით, დაწყებული საერთო კორპორატიული სტრატეგიის შემუშავებიდან მომწოდებლებთან პირადი კომუნიკაციით, სატელეფონო ცენტრების საშუალებით, ინვოისის შედგენამდე, ინტერნეტი და სხვა პუნქტები. დღევანდელი ბიზნეს გარემო გვკარნახობს, რომ DW და მასთან დაკავშირებული BI გადაწყვეტილებები განვითარდეს ტრადიციული ბიზნეს სტრუქტურების გატარების მიღმა. მონაცემები როგორიცაა ი მონაცემები ნორმალიზდება ატომურ დონეზე და „ვარსკვლავის/კუბის ფერმები“.

კონკურენტუნარიანობის შესანარჩუნებლად საჭიროა ტრადიციული და მოწინავე ტექნოლოგიების შერწყმა ფართო ანალიტიკური ლანდშაფტის მხარდასაჭერად.
დასკვნის სახით, ზოგადმა გარემომ უნდა გააუმჯობესოს კომპანიის ცოდნა მთლიანად, უზრუნველყოს, რომ ჩატარებული ანალიზის შედეგად მიღებული ქმედებები იყოს სასარგებლო, რათა ყველამ ისარგებლოს.

მაგალითად, ვთქვათ, თქვენ აფასებთ საკუთარ თავს მომხმარებელს მაღალი ან დაბალი რისკის კატეგორიებად.
თუ ეს ინფორმაცია გენერირებულია მოდელის ამომყვანის ან სხვა საშუალებების მიერ, ის უნდა განთავსდეს DW-ში და ხელმისაწვდომი იყოს ყველასთვის, ნებისმიერი წვდომის ხელსაწყოს საშუალებით, როგორიცაა სტატიკური ანგარიშები, ცხრილები, ცხრილები ან ონლაინ ანალიტიკური დამუშავება (OLAP). .

თუმცა, ამჟამად, ამ ტიპის ინფორმაციის დიდი ნაწილი რჩება სილოსებში მონაცემები იმ პირების ან დეპარტამენტების, რომლებიც აწარმოებენ ანალიზს. ორგანიზაციას, მთლიანობაში, ნაკლებად აქვს ან საერთოდ არ აქვს ხილვადობა გაგებისთვის. მხოლოდ ამ ტიპის ინფორმაციის კონტენტის თქვენს საწარმოს DW-ში შერევით შეგიძლიათ აღმოფხვრათ საინფორმაციო სილოსები და გააუმჯობესოთ თქვენი DW გარემო.
არსებობს ორი ძირითადი დაბრკოლება BI ორგანიზაციის განვითარებაში.
ჯერ ერთი, გვაქვს თავად ორგანიზაციისა და მისი დისციპლინის პრობლემა.
მიუხედავად იმისა, რომ ჩვენ ვერ დავეხმარებით ორგანიზაციული პოლიტიკის ცვლილებებში, ჩვენ შეგვიძლია დავეხმაროთ ორგანიზაციის BI-ს კომპონენტების, მისი არქიტექტურის და როგორ უწყობს ხელს IBM ტექნოლოგია მის განვითარებას.
მეორე ბარიერი, რომელიც უნდა დაიძლიოს, არის ინტეგრირებული ტექნოლოგიისა და მეთოდის ცოდნის ნაკლებობა, რომელიც მიმართავს მთელ BI სივრცეს, მცირე კომპონენტისგან განსხვავებით.

IBM უახლოვდება ინტეგრაციის ტექნოლოგიაში ცვლილებებს. თქვენი პასუხისმგებლობაა გააზრებული დიზაინის უზრუნველყოფა. ეს არქიტექტურა უნდა განვითარდეს შეუზღუდავი ინტეგრაციისთვის არჩეული ტექნოლოგიით, ან სულ მცირე, ტექნოლოგიით, რომელიც იცავს ღია სტანდარტებს. გარდა ამისა, თქვენი კომპანიის მენეჯმენტმა უნდა უზრუნველყოს, რომ BI ვალდებულება განხორციელდეს გეგმის მიხედვით და არ დაუშვას საინფორმაციო სილოსების განვითარება, რომლებიც წარმოიქმნება თვითმომსახურების დღის წესრიგიდან ან მიზნებიდან.
ეს არ ნიშნავს, რომ BI გარემო არ არის მგრძნობიარე სხვადასხვა მომხმარებლის სხვადასხვა საჭიროებებსა და მოთხოვნებზე რეაგირებისთვის; ამის ნაცვლად, ეს ნიშნავს, რომ ამ ინდივიდუალური საჭიროებებისა და მოთხოვნების განხორციელება ხდება მთელი BI ორგანიზაციის სასარგებლოდ.
BI ორგანიზაციის არქიტექტურის აღწერა შეგიძლიათ იხილოთ მე-9 გვერდზე, სურათზე 1.1. არქიტექტურა აჩვენებს ტექნოლოგიებისა და ტექნიკის მდიდარ ნაზავს.
ტრადიციული თვალსაზრისით, არქიტექტურა მოიცავს შემდეგ საწყობის კომპონენტებს

ატომური ფენა (ატომური ფენა).

ეს არის მთელი DW-ის საფუძველი, გული და, შესაბამისად, სტრატეგიული რეპორტაჟი.
I მონაცემები აქ შენახული შეინარჩუნებს ისტორიულ მთლიანობას, მოხსენებები მონაცემები და მოიცავს მიღებულ მეტრიკას, ასევე გაწმენდას, ინტეგრირებას და შენახვას მოდელის ექსტრაქციის გამოყენებით.
ამ ყველა შემდგომი გამოყენება მონაცემები და შესაბამისი ინფორმაცია მიღებულია ამ სტრუქტურიდან. ეს შესანიშნავი წყაროა მაინინგისთვის მონაცემები და სტრუქტურირებული SQL მოთხოვნების მქონე ანგარიშებისთვის

მოქმედი საწყობი მონაცემები ან ანგარიშის საფუძველზე მონაცემები(ოპერაციული მონაცემთა შენახვა (ODS) ან მოხსენება მონაცემთა ბაზა.)

ეს არის დაწესებულება მონაცემები სპეციალურად შექმნილი ტექნიკური ანგარიშგებისთვის.

I მონაცემები ზემოთ შენახული და მოხსენებული ეს სტრუქტურები საბოლოოდ შეიძლება გავრცელდეს საწყობში დადგმის ზონის გავლით, სადაც ის შეიძლება გამოყენებულ იქნას სტრატეგიული სიგნალიზაციისთვის.

დადგმის ტერიტორია.

პირველი გაჩერება უმეტესობისთვის მონაცემები სასაწყობო გარემოსთვის განკუთვნილი ორგანიზაციის ზონაა.
Აქ მე მონაცემები არის ინტეგრირებული, გაწმენდილი და გარდაიქმნება მონაცემები მოგება, რომელიც დაასახლებს საწყობის სტრუქტურას

პაემანი მარტები.

არქიტექტურის ეს ნაწილი წარმოადგენს სტრუქტურას მონაცემები გამოიყენება სპეციალურად OLAP-ისთვის. მონაცემთა მარტების არსებობა, თუ ი მონაცემები ინახება ვარსკვლავების გადაფარვის სქემებში მონაცემები მრავალგანზომილებიანი ურთიერთობით გარემოში, ან ფაილებში მონაცემები კონფიდენციალური, რომელიც გამოიყენება კონკრეტული OLAP ტექნოლოგიით, როგორიცაა DB2 OLAP სერვერი, არ არის შესაბამისი.

ერთადერთი შეზღუდვა ის არის, რომ არქიტექტურა ხელს უწყობს გამოყენებას მონაცემები მრავალგანზომილებიანი.
არქიტექტურა ასევე მოიცავს კრიტიკულ Bi ტექნოლოგიებსა და ტექნიკას, რომლებიც გამოირჩევა:

სივრცითი ანალიზი

კოსმოსი არის ანალიტიკოსისთვის ინფორმაციის მოულოდნელი შემოსავალი და გადამწყვეტი მნიშვნელობა აქვს სრული გარჩევადობისთვის. სივრცეს შეუძლია წარმოადგინოს ინფორმაცია ადამიანების შესახებ, რომლებიც ცხოვრობენ გარკვეულ ადგილას, ისევე როგორც ინფორმაცია იმის შესახებ, თუ სად არის ეს მდებარეობა ფიზიკურად დანარჩენ სამყაროსთან შედარებით.

ამ ანალიზის შესასრულებლად, თქვენ უნდა დაიწყოთ თქვენი ინფორმაციის გრძედი და გრძედის კოორდინატებთან მიბმა. ეს მოხსენიებულია, როგორც "გეოკოდირება" და უნდა იყოს ამოღების, ტრანსფორმაციის და დატვირთვის (ETL) პროცესის ნაწილი თქვენი საწყობის ატომურ დონეზე.

Მონაცემების მოპოვება.

მოპოვება მონაცემები საშუალებას აძლევს ჩვენს კომპანიებს გაზარდონ რაოდენობა მომხმარებელსგაყიდვების ტენდენციების პროგნოზირება და ურთიერთობის მართვის საშუალება მომხმარებელს (CRM), tra altre iniziative della BI.

მოპოვება მონაცემები ამიტომ ის უნდა იყოს ინტეგრირებული სტრუქტურებთან მონაცემები Dwhouse-ს და მხარს უჭერს საწყობის პროცესებს შესაბამისი ტექნოლოგიისა და ტექნიკის ეფექტური და ეფექტური გამოყენების უზრუნველსაყოფად.

როგორც BI არქიტექტურაშია მითითებული, Dwhouse-ის ატომური დონე, ისევე როგორც datamarts, არის შესანიშნავი წყარო. მონაცემები მოპოვებისთვის. იგივე ობიექტები ასევე უნდა იყვნენ მოპოვების შედეგების მიმღებები ფართო აუდიტორიისთვის ხელმისაწვდომობის უზრუნველსაყოფად.

აგენტები.

არსებობს სხვადასხვა "აგენტი", რათა შეამოწმოს კლიენტი ყველა პუნქტისთვის, როგორიცაა კომპანიის ოპერაციული სისტემები და თავად dw. ეს აგენტები შეიძლება იყოს მოწინავე ნერვული ქსელები, რომლებიც გაწვრთნილნი არიან ტენდენციების შესასწავლად თითოეულ წერტილში, როგორიცაა მომავალი პროდუქტის მოთხოვნა გაყიდვების აქციებზე დაფუძნებული, წესებზე დაფუძნებული ძრავები რეაგირებისთვის. dato გარემოებების ერთობლიობა, ან თუნდაც უბრალო აგენტები, რომლებიც გამონაკლისებს აცნობებენ „ტოპ აღმასრულებლებს“. ეს პროცესები ჩვეულებრივ ხდება რეალურ დროში და, შესაბამისად, მჭიდროდ უნდა იყოს დაკავშირებული მათ მოძრაობასთან მონაცემები. ყველა ეს სტრუქტურა მონაცემები, ტექნოლოგიები და ტექნიკა გარანტიას გაძლევთ, რომ ღამეს არ გაატარებთ თქვენი BI-ის ორგანიზაციის გენერირებისთვის.

ეს აქტივობა განვითარდება ეტაპობრივად, მცირე პუნქტებისთვის.
თითოეული ნაბიჯი არის დამოუკიდებელი პროექტის ძალისხმევა და მოხსენიებულია, როგორც განმეორება თქვენს DW ან BI ინიციატივაში. გამეორებები შეიძლება მოიცავდეს ახალი ტექნოლოგიების დანერგვას, ახალი ტექნიკით დაწყებას, ახალი სტრუქტურების დამატებას მონაცემები , ჩატვირთვა ი მონაცემები დამატებითი, ან თქვენი გარემოს ანალიზის გაფართოებით. ეს პარაგრაფი უფრო ღრმად არის განხილული მე-3 თავში.

ტრადიციული DW სტრუქტურებისა და BI ინსტრუმენტების გარდა, არსებობს თქვენი BI ორგანიზაციის სხვა ფუნქციები, რომლებისთვისაც თქვენ უნდა შეიმუშავოთ, როგორიცაა:

მომხმარებელთა შეხების წერტილები (მომხმარებლის შეხება რაოდენობა).

როგორც ნებისმიერ თანამედროვე ორგანიზაციაში, არსებობს უამრავი მომხმარებელთა შეხების წერტილი, რომელიც მიუთითებს იმაზე, თუ როგორ უნდა გქონდეთ დადებითი გამოცდილება მომხმარებელს. არსებობს ტრადიციული არხები, როგორიცაა საცალო ვაჭრობა, კომუტატორის ოპერატორები, პირდაპირი ფოსტა, მულტიმედია და ბეჭდური რეკლამა, ასევე უფრო აქტუალური არხები, როგორიცაა ელექტრონული ფოსტა და ვებ. მონაცემები პროდუქტები გარკვეული კონტაქტის წერტილით უნდა იყოს შეძენილი, ტრანსპორტირება, გაწმენდა, დამუშავება და შემდეგ დასახლება ობიექტებში მონაცემები BI-ს.

ბაზები მონაცემები ოპერატიული და მომხმარებელთა ასოციაციები (ოპერაციული

მონაცემთა ბაზები და მომხმარებელთა საზოგადოებები).
დასასრულს საკონტაქტო პუნქტები მომხმარებელს ნაპოვნია საძირკვლები მონაცემები კომპანიის აპლიკაციისა და მომხმარებლის თემებიდან. THE მონაცემები არსებული არიან მონაცემები ტრადიციული, რომელიც უნდა გაერთიანდეს და გაერთიანდეს მონაცემები რომლებიც მიედინება საკონტაქტო წერტილებიდან საჭირო ინფორმაციის დასაკმაყოფილებლად.

ანალიტიკოსები. (ანალიტიკოსები)

BI გარემოს პირველადი ბენეფიციარი არის ანალიტიკოსი. სწორედ ის სარგებლობს ამჟამინდელი მოპოვებით მონაცემები ოპერატიული, ინტეგრირებული სხვადასხვა წყაროებთან მონაცემები , გაძლიერებული ისეთი ფუნქციებით, როგორიცაა გეოგრაფიული ანალიზი (გეოკოდირება) და წარმოდგენილია BI ტექნოლოგიებში, რომლებიც საშუალებას იძლევა მოპოვება, OLAP, გაფართოებული SQL ანგარიში და გეოგრაფიული ანალიზი. საანგარიშო გარემოს პირველადი ანალიტიკოსის ინტერფეისი არის BI პორტალი.

თუმცა, ანალიტიკოსი არ არის ერთადერთი, ვინც სარგებლობს BI არქიტექტურით.
აღმასრულებლები, მომხმარებელთა დიდი ასოციაციები და წევრებიც კი, მომწოდებლები და ი მომხმარებელს უნდა მოძებნოს სარგებელი საწარმოს BI-ში.

უკან შესანახი ციკლი.

BI არქიტექტურა არის სასწავლო გარემო. განვითარების დამახასიათებელი პრინციპია მდგრადი სტრუქტურების დაშვება მონაცემები უნდა განახლდეს გამოყენებული BI ტექნოლოგიით და მომხმარებლის მიერ განხორციელებული ქმედებებით. მაგალითია მომხმარებელთა ქულა.

თუ გაყიდვების დეპარტამენტი ახდენს მომხმარებლის ქულების მოდელირებას ახალი სერვისით გამოსაყენებლად, მაშინ გაყიდვების დეპარტამენტი არ უნდა იყოს ერთადერთი ჯგუფი, რომელიც სარგებლობს მომსახურებით.

სამაგიეროდ, მოდელის მოპოვება უნდა განხორციელდეს, როგორც საწარმოში მონაცემთა ნაკადის ბუნებრივი ნაწილი და მომხმარებელთა ქულები უნდა გახდეს საწყობის ინფორმაციის კონტექსტის ინტეგრირებული ნაწილი, ხილული ყველა მომხმარებლისთვის. Bi-bI-ცენტრირებული IBM Suite, მათ შორის DB2 UDB, DB2 OLAP სერვერი, მოიცავს 1.1-ზე განსაზღვრულ ძირითად ტექნოლოგიურ კომპონენტებს.

ჩვენ ვიყენებთ არქიტექტურას, როგორც ეს წიგნიდან ჩანს ამ ფიგურაში, რათა მოგვცეს უწყვეტობის დონე და ვაჩვენოთ, თუ როგორ ჯდება თითოეული IBM პროდუქტი საერთო BI სქემაში.

საინფორმაციო შინაარსის მიწოდება (მიწოდება ინფორმაციის შინაარსი)

თქვენი BI გარემოს დიზაინი, განვითარება და დანერგვა რთული ამოცანაა. დიზაინი უნდა მოიცავდეს როგორც ამჟამინდელ, ასევე მომავალ ბიზნეს მოთხოვნებს. არქიტექტურული ნახაზი უნდა იყოს სრული, რათა მოიცავდეს ყველა დასკვნას, რომელიც ნაპოვნია დიზაინის ფაზაში. შესრულება უნდა დარჩეს ერთი მიზნის ერთგული: BI არქიტექტურის შემუშავება, როგორც ფორმალურად არის წარმოდგენილი დიზაინში და ეფუძნება ბიზნესის მოთხოვნებს.

განსაკუთრებით რთულია იმის მტკიცება, რომ დისციპლინა უზრუნველყოფს შედარებით წარმატებას.
ეს მარტივია, რადგან თქვენ არ ქმნით BI გარემოს ერთდროულად, მაგრამ ამას აკეთებთ მცირე ნაბიჯებით დროთა განმავლობაში.

თუმცა, თქვენი არქიტექტურის BI კომპონენტების იდენტიფიცირება მნიშვნელოვანია ორი მიზეზის გამო: თქვენ წარმართავთ ყველა შემდგომ ტექნიკურ არქიტექტურულ გადაწყვეტილებას.
თქვენ შეძლებთ შეგნებულად დაგეგმოთ ტექნოლოგიის კონკრეტული გამოყენება, მიუხედავად იმისა, რომ შესაძლოა არ გაიმეოროთ ტექნოლოგია რამდენიმე თვის განმავლობაში.

თქვენი ბიზნესის მოთხოვნების საკმარისად გაგება გავლენას მოახდენს პროდუქციის ტიპზე, რომელსაც იძენთ თქვენი არქიტექტურისთვის.
თქვენი არქიტექტურის დიზაინი და განვითარება უზრუნველყოფს თქვენი საწყობის არსებობას

არა შემთხვევითი მოვლენა, არამედ საგულდაგულოდ აგებული „კარგად გააზრებული“. საოპერო ხელოვნება, როგორც შერეული ტექნოლოგიის მოზაიკა.

საინფორმაციო კონტენტის დიზაინი

ყველა საწყისი დიზაინი უნდა იყოს ფოკუსირებული და განსაზღვროს ძირითადი BI კომპონენტები, რომლებიც საჭირო იქნება საერთო გარემოსთვის ახლა და მომავალში.
ბიზნესის მოთხოვნების ცოდნა მნიშვნელოვანია.

ნებისმიერი ფორმალური დიზაინის დაწყებამდეც კი, პროექტის დამგეგმავი ხშირად შეუძლია დაუყოვნებლივ განსაზღვროს ერთი ან ორი კომპონენტი.
თუმცა, კომპონენტების ბალანსი, რომელიც შეიძლება საჭირო გახდეს თქვენი არქიტექტურისთვის, ადვილად ვერ მოიძებნება. დიზაინის ფაზაში, არქიტექტურის ძირითადი ნაწილი აკავშირებს აპლიკაციის შემუშავების (JAD) სესიას ბიზნესის მოთხოვნების იდენტიფიცირებისთვის.

ზოგჯერ ეს მოთხოვნები შეიძლება დაეკისროს შეკითხვისა და მოხსენების ინსტრუმენტებს.
მაგალითად, მომხმარებლები აცხადებენ, რომ თუ მათ სურთ მიმდინარე ანგარიშის ავტომატიზაცია, მათ ხელით უნდა შექმნან იგი ორი მიმდინარე ანგარიშის ინტეგრირებით და კომბინაციიდან მიღებული გამოთვლების დამატებით. მონაცემები.
მიუხედავად იმისა, რომ ეს მოთხოვნა მარტივია, ის განსაზღვრავს ფუნქციის გარკვეულ ფუნქციონირებას, რომელიც უნდა შეიტანოთ თქვენი ორგანიზაციისთვის საანგარიშო ინსტრუმენტების შეძენისას.

დიზაინერმა ასევე უნდა დაიცვას დამატებითი მოთხოვნები სრული სურათის მისაღებად. მომხმარებლებს სურთ ამ ანგარიშის გამოწერა?
არის თუ არა მოხსენების ქვეჯგუფები გენერირებული და ეგზავნება სხვადასხვა მომხმარებლებს? სურთ თუ არა მათ ნახონ ეს ანგარიში კომპანიის პორტალზე? ყველა ეს მოთხოვნა არის მომხმარებლის მიერ მოთხოვნილი სახელმძღვანელო ანგარიშის შეცვლის მარტივი აუცილებლობის ნაწილი. ამ ტიპის მოთხოვნების სარგებელი ის არის, რომ ყველას, მომხმარებლებსა და დიზაინერებს, აქვთ გააზრებული ანგარიშების კონცეფცია.

თუმცა არის სხვა ტიპის ბიზნესი, რომელიც უნდა დავგეგმოთ. როდესაც ბიზნეს მოთხოვნები მითითებულია სტრატეგიული ბიზნეს კითხვების სახით, ექსპერტი დიზაინერისთვის ადვილია გაზომოს/ფაქტი და განზომილებიანი მოთხოვნები.

თუ JAD-ის მომხმარებლებმა არ იციან როგორ გამოაცხადონ თავიანთი მოთხოვნები ბიზნეს პრობლემის სახით, დიზაინერი ხშირად მოგვაწვდის მაგალითებს მოთხოვნების შეგროვების სესიის ნახტომით დასაწყებად.
ექსპერტ დიზაინერს შეუძლია დაეხმაროს მომხმარებლებს გაიგონ არა მხოლოდ სტრატეგიული ვაჭრობა, არამედ როგორ ჩამოაყალიბონ იგი.
მოთხოვნების შეგროვების მიდგომა განხილულია მე-3 თავში; ახლა ჩვენ უბრალოდ გვინდა აღვნიშნოთ ყველა ტიპის BI მოთხოვნების დიზაინის აუცილებლობა.

სტრატეგიული ბიზნეს პრობლემა არა მხოლოდ ბიზნესის მოთხოვნაა, არამედ დიზაინის მინიშნებაც. თუ თქვენ უნდა უპასუხოთ მრავალგანზომილებიან კითხვას, მაშინ უნდა დაიმახსოვროთ, წარმოადგინოთ ი მონაცემები განზომილებიანი და თუ დაგჭირდებათ დაიმახსოვროთ მონაცემები მრავალგანზომილებიანი, თქვენ უნდა გადაწყვიტოთ, თუ რა ტიპის ტექნოლოგიას ან ტექნიკას აპირებთ გამოიყენოთ.

ახორციელებთ რეზერვირებული კუბის ვარსკვლავის სქემას, თუ ორივეს? როგორც ხედავთ, უბრალო ბიზნეს პრობლემასაც კი შეუძლია მნიშვნელოვნად იმოქმედოს დიზაინზე. მაგრამ ამ ტიპის ბიზნეს მოთხოვნები ჩვეულებრივი და გასაგებია, ყოველ შემთხვევაში, პროექტების გამოცდილების მქონე დიზაინერებისა და დამგეგმავებისთვის.

იყო საკმარისი დისკუსია OLAP ტექნოლოგიებისა და მხარდაჭერის შესახებ და ხელმისაწვდომია გადაწყვეტილებების ფართო სპექტრი. აქამდე ჩვენ აღვნიშნეთ მარტივი ანგარიშგების გაერთიანების აუცილებლობა ბიზნეს განზომილების მოთხოვნებთან და როგორ მოქმედებს ეს მოთხოვნები ტექნიკურ არქიტექტურულ გადაწყვეტილებებზე.

მაგრამ რა არის მოთხოვნები, რომლებიც ადვილად არ ესმით მომხმარებლებს ან Dw-ს გუნდს? ოდესმე დაგჭირდებათ სივრცითი ანალიზი?
მაინინგის მოდელები მონაცემები იქნებიან ისინი თქვენი მომავლის აუცილებელი ნაწილი? Ვინ იცის?

მნიშვნელოვანია აღინიშნოს, რომ ამ ტიპის ტექნოლოგიები კარგად არ არის ცნობილი მომხმარებელთა საერთო საზოგადოებებისა და Dw გუნდის წევრების მიერ, ნაწილობრივ ეს შეიძლება გამოწვეული იყოს იმით, რომ მათ ჩვეულებრივ ამუშავებენ შიდა ან მესამე მხარის ტექნიკური ექსპერტები. ეს არის იმ პრობლემების უკიდურესი შემთხვევა, რომელსაც ამ ტიპის ტექნოლოგიები წარმოშობს. თუ მომხმარებლები ვერ აღწერენ ბიზნესის მოთხოვნებს ან ვერ აყალიბებენ მათ ისე, რომ ხელმძღვანელობენ დიზაინერებს, ისინი შეიძლება შეუმჩნეველი დარჩეს ან, უარესი, უბრალოდ იგნორირება.

უფრო პრობლემური ხდება, როდესაც დიზაინერი და დეველოპერი ვერ ცნობენ ერთ-ერთი ამ მოწინავე, მაგრამ კრიტიკული ტექნოლოგიების გამოყენებას.
როგორც ხშირად გვსმენია დიზაინერების თქმით, „კარგი, რატომ არ ვდებთ მას, სანამ არ მივიღებთ სხვა რამეს? „მართლა აინტერესებთ პრიორიტეტები, თუ უბრალოდ გაურბიან მოთხოვნებს, რომლებიც არ ესმით? სავარაუდოდ, ეს ბოლო ჰიპოთეზაა. ვთქვათ, თქვენმა გაყიდვების გუნდმა გააცნო ბიზნესის მოთხოვნა, როგორც ეს მოცემულია სურათზე 1.3, როგორც ხედავთ, მოთხოვნა ჩამოყალიბებულია ბიზნეს პრობლემის სახით. განსხვავება ამ პრობლემასა და ტიპურ განზომილებიან პრობლემას შორის არის მანძილი. ამ შემთხვევაში, გაყიდვების გუნდს სურს ყოველთვიურად იცოდეს მთლიანი გაყიდვები პროდუქტებიდან, საწყობებიდან და მომხმარებელს რომლებიც ცხოვრობენ საწყობიდან 5 მილის მანძილზე, სადაც ყიდულობენ.

სამწუხაროდ, დიზაინერებს ან არქიტექტორებს შეუძლიათ უბრალოდ იგნორირება გაუკეთონ სივრცის კომპონენტს იმით, რომ იტყვიან: „ჩვენ გვყავს მომხმარებელი, პროდუქტი და მონაცემები დეპოზიტის. მოდით დავიცვათ მანძილი სხვა გამეორებამდე.

"Არასწორი პასუხი. ამ ტიპის ბიზნეს პრობლემა ეხება BI-ს. ეს წარმოადგენს ჩვენი ბიზნესის უფრო ღრმა გაგებას და ჩვენი ანალიტიკოსების ძლიერ ანალიტიკურ სივრცეს. BI არის მარტივი მოთხოვნის ან სტანდარტული მოხსენების, ან თუნდაც OLAP-ის მიღმა. ეს არ ნიშნავს იმას, რომ ეს ტექნოლოგიები არ არის მნიშვნელოვანი თქვენი BI-სთვის, მაგრამ ისინი მხოლოდ არ წარმოადგენენ BI გარემოს.

დიზაინი ინფორმაციის კონტექსტში (დიზაინი საინფორმაციო შინაარსისთვის)

ახლა, როდესაც ჩვენ დავადგინეთ ბიზნეს მოთხოვნები, რომლებიც განასხვავებენ სხვადასხვა ფუნდამენტურ კომპონენტებს, ისინი უნდა იყოს შეტანილი საერთო არქიტექტურულ დიზაინში. ზოგიერთი BI კომპონენტი ჩვენი საწყისი ძალისხმევის ნაწილია, ზოგი კი რამდენიმე თვის განმავლობაში არ განხორციელდება.

თუმცა, ყველა ცნობილი მოთხოვნა აისახება დიზაინში ისე, რომ როდესაც ჩვენ გვჭირდება კონკრეტული ტექნოლოგიის დანერგვა, ჩვენ მზად ვართ ამისათვის. პროექტის შესახებ რაღაც ასახავს ტრადიციულ აზროვნებას.

ეს ნაკრები მონაცემები გამოიყენება შემდგომი გამოყენების მხარდასაჭერად მონაცემები განზომილებიანი ხელმძღვანელობს ჩვენ მიერ გამოვლენილი ბიზნეს საკითხებით. როგორც დამატებითი დოკუმენტები იქმნება, როგორიცაა დიზაინის შემუშავება მონაცემები, ჩვენ დავიწყებთ ფორმირებას, თუ როგორ ი მონაცემები ისინი ვრცელდებიან გარემოში. ჩვენ დავადგინეთ წარმომადგენლობის აუცილებლობა ი მონაცემები განზომილებიანი გზით, მათი დაყოფა (სპეციფიკური სპეციფიკური საჭიროებების მიხედვით) მონაცემთა მარტებად.

შემდეგი კითხვაზე პასუხის გაცემაა: როგორ აშენდება ეს მონაცემთა მარტები?
აშენებთ ვარსკვლავებს კუბების მხარდასაჭერად, ან უბრალოდ კუბებს, ან უბრალოდ ვარსკვლავებს? (ან სწორი კუბურები, ან სწორი ვარსკვლავები). შექმენით არქიტექტურა დამოკიდებული მონაცემთა მარტებისთვის, რომლებიც საჭიროებენ ატომურ ფენას ყველასთვის მონაცემები იძენთ? მიეცით საშუალება დამოუკიდებელ მონაცემთა მარტებს შეიძინონ i მონაცემები პირდაპირ ოპერაციული სისტემებიდან?

რომელი კუბის ტექნოლოგიის სტანდარტიზაციას შეეცდებით?

თქვენ გყავთ უზარმაზარი რაოდენობით ღმერთები მონაცემები საჭიროა განზომილებიანი ანალიზისთვის ან გჭირდებათ კუბურები თქვენი ეროვნული გაყიდვების ძალისგან ყოველკვირეულად თუ ორივე ერთად? აშენებთ ისეთ მძლავრ რამეს, როგორიც არის DB2 OLAP სერვერი ფინანსებისთვის ან Cognos PowerPlay კუბები თქვენი გაყიდვების ორგანიზაციისთვის, ან ორივე? ეს არის დიდი არქიტექტურული დიზაინის გადაწყვეტილებები, რომლებიც გავლენას მოახდენს თქვენს BI გარემოზე აქედან მოყოლებული. დიახ, თქვენ დაადგინეთ OLAP-ის საჭიროება. ახლა როგორ განახორციელებთ ამ ტიპის ტექნიკას და ტექნოლოგიას?

როგორ მოქმედებს ზოგიერთი ყველაზე მოწინავე ტექნოლოგია თქვენს დიზაინზე? დავუშვათ, რომ თქვენ დაადგინეთ სივრცის საჭიროება თქვენს ორგანიზაციაში. ახლა თქვენ უნდა გაიხსენოთ არქიტექტურული ნახატების გამოცემები მაშინაც კი, თუ არ აპირებთ სივრცითი კომპონენტების დამზადებას რამდენიმე თვის განმავლობაში. არქიტექტორმა დღეს უნდა დააპროექტოს იმის მიხედვით, რაც საჭიროა. იწინასწარმეტყველეთ სივრცითი ანალიტიკის საჭიროება, რომელიც ქმნის, ინახავს, ასრულებს და უზრუნველყოფს წვდომას მონაცემები სივრცითი. ეს, თავის მხრივ, უნდა იყოს შეზღუდვა პროგრამული უზრუნველყოფის ტექნოლოგიის ტიპისა და პლატფორმის სპეციფიკაციების შესახებ, რომელთა განხილვაც შეგიძლიათ ამჟამად. მაგალითად, ადმინისტრაციის სისტემა მონაცემთა ბაზა რელაციურ ფენას (RDBMS), რომელსაც თქვენ ასრულებთ თქვენი ატომური ფენისთვის, უნდა ჰქონდეს ძლიერი სივრცითი მასშტაბი. ეს უზრუნველყოფს მაქსიმალურ შესრულებას თქვენს ანალიტიკურ აპლიკაციებში გეომეტრიისა და სივრცითი ობიექტების გამოყენებისას. თუ თქვენი RDBMS ვერ უმკლავდება მონაცემები (სივრცით-ცენტრული) შინაგანად, ამიტომ მოგიწევთ ა მონაცემთა ბაზა (სივრცით-ცენტრული) გარეგანი. ეს ართულებს საკითხების მართვას და კომპრომისს აყენებს თქვენს მთლიან შესრულებას, რომ აღარაფერი ვთქვათ დამატებით პრობლემებზე, რომლებიც შექმნილია თქვენი DBA-ებისთვის, რადგან მათ, ალბათ, აქვთ მინიმალური გაგება საფუძვლების შესახებ. მონაცემები სივრცითაც. მეორეს მხრივ, თუ თქვენი RDMBS ძრავა ამუშავებს ყველა სივრცულ კომპონენტს და მისმა ოპტიმიზატორმა იცის სივრცითი ობიექტების განსაკუთრებული საჭიროებები (მაგალითად, ინდექსირება), მაშინ თქვენი DBA ადვილად უმკლავდება საკითხების მართვას და თქვენ შეგიძლიათ გაზარდოთ შესრულება.

გარდა ამისა, თქვენ უნდა დაარეგულიროთ დადგმის არე და ატომური გარემოს ფენა, რათა შეიცავდეს მისამართის გასუფთავებას (ა

სივრცითი ანალიზის ძირითადი ელემენტი), ასევე კოსმოსური ობიექტების შემდგომი დაზოგვა. ხატვის გამოცემების თანმიმდევრობა გრძელდება ახლა, როდესაც ჩვენ შემოვიღეთ მკაფიო მიმართულების ცნება. ერთი რამ, ეს აპლიკაცია კარნახობს პროგრამული უზრუნველყოფის ტიპს, რომელიც საჭიროა თქვენი ETL ძალისხმევისთვის.

გჭირდებათ პროდუქტები, როგორიცაა Trillium, რომ მისაწოდოთ სუფთა მისამართი, ან თქვენი არჩევანის ETL გამყიდველი ამ ფუნქციის უზრუნველსაყოფად?
ამჟამად მნიშვნელოვანია, რომ დააფასოთ დიზაინის დონე, რომელიც უნდა დასრულდეს თქვენი საწყობის დანერგვის დაწყებამდე. ზემოხსენებულმა მაგალითებმა უნდა აჩვენოს დიზაინის გადაწყვეტილებების სიმრავლე, რომლებიც უნდა მოჰყვეს რაიმე კონკრეტული ბიზნეს მოთხოვნის იდენტიფიკაციას. თუ სწორად იქნა მიღებული, ეს დიზაინის გადაწყვეტილებები ხელს უწყობს ურთიერთდამოკიდებულებას თქვენი გარემოს ფიზიკურ სტრუქტურებს შორის, გამოყენებული ტექნოლოგიების შერჩევასა და ინფორმაციის შინაარსის გავრცელების ნაკადს შორის. ამ ჩვეულებრივი BI არქიტექტურის გარეშე, თქვენი ორგანიზაცია დაექვემდებარება არსებული ტექნოლოგიების ქაოტურ ნაზავს, საუკეთესო შემთხვევაში თავისუფლად შეკერილი ერთმანეთთან აშკარა სტაბილურობის უზრუნველსაყოფად.

ინფორმაციის შინაარსის შენარჩუნება

თქვენი ორგანიზაციისთვის ინფორმაციის ღირებულების მიტანა ძალიან რთული ამოცანაა. საკმარისი გაგებისა და გამოცდილების, ან სათანადო დაგეგმვისა და დიზაინის გარეშე, საუკეთესო გუნდებიც კი მარცხდებიან. მეორეს მხრივ, თუ თქვენ გაქვთ დიდი ინტუიცია და დეტალური დაგეგმვა, მაგრამ არ გაქვთ დისციპლინა შესრულებისთვის, თქვენ უბრალოდ დახარჯეთ თქვენი ფული და დრო, რადგან თქვენი ძალისხმევა განწირულია მარცხისთვის. მესიჯი მკაფიო უნდა იყოს: თუ გაკლიათ ამ უნარებიდან ერთი ან მეტი, გაგება/გამოცდილება ან დაგეგმვა/დიზაინი ან განხორციელების დისციპლინა, ეს ანგრევს ან გაანადგურებს BI ორგანიზაციის შენობას.

არის თქვენი გუნდი საკმარისად მომზადებული? არის ვინმე თქვენს BI გუნდში, ვისაც ესმის BI გარემოში არსებული უზარმაზარი ანალიტიკური ლანდშაფტი და ამ ლანდშაფტის შესანარჩუნებლად საჭირო ტექნიკა და ტექნოლოგიები? არის თუ არა ვინმე თქვენს გუნდში, რომელსაც შეუძლია ამოიცნოს განაცხადის განსხვავება მოწინავეებს შორის

სტატიკური მოხსენება და OLAP, თუ განსხვავებები ROLAP-სა და OLAP-ს შორის? თქვენი გუნდის ერთ-ერთი წევრი ნათლად ცნობს, თუ როგორ უნდა ამოიღოს და როგორ შეიძლება გავლენა იქონიოს საწყობზე ან როგორ შეუძლია საწყობს მხარი დაუჭიროს ამოღების შესრულებას? გუნდის წევრს ესმის მისი ღირებულება მონაცემები სივრცე თუ აგენტზე დაფუძნებული ტექნოლოგია? გყავთ ვინმე, ვინც აფასებს ETL ინსტრუმენტების უნიკალურ გამოყენებას შეტყობინებების ბროკერის ტექნოლოგიის წინააღმდეგ? თუ არ გაქვთ, მიიღეთ ერთი. BI ბევრად აღემატება ნორმალიზებულ ატომურ ფენას, OLAP-ს, ვარსკვლავურ სქემებს და ODS-ს.

BI მოთხოვნების და მათი გადაწყვეტილებების ამოცნობის გაგება და გამოცდილების ქონა აუცილებელია თქვენი შესაძლებლობისთვის, სწორად მოახდინოთ მომხმარებლის საჭიროებები და შეიმუშავოთ და განახორციელოთ მათი გადაწყვეტილებები. თუ თქვენს მომხმარებელთა საზოგადოებას უჭირს მოთხოვნების აღწერა, საწყობის გუნდის ამოცანაა უზრუნველყოს ეს გაგება. მაგრამ თუ საწყობის გუნდი

არ ცნობს BI-ს კონკრეტულ აპლიკაციას - მაგალითად, მონაცემთა მოპოვებას - მაშინ ეს არ არის საუკეთესო რამ, რომ BI გარემო ხშირად შემოიფარგლება მხოლოდ პასიური საცავებით. თუმცა, ამ ტექნოლოგიების იგნორირება არ ამცირებს მათ მნიშვნელობას და მათ ეფექტს თქვენი ორგანიზაციის ბიზნეს დაზვერვის შესაძლებლობების გაჩენაზე, ისევე როგორც საინფორმაციო ლანდშაფტზე, რომლის განვითარებასაც აპირებთ.

დაგეგმვა უნდა მოიცავდეს ნახატის ცნებას და ორივე მოითხოვს კომპეტენტურ ინდივიდს. გარდა ამისა, დიზაინი მოითხოვს გუნდური საწყობის ფილოსოფიას და სტანდარტების დაცვას. მაგალითად, თუ თქვენმა კომპანიამ შექმნა სტანდარტული პლატფორმა ან დაადგინა კონკრეტული RDBMS, რომლის სტანდარტიზაციაც გსურთ მთელ პლატფორმაზე, გუნდის ყველა წევრის პასუხისმგებლობა ეკისრება ამ სტანდარტების დაცვას. ზოგადად, გუნდი ავლენს სტანდარტიზაციის აუცილებლობას (მომხმარებელთა საზოგადოებებში), მაგრამ თავად გუნდს არ სურს დაიცვას სტანდარტები, რომლებიც ასევე დამკვიდრებულია კომპანიის სხვა სფეროებში ან შესაძლოა მსგავს კომპანიებშიც კი. ეს არა მხოლოდ ფარისევლობაა, არამედ ადასტურებს, რომ კომპანიას არ შეუძლია არსებული რესურსების და ინვესტიციების ათვისება. ეს არ ნიშნავს, რომ არ არსებობს სიტუაციები, რომლებიც იძლევიან არასტანდარტიზებულ პლატფორმას ან ტექნოლოგიას; თუმცა, საწყობის ძალისხმევა

მათ უნდა ეჭვიანობით დაიცვან საწარმოს სტანდარტები, სანამ ბიზნესის მოთხოვნები სხვაგვარად არ კარნახობს.

მესამე ძირითადი კომპონენტი, რომელიც საჭიროა BI ორგანიზაციის ასაშენებლად, არის დისციპლინა.
ეს დამოკიდებულია მთლიანობაში, თანაბრად ინდივიდებზე და გარემოზე. პროექტის დამგეგმავებმა, სპონსორებმა, არქიტექტორებმა და მომხმარებლებმა უნდა დააფასონ დისციპლინა, რომელიც აუცილებელია კომპანიის საინფორმაციო ლანდშაფტის შესაქმნელად. დიზაინერებმა უნდა მიმართონ თავიანთი დიზაინის ძალისხმევას ისე, რომ შეავსონ საზოგადოების სხვა საჭირო ძალისხმევა.

მაგალითად, ვთქვათ, რომ თქვენი კომპანია აშენებს ERP აპლიკაციას, რომელსაც აქვს საწყობის კომპონენტი.
ამიტომ ERP დიზაინერების პასუხისმგებლობაა ითანამშრომლონ საწყობის გარემოს გუნდთან, რათა არ მოხდეს კონკურენცია ან უკვე დაწყებული სამუშაოს დუბლირება.

დისციპლინა ასევე არის თემა, რომელიც უნდა განიხილოს მთელმა ორგანიზაციამ და, როგორც წესი, ჩამოყალიბებულია და ენდობა აღმასრულებელ დონეს.
მზად არიან მენეჯერები დაიცვან შემუშავებული მიდგომა? მიდგომა, რომელიც გვპირდება შექმნას საინფორმაციო კონტენტი, რომელიც საბოლოოდ მოუტანს ღირებულებას საწარმოს ყველა სფეროსთვის, მაგრამ შესაძლოა კომპრომისზე წავიდეს ინდივიდუალური ან უწყებრივი დღის წესრიგი? დაიმახსოვრე გამონათქვამი "ყველაფერზე ფიქრი უფრო მნიშვნელოვანია, ვიდრე მხოლოდ ერთ რამეზე ფიქრი". ეს გამონათქვამი მართალია BI ორგანიზაციებისთვის.

სამწუხაროდ, ბევრი საწყობი ყურადღებას ამახვილებს თავის ძალისხმევაზე კონკრეტული განყოფილების ან კონკრეტული მომხმარებლისთვის მიზანმიმართული და ღირებულების მინიჭების მცდელობაზე, ფართო ორგანიზაციისადმი მცირედ გათვალისწინების გარეშე. დავუშვათ, აღმასრულებელი ითხოვს დახმარებას საწყობის გუნდისგან. გუნდი პასუხობს 90-დღიანი ძალისხმევით, რომელიც მოიცავს არა მხოლოდ მენეჯერის მიერ განსაზღვრული შეტყობინებების მოთხოვნების მიწოდებას, არამედ იმის უზრუნველყოფას, რომ ყველა მონაცემები ბაზის შერევა ხდება ატომურ დონეზე შემოთავაზებულ კუბის ტექნოლოგიაში დანერგვამდე.
ეს საინჟინრო დამატება უზრუნველყოფს საწყობის საწარმოს სარგებელს მონაცემები მენეჯერს სჭირდება.
თუმცა, აღმასრულებელი ესაუბრა გარე საკონსულტაციო ფირმებს, რომლებმაც შესთავაზეს მსგავსი განაცხადი 4 კვირაზე ნაკლებ დროში მიწოდებით.

თუ ვივარაუდოთ, რომ შიდა საწყობის გუნდი კომპეტენტურია, აღმასრულებელს აქვს არჩევანი. ვის შეუძლია მხარი დაუჭიროს დამატებით საინჟინრო დისციპლინას, რომელიც საჭიროა საინფორმაციო აქტივების საწარმოს გასაშენებლად ან შეუძლია აირჩიოს საკუთარი გადაწყვეტის სწრაფად შექმნა. ბოლო, როგორც ჩანს, ძალიან ხშირად ირჩევა და მხოლოდ ინფორმაციის კონტეინერების შექმნას ემსახურება, რომელიც მხოლოდ რამდენიმეს ან ცალკეულ პირს სარგებელს მოუტანს.

მოკლე და გრძელვადიანი მიზნები

არქიტექტორებმა და პროექტის დიზაინერებმა უნდა ჩამოაყალიბონ გრძელვადიანი ხედვა საერთო არქიტექტურისა და BI ორგანიზაციაში ზრდის გეგმების შესახებ. მოკლევადიანი მოგებისა და გრძელვადიანი დაგეგმვის ეს კომბინაცია წარმოადგენს BI ძალისხმევის ორ მხარეს. მოკლევადიანი მოგება არის BI-ს ასპექტი, რომელიც დაკავშირებულია თქვენი საწყობის გამეორებასთან.

ეს არის სადაც დამგეგმავები, არქიტექტორები და სპონსორები ყურადღებას ამახვილებენ კონკრეტული კომერციული მოთხოვნების დაკმაყოფილებაზე. სწორედ ამ დონეზე შენდება ფიზიკური სტრუქტურები, ხდება ტექნოლოგიების შეძენა და ტექნიკის დანერგვა. ისინი არავითარ შემთხვევაში არ ითვალისწინებენ კონკრეტულ მოთხოვნებს, როგორც ეს განსაზღვრულია კონკრეტული მომხმარებლის თემების მიერ. ყველაფერი კეთდება კონკრეტული საზოგადოების მიერ განსაზღვრული კონკრეტული მოთხოვნების დასაკმაყოფილებლად.
თუმცა, გრძელვადიანი დაგეგმვა BI-ის მეორე ასპექტია. ეს არის ის, სადაც გეგმები და პროექტები უზრუნველყოფდა ნებისმიერი ფიზიკური სტრუქტურის აშენებას, ტექნოლოგიების შერჩევას და დანერგილი ტექნიკის შემუშავებას საწარმოსკენ. ეს არის გრძელვადიანი დაგეგმვა, რომელიც უზრუნველყოფს თანმიმდევრულობას, რომელიც საჭიროა იმის უზრუნველსაყოფად, რომ ბიზნესის სარგებელი წარმოიქმნას ნებისმიერი მოკლევადიანი მოგებიდან.

დაასაბუთეთ თქვენი BI ძალისხმევა

Un მონაცემთა საწყობი თავისთავად მას არ აქვს თანდაყოლილი ღირებულება. სხვა სიტყვებით რომ ვთქვათ, არ არსებობს თანდაყოლილი მნიშვნელობა საწყობის ტექნოლოგიებსა და განხორციელების ტექნიკას შორის.

ნებისმიერი სასაწყობო ძალისხმევის ღირებულება ვლინდება საწყობის გარემოს და დროთა განმავლობაში კულტივირებული ინფორმაციის კონტენტის შედეგად შესრულებულ ქმედებებში. ეს არის კრიტიკული პუნქტი, რომელიც უნდა გესმოდეთ, სანამ ოდესმე შეეცდებით შეაფასოთ სადმე ინიციატივის ღირებულება.

ძალიან ხშირად, არქიტექტორები და დიზაინერები ცდილობენ გამოიყენონ ღირებულება საწყობის ფიზიკურ და ტექნიკურ კომპონენტებზე, როდესაც სინამდვილეში ღირებულება ეფუძნება ბიზნეს პროცესებს, რომლებზეც დადებით გავლენას ახდენს საწყობი და კარგად შეძენილი ინფორმაცია.

აქ არის BI-ს დაარსების გამოწვევა: როგორ ამართლებთ ინვესტიციას? თუ სახლს არ აქვს შინაგანი ღირებულება, პროექტის დიზაინერებმა უნდა გამოიკვლიონ, განსაზღვრონ და დააფორმონ სარგებელი, რომელიც მიღწეულია იმ პირების მიერ, რომლებიც გამოიყენებენ საწყობს კონკრეტული ბიზნეს პროცესების ან დაცული ინფორმაციის ღირებულების გასაუმჯობესებლად, ან ორივე ერთად.

საკითხის გასართულებლად, ნებისმიერი ბიზნეს პროცესი, რომელიც გავლენას მოახდენს სასაწყობო ძალისხმევით, შეიძლება უზრუნველყოს "მნიშვნელოვანი" ან "მცირე" სარგებელი. მნიშვნელოვანი სარგებელი იძლევა ხელშესახებ მეტრიკას ინვესტიციის ანაზღაურების (ROI) გასაზომად - მაგალითად, ინვენტარის დამატებით დროში გადაქცევა კონკრეტული პერიოდის განმავლობაში ან ტრანსპორტირების დაბალი ღირებულება თითო გადაზიდვისთვის. უფრო რთულია დახვეწილი უპირატესობების განსაზღვრა, როგორიცაა ინფორმაციის ხელმისაწვდომობის გაუმჯობესება, ხელშესახები ღირებულების თვალსაზრისით.

დააკავშირეთ თქვენი პროექტი, რომ იცოდეთ საქმიანი მოთხოვნები

ძალიან ხშირად, პროექტის დამგეგმავები ცდილობენ დააკავშირონ საწყობის ღირებულება ამორფული საწარმოს მიზნებთან. განცხადებით, რომ "საწყობის ღირებულება ეფუძნება ჩვენს უნარს, დავაკმაყოფილოთ სტრატეგიული მოთხოვნები", ჩვენ ვხსნით დისკუსიას სასიამოვნოდ. მაგრამ მხოლოდ ეს არ არის საკმარისი იმის დასადგენად, აქვს თუ არა აზრი ინვენტარიზაციაში ინვესტირებას. უმჯობესია დაუკავშიროთ საწყობის გამეორებები კონკრეტულ, ცნობილ ბიზნეს მოთხოვნებს.

გაზომეთ ROI

ROI-ის გამოთვლა საწყობში შეიძლება იყოს განსაკუთრებით რთული. განსაკუთრებით რთულია თუ უპირატესობა

კონკრეტული გამეორების პრინციპი არის ის, რაც არ არის ხელშესახები ან ადვილი გასაზომი. ერთმა კვლევამ აჩვენა, რომ მომხმარებლები აღიქვამენ BI ინიციატივების ორ მთავარ სარგებელს:

▪ შექმენით გადაწყვეტილებების მიღების უნარი
▪ შექმენით ინფორმაციაზე წვდომა
ეს სარგებელი არის რბილი (ან რბილი) სარგებელი. ადვილია იმის დანახვა, თუ როგორ შეგვიძლია გამოვთვალოთ ROI მძიმე (ან ძირითადი) სარგებელის საფუძველზე, როგორიცაა ტრანსპორტირების ხარჯების შემცირება, მაგრამ როგორ გავზომოთ უკეთესი გადაწყვეტილებების მიღების უნარი?
ეს ნამდვილად გამოწვევაა პროექტის დამგეგმავებისთვის, როდესაც ისინი ცდილობენ დაარწმუნონ კომპანია ინვესტიცია განახორციელოს კონკრეტულ საწყობში. გაყიდვების გაზრდა ან დანახარჯების შემცირება აღარ არის ცენტრალური თემები, რომლებიც განაპირობებს BI გარემოს.
ამის ნაცვლად, თქვენ ეძებთ ბიზნეს მოთხოვნებს ინფორმაციის უკეთესი წვდომისთვის, რათა კონკრეტულმა განყოფილებამ შეძლოს უფრო სწრაფი გადაწყვეტილებების მიღება. ეს არის სტრატეგიული დრაივერები, რომლებიც თანაბრად მნიშვნელოვანია საწარმოსთვის, მაგრამ უფრო ბუნდოვანი და უფრო რთული დასახასიათებელია ხელშესახები მეტრიკის მიხედვით. ამ შემთხვევაში, ROI-ის გამოთვლა შეიძლება იყოს შეცდომაში შემყვანი, თუ არა შეუსაბამო.
პროექტის დამგეგმავებმა უნდა შეძლონ ხელშესახები ღირებულების დემონსტრირება აღმასრულებლებისთვის, რათა გადაწყვიტონ, ღირს თუ არა ინვესტიცია კონკრეტულ გამეორებაში. თუმცა, ჩვენ არ შემოგთავაზებთ ROI-ის გამოთვლის ახალ მეთოდს და არც რაიმე არგუმენტს მოვიყვანთ მის სასარგებლოდ ან წინააღმდეგ.
არსებობს მრავალი სტატია და წიგნი, რომლებიც განიხილავენ ROI-ის გამოთვლის საფუძვლებს. არსებობს სპეციალური ღირებულების წინადადებები, როგორიცაა ინვესტიციის ღირებულება (VOI), შემოთავაზებული ისეთი ჯგუფების მიერ, როგორიცაა Gartner, რომელთა კვლევაც შეგიძლიათ. ამის ნაცვლად, ჩვენ ყურადღებას გავამახვილებთ ნებისმიერი ROI-ის ან სხვა ღირებულების წინადადებების ძირითად ასპექტებზე, რომლებიც უნდა გაითვალისწინოთ. ROI-ის გამოყენება გარდა არგუმენტისა „მძიმე“ უპირატესობებისა და „რბილი“ უპირატესობების შესახებ, რომლებიც დაკავშირებულია BI ძალისხმევასთან, არსებობს სხვა საკითხები, რომლებიც გასათვალისწინებელია ROI-ს გამოყენებისას. Მაგალითად:

მიაწერეთ ძალიან ბევრი დანაზოგი DW-ის ძალისხმევას, რომელიც მაინც მოხდებოდა
დავუშვათ, რომ თქვენი კომპანია გადავიდა მთავარი არქიტექტურიდან განაწილებულ UNIX გარემოში. ამრიგად, ნებისმიერი დანაზოგი, რომელიც შეიძლება (ან შეიძლება არ) იყოს რეალიზებული ამ ძალისხმევის შედეგად, არ უნდა მიეწეროს ექსკლუზიურად, თუ საერთოდ (?), საწყობს.

ყველაფრის არ აღრიცხვა ძვირია. და ბევრი რამ არის გასათვალისწინებელი. განვიხილოთ შემდეგი სია:

▪ დაწყების ღირებულება, მიზანშეწონილობის ჩათვლით.
▪ გამოყოფილი ტექნიკის ღირებულება შესაბამისი შენახვისა და კომუნიკაციებით
▪ პროგრამული უზრუნველყოფის ღირებულება, მართვის ჩათვლით მონაცემები და კლიენტის/სერვერის გაფართოებები, ETL პროგრამული უზრუნველყოფა, DSS ტექნოლოგიები, ვიზუალიზაციის ხელსაწყოები, დაგეგმვისა და სამუშაო პროცესის აპლიკაციები და მონიტორინგის პროგრამული უზრუნველყოფა, .
▪ სტრუქტურის დიზაინის ღირებულება მონაცემები, შექმნით და ოპტიმიზაციით
▪ პროგრამული უზრუნველყოფის განვითარების ღირებულება პირდაპირ კავშირშია BI ძალისხმევასთან
▪ ადგილზე მხარდაჭერის ღირებულება, შესრულების ოპტიმიზაციის ჩათვლით, პროგრამული უზრუნველყოფის ვერსიის კონტროლისა და დახმარების ოპერაციების ჩათვლით გამოიყენეთ "Big-Bang" ROI. საწყობის, როგორც ერთიანი, გიგანტური ძალისხმევის აშენება განწირულია წარუმატებლად, ამიტომაც კი გამოთვალეთ ROI მსხვილი საწარმოს ინიციატივისთვის. შეთავაზება გასაკვირია და დამგეგმავები აგრძელებენ უსუსურ მცდელობებს შეაფასონ მთელი ძალისხმევის ღირებულება. რატომ ცდილობენ დამგეგმავები დააყენონ ფულადი ღირებულება ბიზნეს ინიციატივისთვის, თუ ფართოდ არის ცნობილი და მიღებული, რომ კონკრეტული გამეორებების შეფასება რთულია? როგორ არის შესაძლებელი? ეს შეუძლებელია რამდენიმე გამონაკლისის გარდა. არ გააკეთო. ახლა, როდესაც ჩვენ დავადგინეთ, რა არ უნდა გავაკეთოთ ROI-ის გამოთვლისას, აქ არის რამდენიმე პუნქტი, რომელიც დაგვეხმარება საიმედო პროცესის ჩამოყალიბებაში თქვენი BI ძალისხმევის ღირებულების შესაფასებლად.

ROI კონსენსუსის მიღება. თქვენი BI ძალისხმევის ღირებულების შესაფასებლად თქვენი არჩევანის ტექნიკის მიუხედავად, მასზე უნდა შეთანხმდნენ ყველა მხარე, მათ შორის პროექტის დიზაინერები, სპონსორები და ბიზნესის აღმასრულებლები.

შეამცირეთ ROI იდენტიფიცირებად ნაწილებად. აუცილებელი ნაბიჯი ROI-ის გონივრული გაანგარიშებისკენ არის ამ გაანგარიშების ფოკუსირება კონკრეტულ პროექტზე. ეს საშუალებას გაძლევთ შეაფასოთ ღირებულება კონკრეტული ბიზნეს მოთხოვნების დაკმაყოფილების საფუძველზე

განსაზღვრეთ ხარჯები. როგორც აღვნიშნეთ, გასათვალისწინებელია მრავალი ხარჯი. გარდა ამისა, ხარჯები უნდა მოიცავდეს არა მხოლოდ ერთ გამეორებასთან დაკავშირებულ ხარჯებს, არამედ საწარმოს სტანდარტებთან შესაბამისობის უზრუნველყოფას.

განსაზღვრეთ სარგებელი. ROI-ის მკაფიოდ დაკავშირებით კონკრეტულ ბიზნეს მოთხოვნებთან, ჩვენ უნდა შევძლოთ განვსაზღვროთ სარგებელი, რომელიც გამოიწვევს მოთხოვნების დაკმაყოფილებას.

შეამცირეთ ხარჯები და სარგებელი გარდაუვალ მოგებაში. ეს საუკეთესო გზაა თქვენი შეფასებების დაფუძნებისთვის წმინდა მიმდინარე ღირებულებაზე (NPV) და არა მომავალი შემოსავლის მომავალი ღირებულების პროგნოზირების მცდელობისგან.

დაიცავით თქვენი ROI-ის გაყოფის დრო მინიმუმამდე. ის კარგად არის დადასტურებული იმ დიდი ხნის განმავლობაში, რაც გამოიყენება თქვენს ROI-ში.

გამოიყენეთ ერთზე მეტი ROI ფორმულა. ROI-ის პროგნოზირების მრავალი მეთოდი არსებობს და თქვენ უნდა დაგეგმოთ, გამოიყენოთ თუ არა ერთი ან მეტი მათგანი, მათ შორის წმინდა მიმდინარე ღირებულება, შიდა ანაზღაურება (IRR) და ანაზღაურება.

განმეორებადი პროცესის განსაზღვრა. ეს გადამწყვეტია ნებისმიერი გრძელვადიანი ღირებულების გამოსათვლელად. ერთი განმეორებადი პროცესი უნდა იყოს დოკუმენტირებული ყველა პროექტის შემდგომი თანმიმდევრობისთვის.

ჩამოთვლილი პრობლემები ყველაზე გავრცელებულია საწყობის გარემოში ექსპერტების მიერ განსაზღვრული. მენეჯმენტის დაჟინებული მოთხოვნა „Big-Bang“ ROI-ის მიწოდებაზე ძალიან დეზორიენტირებადია. თუ თქვენ დაიწყებთ ROI-ს ყველა გამოთვლას მათი იდენტიფიცირებადი, ხელშესახები ნაწილებად დაყოფით, თქვენ გაქვთ კარგი შანსი, შეაფასოთ ზუსტი ROI ნიშანი.

კითხვები ROI უპირატესობებთან დაკავშირებით

როგორიც არ უნდა იყოს თქვენი სარგებელი, რბილი თუ მყარი, შეგიძლიათ გამოიყენოთ რამდენიმე ძირითადი კითხვა მათი ღირებულების დასადგენად. მაგალითად, მარტივი სკალირების სისტემის გამოყენებით, 1-დან 10-მდე, შეგიძლიათ გაზომოთ ნებისმიერი ძალისხმევის გავლენა შემდეგი კითხვების გამოყენებით:

როგორ შეაფასებდით გაგებას მონაცემები მიჰყვებით თქვენი კომპანიის ამ პროექტს?
როგორ შეაფასებდით პროცესის გაუმჯობესებას ამ პროექტის შედეგად?
როგორ შეაფასებდით ახალი შეხედულებებისა და დასკვნების გავლენას, რომლებიც ახლა ხელმისაწვდომია ამ გამეორებით
რა გავლენა მოახდინა ახალმა და ეფექტურმა გამომთვლელმა გარემომ ნასწავლის შედეგად? თუ ამ კითხვებზე პასუხები ცოტაა, შესაძლებელია, რომ კომპანია არ ღირდეს განხორციელებული ინვესტიცია. მაღალი ქულის მქონე კითხვები მიუთითებს მნიშვნელოვან ღირებულების მიღწევებზე და უნდა იყოს სახელმძღვანელო შემდგომი გამოკვლევისთვის. მაგალითად, პროცესის გაუმჯობესების მაღალმა ქულამ დიზაინერები უნდა გამოიკვლიონ, თუ როგორ გაუმჯობესდა პროცესები. თქვენ შეიძლება აღმოაჩინოთ, რომ ზოგიერთი ან ყველა მიღებული მოგება ხელშესახებია და, შესაბამისად, ფულადი ღირებულება შეიძლება ადვილად იქნას გამოყენებული. მაქსიმალური სარგებლობის მიღება პირველი გამეორებიდან საწყობი თქვენი საწარმოს ძალისხმევის უდიდესი შედეგი ხშირად პირველი რამდენიმე გამეორებაა. ეს ადრეული მცდელობები ტრადიციულად ადგენს საზოგადოებისთვის ყველაზე სასარგებლო ინფორმაციის შინაარსს და ხელს უწყობს ტექნოლოგიური საფუძვლის ჩამოყალიბებას შემდგომი BI აპლიკაციებისთვის. როგორც წესი, ყოველი მომდევნო შემდგომი მონაცემები სასაწყობო პროექტები სულ უფრო და უფრო ნაკლებ დამატებით ღირებულებას მოაქვს საწარმოს მთლიანობაში. ეს განსაკუთრებით ეხება იმ შემთხვევაში, თუ გამეორება არ ამატებს ახალ თემებს ან არ აკმაყოფილებს ახალი მომხმარებლის საზოგადოების საჭიროებებს.

შენახვის ეს ფუნქცია ასევე ვრცელდება მზარდი დასტაებისთვის მონაცემები ისტორიკოსები. როგორც შემდგომი ძალისხმევა მოითხოვს მეტს მონაცემები და კიდევ როგორ მონაცემები დროთა განმავლობაში საწყობში შეედინება, უმეტესობა მონაცემები იგი ნაკლებად რელევანტური ხდება გამოყენებული ანალიზისთვის. ესენი მონაცემები მათ ხშირად უწოდებენ მონაცემები მიძინებული და ყოველთვის ძვირია მათი შენახვა, რადგან ისინი თითქმის არასოდეს გამოიყენება.

რას ნიშნავს ეს პროექტის სპონსორებისთვის? არსებითად, ადრეული სპონსორები იზიარებენ იმაზე მეტს, ვიდრე ინვესტიციის ღირებულებაა. ეს არის პირველადი, რადგან ისინი სტიმულს წარმოადგენენ საწყობის ფართო ტექნოლოგიისა და რესურსების გარემოს ფენის ჩამოყალიბებისთვის, მათ შორის ორგანული.

მაგრამ ამ პირველ ნაბიჯებს მოაქვს უმაღლესი ღირებულება და ამიტომ პროექტის დიზაინერებს ხშირად უწევთ ინვესტიციის გამართლება.
თქვენი BI ინიციატივის შემდეგ შესრულებულ პროექტებს შეიძლება ჰქონდეთ დაბალი (პირველთან შედარებით) და პირდაპირი ხარჯები, მაგრამ ნაკლები ღირებულება მოუტანს კომპანიას.

და ორგანიზაციის მფლობელებმა უნდა დაიწყონ დაგროვების გადაყრის განხილვა მონაცემები და ნაკლებად შესაბამისი ტექნოლოგიები.

მონაცემთა მოპოვება: მოპოვება dati

მრავალი არქიტექტურული კომპონენტი მოითხოვს ცვალებადობას მონაცემთა მოპოვების ტექნოლოგიებსა და ტექნიკაში.
მაგალითად, სხვადასხვა "აგენტები" ინტერესის წერტილების შესასწავლად მომხმარებელს, კომპანიის ოპერაციული სისტემები და თავად dw. ეს აგენტები შეიძლება იყოს მოწინავე ნერვული ქსელები, რომლებიც გაწვრთნილი არიან POT ტენდენციებზე, როგორიცაა სამომავლო პროდუქციის მოთხოვნა გაყიდვების აქციებზე დაყრდნობით; წესებზე დაფუძნებული ძრავები კომპლექტზე რეაგირებისთვის dato გარემოებები, მაგალითად, სამედიცინო დიაგნოსტიკა და მკურნალობის რეკომენდაციები; ან თუნდაც უბრალო აგენტები გამონაკლისების მოხსენების როლით ტოპ აღმასრულებლებისთვის. ზოგადად ეს მოპოვების პროცესები მონაცემები si

გადაამოწმეთ რეალურ დროში; ამიტომ ისინი მთლიანად უნდა იყოს გაერთიანებული მოძრაობასთან მონაცემები სტესი

ონლაინ ანალიტიკური დამუშავების დამუშავება

ონლაინ ანალიტიკა

დაჭრის, კამათლის, გაგორების, გაბურღვის და ანალიზის უნარი
what-if, არის IBM ტექნოლოგიის კომპლექტის ფარგლებში. მაგალითად, ონლაინ ანალიტიკური დამუშავების (OLAP) ფუნქციები არსებობს DB2-სთვის, რომელიც ახორციელებს განზომილებიანი ანალიზის პროგრამულ ძრავში. მონაცემთა ბაზა იგივე .

ფუნქციები ამატებს განზომილებიანი სარგებლობას SQL-ს და სარგებლობს DB2-ის ბუნებრივი ნაწილის ყველა უპირატესობით. OLAP ინტეგრაციის კიდევ ერთი მაგალითია ამოღების ინსტრუმენტი, DB2 OLAP სერვერის ანალიზატორი. ეს ტექნოლოგია საშუალებას აძლევს DB2 OLAP სერვერის კუბებს სწრაფად და ავტომატურად გაანალიზდეს მნიშვნელობის მნიშვნელობების დასადგენად და მოხსენებაში. მონაცემები უჩვეულო ან მოულოდნელი მთელ კუბში ბიზნეს ანალიტიკოსისთვის. და ბოლოს, DW ცენტრის ფუნქციები იძლევა საშუალებას, რომ არქიტექტორებმა გააკონტროლონ, სხვა საკითხებთან ერთად, DB2 OLAP სერვერის კუბის პროფილი, როგორც ETL პროცესების ბუნებრივი ნაწილი.

სივრცითი ანალიზი სივრცითი ანალიზი

სივრცე წარმოადგენს პანორამისთვის საჭირო ანალიტიკური წამყვანების (წამყვანების) ნახევარს
ანალიტიკური ფართო (დრო წარმოადგენს მეორე ნახევარს). საწყობის ატომური დონე, რომელიც გამოსახულია სურათ 1.1-ზე, მოიცავს როგორც დროის, ასევე სივრცის საფუძვლებს. დროის შტამპები წამყვანის ანალიზებს დროის მიხედვით და მისამართის ინფორმაციის წამყვანის ანალიზებს სივრცის მიხედვით. დროის ანაბეჭდები ატარებენ ანალიზს დროის მიხედვით, ხოლო მისამართის ინფორმაცია ახორციელებს ანალიზს სივრცის მიხედვით. დიაგრამა გვიჩვენებს გეოკოდირებას - მისამართების გადაქცევის პროცესს წერტილებად რუკაზე ან წერტილებში სივრცეში ისე, რომ ცნებები, როგორიცაა მანძილი და შიგნით/გარეთ შეიძლება გამოყენებულ იქნას ანალიზში - ჩატარებული ატომურ დონეზე და სივრცითი ანალიზი, რომელიც ხელმისაწვდომია ანალიტიკოსი. IBM უზრუნველყოფს სივრცით გაფართოებებს, რომლებიც შემუშავებულია გარემოს დაცვის სისტემის კვლევის ინსტიტუტთან (ESRI), რათა მონაცემთა ბაზა DB2 ისე, რომ კოსმოსური ობიექტები შეიძლება იყოს შენახული, როგორც ჩვეულებრივი ნაწილი მონაცემთა ბაზა ურთიერთობითი. db2

სივრცითი გაფართოებები, ასევე გთავაზობთ ყველა SQL გაფართოებას, რათა ისარგებლოს სივრცითი ანალიზით. მაგალითად, SQL გაფართოებები შეკითხვის წინააღმდეგ
მისამართებს შორის მანძილი ან არის თუ არა წერტილი განსაზღვრული პოლიგონური არეალის შიგნით თუ გარეთ, არის ანალიტიკური სტანდარტი სივრცითი გაფართოებით. დამატებითი ინფორმაციისთვის იხილეთ თავი 16.

მონაცემთა ბაზა-Resident Tools Tools მონაცემთა ბაზა-Რეზიდენტი

DB2-ს აქვს მრავალი BI-რეზიდენტი SQL ფუნქცია, რომელიც ეხმარება ანალიზის მოქმედებას. Ესენი მოიცავს:

რეკურსიის ფუნქციები ანალიზის შესასრულებლად, როგორიცაა ” ფრენის ყველა შესაძლო ბილიკის პოვნა San Francisco a ნიუ იორკი".
ანალიტიკური ფუნქციები რეიტინგისთვის, კუმულაციური ფუნქციები, კუბი და შეკრება ამოცანების გასაადვილებლად, რომლებიც ჩვეულებრივ ხდება მხოლოდ OLAP ტექნოლოგიით, ახლა ძრავის ბუნებრივი ნაწილია. მონაცემთა ბაზა
შედეგების შემცველი ცხრილების შექმნის შესაძლებლობა
გამყიდველები მონაცემთა ბაზა ლიდერები აერთიანებენ უფრო მეტ BI შესაძლებლობებს მონაცემთა ბაზა სტესო
მთავარი მომწოდებლები მონაცემთა ბაზა ისინი აერთიანებენ უფრო მეტ BI შესაძლებლობებს მონაცემთა ბაზა სტესო
ეს უზრუნველყოფს BI გადაწყვეტილებების უკეთეს შესრულებას და შესრულების მეტ ვარიანტს.
DB2 V8-ის მახასიათებლები და ფუნქციები დეტალურად არის განხილული შემდეგ თავებში:
ტექნიკური არქიტექტურა და მონაცემთა მართვის საფუძვლები (თავი 5)

DB2 BI საფუძვლები (თავი 6)
DB2 მატერიალიზებული შეკითხვის ცხრილები (თავი 7)
DB2 OLAP ფუნქციები (თავი 13)
DB2 გაძლიერებული BI ფუნქციები და ფუნქციები (თავი 15) მონაცემთა მიწოდების გამარტივებული სისტემა მიწოდების სისტემა მონაცემები გამარტივებული

1.1-ზე გამოსახული არქიტექტურა მოიცავს მრავალ კონსტრუქციას მონაცემები ფიზიკური. ერთი არის საწყობი მონაცემები მოქმედი. ზოგადად, ODS არის სუბიექტზე ორიენტირებული, ინტეგრირებული და მიმდინარე ობიექტი. თქვენ შექმნით ODS-ს, მაგალითად, გაყიდვების ოფისის მხარდასაჭერად. ODS გაყიდვები შეავსებს მონაცემები მრავალი განსხვავებული სისტემიდან, მაგრამ შეინარჩუნებს მხოლოდ, მაგალითად, დღევანდელ ტრანზაქციებს. ODS ასევე შეიძლება განახლდეს დღეში ბევრჯერ. ამავდროულად, პროცესები უბიძგებს მონაცემები ინტეგრირებულია სხვა აპლიკაციებში. ეს სტრუქტურა სპეციალურად შექმნილია ინტეგრაციისთვის მონაცემები მიმდინარე და დინამიური და იქნება სავარაუდო კანდიდატი რეალურ დროში ანალიტიკის მხარდასაჭერად, როგორიცაა სერვისის აგენტებისთვის მიწოდება მომხმარებელს კლიენტის მიმდინარე გაყიდვების ინფორმაცია თავად საწყობიდან გაყიდვების ტენდენციის ინფორმაციის ამოღებით. სურათი 1.1-ზე ნაჩვენები სხვა სტრუქტურა არის dw-ის ფორმალური მდგომარეობა. ეს არ არის მხოლოდ აუცილებელი ინტეგრაციის განხორციელების ადგილი, ხარისხი მონაცემები, და გარდაქმნის მონაცემები შემომავალი საწყობი, მაგრამ ასევე არის საიმედო და დროებითი შესანახი ადგილი მონაცემები რეპლიკაციები, რომლებიც შეიძლება გამოყენებულ იქნას რეალურ დროში ანალიზში. თუ გადაწყვეტთ გამოიყენოთ ODS ან დადგმის ზონა, ერთ-ერთი საუკეთესო ინსტრუმენტი ამ სტრუქტურების დასასახლებლად მონაცემები სხვადასხვა ოპერაციული წყაროების გამოყენება არის DB2-ის ჰეტეროგენული განაწილებული მოთხოვნა. ეს შესაძლებლობა მიეწოდება არასავალდებულო DB2 ფუნქციით, სახელწოდებით DB2 Relational Connect (მხოლოდ მოთხოვნა) და DB2 DataJoiner-ის მეშვეობით (ცალკე პროდუქტი, რომელიც აწვდის შეკითხვის, ჩასმის, განახლებისა და წაშლის შესაძლებლობას ჰეტეროგენულ განაწილებულ RDBMS-ებში).

ეს ტექნოლოგია საშუალებას აძლევს არქიტექტორებს მონაცემები მიბმას მონაცემები წარმოება ანალიტიკური პროცესებით. ტექნოლოგიას არა მხოლოდ შეუძლია მოერგოს რეპლიკაციის ნებისმიერ მოთხოვნას, რომელიც შეიძლება წარმოიშვას რეალურ დროში ანალიტიკით, არამედ მას ასევე შეუძლია დაუკავშირდეს მონაცემთა მრავალფეროვან ბაზას. მონაცემები ყველაზე პოპულარული, მათ შორის DB2, Oracle, Sybase, SQL Server, Informix და სხვა. DB2 DataJoiner შეიძლება გამოყენებულ იქნას სტრუქტურის დასასახლებლად მონაცემები ფორმალური, როგორც ODS ან თუნდაც მუდმივი მაგიდა, რომელიც წარმოდგენილია საწყობში, რომელიც შექმნილია მყისიერი განახლებების სწრაფი აღდგენისთვის ან გასაყიდად. რა თქმა უნდა, იგივე სტრუქტურები მონაცემები შეიძლება დასახლდეს გამოყენებით

კიდევ ერთი მნიშვნელოვანი ტექნოლოგია, რომელიც შექმნილია რეპლიკაციისთვის მონაცემები, IBM DataPropagator Relational. (DataPropagator არის ცალკე პროდუქტი ცენტრალური სისტემებისთვის. DB2 UNIX, Linux, Windows და OS/2 მოიცავს მონაცემთა რეპლიკაციის სერვისებს მონაცემები როგორც სტანდარტული მახასიათებელი).
გადაადგილების კიდევ ერთი მეთოდი მონაცემები საწარმოს ირგვლივ მოქმედი არის საწარმოს აპლიკაციის ინტეგრატორი, სხვაგვარად ცნობილი როგორც შეტყობინებების ბროკერი. ეს უნიკალური ტექნოლოგია საშუალებას აძლევს შეუდარებელ კონტროლს დამიზნებისა და გადაადგილებისთვის. მონაცემები კომპანიის გარშემო. IBM-ს აქვს ყველაზე ფართოდ გამოყენებული შეტყობინებების ბროკერი, MQSeries, ან პროდუქტის ვარიაცია, რომელიც მოიცავს მოთხოვნებს e-commerce, IBM WebSphere MQ.
Per più discussione su come sfruttare MQ per sostenere un magazzino e un ambiente BI, visitare ვებგვერდი del libro. Per ora, è sufficiente dire che questa tecnologia è un mezzo eccellente per catturare e trasformare (utilizzando MQSeries Integrator) მონაცემები ორიენტირებული (მიზნობრივი) ოპერატორები, რომლებიც დაკომპლექტებულია BI გადაწყვეტილებებისთვის. MQ ტექნოლოგია ინტეგრირებული და შეფუთულია UDB V8-ში, რაც იმას ნიშნავს, რომ შეტყობინებების რიგები ახლა შეიძლება იმართებოდეს ისე, თითქოს ისინი იყოს DB2 ცხრილები. კონცეფცია შედუღების რიგში შეტყობინებები და სამყაროს მონაცემთა ბაზა ურთიერთობები მიდის მძლავრი მიწოდების გარემოსკენ მონაცემები.

Zero-Latency ნულოვანი შეყოვნება

IBM-ის საბოლოო სტრატეგიული მიზანი არის ნულოვანი ლატენტური ანალიზი. როგორც განსაზღვრავს
Gartner, BI სისტემას უნდა შეეძლოს დასკვნის გაკეთება, ათვისება და ანალიტიკოსებისთვის ინფორმაციის მიწოდება მოთხოვნის შემთხვევაში. გამოწვევა, რა თქმა უნდა, არის ის, თუ როგორ უნდა ავურიოთ მონაცემები მიმდინარე და რეალურ დროში საჭირო ისტორიული ინფორმაციით, როგორიცაა ი მონაცემები დაკავშირებული ნიმუში/ტენდენცია, ან მოპოვებული გაგება, როგორიცაა მომხმარებლის პროფილირება.

ასეთი ინფორმაცია მოიცავს, მაგალითად, იდენტიფიკაციას მომხმარებელს მაღალი ან დაბალი რისკის ან რომელი პროდუქტების ი მომხმარებელს ისინი დიდი ალბათობით შეიძენენ, თუ უკვე აქვთ ყველი კალათებში.

ნულოვანი შეყოვნების მიღწევა რეალურად დამოკიდებულია ორ ფუნდამენტურ მექანიზმზე:

სრული გაერთიანება მონაცემები რომლებიც გაანალიზებულია BI-ს მიერ შექმნილი დადგენილი ტექნიკითა და ინსტრუმენტებით
მიწოდების სისტემა მონაცემები ეფექტურია რეალურ დროში ანალიტიკის რეალურად ხელმისაწვდომობის უზრუნველსაყოფად. ეს წინაპირობები ნულოვანი შეყოვნებისთვის არ განსხვავდება IBM-ის მიერ დასახული და ზემოთ აღწერილი ორი მიზნისგან. ახლო შეჯვარება მონაცემები ეს არის IBM-ის უწყვეტი ინტეგრაციის პროგრამის ნაწილი. და შექმენით მიწოდების სისტემა მონაცემები ეფექტური მთლიანად დამოკიდებულია არსებულ ტექნოლოგიაზე, რომელიც ამარტივებს მიწოდების პროცესს მონაცემები. შედეგად, IBM-ის სამი მიზნიდან ორი გადამწყვეტია მესამეს განსახორციელებლად. IBM შეგნებულად ავითარებს თავის ტექნოლოგიას, რათა უზრუნველყოს ნულოვანი შეყოვნება საწყობის ძალისხმევის რეალობად. რეზიუმე / სინთეზი BI ორგანიზაცია გთავაზობთ გზის რუკას თქვენი გარემოს შესაქმნელად
განმეორებით. ის უნდა იყოს მორგებული, რათა ასახავდეს თქვენი ბიზნესის საჭიროებებს, როგორც ამჟამინდელ, ასევე მომავალს. ფართო არქიტექტურული ხედვის გარეშე, საწყობის გამეორება არის ცენტრალური საწყობის შემთხვევითი განხორციელებები, რომლებიც მცირეს აკეთებენ ფართო, ინფორმაციული საწარმოს შესაქმნელად. პირველი დაბრკოლება პროექტის მენეჯერებისთვის არის ის, თუ როგორ უნდა გაამართლონ BI ორგანიზაციის განვითარებისთვის საჭირო ინვესტიციები. მიუხედავად იმისა, რომ ROI გაანგარიშება რჩება საწყობის განხორციელების საყრდენად, ზუსტი პროგნოზირება უფრო რთული ხდება. ამან გამოიწვია სხვა მეთოდები იმის დასადგენად, იღებთ თუ არა თქვენი ფულის ღირებულებას. მაგალითად, ინვესტიციის ღირებულება 2 (VOI), დაწინაურებულია, როგორც გამოსავალი. ეს ევალება არქიტექტორებს მონაცემები და პროექტის დამგეგმავები მიზანმიმართულად აწარმოებენ და აწვდიან ინფორმაციას მომხმარებელთა ასოციაციებს და არა უბრალოდ მათ მომსახურებას მონაცემები. ამ ორს შორის დიდი განსხვავებაა. ინფორმაცია არის ის, რაც განასხვავებს გადაწყვეტილების მიღებასა და ეფექტურობას; შედარებით, ი მონაცემები ისინი ქმნიან ბლოკებს ამ ინფორმაციის მისაღებად.

თუნდაც კრიტიკული წყაროს მიმართ მონაცემები ბიზნეს მოთხოვნების დასაკმაყოფილებლად, BI გარემოს უფრო დიდი როლი უნდა ჰქონდეს საინფორმაციო შინაარსის შექმნაში. ჩვენ უნდა გადავდგათ დამატებითი ნაბიჯები გასაწმენდად, ინტეგრირებისთვის, ტრანსფორმაციისთვის ან სხვაგვარად შევქმნათ საინფორმაციო კონტენტი, რომელზეც მომხმარებლებს შეუძლიათ იმოქმედონ, შემდეგ კი უნდა დავრწმუნდეთ, რომ ეს ქმედებები და გადაწყვეტილებები, სადაც გონივრულია, აისახოს BI გარემოში. თუ საწყობს გადავიტანთ მხოლოდ მომსახურეობაზე მონაცემები, უზრუნველყოფილია, რომ მომხმარებელთა ასოციაციები შექმნიან საინფორმაციო შინაარსს, რომელიც საჭიროა ზომების მისაღებად. ეს უზრუნველყოფს, რომ მათი საზოგადოება შეძლებს უკეთესი გადაწყვეტილებების მიღებას, მაგრამ საწარმო განიცდის ცოდნის ნაკლებობას, რომელიც მათ გამოიყენეს. დათო რადგანაც არქიტექტორები და პროექტის დამგეგმავები იწყებენ კონკრეტულ პროექტებს BI გარემოში, ისინი რჩებიან ანგარიშვალდებულნი მთლიანად საწარმოს წინაშე. BI გამეორებების ამ ორმხრივი მახასიათებლის მარტივი მაგალითი ნაპოვნია წყაროში მონაცემები. Ყველა მონაცემები მიღებული კონკრეტული ბიზნეს მოთხოვნებისთვის უნდა იყოს დასახლებული პირველ ატომურ ფენაში. ეს უზრუნველყოფს საწარმოს საინფორმაციო აქტივის განვითარებას, ასევე იტერაციაში განსაზღვრული კონკრეტული მომხმარებლის მოთხოვნების მართვას.

WhatisaDataWarehouse?

მონაცემთა საწყობი ის 1990 წლიდან არის საინფორმაციო სისტემების არქიტექტურის გული და მხარს უჭერს საინფორმაციო პროცესებს მყარი ინტეგრირებული პლატფორმის შეთავაზებით მონაცემები შემდგომი ანალიზის საფუძვლად მიღებული ისტორიული მონაცემები. THE მონაცემთა საწყობი ისინი სთავაზობენ ინტეგრაციას შეუთავსებელი აპლიკაციების სისტემების სამყაროში. მონაცემთა საწყობი ის ტენდენციად გადაიქცა. მონაცემთა საწყობი ორგანიზება და დამახსოვრება ი მონაცემები აუცილებელია ხანგრძლივი ისტორიული დროითი პერსპექტივის საინფორმაციო და ანალიტიკური პროცესებისთვის. ეს ყველაფერი მოითხოვს მნიშვნელოვან და მუდმივ ვალდებულებას მშენებლობისა და მოვლა-პატრონობის საქმეში მონაცემთა საწყობი.

მაშ რა არის ა მონაცემთა საწყობი? ა მონაცემთა საწყობი და:

▪ საგნებზე ორიენტირებული
▪ ინტეგრირებული სისტემა
▪ ვარიანტის დრო
▪ არამდგრადი (არ შეიძლება წაიშალოს)

კოლექცია მონაცემები გამოიყენება მენეჯერული გადაწყვეტილებების მხარდასაჭერად პროცესების განხორციელებაში.
I მონაცემები ჩასმულია მონაცემთა საწყობი უმეტეს შემთხვევაში ისინი მომდინარეობენ ოპერაციული გარემოდან. The მონაცემთა საწყობი იგი იქმნება საცავი განყოფილებით, ფიზიკურად გამოყოფილი დანარჩენი სისტემისგან, რომელსაც ის შეიცავს მონაცემები ადრე გარდაქმნილი აპლიკაციებით, რომლებიც მუშაობენ ოპერაციული გარემოდან მომდინარე ინფორმაციაზე.

სიტყვასიტყვითი განმარტება ა მონაცემთა საწყობი იმსახურებს სიღრმისეულ ახსნას, რადგან არსებობს მნიშვნელოვანი მოტივაციები და ძირითადი მნიშვნელობები, რომლებიც აღწერს საწყობის მახასიათებლებს.

საგანზე ორიენტაცია ორიენტაცია თემატური

პირველი თვისება ა მონაცემთა საწყობი არის ის, რომ ის ორიენტირებულია კომპანიის მთავარ მოთამაშეებზე. მეგზური სასამართლო პროცესების მეშვეობით მონაცემები ის განსხვავდება უფრო კლასიკური მეთოდისგან, რომელიც მოიცავს აპლიკაციების ორიენტაციას პროცესებსა და ფუნქციებზე, მეთოდი, რომელსაც ძირითადად იზიარებს უახლესი მართვის სისტემების უმეტესობა.

ოპერაციული სამყარო შექმნილია ისეთი აპლიკაციებისა და ფუნქციების გარშემო, როგორიცაა სესხები, შემნახველი, საბანკო ბარათები და ნდობა ფინანსური ინსტიტუტისთვის. dw-ის სამყარო ორგანიზებულია ძირითადი საგნების გარშემო, როგორიცაა მომხმარებელი, გამყიდველი, პროდუქტი და აქტივობა. თემების გარშემო გასწორება გავლენას ახდენს დიზაინსა და განხორციელებაზე მონაცემები ნაპოვნია dw-ში. რაც მთავარია, მთავარი თემა გავლენას ახდენს ძირითადი სტრუქტურის ყველაზე მნიშვნელოვან ნაწილზე.

აპლიკაციის სამყაროზე გავლენას ახდენს როგორც მონაცემთა ბაზის დიზაინი, ასევე პროცესის დიზაინი. dw-ის სამყარო ექსკლუზიურად მოდელირებაზეა ორიენტირებული მონაცემები და დიზაინზე მონაცემთა ბაზა. პროცესის დიზაინი (მისი კლასიკური ფორმით) არ არის dw გარემოს ნაწილი.

განსხვავებები პროცესის/ფუნქციის განაცხადის არჩევანსა და საგნის არჩევანს შორის ასევე ვლინდება, როგორც განსხვავებები შინაარსის მიხედვით. მონაცემები დეტალურ დონეზე. THE მონაცემები del dw არ შეიცავს ი მონაცემები რომელიც არ იქნება გამოყენებული DSS პროცესისთვის აპლიკაციების დროს

ოპერაციულზე ორიენტირებული მონაცემები შეიცავს ი მონაცემები დაუყონებლივ დააკმაყოფილოს ფუნქციონალური/დამუშავების მოთხოვნები, რომლებიც შეიძლება გამოიყენოს ან არ გამოიყენოს DSS ანალიტიკოსისთვის.
კიდევ ერთი მნიშვნელოვანი გზა, რომელშიც ოპერაციულზე ორიენტირებული აპლიკაციები მონაცემები განსხვავდება მონაცემები dw-ის ანგარიშებშია მონაცემები. მე მონაცემები ოპერაციები ინარჩუნებს უწყვეტ ურთიერთობას ორ ან მეტ ცხრილს შორის აქტიური ბიზნეს წესის საფუძველზე. THE მონაცემები dw კვეთს დროის სპექტრს და dw-ში ნაპოვნი ურთიერთობები ბევრია. ბევრი სავაჭრო წესი (და შესაბამისად, ბევრი ურთიერთობა მონაცემები ) წარმოდგენილია მარაგში მონაცემები ორ ან მეტ მაგიდას შორის.

(დაწვრილებითი ახსნისთვის, თუ როგორ არის ურთიერთობა მონაცემები განიხილება DW-ში, ჩვენ მივმართავთ ტექნიკურ თემას ამ საკითხთან დაკავშირებით.)
სხვა პერსპექტივიდან, გარდა ფუნდამენტური განსხვავებისა ფუნქციური/პროცესული აპლიკაციის არჩევასა და საგნის არჩევანს შორის, არ არის უფრო დიდი განსხვავება ოპერაციულ სისტემებსა და მონაცემები და DW.

INTEGRATION INTEGRATION

dw გარემოს ყველაზე მნიშვნელოვანი ასპექტი ისაა, რომ ი მონაცემები dw-ში ნაპოვნი ადვილად ინტეგრირებულია. ყოველთვის. გამონაკლისის გარეშე. თავად dw გარემოს არსი ის არის, რომ ი მონაცემები საწყობის საზღვრებში შემავალი ინტეგრირებულია.

ინტეგრაცია ვლინდება მრავალი განსხვავებული გზით - თანმიმდევრული იდენტიფიცირებული კონვენციებით, თანმიმდევრული ცვლადის გაზომვით, თანმიმდევრული კოდირებული სტრუქტურებით, ფიზიკურ ატრიბუტებში. მონაცემები თანმიმდევრული და ა.შ.

წლების განმავლობაში, სხვადასხვა აპლიკაციის დიზაინერებმა მიიღეს მრავალი გადაწყვეტილება იმის შესახებ, თუ როგორ უნდა შემუშავდეს აპლიკაცია. დიზაინერების აპლიკაციების სტილი და ინდივიდუალური დიზაინის გადაწყვეტილებები თავს იჩენს ასი გზით: განსხვავებები კოდირებაში, ძირითადი სტრუქტურაში, ფიზიკურ მახასიათებლებში, საიდენტიფიკაციო კონვენციებში და ა.შ. მრავალი აპლიკაციის დიზაინერის კოლექტიური შესაძლებლობა შექმნას არათანმიმდევრული აპლიკაციები, ლეგენდარულია. სურათი 3 ასახავს ზოგიერთ ყველაზე მნიშვნელოვან განსხვავებას აპლიკაციების დიზაინის გზებში.

კოდირება: Encode:

აპლიკაციის დიზაინერებმა აირჩიეს ველის კოდირება - სექსი - სხვადასხვა გზით. დიზაინერი სექსს წარმოადგენს როგორც "m" და "f". სხვა დიზაინერი წარმოადგენს სქესს, როგორც "1" და "0". სხვა დიზაინერი წარმოადგენს სექსს, როგორც "x" და "y". კიდევ ერთი დიზაინერი სექსს წარმოადგენს როგორც „მამაკაცი“ და „ქალი“. დიდი მნიშვნელობა არ აქვს, როგორ შემოდის სექსი DW-ში. "M" და "F" ალბათ ისეთივე კარგია, როგორც მთელი პიესა.

მთავარია, რომ სქესის ველი როგორი წარმოშობიდან გამომდინარეობს, ეს ველი მოდის DW-ში თანმიმდევრულ ინტეგრირებულ მდგომარეობაში. შესაბამისად, როდესაც ველი ჩაიტვირთება DW-ში აპლიკაციიდან, სადაც ის წარმოდგენილია ფორმატში "M" და "F", მონაცემები უნდა გადაკეთდეს DW ფორმატში.

ატრიბუტების გაზომვა: გაზომვა ატრიბუტები:

აპლიკაციის დიზაინერებმა წლების განმავლობაში აირჩიეს მილსადენის გაზომვა სხვადასხვა გზით. დიზაინერი ინახავს მონაცემები მილსადენი სანტიმეტრებში. სხვა აპლიკაციის დიზაინერი ინახავს მონაცემები მილსადენის ინჩის მიხედვით. სხვა აპლიკაციის დიზაინერი ინახავს მონაცემები მილსადენი მილიონ კუბურ ფუტს წამში. და კიდევ ერთი დიზაინერი ინახავს მილსადენის ინფორმაციას ეზოების თვალსაზრისით. როგორიც არ უნდა იყოს წყარო, როდესაც მილსადენის ინფორმაცია მოდის DW-ში, ის უნდა გაიზომოს იმავე გზით.

მე-3 ნახატზე მითითებების მიხედვით, ინტეგრაციის საკითხები გავლენას ახდენს პროექტის თითქმის ყველა ასპექტზე - ფიზიკურ მახასიათებლებზე. მონაცემები, ერთზე მეტი წყაროს არსებობის დილემა მონაცემები, არათანმიმდევრული იდენტიფიცირებული ნიმუშების, ფორმატების საკითხი მონაცემები არათანმიმდევრული და ა.შ.

როგორიც არ უნდა იყოს დიზაინის თემა, შედეგი იგივეა – ე.ი მონაცემები უნდა იყოს შენახული DW-ში ცალკეული და გლობალურად მისაღები ფორმით, მაშინაც კი, როდესაც ძირითადი ოპერაციული სისტემები მათ განსხვავებულად ინახავს მონაცემები.

როდესაც DSS ანალიტიკოსი უყურებს DW-ს, ანალიტიკოსის მიზანი უნდა იყოს გამოიყენოს მონაცემები რომლებიც საწყობშია,

ვიდრე გაინტერესებთ სანდოობის ან თანმიმდევრულობის შესახებ მონაცემები.

დროის ვარიაცია

ყველა მე მონაცემები DW-ში ისინი ზუსტია დროის გარკვეულ მომენტში. ეს ძირითადი მახასიათებელი მონაცემები DW-ში ძალიან განსხვავდება მონაცემები ნაპოვნია საოპერაციო გარემოში. THE მონაცემები ოპერაციული გარემო ისეთივე ზუსტია, როგორც დაშვების მომენტში. სხვა სიტყვებით რომ ვთქვათ, ოპერაციულ გარემოში, როდესაც დისკზე წვდომა ხდება მონაცემები, მოსალოდნელია, რომ ის ასახავს ზუსტ მნიშვნელობებს წვდომის დროს. Იმიტომ რომ მე მონაცემები DW-ში ზუსტია, როგორც დროის გარკვეულ მომენტში (ანუ, არა „ახლა“), ნათქვამია, რომ მე მონაცემები DW-ში ნაპოვნია „დროის დისპერსიები“.
დროის სხვაობა მონაცემები DW-ის მიერ არის მოხსენიებული მრავალი გზით.
უმარტივესი გზაა ის, რომ ი მონაცემები DW წარმოადგენს მონაცემები დიდი ხნის ჰორიზონტზე - ხუთიდან ათ წლამდე. საოპერაციო გარემოსთვის წარმოდგენილი დროის ჰორიზონტი გაცილებით მოკლეა, ვიდრე დღევანდელი დღევანდელი მნიშვნელობები სამოცი ოთხმოცდაათამდე.
აპლიკაციები, რომლებიც კარგად უნდა მუშაობდნენ და ხელმისაწვდომი უნდა იყვნენ ტრანზაქციის დასამუშავებლად, უნდა შეიცავდეს მინიმალურ რაოდენობას მონაცემები თუ ისინი რაიმე ხარისხის მოქნილობის საშუალებას იძლევა. ასე რომ, ოპერაციულ აპლიკაციებს აქვთ მოკლე დროის ჰორიზონტი, როგორიცაა აუდიო აპლიკაციის დიზაინის თემა.
მეორე გზა „დროის დისპერსი“ გამოჩნდება DW-ში არის გასაღების სტრუქტურაში. DW-ის თითოეული საკვანძო სტრუქტურა შეიცავს, ირიბად ან აშკარად, დროის ელემენტს, როგორიცაა დღე, კვირა, თვე და ა.შ. დროის ელემენტი თითქმის ყოველთვის არის DW-ში ნაპოვნი თანმიმდევრული გასაღების ბოლოში. ამ შემთხვევებში, დროის ელემენტი იარსებებს იმპლიციტურად, მაგალითად, შემთხვევა, როდესაც მთელი ფაილის დუბლირება ხდება თვის ან კვარტალის ბოლოს.
მესამე გზა დროის დისპერსიის ჩვენების არის ის, რომ i მონაცემები DW-ის, სწორად დარეგისტრირების შემდეგ, ვერ განახლდება. THE მონაცემები DW-ის ყველა პრაქტიკული მიზნისთვის არის კადრების გრძელი სერია. რა თქმა უნდა, თუ კადრები არასწორად არის გადაღებული, მაშინ სნეპშოტები შეიძლება შეიცვალოს. მაგრამ თუ ვივარაუდებთ, რომ კადრები სწორად არის გადაღებული, ისინი არ იცვლება გადაღებისთანავე. Ზოგიერთ

ზოგიერთ შემთხვევაში შესაძლოა არაეთიკური ან თუნდაც არასწორი იყოს DW-ში სნეპშოტების შეცვლა. THE მონაცემები ფუნქციონირებს, ზუსტი, როგორც წვდომის მომენტში, მათი განახლება შესაძლებელია საჭიროებისამებრ.

არამდგრადი

DW-ის მეოთხე მნიშვნელოვანი მახასიათებელია ის, რომ ის არამდგრადია.
განახლებები, ჩასმა, წაშლა და ცვლილებები რეგულარულად ხდება ოპერაციულ გარემოში ჩანაწერის მიხედვით. მაგრამ ძირითადი მანიპულირება მონაცემები რაც საჭიროა DW-ში გაცილებით მარტივია. არსებობს მხოლოდ ორი სახის ოპერაციები, რომლებიც ხდება DW-ში - საწყისი დატვირთვა მონაცემები და წვდომა მონაცემები. არ არის განახლება მონაცემები (განახლების ზოგადი გაგებით) DW-ში, როგორც ნორმალური დამუშავების ოპერაცია. ამ ძირითადი განსხვავების რამდენიმე ძალიან ძლიერი შედეგია ოპერაციულ დამუშავებასა და DW დამუშავებას შორის. დიზაინის დონეზე, სიფრთხილის აუცილებლობა არანორმალური განახლების მიმართ არ არის ფაქტორი DW-ში, რადგან განახლდება მონაცემები არ ხორციელდება. ეს ნიშნავს, რომ ფიზიკური დიზაინის დონეზე, თავისუფლება შეიძლება იქნას მიღებული წვდომის ოპტიმიზაციისთვის მონაცემები, კერძოდ, ფიზიკური ნორმალიზაციისა და დენორმალიზაციის თემების განხილვისას. DW ოპერაციების სიმარტივის კიდევ ერთი შედეგი არის ძირითადი ტექნოლოგია, რომელიც გამოიყენება DW გარემოს გასაშვებად. ჩანაწერ-ჩანაწერი განახლებების მხარდაჭერისთვის (როგორც ხშირად ხდება ოპერაციული დამუშავების შემთხვევაში) მოითხოვს ტექნოლოგიას ჰქონდეს ძალიან რთული საფუძველი აშკარა სიმარტივის მიღმა.
ტექნოლოგია, რომელიც მხარს უჭერს სარეზერვო და აღდგენას, ტრანზაქციებს და მთლიანობას მონაცემები და ჩიხური მდგომარეობის გამოვლენა და გამოსწორება საკმაოდ რთულია და არ არის აუცილებელი DW დამუშავებისთვის. DW-ის მახასიათებლები, დიზაინის ორიენტაცია, ინტეგრაცია მონაცემები DW-ის ფარგლებში, დროის სხვაობა და მართვის სიმარტივე მონაცემები, ეს ყველაფერი იწვევს გარემოს, რომელიც ძალიან, ძალიან განსხვავდება კლასიკური ოპერაციული გარემოსგან. თითქმის ყველაფრის წყარო მონაცემები DW არის საოპერაციო გარემო. მაცდურია ვიფიქროთ, რომ არსებობს უზარმაზარი სიჭარბე მონაცემები ორ გარემოს შორის.
სინამდვილეში, პირველი შთაბეჭდილება, რაც ბევრ ადამიანს აქვს, არის დიდი ჭარბი რაოდენობა მონაცემები საოპერაციო გარემოსა და გარემოს შორის

DW. ასეთი ინტერპრეტაცია ზედაპირულია და ცხადყოფს იმის დემონსტრირებას, თუ რა ხდება DW-ში.
მართლაც, არის მინიმალური ჭარბი რაოდენობა მონაცემები საოპერაციო გარემოსა და ი მონაცემები DW-ის. განვიხილოთ შემდეგი: I მონაცემები ისინი გაფილტრულია dato ოპერაციული გარემოდან DW გარემოზე გადასვლა. ბევრი მონაცემები ისინი არასოდეს გადიან საოპერაციო გარემოს გარეთ. გარდა იმისა, რომ ი მონაცემები რომლებიც აუცილებელია DSS დამუშავებისთვის, იპოვონ მიმართულება გარემოში

▪ დროის ჰორიზონტი მონაცემები ის ძალიან განსხვავდება ერთი გარემოდან მეორეში. THE მონაცემები საოპერაციო გარემოში ისინი ძალიან სუფთაა. THE მონაცემები DW-ში ისინი ბევრად უფრო ძველია. მხოლოდ დროის ჰორიზონტის თვალსაზრისით, ძალიან მცირეა გადახურვა ოპერაციულ გარემოსა და DW-ს შორის.

▪ DW შეიცავს მონაცემები შეჯამება, რომლებიც არასდროს გვხვდება გარემოში

▪ მე მონაცემები განიცდიან ფუნდამენტურ ტრანსფორმაციას, როდესაც ისინი გადადიან სურათზე 3-ზე, ასახავს ამას მონაცემები მნიშვნელოვნად შეცვლილია იმ პირობით, რომ შეირჩევა და გადაინაცვლებს DW-ში. სხვაგვარად რომ ვთქვათ, უმეტესობა მონაცემები ის ფიზიკურად და რადიკალურად იცვლება DW-ში გადატანისას. ინტეგრაციის თვალსაზრისით, ისინი არ არიან იგივე მონაცემები რომლებიც ცხოვრობენ საოპერაციო გარემოში. ამ ფაქტორების გათვალისწინებით, ჭარბი რაოდენობა მონაცემები ორ გარემოს შორის იშვიათი მოვლენაა, რაც იწვევს ორ გარემოს შორის 1%-ზე ნაკლებ სიჭარბეს. საწყობის სტრუქტურა DW-ებს აქვთ განსხვავებული სტრუქტურა. არსებობს შეჯამებისა და დეტალების სხვადასხვა დონე, რომელიც განასხვავებს DW-ებს.
DW-ის სხვადასხვა კომპონენტებია:

მეტამონაცემები
dati მიმდინარე დეტალები
dati ძველი დეტალებით
dati ოდნავ შეჯამებული
dati უაღრესად შეჯამებული

ჯერჯერობით მთავარი საზრუნავი არის ი მონაცემები მიმდინარე დეტალები. ეს არის მთავარი საზრუნავი, რადგან:

I მონაცემები მიმდინარე დეტალები ასახავს უახლეს მოვლენებს, რომლებიც ყოველთვის დიდ ინტერესს იწვევს და
i მონაცემები მიმდინარე დეტალები მოცულობითია, რადგან ის ინახება მარცვლოვნების ყველაზე დაბალ დონეზე და
i მონაცემები მიმდინარე დეტალები თითქმის ყოველთვის ინახება დისკის მეხსიერებაში, რომელიც არის სწრაფი წვდომა, მაგრამ ძვირი და რთული გამოსაყენებლად მონაცემები დეტალები უფრო ძველია მონაცემები რომლებიც ინახება ზოგიერთ მეხსიერებაზე მასობრივი. მასზე წვდომა ხდება სპორადულად და ინახება დეტალების დონეზე თავსებადია მონაცემები მიმდინარე დეტალები. მიუხედავად იმისა, რომ არ არის სავალდებულო შენახვა ალტერნატიულ შესანახ საშუალებაზე, დიდი მოცულობის გამო მონაცემები შერწყმულია სპორადულ წვდომასთან მონაცემები, შენახვის საშუალება ამისთვის მონაცემები უფრო ძველი დეტალური მონაცემები ჩვეულებრივ არ ინახება დისკზე. THE მონაცემები მსუბუქად შეჯამებული ისინი არიან მონაცემები რომლებიც გამოხდილია აღმოჩენილი დეტალების დაბალი დონიდან დეტალების ამჟამინდელ დონეზე. DW-ის ეს დონე თითქმის ყოველთვის ინახება დისკზე. დიზაინის პრობლემები არქიტექტორის წინაშე მონაცემები DW-ის ამ დონის მშენებლობაში არის:

დროის რა ერთეულია ზემოთ გაკეთებული შეჯამება
რომელი შინაარსი, ატრიბუტები ოდნავ შეაჯამებს შინაარსის შინაარსს მონაცემები შემდეგი დონე მონაცემები ნაპოვნი DW არის ის მონაცემები უაღრესად შეჯამებული. THE მონაცემები ძალიან შეჯამებული არის კომპაქტური და ადვილად ხელმისაწვდომი. THE მონაცემები მაღალი შეჯამება ზოგჯერ გვხვდება DW გარემოში და სხვა შემთხვევებში ი მონაცემები უაღრესად შეჯამებული გვხვდება ტექნოლოგიის უშუალო კედლების მიღმა, სადაც განთავსებულია DW. (ყოველ შემთხვევაში, ე.ი მონაცემები უაღრესად შეჯამებული არის DW-ის ნაწილი, მიუხედავად იმისა, თუ სად ი მონაცემები ფიზიკურად არიან დასახლებული). DW-ის საბოლოო კომპონენტი არის მეტამონაცემები. მეტამონაცემები მრავალი თვალსაზრისით განსხვავებულ განზომილებაშია, ვიდრე სხვები მონაცემები DW-ის, რადგან მეტამონაცემები არ შეიცავს არცერთს dato უშუალოდ საოპერაციო გარემოდან აღებული. მეტამონაცემებს განსაკუთრებული და ძალიან მნიშვნელოვანი როლი აქვს DW-ში. მეტამონაცემები გამოიყენება როგორც:

დირექტორია, რომელიც დაეხმარება DSS ანალიტიკოსს DW-ის შინაარსის პოვნაში,
რუკების სახელმძღვანელო მონაცემები იმის შესახებ, თუ როგორ მე მონაცემები გარდაიქმნენ ოპერატიული გარემოდან DW გარემოში,
გზამკვლევი ალგორითმებისთვის, რომლებიც გამოიყენება შეჯამებისთვის მონაცემები მიმდინარე დეტალების ე.ი მონაცემები ოდნავ შეჯამებული, ე.ი მონაცემები მოკლედ რომ ვთქვათ, მეტამონაცემები ბევრად უფრო დიდ როლს თამაშობს DW გარემოში, ვიდრე ოდესმე ჰქონია ოპერაციულ გარემოში ძველი დეტალების შენახვა საშუალო მაგნიტური ლენტი შეიძლება გამოყენებულ იქნას ამ სახის შესანახად მონაცემები. სინამდვილეში, არსებობს საცავის მედიის ფართო არჩევანი, რომელიც უნდა იქნას გათვალისწინებული ძველი შენახვისთვის მონაცემები დეტალების. მოცულობის მიხედვით მონაცემებიწვდომის სიხშირე, ხელსაწყოების ღირებულება და წვდომის ტიპი, სავსებით სავარაუდოა, რომ სხვა ხელსაწყოებს დასჭირდებათ ძველი დონის დეტალები DW-ში. მონაცემთა ნაკადი არსებობს ნორმალური და პროგნოზირებადი ნაკადი მონაცემები DW-ის ფარგლებში.
I მონაცემები ისინი შედიან DW-ში საოპერაციო გარემოდან. (შენიშვნა: ამ წესიდან არის რამდენიმე ძალიან საინტერესო გამონაკლისი. თუმცა, თითქმის ყველა მონაცემები შეიტანეთ DW ოპერაციული გარემოდან). დათო რომ მე მონაცემები შედით DW-ში ოპერაციული გარემოდან, ის გარდაიქმნება ისე, როგორც ადრე იყო აღწერილი. DW-ში შესვლის პირობით, ი მონაცემები შეიყვანეთ დეტალების მიმდინარე დონე, როგორც ნაჩვენებია. ის იქ ცხოვრობს და გამოიყენება მანამ, სანამ არ მოხდება სამი მოვლენადან ერთ-ერთი:

განწმენდილია,
არის შეჯამებული და/ან ▪è მოძველებული პროცესი DW-ში მოძრაობს i მონაცემები მიმდინარე დეტალები ა მონაცემები დეტალურად ძველი, ასაკის მიხედვით მონაცემები. Პროცესი

შეჯამება იყენებს დეტალებს მონაცემები რომ გამოვთვალოთ მონაცემები ოდნავ შეჯამებული და უაღრესად შეჯამებული დონეები მონაცემები. არის გამონაკლისები ნაჩვენები ნაკადიდან (მოგვიანებით იქნება განხილული). თუმცა, ჩვეულებრივ, უმრავლესობისთვის მონაცემები ნაპოვნი ფარგლებში DW, ნაკადი მონაცემები როგორც წარმოდგენილია.

მონაცემთა საწყობის გამოყენება

გასაკვირი არ არის, რომ სხვადასხვა დონეზე მონაცემები DW-ში ისინი არ იღებენ გამოყენების სხვადასხვა დონეს. როგორც წესი, რაც უფრო მაღალია შეჯამების დონე, მით უფრო ი მონაცემები ისინი გამოიყენება.
ბევრი გამოყენება ხდება მონაცემები უაღრესად შეჯამებული, ხოლო ძველი მონაცემები დეტალები თითქმის არასოდეს გამოიყენება. არსებობს კარგი მიზეზი, რომ ორგანიზაცია გადავიდეს რესურსების გამოყენების პარადიგმაზე. უფრო შეჯამებული ი მონაცემები, მით უფრო სწრაფი და ეფექტურია მისი მიღწევა მონაცემები. Თუ მაღაზია აღმოაჩენს, რომ ის ბევრ პროცესს აკეთებს DW-ის დეტალურ დონეზე, შემდეგ იხარჯება შესაბამისი დიდი რაოდენობის მანქანების რესურსები. ყველას ინტერესებშია შეჯამების რაც შეიძლება მალე დამუშავება.

მრავალი მაღაზიისთვის, DSS ანალიტიკოსმა წინასწარ DW გარემოში გამოიყენა მონაცემები დეტალების დონეზე. ბევრი თვალსაზრისით ჩამოსვლა მონაცემები დეტალური შეჯამება წააგავს უსაფრთხოების საბანს, მაშინაც კი, როდესაც შეჯამების სხვა დონე ხელმისაწვდომია. არქიტექტორის ერთ-ერთი საქმიანობა მონაცემები არის DSS მომხმარებლის მოშორება მუდმივი გამოყენებისგან მონაცემები დეტალების ყველაზე დაბალ დონეზე. არქიტექტორს აქვს ორი მოტივაცია მონაცემები:

დატენვის სისტემის დაყენებით, სადაც საბოლოო მომხმარებელი იხდის მოხმარებულ რესურსებს და
რაც მიუთითებს იმაზე, რომ ძალიან კარგი რეაგირების დროის მიღწევა შესაძლებელია, როდესაც ქცევა ი მონაცემები არის შეჯამების მაღალ დონეზე, ხოლო ცუდი რეაგირების დრო მოდის ქცევიდან მონაცემები დაბალ დონეზე სხვა მოსაზრებები არსებობს სხვა DW სამშენებლო და მენეჯმენტის მოსაზრებები.
პირველი განხილვა არის ინდექსები. THE მონაცემები შეჯამების უფრო მაღალ დონეზე მათი თავისუფლად ინდექსირება შესაძლებელია, ხოლო ე.ი მონაცემები

დეტალების დაბალ დონეზე, ისინი იმდენად დიდია, რომ მათი ინდექსირება შესაძლებელია ეკონომიურად. ამავე აზრიდან გამომდინარე, ი მონაცემები მაღალ დონეზე დეტალურად შეიძლება შედარებით ადვილად რესტრუქტურიზაცია, ხოლო მოცულობა მონაცემები ქვედა დონეზე ის იმდენად დიდია, რომ ი მონაცემები მათი ადვილად განახლება შეუძლებელია. შესაბამისად, მოდელი მონაცემები და დიზაინის მიერ შესრულებულმა ფორმალურმა მუშაობამ საფუძველი ჩაუყარა DW-ს, რომელიც გამოიყენება თითქმის ექსკლუზიურად დეტალების ამჟამინდელ დონეზე. სხვა სიტყვებით რომ ვთქვათ, სამოდელო საქმიანობა მონაცემები ისინი არ ვრცელდება შემაჯამებელ დონეებზე, თითქმის ყველა შემთხვევაში. კიდევ ერთი სტრუქტურული მოსაზრება არის ქვედანაყოფის მონაცემები DW-ის მიერ.

დაყოფა შეიძლება გაკეთდეს ორ დონეზე - დონეზე დბმ და განაცხადის დონეზე. დონეზე განყოფილებაში დბმსაქართველოს დბმ ინფორმირებულია დანაყოფების შესახებ და შესაბამისად აკონტროლებს მათ. აპლიკაციის დონეზე დაყოფის შემთხვევაში განყოფილებების შესახებ ინფორმირებულია მხოლოდ პროგრამისტი და მათ ადმინისტრირებაზე პასუხისმგებლობა ეკისრება მას.

დონის ქვემოთ დბმ, ბევრი სამუშაო კეთდება ავტომატურად. არსებობს უამრავი მოუქნელობა, რომელიც დაკავშირებულია განყოფილებების ავტომატურად ადმინისტრირებასთან. განაცხადის დონეზე დაყოფის შემთხვევაში მონაცემები del მონაცემთა საწყობი, ბევრი სამუშაო ამძიმებს პროგრამისტს, მაგრამ საბოლოო შედეგი არის მოქნილობა ადმინისტრირებაში მონაცემები in მონაცემთა საწყობი

სხვა ანომალიები

მიუხედავად იმისა, რომ კომპონენტები მონაცემთა საწყობი ისინი მუშაობენ ისე, როგორც აღწერილია თითქმის ყველასთვის მონაცემები, არის რამდენიმე სასარგებლო გამონაკლისი, რომელთა განხილვაც საჭიროა. გამონაკლისი არის ის მონაცემები საჯარო შემაჯამებელი მონაცემები. Ესენი არიან მონაცემები შეჯამებები, რომლებიც გამოითვლება მონაცემთა საწყობი მაგრამ მათ საზოგადოება იყენებს. THE მონაცემები საჯარო რეზიუმეები ინახება და იმართება მასში მონაცემთა საწყობითუმცა, როგორც უკვე აღვნიშნეთ, ისინი გამოითვლება. ბუღალტერები მუშაობენ ასეთი კვარტალური წარმოებისთვის მონაცემები როგორიცაა შემოსავალი, კვარტალური ხარჯები, კვარტალური მოგება და ა.შ. ბუღალტერების მიერ შესრულებული სამუშაო გარეა მონაცემთა საწყობი. თუმცა, ი მონაცემები გამოიყენება „შინაგანად“ კომპანიის შიგნით – დან მარკეტინგული, გაყიდვები და ა.შ. კიდევ ერთი ანომალია, რომელიც არ იქნება განხილული, არის ის მონაცემები ესტერნი.

კიდევ ერთი გამორჩეული ტიპი მონაცემები რომელიც შეიძლება მოიძებნოს ა მონაცემთა საწყობი არის მუდმივი დეტალური მონაცემები. ეს იწვევს მუდმივი შენახვის აუცილებლობას მონაცემები დეტალურ დონეზე ეთიკური ან სამართლებრივი მიზეზების გამო. თუ კომპანია ექვემდებარება თავის მუშებს საშიშ ნივთიერებებს, საჭიროა მონაცემები დეტალური და მუდმივი. თუ კომპანია აწარმოებს პროდუქტს, რომელიც მოიცავს საზოგადოებრივ უსაფრთხოებას, როგორიცაა თვითმფრინავის ნაწილები, საჭიროა მონაცემები მუდმივი დეტალები, ასევე, თუ კომპანია დებს საშიშ კონტრაქტებს.

კომპანიას არ შეუძლია დეტალების უგულებელყოფა, რადგან მომდევნო რამდენიმე წლის განმავლობაში სასამართლო პროცესის, გაწვევის, სადავო კონსტრუქციის ხარვეზის შემთხვევაში და ა.შ. კომპანიის ექსპოზიცია შეიძლება იყოს დიდი. შედეგად, არსებობს უნიკალური სახეობა მონაცემები ცნობილია როგორც მუდმივი დეტალური მონაცემები.

ᲨᲔᲛᲐᲯᲐᲛᲔᲑᲔᲚᲘ

Un მონაცემთა საწყობი არის ობიექტზე ორიენტირებული, ინტეგრირებული, დროის ვარიანტი, კრებული მონაცემები არასტაბილური ადმინისტრაციის გადაწყვეტილების მიღების საჭიროებების მხარდასაჭერად. ა-ის თითოეული გამორჩეული ფუნქცია მონაცემთა საწყობი აქვს თავისი შედეგები. გარდა ამისა, არსებობს ოთხი დონე მონაცემები del მონაცემთა საწყობი:

ძველი დეტალი
აქტუალური დეტალი
dati ოდნავ შეჯამებული
dati ძალიან შეჯამებული მეტამონაცემები ასევე მნიშვნელოვანი ნაწილია მონაცემთა საწყობი. ᲐᲑᲡᲢᲠᲐᲥᲢᲣᲚᲘ შენახვის კონცეფცია მონაცემები მას ბოლო დროს დიდი ყურადღება ექცევა და 90-იანი წლების ტრენდად იქცა, რაც განპირობებულია ა. მონაცემთა საწყობი მენეჯმენტის მხარდაჭერის სისტემების შეზღუდვების დასაძლევად, როგორიცაა გადაწყვეტილების მხარდაჭერის სისტემები (DSS) და აღმასრულებელი საინფორმაციო სისტემები (EIS). თუნდაც ცნება მონაცემთა საწყობი გამოიყურება პერსპექტიული, განხორციელება ი მონაცემთა საწყობი შეიძლება იყოს პრობლემური ფართომასშტაბიანი სასაწყობო პროცესების გამო. მიუხედავად სასაწყობო პროექტების სირთულისა მონაცემები, ბევრი მომწოდებელი და კონსულტანტი, რომლებიც მარაგებს მონაცემები ისინი აცხადებენ, რომ შენახვა მონაცემები დენი არ იწვევს პრობლემებს. თუმცა, ამ კვლევითი პროექტის დასაწყისში თითქმის არ ჩატარებულა დამოუკიდებელი, მკაცრი და სისტემატური კვლევა. შესაბამისად, ძნელი სათქმელია, რა ხდება რეალურად ინდუსტრიაში მათი აშენებისას მონაცემთა საწყობი. ამ კვლევამ შეისწავლა სასაწყობო პრაქტიკა მონაცემები თანამედროვეები, რომლებიც მიზნად ისახავს ავსტრალიური პრაქტიკის უფრო მდიდარი გაგების განვითარებას. ლიტერატურის მიმოხილვამ უზრუნველყო ემპირიული კვლევის კონტექსტი და საფუძველი. ამ კვლევის შედეგად მიღებულია მთელი რიგი დასკვნები. პირველ რიგში, ამ კვლევამ გამოავლინა აქტივობები, რომლებიც წარმოიშვა განვითარების დროს მონაცემთა საწყობი. ბევრ სფეროში, ე.ი მონაცემები შეკრებილმა დაადასტურა ლიტერატურაში მოხსენებული პრაქტიკა. მეორე, საკითხები და პრობლემები, რამაც შეიძლება გავლენა მოახდინოს განვითარების განვითარებაზე მონაცემთა საწყობი გამოვლინდა ამ კვლევის შედეგად. და ბოლოს, ავსტრალიური ორგანიზაციების მიერ მიღებული სარგებელი, რომლებიც დაკავშირებულია გამოყენებასთან მონაცემთა საწყობი გამოვლინდა.

Თავი 1

მოძებნეთ კონტექსტი

მონაცემთა შენახვის კონცეფცია ფართოდ გავრცელდა და გახდა განვითარებადი ტენდენცია 90-იან წლებში (McFadden 1996, TDWI 1996, Shah and Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman and Oates 2000). ეს ჩანს სავაჭრო პუბლიკაციებში მონაცემთა შენახვის შესახებ სტატიების მზარდი რაოდენობის მიხედვით (Little and Gibson 1999). ბევრი სტატია (იხ., მაგალითად, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett and King 1996, Graham et al. 1996, Sakaguchi and Frolick 1996, Alvarez 1997, Brousell 1997, 1997, 1997, 1997, 1998, 1999, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, XNUMX, კლარტი , Edwards XNUMX, TDWI XNUMX) აღნიშნავს მნიშვნელოვანი სარგებელი, რომლებიც მიიღეს ორგანიზაციებმა, რომლებიც ახორციელებენ მონაცემთა საწყობი. მათ მხარი დაუჭირეს თავიანთ თეორიას წარმატებული განხორციელების ანეკდოტური მტკიცებულებებით, ინვესტიციის მაღალი ანაზღაურების (ROI) მაჩვენებლებით და ასევე, მითითებებისა თუ მეთოდოლოგიების შემუშავებისთვის. მონაცემთა საწყობი

(Shanks et al. 1997, Seddon and Benjamin 1998, Little and Gibson 1999). უკიდურეს შემთხვევაში, გრეჰემი და სხვ. (1996) იტყობინება სამწლიანი ინვესტიციის საშუალო ანაზღაურება 401%.

თუმცა, ამჟამინდელი ლიტერატურის დიდმა ნაწილმა უგულებელყო ასეთი პროექტების განხორციელებასთან დაკავშირებული სირთულეები. -ის პროექტები მონაცემთა საწყობი ისინი, როგორც წესი, რთული და ფართომასშტაბიანია და, შესაბამისად, ახასიათებს მარცხის მაღალი ალბათობა, თუ მათ გულდასმით არ აკონტროლებენ (შაჰ და მილშტეინი 1997, ეკერსონი 1997, ფოლი 1997ბ, ზიმერი 1997, ბორტი 1998, გიბსი და კლაიმერი 1998, რაო 1998). ისინი საჭიროებენ როგორც ადამიანურ, ისე ფინანსურ რესურსებს, ასევე დროსა და ძალისხმევას მათი ასაშენებლად (Hill 1998, Crofts 1998). ტიპიური დრო და ფინანსური საშუალებებია საჭირო დაახლოებით ორი წელი და ორიდან სამ მილიონ დოლარამდე, შესაბამისად (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). ეს დრო და ფინანსური საშუალებებია საჭირო მონაცემთა შენახვის მრავალი განსხვავებული ასპექტის კონტროლისა და კონსოლიდაციისთვის (Cafasso 1995, Hill 1998). ტექნიკისა და პროგრამული უზრუნველყოფის საკითხებთან ერთად, სხვა ფუნქციები, რომლებიც განსხვავდება მოპოვებისგან მონაცემები დატვირთვის პროცესებზე მონაცემები, მეხსიერების მოცულობა განახლებებისა და მეტა-ს მართვისთვის მონაცემები მომხმარებლის ტრენინგისთვის, გასათვალისწინებელია.

იმ დროს, როდესაც ეს კვლევითი პროექტი დაიწყო, ძალიან ცოტა აკადემიური კვლევა ტარდებოდა მონაცემთა შენახვის სფეროში, განსაკუთრებით ავსტრალიაში. ეს აშკარა იყო იმდროინდელი ჟურნალებიდან ან სხვა აკადემიური ნაშრომებიდან მონაცემთა შენახვის შესახებ გამოქვეყნებული სტატიების სიმცირით. ბევრი ხელმისაწვდომი აკადემიური ნაშრომი აღწერს აშშ-ს გამოცდილებას. მონაცემთა შენახვის სფეროში აკადემიური კვლევის ნაკლებობამ გამოიწვია მკაცრი კვლევებისა და ემპირიული კვლევების მოწოდებები (McFadden 1996, Shanks et al. 1997, Little and Gibson 1999). კერძოდ, კვლევითი კვლევები განხორციელების პროცესზე მონაცემთა საწყობი უნდა განხორციელდეს ზოგადი ცოდნის გასაფართოებლად განხორციელების შესახებ მონაცემთა საწყობი და იქნება საფუძველი მომავალი კვლევისთვის (შანქსი და სხვ. 1997, ლიტლი და გიბსონი 1999).

ამ კვლევის მიზანი, შესაბამისად, არის იმის შესწავლა, თუ რა ხდება რეალურად, როდესაც ორგანიზაციები ახორციელებენ და იყენებენ ი მონაცემთა საწყობი ავსტრალიაში. კონკრეტულად, ეს კვლევა მოიცავს ა-ის განვითარების მთელი პროცესის ანალიზს მონაცემთა საწყობი, დაწყებული დაწყებიდან და დაგეგმვით, დიზაინისა და განხორციელების და შემდგომი გამოყენების ავსტრალიურ ორგანიზაციებში. გარდა ამისა, კვლევა ასევე ხელს შეუწყობს მიმდინარე პრაქტიკას იმ სფეროების იდენტიფიცირებით, სადაც შესაძლებელია პრაქტიკის შემდგომი გაუმჯობესება და არაეფექტურობისა და რისკების მინიმუმამდე დაყვანა ან თავიდან აცილება. გარდა ამისა, ეს იქნება საფუძველი სხვა კვლევებისთვის მონაცემთა საწყობი ავსტრალიაში და შეავსებს იმ ხარვეზს, რომელიც ამჟამად არსებობს ლიტერატურაში.

Კვლევის კითხვები

ამ კვლევის მიზანია განხორციელების პროცესში ჩართული აქტივობების შესწავლა მონაცემთა საწყობი და მათი გამოყენება ავსტრალიური ორგანიზაციების მიერ. კერძოდ, შესწავლილია ელემენტები, რომლებიც ეხება პროექტის დაგეგმვას, განვითარებას, ექსპლუატაციას, გამოყენებას და რისკებს. ასე რომ, ამ კვლევის კითხვაა:

„როგორ არის ამჟამინდელი პრაქტიკა მონაცემთა საწყობი ავსტრალიაში?"

ამ კითხვაზე ეფექტური პასუხის გასაცემად საჭიროა მრავალი დამხმარე კვლევის კითხვა. კერძოდ, სამი ქვეკითხა გამოიკვეთა ლიტერატურიდან, რომელიც წარმოდგენილია მე-2 თავში, ამ კვლევითი პროექტის წარმართვის მიზნით: როგორ არის მონაცემთა საწყობი ავსტრალიური ორგანიზაციებიდან? რა პრობლემები შეგხვდათ?

რა სარგებელი აქვს გამოცდილი?
ამ კითხვებზე პასუხის გასაცემად გამოყენებული იქნა საძიებო კვლევის დიზაინი გამოკითხვის გამოყენებით. როგორც საძიებო კვლევა, ზემოაღნიშნულ კითხვებზე პასუხები არ არის სრული (Shanks et al. 1993, Denscombe 1998). ამ შემთხვევაში, ამ კითხვებზე პასუხების გასაუმჯობესებლად საჭიროა ტრიანგულაცია. თუმცა, გამოძიება მყარ საფუძველს შექმნის ამ კითხვებზე მომავალი მუშაობისთვის. დეტალური განხილვა კვლევის მეთოდის დასაბუთებასა და დიზაინზე წარმოდგენილია მე-3 თავში.

კვლევითი პროექტის სტრუქტურა

ეს კვლევითი პროექტი დაყოფილია ორ ნაწილად: მონაცემთა შენახვის კონცეფციის კონტექსტუალური შესწავლა და ემპირიული კვლევა (იხ. სურათი 1.1), რომელთაგან თითოეული განხილულია ქვემოთ.

ნაწილი I: კონტექსტუალური შესწავლა

კვლევის პირველი ნაწილი მოიცავდა მიმდინარე ლიტერატურის მიმოხილვას სხვადასხვა ტიპის მონაცემთა საწყობის შესახებ, მათ შორის გადაწყვეტილების მხარდაჭერის სისტემები (DSS), აღმასრულებელი საინფორმაციო სისტემები (EIS), საქმის შესწავლა. მონაცემთა საწყობი და ცნებები მონაცემთა საწყობი. გარდა ამისა, ფორუმის შედეგები მონაცემთა საწყობი და ექსპერტთა და პრაქტიკოსთა შეხვედრის ჯგუფები Monash DSS-ის კვლევითი ჯგუფის ხელმძღვანელობით, წვლილი შეიტანეს კვლევის ამ ფაზაში, რომელიც მიზნად ისახავდა პრაქტიკაში ინფორმაციის მიღებას. მონაცემთა საწყობი და მათი მიღებასთან დაკავშირებული რისკების იდენტიფიცირება. ამ კონტექსტური კვლევის პერიოდში შეიქმნა პრობლემური არეალის გაგება შემდგომი ემპირიული გამოკვლევებისთვის საფუძვლიანი ცოდნის უზრუნველსაყოფად. თუმცა, ეს იყო მუდმივი პროცესი კვლევის ჩატარებისას.

ნაწილი II: ემპირიული კვლევა

მონაცემთა შენახვის შედარებით ახალმა კონცეფციამ, განსაკუთრებით ავსტრალიაში, შექმნა გამოკითხვის საჭიროება მომხმარებლის გამოცდილების ფართო სურათის მისაღებად. ეს ნაწილი განხორციელდა მას შემდეგ, რაც პრობლემის სფერო ჩამოყალიბდა ვრცელი ლიტერატურის მიმოხილვით. კონტექსტური კვლევის ფაზაში ჩამოყალიბებული მონაცემთა საწყობის კონცეფცია გამოყენებული იქნა ამ კვლევის საწყისი კითხვარისთვის. ამის შემდეგ ჩატარდა კითხვარი. თქვენ ხართ ექსპერტები მონაცემთა საწყობი მონაწილეობდა ტესტში. საწყისი კითხვარის ტესტირების მიზანი იყო კითხვების სისრულისა და სიზუსტის შემოწმება. ტესტის შედეგების მიხედვით, კითხვარი შეიცვალა და შეცვლილი ვერსია გაეგზავნა გამოკითხვის მონაწილეებს. დაბრუნებული კითხვარები შემდეგ გაანალიზდა ი მონაცემები ცხრილებში, დიაგრამებში და სხვა ფორმატებში. THE

ანალიზის შედეგები მონაცემები ისინი ქმნიან ავსტრალიაში მონაცემთა შენახვის პრაქტიკის სურათს.

მონაცემთა საწყობის მიმოხილვა

მონაცემთა შენახვის კონცეფცია განვითარდა კომპიუტერული ტექნოლოგიების გაუმჯობესებით.
ის მიზნად ისახავს პრობლემების გადალახვას აპლიკაციების მხარდაჭერის ჯგუფების წინაშე, როგორიცაა გადაწყვეტილების მხარდაჭერის სისტემა (DSS) და აღმასრულებელი საინფორმაციო სისტემა (EIS).

წარსულში ამ აპლიკაციების ყველაზე დიდი დაბრკოლება იყო ამ აპლიკაციების უუნარობა მონაცემთა ბაზა ანალიზისთვის აუცილებელია.
ეს ძირითადად გამოწვეულია მენეჯმენტის მუშაობის ბუნებით. კომპანიის მენეჯმენტის ინტერესები მუდმივად განსხვავდება დაფარვის სფეროდან გამომდინარე. ამიტომ ი მონაცემები ამ აპლიკაციებისთვის ფუნდამენტურია, მათ უნდა შეეძლოთ სწრაფად შეიცვალონ დამუშავებული ნაწილის მიხედვით.
ეს ნიშნავს, რომ ი მონაცემები ხელმისაწვდომი უნდა იყოს შესაბამისი ფორმით მოთხოვნილი ანალიზებისთვის. სინამდვილეში, აპლიკაციების მხარდაჭერის ჯგუფებს წარსულში ძალიან გაუჭირდათ შეგროვება და ინტეგრირება მონაცემები რთული და მრავალფეროვანი წყაროებიდან.

ამ განყოფილების დარჩენილი ნაწილი წარმოადგენს მონაცემთა შენახვის კონცეფციის მიმოხილვას და განიხილავს, თუ როგორ მონაცემთა საწყობი შეუძლია აპლიკაციის მხარდაჭერის ჯგუფების პრობლემების გადალახვა.
ტერმინი ”მონაცემთა საწყობი” პოპულარიზაცია მოახდინა უილიამ ინმონმა 1990 წელს. მისი ხშირად ციტირებული განმარტება ხედავს მონაცემთა საწყობი როგორც კოლექცია მონაცემები სუბიექტზე ორიენტირებული, ინტეგრირებული, არასტაბილური და დროთა განმავლობაში ცვლადი, მენეჯმენტის გადაწყვეტილებების მხარდასაჭერად.

ამ განმარტების გამოყენებით ინმონი ხაზს უსვამს, რომ ი მონაცემები მცხოვრები ა მონაცემთა საწყობი მათ უნდა ჰქონდეთ შემდეგი 4 მახასიათებელი:

▪ სუბიექტზე ორიენტირებული
▪ ინტეგრირებული
▪ არამდგრადი
▪ ცვლადი დროთა განმავლობაში სუბიექტზე ორიენტირებული ინმონ ნიშნავს, რომ ი მონაცემები in მონაცემთა საწყობი უდიდეს ორგანიზაციულ სფეროებში, რომლებიც ყოფილა

მოდელში განსაზღვრული მონაცემები. მაგალითად ყველა მონაცემები რაც შეეხება ი მომხმარებელს შეიცავს საგნის ზონაში მომხმარებელს. ანალოგიურად ყველა მონაცემები პროდუქტებთან დაკავშირებულ პროდუქტებს შეიცავს PRODUCTS სათაურის ველში.

ინტეგრირებული ინმონით ნიშნავს, რომ ი მონაცემები სხვადასხვა პლატფორმებიდან, სისტემებიდან და ლოკაციებიდან მოდის, გაერთიანებულია და ინახება ერთ ადგილას. შესაბამისად მონაცემები მსგავსი უნდა გარდაიქმნას თანმიმდევრულ ფორმატებად, რათა მათი ადვილად დამატება და შედარება მოხდეს.
მაგალითად, მამრობითი და მდედრობითი სქესი წარმოდგენილია ასოებით M და F ერთ სისტემაში, ხოლო 1-ით და 0-ით მეორეში. მათი სწორად ინტეგრირებისთვის, ერთი ან ორივე ფორმატი უნდა გარდაიქმნას ისე, რომ ორი ფორმატი ერთნაირი იყოს. ამ შემთხვევაში ჩვენ შეგვიძლია შევცვალოთ M 1-ზე და F 0-ზე ან პირიქით. სუბიექტზე ორიენტირებული და ინტეგრირებული მიუთითებს, რომ მონაცემთა საწყობი შექმნილია ფუნქციური და განივი ხედვის უზრუნველსაყოფად მონაცემები კომპანიის მიერ.

Non-volatile-ში ის გულისხმობს, რომ ი მონაცემები in მონაცემთა საწყობი დარჩეს თანმიმდევრული და განახლებული მონაცემები არაა აუცილებელი. სამაგიეროდ, ყოველი ცვლილება მონაცემები ორიგინალებს ემატება მონაცემთა ბაზა del მონაცემთა საწყობი. ეს ნიშნავს, რომ ისტორიული დეი მონაცემები შეიცავს მონაცემთა საწყობი.

დროით ცვლადებისთვის Inmon მიუთითებს, რომ i მონაცემები in მონაცემთა საწყობი ყოველთვის შეიცავს ei დროის ინდიკატორებს მონაცემები ისინი ჩვეულებრივ კვეთენ დროის გარკვეულ ჰორიზონტს. მაგალითად ა
მონაცემთა საწყობი შეიძლება შეიცავდეს 5 წლის ისტორიულ ღირებულებებს მომხმარებელს 1993 წლიდან 1997 წლამდე. ხელმისაწვდომობა ისტორია და დროის სერია მონაცემები საშუალებას გაძლევთ გაანალიზოთ ტენდენციები.

Un მონაცემთა საწყობი მას შეუძლია საკუთარი თავის შეგროვება მონაცემები OLTP სისტემებიდან; წყაროებიდან მონაცემები ორგანიზაციის გარედან და/ან სხვა სპეციალური დაჭერის სისტემის პროექტებით მონაცემები.
I მონაცემები ექსტრაქტებს შეუძლიათ გაიარონ გაწმენდის პროცესი, ამ შემთხვევაში ე.ი მონაცემები გარდაიქმნება და ინტეგრირდება მასში შენახვამდე მონაცემთა ბაზა del მონაცემთა საწყობი. Შემდეგ მე მონაცემები

ფარგლებში მცხოვრები მონაცემთა ბაზა del მონაცემთა საწყობი ხელმისაწვდომია საბოლოო მომხმარებლის შესვლისა და აღდგენის ხელსაწყოებისთვის. ამ ინსტრუმენტების გამოყენებით, საბოლოო მომხმარებელს შეუძლია წვდომა ჰქონდეს ორგანიზაციის ინტეგრირებულ ხედზე მონაცემები.

I მონაცემები ფარგლებში მცხოვრები მონაცემთა ბაზა del მონაცემთა საწყობი ისინი ინახება როგორც დეტალურად, ასევე შემაჯამებელ ფორმატში.
შეჯამების დონე შეიძლება დამოკიდებული იყოს მის ბუნებაზე მონაცემები. მე მონაცემები დეტალური შეიძლება შედგებოდეს მონაცემები მიმდინარე და მონაცემები ისტორიკოსები
I მონაცემები ჰონორარი არ შედის მონაცემთა საწყობი სანამ მე მონაცემები in მონაცემთა საწყობი ხელახლა განახლებულია.
გარდა შენახვისა ი მონაცემები საკუთარ თავს, ა მონაცემთა საწყობი მას ასევე შეუძლია შეინახოს სხვადასხვა ტიპის dato სახელწოდებით METADATA, რომელიც აღწერს მონაცემები მაცხოვრებლები მის მონაცემთა ბაზა.
არსებობს ორი სახის მეტამონაცემები: განვითარების მეტამონაცემები და ანალიტიკის მეტამონაცემები.
განვითარების მეტამონაცემები გამოიყენება მოპოვების, გაწმენდის, რუკების და ჩატვირთვის პროცესების მართვისა და ავტომატიზაციისთვის. მონაცემები in მონაცემთა საწყობი.
განვითარების მეტამონაცემებში მოცემული ინფორმაცია შეიძლება შეიცავდეს ოპერაციული სისტემების დეტალებს, ამოსაღები ელემენტების დეტალებს, მოდელს მონაცემები del მონაცემთა საწყობი და კონვერტაციის ბიზნეს წესები მონაცემები.

მეტამონაცემების მეორე ტიპი, რომელიც ცნობილია როგორც ანალიტიკის მეტამონაცემები, საშუალებას აძლევს საბოლოო მომხმარებელს გამოიკვლიოს შინაარსის შინაარსი. მონაცემთა საწყობი რომ იპოვონ მონაცემები ხელმისაწვდომი და მათი მნიშვნელობა მკაფიო, არატექნიკური თვალსაზრისით.

ამიტომ ანალიტიკის მეტამონაცემები მუშაობს როგორც ხიდს შორის მონაცემთა საწყობი და საბოლოო მომხმარებლის აპლიკაციები. ეს მეტამონაცემები შეიძლება შეიცავდეს ბიზნეს მოდელს, აღწერას მონაცემები ბიზნეს მოდელის შესაბამისი, წინასწარ განსაზღვრული მოთხოვნები და ანგარიშები, ინფორმაცია მომხმარებლის წვდომისთვის და ინდექსი.

ანალიზისა და განვითარების მეტამონაცემები უნდა გაერთიანდეს ერთ ინტეგრირებულ შემაკავებელ მეტამონაცემებში, რათა სწორად იმუშაოს.

სამწუხაროდ, ბევრ არსებულ ინსტრუმენტს აქვს საკუთარი მეტამონაცემები და ამჟამად არ არსებობს ამისთვის არსებული სტანდარტები

მიეცით საშუალება მონაცემთა შენახვის ინსტრუმენტებს ამ მეტამონაცემების ინტეგრირება. ამ სიტუაციის გამოსასწორებლად, მონაცემთა შენახვის ძირითადი ინსტრუმენტების ბევრმა ტრეიდერმა ჩამოაყალიბა Meta Data Council, რომელიც მოგვიანებით გახდა Meta Data Coalition.

ამ კოალიციის მიზანია შექმნას სტანდარტული მეტამონაცემების ნაკრები, რომელიც საშუალებას აძლევს მონაცემთა შენახვის სხვადასხვა ინსტრუმენტებს მეტამონაცემების გარდაქმნას
მათი ძალისხმევის შედეგად შეიქმნა Meta Data Interchange Specification (MDIS), რომელიც საშუალებას მისცემს ინფორმაციის გაცვლას Microsoft-ის არქივებსა და დაკავშირებულ MDIS ფაილებს შორის.

არსებობა მონაცემები როგორც შეჯამებული/ინდექსირებული, ასევე დეტალური აძლევს მომხმარებელს შესაძლებლობას განახორციელოს DRILL DROWN (ბურღვა) მონაცემები ინდექსირებულია დეტალურად და პირიქით. არსებობა მონაცემები დეტალური ისტორიები საშუალებას გაძლევთ შექმნათ ტენდენციის ანალიზი დროთა განმავლობაში. გარდა ამისა, ანალიტიკის მეტამონაცემები შეიძლება გამოყენებულ იქნას როგორც დირექტორია მონაცემთა ბაზა del მონაცემთა საწყობი დასახმარებლად საბოლოო მომხმარებლების პოვნაში მონაცემები საჭირო.

OLTP სისტემებთან შედარებით, მათი ანალიზის მხარდაჭერის უნარით მონაცემები და ანგარიშგება, მონაცემთა საწყობი იგი განიხილება, როგორც უფრო შესაფერის სისტემა საინფორმაციო პროცესებისთვის, როგორიცაა შეკითხვებზე პასუხის გაცემა და მოხსენებების წარმოება. მომდევნო განყოფილებაში დეტალურად იქნება ხაზგასმული ორი სისტემის განსხვავებები.

მონაცემთა საწყობი OLTP სისტემების წინააღმდეგ

ორგანიზაციებში არსებული მრავალი საინფორმაციო სისტემა გამიზნულია ყოველდღიური ოპერაციების მხარდასაჭერად. ეს სისტემები, რომლებიც ცნობილია როგორც OLTP SYSTEMS, იღებენ მუდმივად განახლებულ ყოველდღიურ ტრანზაქციებს.

I მონაცემები ამ სისტემებში ისინი ხშირად იცვლება, ემატება ან იშლება. მაგალითად, მომხმარებლის მისამართი იცვლება ერთი ადგილიდან მეორეზე გადასვლისას. ამ შემთხვევაში ახალი მისამართი დარეგისტრირდება მისამართის ველის შეცვლით მონაცემთა ბაზა. ამ სისტემების მთავარი მიზანია ტრანზაქციის ხარჯების შემცირება და ამავე დროს დამუშავების დროის შემცირება. OLTP სისტემების მაგალითები მოიცავს კრიტიკულ მოქმედებებს, როგორიცაა შეკვეთის შეყვანა, სახელფასო, ინვოისი, წარმოება, კლიენტების მომსახურება მომხმარებელს.

OLTP სისტემებისგან განსხვავებით, რომლებიც შეიქმნა ტრანზაქციის და მოვლენებზე დაფუძნებული პროცესებისთვის, ე.ი მონაცემთა საწყობი შეიქმნა ანალიტიკაზე დაფუძნებული პროცესების მხარდაჭერისთვის მონაცემები და გადაწყვეტილების მიღების პროცესები.

ეს ჩვეულებრივ მიიღწევა i მონაცემები სხვადასხვა OLTP და გარე სისტემებიდან ერთ „კონტეინერში“. მონაცემებიროგორც წინა ნაწილში იყო განხილული.

Monash მონაცემთა შენახვის პროცესის მოდელი

პროცესის მოდელი მონაცემთა საწყობი Monash შეიმუშავეს Monash DSS Research Group-ის მკვლევარებმა და ეფუძნება ლიტერატურას მონაცემთა საწყობი, სისტემების სფეროების განვითარების მხარდაჭერის გამოცდილებაზე, აპლიკაციების მომწოდებლებთან დისკუსიებზე გამოსაყენებლად მონაცემთა საწყობი, გამოყენების ექსპერტთა ჯგუფზე მონაცემთა საწყობი.

ფაზებია: დაწყება, დაგეგმვა, განვითარება, ოპერაციები და ახსნა. დიაგრამა ხსნის ა-ს განვითარების განმეორებით ან ევოლუციური ხასიათს მონაცემთა საწყობი პროცესი სხვადასხვა ფაზას შორის მოთავსებული ორმხრივი ისრების გამოყენებით. ამ კონტექსტში, „იტერატიული“ და „ევოლუციური“ ნიშნავს, რომ პროცესის ყოველ საფეხურზე განხორციელების აქტივობები ყოველთვის შეიძლება გავრცელდეს უკან, წინა ეტაპისკენ. ეს გამოწვეულია პროექტის ბუნებით მონაცემთა საწყობი რომელშიც ნებისმიერ დროს წარმოიქმნება დამატებითი მოთხოვნები საბოლოო მომხმარებლისგან. მაგალითად, პროცესის განვითარების ფაზაში მონაცემთა საწყობი, ახალი განზომილება ან საგნის არე მოითხოვება საბოლოო მომხმარებლის მიერ, რომელიც არ იყო თავდაპირველი გეგმის ნაწილი, ეს უნდა დაემატოს სისტემას. ეს იწვევს პროექტში ცვლილებას. შედეგი არის ის, რომ საპროექტო ჯგუფმა უნდა შეცვალოს აქამდე შექმნილი დოკუმენტების მოთხოვნები დიზაინის ფაზაში. ხშირ შემთხვევაში, პროექტის მიმდინარე მდგომარეობა უნდა დაბრუნდეს დიზაინის ფაზაში, სადაც ახალი მოთხოვნა უნდა დაემატოს და დოკუმენტირებული იყოს. საბოლოო მომხმარებელს უნდა შეეძლოს ნახოს განხილული კონკრეტული დოკუმენტაცია და ცვლილებები, რომლებიც განხორციელდა განვითარების ფაზაში. განვითარების ამ ციკლის დასასრულს პროექტმა უნდა მიიღოს შესანიშნავი გამოხმაურება როგორც განვითარების, ასევე მომხმარებლის გუნდისგან. გამოხმაურება შემდეგ ხელახლა გამოიყენება მომავალი პროექტის გასაუმჯობესებლად.

Მოცულობის დაგეგმვა
Dw, როგორც წესი, არის ძალიან დიდი ზომის და იზრდება ძალიან სწრაფად (Best 1995, Rudin 1997a) რაოდენობის შედეგად მონაცემები ისტორიები, რომლებსაც ისინი ინარჩუნებენ მათი ხანგრძლივობისგან. ზრდა ასევე შეიძლება გამოწვეული იყოს მონაცემები მომხმარებლების მიერ მოთხოვნილი დამატებები ღირებულების გასაზრდელად მონაცემები რომ უკვე აქვთ. შესაბამისად, შენახვის მოთხოვნები მონაცემები შეიძლება მნიშვნელოვნად გაძლიერდეს (Eckerson 1997). ამდენად, აუცილებელია იმის უზრუნველყოფა, რომ ტევადობის დაგეგმვის ჩატარებით, შენდება სისტემა შეიძლება გაიზარდოს საჭიროებების ზრდასთან ერთად (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
მონაცემთა ბაზის მასშტაბურობის დაგეგმვისას უნდა იცოდეთ საწყობის მოცულობის მოსალოდნელი ზრდა, სავარაუდო მოთხოვნების ტიპები და მხარდაჭერილი საბოლოო მომხმარებლების რაოდენობა (Best 1995, Rudin 1997b, Foley 1997a). მასშტაბირებადი აპლიკაციების შექმნა მოითხოვს მასშტაბირებადი სერვერის ტექნოლოგიებისა და მასშტაბირებადი აპლიკაციების დიზაინის ტექნიკის ერთობლიობას (Best 1995, Rudin 1997b. ორივე აუცილებელია მაღალი მასშტაბირებადი აპლიკაციის შესაქმნელად. მასშტაბირებადი სერვერის ტექნოლოგიებს შეუძლია გააადვილოს და მომგებიანი გახადოს მეხსიერების, მეხსიერების და CPU-ის დამატება დეგრადაციის გარეშე. შესრულება (Lang 1997, Telephony 1997).

არსებობს ორი ძირითადი მასშტაბირებადი სერვერის ტექნოლოგია: სიმეტრიული მრავალჯერადი დამუშავება (SMP) და მასიურად პარალელური დამუშავება (MPP) (IDC 1997, Humphries et al. 1999). SMP სერვერს, როგორც წესი, აქვს მრავალი პროცესორი, რომლებიც იზიარებენ მეხსიერებას, სისტემის ავტობუსს და სხვა რესურსებს (IDC 1997, Humphries et al. 1999). მისი გაზრდის მიზნით შეიძლება დაემატოს დამატებითი პროცესორები შეიძლება გამოთვლითი. კიდევ ერთი მეთოდი გაზრდის შეიძლება SMP სერვერის, არის მრავალი SMP აპარატის გაერთიანება. ეს ტექნიკა ცნობილია როგორც კლასტერირება (Humphries et al. 1999). MPP სერვერს, მეორე მხრივ, აქვს მრავალი პროცესორი, თითოეულს თავისი მეხსიერებით, ავტობუსის სისტემით და სხვა რესურსებით (IDC 1997, Humphries et al. 1999). თითოეულ პროცესორს კვანძი ეწოდება. ზრდა შეიძლება გამოთვლების მიღება შესაძლებელია

დამატებითი კვანძების დამატება MPP სერვერებზე (Humphries et al. 1999).

SMP სერვერების სისუსტე არის ის, რომ ძალიან ბევრმა შეყვანა-გამომავალმა (I/O) ოპერაციამ შეიძლება გადატვირთოს სისტემის ავტობუსები (IDC 1997). ეს პრობლემა არ ხდება MPP სერვერებში, რადგან თითოეულ პროცესორს აქვს საკუთარი ავტობუსის სისტემა. თუმცა, თითოეულ კვანძს შორის ურთიერთკავშირი ზოგადად გაცილებით ნელია, ვიდრე SMP ავტობუსის სისტემა. გარდა ამისა, MPP სერვერებს შეუძლიათ დაამატონ სირთულის დამატებითი დონე აპლიკაციის შემქმნელებს (IDC 1997). ამრიგად, SMP და MPP სერვერებს შორის არჩევანზე შეიძლება გავლენა იქონიოს ბევრმა ფაქტორმა, მათ შორის აპლიკაციების სირთულეზე, ფასი/ეფექტურობის თანაფარდობა, საჭირო დამუშავების სიმძლავრე, თავიდან აცილებული dw აპლიკაციები და ზომის ზრდა. მონაცემთა ბაზა dw-ს და საბოლოო მომხმარებლების რაოდენობაში.

მრავალი მასშტაბური აპლიკაციის დიზაინის ტექნიკა შეიძლება გამოყენებულ იქნას სიმძლავრის დაგეგმვაში. ერთი იყენებს სხვადასხვა შეტყობინებების პერიოდს, როგორიცაა დღეები, კვირები, თვეები და წლები. სხვადასხვა შეტყობინების პერიოდის მქონე, მონაცემთა ბაზა ის შეიძლება დაიყოს მართვად დაჯგუფებულ ნაწილებად (Inmon et al. 1997). კიდევ ერთი ტექნიკა არის შემაჯამებელი ცხრილების გამოყენება, რომლებიც აგებულია შეჯამებით მონაცემები da მონაცემები დეტალური. ამრიგად, ი მონაცემები შეჯამებული უფრო კომპაქტურია, ვიდრე დეტალური, რაც ნაკლებ მეხსიერებას მოითხოვს. ასე რომ მონაცემები დეტალების შენახვა შესაძლებელია ნაკლებად ძვირადღირებულ საცავში, რაც დაზოგავს კიდევ უფრო მეტ შენახვას. მიუხედავად იმისა, რომ შემაჯამებელი ცხრილების გამოყენებამ შეიძლება დაზოგოს მეხსიერების სივრცე, ისინი დიდ ძალისხმევას მოითხოვს მათი განახლებისთვის და ბიზნესის საჭიროებებთან შესაბამისობაში. თუმცა, ეს ტექნიკა ფართოდ გამოიყენება და ხშირად გამოიყენება წინა ტექნიკასთან ერთად (Best 1995, Inmon 1996a, Chauduri and Dayal
1997).

განსაზღვრა მონაცემთა საწყობი ტექნიკური არქიტექტურები dw არქიტექტურის ტექნიკის განმარტება

მონაცემთა საწყობის ადრეული მიმღებები, უპირველეს ყოვლისა, ფიქრობდნენ dw-ის ცენტრალიზებულ განხორციელებაზე, რომელშიც ყველა მონაცემები, მათ შორის ი მონაცემები გარე, ინტეგრირებული იყო ერთში,
ფიზიკური შენახვა (Inmon 1996a, Bresnahan 1996, Peacock 1998).

ამ მიდგომის მთავარი უპირატესობა ის არის, რომ საბოლოო მომხმარებლებს შეუძლიათ მიიღონ წვდომა საწარმოს მასშტაბით მონაცემები ორგანიზაციული (Ovum 1998). კიდევ ერთი უპირატესობა ის არის, რომ ის გთავაზობთ სტანდარტიზაციას მონაცემები ორგანიზაციის მეშვეობით, რაც ნიშნავს, რომ არსებობს მხოლოდ ერთი ვერსია ან განმარტება თითოეული ტერმინოლოგიისთვის, რომელიც გამოიყენება dw საცავში (მეტამონაცემები) (Flanagan and Safdie 1997, Ovum 1998). მეორეს მხრივ, ამ მიდგომის მინუსი არის ის, რომ ის ძვირია და რთულად ასაშენებელია (Flanagan and Safdie 1997, Ovum 1998, Inmon et al. 1998). შენახვის არქიტექტურიდან არც ისე დიდი ხნის შემდეგ მონაცემები ცენტრალიზებული გახდა პოპულარული, განვითარდა მცირე ქვეჯგუფების მოპოვების კონცეფცია მონაცემები კონკრეტული აპლიკაციების საჭიროებების მხარდასაჭერად (Varney 1996, IDC 1997, Berson and Smith 1997, Peacock 1998). ეს პატარა სისტემები უფრო დიდის წარმოებულებია მონაცემთა საწყობი ცენტრალიზებული. ისინი დასახელებულია მონაცემთა საწყობი დამოკიდებული უწყებრივი ან დამოკიდებული მონაცემების მარტები. დამოკიდებული მონაცემთა მარტის არქიტექტურა ცნობილია, როგორც სამსაფეხურიანი არქიტექტურა, სადაც პირველი იარუსი შედგება მონაცემთა საწყობი ცენტრალიზებული, მეორე შედგება დეპოზიტებისგან მონაცემები უწყებრივი და მესამე შედგება წვდომისგან მონაცემები და ანალიზის ინსტრუმენტებით (Demarest 1994, Inmon et al. 1997).

მონაცემთა მარტები ჩვეულებრივ შენდება შემდეგ მონაცემთა საწყობი ცენტრალიზებული აშენდა კონკრეტული ერთეულების საჭიროებების დასაკმაყოფილებლად (White 1995, Varney 1996).
მონაცემთა მარტების მაღაზია ი მონაცემები ძალიან აქტუალურია კონკრეტულ ერთეულებთან დაკავშირებით (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

ამ მეთოდის უპირატესობა ის არის, რომ არ იქნება dato არ არის ინტეგრირებული და რომ ი მონაცემები ნაკლებად ზედმეტი იქნება მონაცემთა მარტებში, როგორც ყველა მონაცემები ისინი მოდიან საწყობიდან მონაცემები ინტეგრირებული. კიდევ ერთი უპირატესობა ის არის, რომ იქნება რამდენიმე კავშირი თითოეულ მონაცემთა მარტსა და მის წყაროებს შორის მონაცემები რადგან თითოეულ მონაცემთა მარტს აქვს მხოლოდ ერთი წყარო მონაცემები. გარდა ამისა, ამ არქიტექტურით, საბოლოო მომხმარებლებს კვლავ შეუძლიათ წვდომა მიმოხილვაზე მონაცემები

კორპორატიული ორგანიზაციები. ეს მეთოდი ცნობილია როგორც ზემოდან ქვევით მეთოდი, სადაც მონაცემთა მარტები აგებულია შემდეგ მონაცემთა საწყობი (ფარშევანგი 1998, გოფი 1998).
შედეგების ადრეული ჩვენების საჭიროების გაზრდის გამო, ზოგიერთმა ორგანიზაციამ დაიწყო დამოუკიდებელი მონაცემთა მარტის შექმნა (Flanagan and Safdie 1997, White 2000). ამ შემთხვევაში, მონაცემთა მარტები იღებენ საკუთარ თავს მონაცემები პირდაპირ საფუძვლებიდან მონაცემები OLTP და არა ცენტრალიზებული და ინტეგრირებული საწყობიდან, რაც გამორიცხავს ცენტრალური საწყობის ადგილზე არსებობის აუცილებლობას.

თითოეული მონაცემთა მარტი მოითხოვს მინიმუმ ერთ ბმულს მის წყაროებთან მონაცემები. თითოეული მონაცემთა მარტისთვის მრავალჯერადი კავშირის მინუსი არის ის, რომ წინა ორ არქიტექტურასთან შედარებით, ჭარბი რაოდენობაა. მონაცემები მნიშვნელოვნად იზრდება.

თითოეული მონაცემთა მარტი უნდა შეინახოს ყველა მონაცემები საჭიროა ადგილობრივად, რათა არ ჰქონდეს გავლენა OLTP სისტემებზე. ეს იწვევს იმას, რომ ი მონაცემები ისინი ინახება სხვადასხვა მონაცემთა მარტებში (Inmon et al. 1997). ამ არქიტექტურის კიდევ ერთი მინუსი არის ის, რომ იგი იწვევს მონაცემთა მარტებსა და მათ მონაცემთა წყაროებს შორის რთული ურთიერთკავშირის შექმნას. მონაცემები რომელთა განხორციელება და კონტროლი რთულია (Inmon et al. 1997).

კიდევ ერთი მინუსი არის ის, რომ საბოლოო მომხმარებლებს არ შეუძლიათ კომპანიის ინფორმაციის მიმოხილვაზე წვდომა, რადგან ი მონაცემები მონაცემთა სხვადასხვა მარტი არ არის ინტეგრირებული (Ovum 1998).
კიდევ ერთი მინუსი არის ის, რომ შეიძლება არსებობდეს ერთზე მეტი განმარტება თითოეული ტერმინოლოგიისთვის, რომელიც გამოიყენება მონაცემთა მარკეტებში, რაც წარმოშობს შეუსაბამობებს მონაცემები ორგანიზაციაში (Ovum 1998).
მიუხედავად ზემოთ განხილული უარყოფითი მხარეებისა, მონაცემთა დამოუკიდებელი მარტები მაინც იზიდავს მრავალი ორგანიზაციის ინტერესს (IDC 1997). ერთი ფაქტორი, რაც მათ მიმზიდველს ხდის, არის ის, რომ ისინი უფრო სწრაფად ვითარდებიან და ნაკლებ დროსა და რესურსებს საჭიროებენ (ბრესნაჰანი 1996, ბერსონი და სმიტი 1997, Ovum 1998). შესაბამისად, ისინი ძირითადად ემსახურებიან როგორც სატესტო პროექტებს, რომლებიც შეიძლება გამოყენებულ იქნას პროექტში უპირატესობებისა და/ან არასრულყოფილების სწრაფად დასადგენად (Parsaye 1995, Braly 1995, Newing 1996). ამ შემთხვევაში, საპილოტე პროექტში განსახორციელებელი ნაწილი უნდა იყოს მცირე, მაგრამ მნიშვნელოვანი ორგანიზაციისთვის (ნივინგი 1996, Mansell-Lewis 1996).

პროტოტიპის შესწავლით, საბოლოო მომხმარებლებს და ადმინისტრაციას შეუძლიათ გადაწყვიტონ გააგრძელონ თუ შეაჩერონ პროექტი (Flanagan and Safdie 1997).
თუ გადაწყვეტილება გაგრძელდება, მონაცემების მარტები სხვა ინდუსტრიებისთვის უნდა აშენდეს ერთ დროს. საბოლოო მომხმარებლებისთვის არსებობს ორი ვარიანტი მათი საჭიროებიდან გამომდინარე მონაცემთა დამოუკიდებელი მატრიცების შესაქმნელად: ინტეგრირებული/ფედერირებული და არაინტეგრირებული (Ovum 1998)

პირველ მეთოდში, ყოველი ახალი მონაცემთა მარტი უნდა აშენდეს მიმდინარე მონაცემთა მარტისა და მოდელის საფუძველზე მონაცემები გამოიყენება კომპანიის მიერ (Varney 1996, Berson and Smith 1997, Peacock 1998). მოდელის გამოყენების აუცილებლობა მონაცემები კომპანიის შესახებ ნიშნავს, რომ უზრუნველყოფილი უნდა იყოს, რომ არსებობს მხოლოდ ერთი განმარტება თითოეული ტერმინოლოგიისთვის, რომელიც გამოიყენება მონაცემთა მარკეტებში, ეს ასევე არის იმის უზრუნველსაყოფად, რომ მონაცემთა სხვადასხვა მარტი შეიძლება გაერთიანდეს კომპანიის ინფორმაციის მიმოხილვისთვის (ბრესნაჰანი 1996). ამ მეთოდს ქვემოდან ზევით ეწოდება და საუკეთესოა, როდესაც არსებობს ფინანსური საშუალებებისა და დროის შეზღუდვა (Flanagan and Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). მეორე მეთოდით, აგებულ მონაცემთა მარტებს შეუძლიათ მხოლოდ კონკრეტული ერთეულის მოთხოვნილებების დაკმაყოფილება. ფედერირებული მონაცემთა მარტის ვარიანტია მონაცემთა საწყობი განაწილებული, რომელშიც მონაცემთა ბაზა Hub Server შუა პროგრამა გამოიყენება მრავალი მონაცემთა მარტის ერთ საცავში გაერთიანებისთვის მონაცემები გავრცელდა (White 1995). ამ შემთხვევაში, ი მონაცემები კომპანიები განაწილებულია რამდენიმე მონაცემთა ბაზაში. საბოლოო მომხმარებლის მოთხოვნები გადაგზავნილია მონაცემთა ბაზა სერვერის კერის შუა პროგრამა, რომელიც ამოიღებს ყველაფერს მონაცემები მოითხოვება მონაცემთა მარტის მიერ და აბრუნებს შედეგებს საბოლოო მომხმარებლის აპლიკაციებს. ეს მეთოდი აწვდის ბიზნეს ინფორმაციას საბოლოო მომხმარებლებს. თუმცა, დამოუკიდებელი მონაცემთა მარტის პრობლემები ჯერ კიდევ არ არის აღმოფხვრილი. არსებობს კიდევ ერთი არქიტექტურა, რომელიც შეიძლება გამოყენებულ იქნას, რომელსაც ეწოდება მონაცემთა საწყობი ვირტუალური (თეთრი 1995). თუმცა, ეს არქიტექტურა, რომელიც აღწერილია სურათზე 2.9, არ არის მონაცემთა შენახვის არქიტექტურა. მონაცემები რეალური, რადგან ის არ გადაიტანს დატვირთვას OLTP სისტემებიდან მონაცემთა საწყობი (Demarest 1994).

ფაქტობრივად, ითხოვს მონაცემები საბოლოო მომხმარებლებიდან გადაეცემა OLTP სისტემებს, რომლებიც აბრუნებენ შედეგებს მომხმარებლის მოთხოვნების დამუშავების შემდეგ. მიუხედავად იმისა, რომ ეს არქიტექტურა საშუალებას აძლევს საბოლოო მომხმარებლებს შექმნან მოხსენებები და განახორციელონ მოთხოვნები, მას არ შეუძლია უზრუნველყოს

მონაცემები კომპანიის ინფორმაციის ისტორიული და მიმოხილვა, როგორც ი მონაცემები სხვადასხვა OLTP სისტემებიდან არ არის ინტეგრირებული. აქედან გამომდინარე, ეს არქიტექტურა ვერ დააკმაყოფილებს ანალიზს მონაცემები კომპლექსი, როგორიცაა პროგნოზები.

წვდომისა და აღდგენის აპლიკაციების შერჩევა მონაცემები

შენობის მიზანი ა მონაცემთა საწყობი არის ინფორმაციის გადაცემა საბოლოო მომხმარებლებისთვის (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); ერთი ან მეტი წვდომისა და აღდგენის აპლიკაცია მონაცემები უნდა იყოს უზრუნველყოფილი. დღეისათვის არსებობს ამ აპლიკაციების მრავალფეროვნება, საიდანაც მომხმარებელს შეუძლია აირჩიოს (Hammergren 1998, Humphries et al. 1999). თქვენ მიერ არჩეული აპლიკაციები განსაზღვრავს თქვენი სასაწყობო ძალისხმევის წარმატებას მონაცემები ორგანიზაციაში, რადგან აპლიკაციები ყველაზე თვალსაჩინო ნაწილია მონაცემთა საწყობი საბოლოო მომხმარებლისთვის (Inmon et al. 1997, Poe 1996). წარმატებული იყოს ა მონაცემთა საწყობი, უნდა შეეძლოს მხარი დაუჭიროს ანალიზის საქმიანობას მონაცემები საბოლოო მომხმარებლის (Poe 1996, Seddon and Benjamin 1998, Eckerson 1999). ამგვარად, უნდა განისაზღვროს ის „დონე“, რაც სურს საბოლოო მომხმარებელს (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

ზოგადად, საბოლოო მომხმარებლები შეიძლება დაიყოს სამ კატეგორიად: აღმასრულებელი მომხმარებლები, ბიზნეს ანალიტიკოსები და ძლიერი მომხმარებლები (Poe 1996, Humphries et al. 1999). აღმასრულებელ მომხმარებლებს სჭირდებათ მარტივი წვდომა წინასწარ განსაზღვრულ ანგარიშებზე (Humphries et al. 1999). ამ კოეფიციენტებზე წვდომა მარტივად არის შესაძლებელი მენიუს ნავიგაციით (Poe 1996). გარდა ამისა, ანგარიშებში უნდა იყოს წარმოდგენილი ინფორმაცია გრაფიკული გამოსახულების გამოყენებით, როგორიცაა ცხრილები და შაბლონები ინფორმაციის სწრაფად გადასაცემად (Humphries et al. 1999). ბიზნეს ანალიტიკოსებს, რომლებსაც შეიძლება არ ჰქონდეთ ტექნიკური შესაძლებლობები ნულიდან მოხსენებების შემუშავებისთვის, უნდა შეეძლოთ მიმდინარე ანგარიშების შეცვლა მათი სპეციფიკური საჭიროებების დასაკმაყოფილებლად (Poe 1996, Humphries et al. 1999). მეორეს მხრივ, ძლიერი მომხმარებლები არიან საბოლოო მომხმარებლების ტიპი, რომლებსაც აქვთ შესაძლებლობა შექმნან და დაწერონ მოთხოვნები და ანგარიშები ნულიდან (Poe 1996, Humphries et al. 1999). ისინი არიან ვინც

ისინი ამუშავებენ ანგარიშებს სხვა ტიპის მომხმარებლებისთვის (Poe 1996, Humphries et al. 1999).

საბოლოო მომხმარებლის მოთხოვნების დადგენის შემდეგ, უნდა მოხდეს წვდომისა და აღდგენის აპლიკაციების შერჩევა მონაცემები მათ შორის ყველა ხელმისაწვდომი (Poe 1996, Inmon et al. 1997).
წვდომა მონაცემები და ამოღების ინსტრუმენტები შეიძლება დაიყოს 4 ტიპად: OLAP ინსტრუმენტები, EIS/DSS ინსტრუმენტები, შეკითხვისა და მოხსენების ხელსაწყოები და მონაცემთა მოპოვების ინსტრუმენტები.

OLAP ინსტრუმენტები მომხმარებლებს საშუალებას აძლევს შექმნან ad hoc მოთხოვნები, ისევე როგორც მათზე გაკეთებული მონაცემთა ბაზა del მონაცემთა საწყობი. გარდა ამისა, ეს პროდუქტები მომხმარებლებს საშუალებას აძლევს გაბურღონ ქვემოთ მონაცემები ზოგადიდან დეტალამდე.

EIS/DSS ინსტრუმენტები უზრუნველყოფს აღმასრულებელ მოხსენებას, როგორიცაა „რა იქნებოდა, თუ“ ანალიზი და მენიუზე ორიენტირებული ანგარიშების წვდომა. მოხსენებები უნდა იყოს წინასწარ განსაზღვრული და შერწყმული მენიუებთან უფრო ადვილი ნავიგაციისთვის.
შეკითხვისა და მოხსენების ინსტრუმენტები მომხმარებლებს საშუალებას აძლევს შექმნან წინასწარ განსაზღვრული და კონკრეტული ანგარიშები.

მონაცემთა მოპოვების ინსტრუმენტები გამოიყენება ურთიერთობების იდენტიფიცირებისთვის, რომლებმაც შეიძლება ახალი შუქი მოჰფინონ დავიწყებულ ოპერაციებს ქვეყანაში მონაცემები მონაცემთა საწყობის.

თითოეული ტიპის მომხმარებლის მოთხოვნების ოპტიმიზაციასთან ერთად, არჩეული ინსტრუმენტები უნდა იყოს ინტუიციური, ეფექტური და მარტივი გამოსაყენებელი. ისინი ასევე უნდა იყვნენ თავსებადი არქიტექტურის სხვა ნაწილებთან და შეეძლოთ იმუშაონ არსებულ სისტემებთან. ასევე რეკომენდებულია მონაცემთა ხელმისაწვდომობისა და მოპოვების ხელსაწყოების არჩევა გონივრული ფასებით და შესრულებით. გასათვალისწინებელი სხვა კრიტერიუმები მოიცავს ხელსაწყოების გამყიდველის ვალდებულებას მხარი დაუჭიროს მათ პროდუქტს და როგორ განვითარდება ის მომავალ გამოშვებებში. მონაცემთა საწყობის გამოყენებაში მომხმარებლის ჩართულობის უზრუნველსაყოფად, დეველოპერული გუნდი მომხმარებლებს აერთიანებს ხელსაწყოების შერჩევის პროცესში. ამ შემთხვევაში უნდა ჩატარდეს მომხმარებლის პრაქტიკული შეფასება.

მონაცემთა საწყობის ღირებულების გასაუმჯობესებლად დეველოპერთა გუნდს ასევე შეუძლია უზრუნველყოს ვებ წვდომა მონაცემთა საწყობში. ინტერნეტში ჩართული მონაცემთა საწყობი მომხმარებლებს აძლევს წვდომას მონაცემები შორეული ადგილებიდან ან მოგზაურობის დროს. დამატებითი ინფორმაცია შეიძლება

უზრუნველყოფილი იქნება დაბალ ფასად ტრენინგის ხარჯების შემცირების გზით.

2.4.3 მონაცემთა საწყობი ოპერაციის ფაზა

ეს ეტაპი შედგება სამი აქტივობისგან: მონაცემთა განახლების სტრატეგიების განსაზღვრა, მონაცემთა საწყობის საქმიანობის კონტროლი და მონაცემთა საწყობის უსაფრთხოების მართვა.

მონაცემთა განახლების სტრატეგიების განსაზღვრა

საწყისი დატვირთვის შემდეგ, ე.ი მონაცემები in მონაცემთა ბაზა მონაცემთა საწყობი პერიოდულად უნდა განახლდეს მათში განხორციელებული ცვლილებების რეპროდუცირებისთვის მონაცემები ორიგინალები. ამიტომ თქვენ უნდა გადაწყვიტოთ როდის განაახლოთ, რამდენად ხშირად უნდა დაიგეგმოს განახლება და როგორ განაახლოთ მონაცემები მონაცემები. მიზანშეწონილია განაახლოთ მონაცემები როდესაც სისტემა შეიძლება ხაზგარეშე იყოს. განახლების სიხშირე განისაზღვრება დეველოპერის გუნდის მიერ მომხმარებლის მოთხოვნების საფუძველზე. მონაცემთა საწყობის განახლების ორი მიდგომა არსებობს: სრული განახლება და ცვლილებების უწყვეტი დატვირთვა.

პირველი მიდგომა, სრული განახლება, მოითხოვს ყველაფრის გადატვირთვას მონაცემები ნულიდან. ეს ნიშნავს, რომ ყველა მონაცემები საჭირო უნდა იყოს ამოღებული, გაწმენდილი, გარდაქმნილი და ინტეგრირებული თითოეულ განახლებაში. ეს მიდგომა შეძლებისდაგვარად თავიდან უნდა იქნას აცილებული, რადგან ის დიდ დროსა და რესურსებს მოითხოვს.

ალტერნატიული მიდგომაა ცვლილებების მუდმივად ატვირთვა. ეს ამატებს ი მონაცემები რომლებიც შეიცვალა მონაცემთა საწყობის ბოლო განახლების ციკლიდან. ახალი ან შეცვლილი ჩანაწერების იდენტიფიცირება მნიშვნელოვნად ამცირებს ოდენობას მონაცემები რომელიც უნდა გავრცელდეს მონაცემთა საწყობში ყოველ განახლებაში, რადგან მხოლოდ ეს მონაცემები დაემატება მონაცემთა ბაზა მონაცემთა საწყობის.

არსებობს მინიმუმ 5 მიდგომა, რომელიც შეიძლება გამოყენებულ იქნეს I მონაცემები ახალი ან შეცვლილი. მონაცემთა განახლების ეფექტური სტრატეგიის მისაღებად მონაცემები ამ მიდგომების ნარევი, რომელიც აღწერს სისტემაში არსებულ ყველა ცვლილებას, შეიძლება სასარგებლო იყოს.

პირველი მიდგომა, რომელიც იყენებს დროის ნიშანს, ვარაუდობს, რომ ყველა მინიჭებულია მონაცემები დაარედაქტირეთ და განაახლეთ დროის შტამპი, ასე რომ თქვენ შეგიძლიათ მარტივად ამოიცნოთ ყველა მონაცემები შეცვლილი და ახალი. თუმცა, ეს მიდგომა არ ყოფილა ფართოდ გამოყენებული დღევანდელი ოპერაციული სისტემების უმეტესობაში.
მეორე მიდგომა არის აპლიკაციის მიერ გენერირებული დელტა ფაილის გამოყენება, რომელიც შეიცავს მხოლოდ ცვლილებებს მონაცემები. ამ ფაილის გამოყენება ასევე აძლიერებს განახლების ციკლს. თუმცა, ეს მეთოდიც კი არ არის გამოყენებული ბევრ აპლიკაციაში.
მესამე მიდგომა არის ჟურნალის ფაილის სკანირება, რომელიც ძირითადად შეიცავს დელტა ფაილის მსგავს ინფორმაციას. ერთადერთი განსხვავება ისაა, რომ ჟურნალის ფაილი იქმნება აღდგენის პროცესისთვის და შეიძლება რთული გასაგები იყოს.
მეოთხე მიდგომა არის განაცხადის კოდის შეცვლა. თუმცა, აპლიკაციის კოდის უმეტესობა ძველი და მყიფეა; ამიტომ ეს ტექნიკა თავიდან უნდა იქნას აცილებული.
ბოლო მიდგომა არის შედარება ი მონაცემები წყაროები მთავარი dei ფაილით მონაცემები.

მონაცემთა საწყობის საქმიანობის მონიტორინგი

მას შემდეგ, რაც მონაცემთა საწყობი მიეწოდება მომხმარებლებს, ის დროთა განმავლობაში უნდა იყოს მონიტორინგი. ამ შემთხვევაში, მონაცემთა საწყობის ადმინისტრატორს შეუძლია გამოიყენოს ერთი ან მეტი მართვის და კონტროლის ინსტრუმენტი მონაცემთა საწყობის გამოყენების მონიტორინგისთვის. კერძოდ, ინფორმაციის შეგროვება შესაძლებელია ადამიანებისა და მონაცემთა საწყობში წვდომის დროის შესახებ. Მოდი მონაცემები შეგროვებული, შესრულებული სამუშაოს პროფილი შეიძლება შეიქმნას, რომელიც შეიძლება გამოყენებულ იქნას როგორც შემავალი მომხმარებლის დაბრუნების განხორციელებაში. Chargeback მომხმარებლებს საშუალებას აძლევს ინფორმირებულები იყვნენ მონაცემთა საწყობის დამუშავების ღირებულების შესახებ.

გარდა ამისა, მონაცემთა საწყობის აუდიტი ასევე შეიძლება გამოყენებულ იქნას მოთხოვნის ტიპების, მათი ზომის, დღეში მოთხოვნების რაოდენობის, შეკითხვის რეაქციის დროების, მიღწეული სექტორების და ოდენობის დასადგენად. მონაცემები დამუშავებული. მონაცემთა საწყობის აუდიტის გაკეთების კიდევ ერთი მიზანია იდენტიფიცირება მონაცემები რომლებიც არ გამოიყენება. ესენი მონაცემები მათი ამოღება შესაძლებელია მონაცემთა საწყობიდან დროის გასაუმჯობესებლად

შეკითხვის შესრულების პასუხი და კონტროლის ზრდა მონაცემები რომელიც ცხოვრობს ფარგლებში მონაცემთა ბაზა მონაცემთა საწყობის.

მონაცემთა საწყობის უსაფრთხოების მართვა

მონაცემთა საწყობი შეიცავს მონაცემები ინტეგრირებული, კრიტიკული, მგრძნობიარე, რომლის მიღწევაც ადვილად შეიძლება. ამ მიზეზით ის დაცული უნდა იყოს არაავტორიზებული მომხმარებლებისგან. უსაფრთხოების განხორციელების ერთ-ერთი გზაა del ფუნქციის გამოყენება DBMS სხვადასხვა ტიპის მომხმარებლისთვის სხვადასხვა პრივილეგიების მინიჭება. ამ გზით, წვდომის პროფილი უნდა იყოს დაცული თითოეული ტიპის მომხმარებლისთვის. მონაცემთა საწყობის უსაფრთხოების კიდევ ერთი გზაა მისი დაშიფვრა, როგორც ეს წერია მონაცემთა ბაზა მონაცემთა საწყობის. წვდომა მონაცემები და ამოღების ინსტრუმენტებმა უნდა გაშიფრონ მონაცემები მომხმარებლებისთვის შედეგების წარდგენამდე.

2.4.4 მონაცემთა საწყობი განლაგების ფაზა

ეს არის ბოლო ეტაპი მონაცემთა საწყობის განხორციელების ციკლში. ამ ფაზაში განსახორციელებელი აქტივობები მოიცავს მომხმარებლების ტრენინგს მონაცემთა საწყობის გამოყენებისთვის და მონაცემთა საწყობის მიმოხილვის განხორციელებას.

მომხმარებლის ტრენინგი

მომხმარებლის ტრენინგი უნდა ჩატარდეს წვდომამდე მონაცემები მონაცემთა საწყობისა და მოძიების ინსტრუმენტების გამოყენება. ზოგადად, სესიები უნდა დაიწყოს შენახვის კონცეფციის შესავალით მონაცემები, მონაცემთა საწყობის შინაარსი, მეტა მონაცემები და ინსტრუმენტების ძირითადი მახასიათებლები. შემდეგ, უფრო მოწინავე მომხმარებლებს ასევე შეეძლოთ შეისწავლონ ფიზიკური ცხრილები და მომხმარებლის მახასიათებლები მონაცემების ხელმისაწვდომობისა და მოპოვების ინსტრუმენტები.

მომხმარებლის ტრენინგის მრავალი მიდგომა არსებობს. ერთ-ერთი მათგანი მოიცავს მრავალი მომხმარებლის ან ანალიტიკოსის შერჩევას, რომლებიც არჩეულია მომხმარებლების ნაკრებიდან, მათი ლიდერობისა და კომუნიკაციის უნარებიდან გამომდინარე. ისინი პირადად გადიან ტრენინგს ყველაფერზე, რაც უნდა იცოდნენ სისტემის გაცნობისთვის. ტრენინგის დასრულების შემდეგ, ისინი უბრუნდებიან თავიანთ სამუშაოს და იწყებენ სხვა მომხმარებლების სწავლებას, თუ როგორ გამოიყენონ სისტემა. Ზე

მათ მიერ ნასწავლიდან გამომდინარე, სხვა მომხმარებლებს შეუძლიათ დაიწყონ მონაცემთა საწყობის შესწავლა.
კიდევ ერთი მიდგომა არის ერთდროულად ბევრი მომხმარებლის მომზადება, თითქოს საკლასო კურსს გადიხართ. ეს მეთოდი შესაფერისია მაშინ, როდესაც ბევრი მომხმარებელია, რომლებიც ერთდროულად საჭიროებენ ტრენინგს. კიდევ ერთი მეთოდია თითოეული მომხმარებლის ინდივიდუალურად მომზადება, სათითაოდ. ეს მეთოდი შესაფერისია, როდესაც მომხმარებელი ცოტაა.

მომხმარებლის ტრენინგის მიზანია გაეცნოთ წვდომას მონაცემები და აღდგენის ხელსაწყოები, ასევე მონაცემთა საწყობის შინაარსი. თუმცა, ზოგიერთი მომხმარებელი შეიძლება გადატვირთული იყოს ტრენინგის დროს მოწოდებული ინფორმაციის რაოდენობით. შემდეგ უნდა ჩატარდეს გარკვეული რაოდენობის განახლების სესიები მუდმივი დახმარებისთვის და კონკრეტულ კითხვებზე პასუხის გასაცემად. ზოგიერთ შემთხვევაში მომხმარებლის ჯგუფი იქმნება ამ ტიპის მხარდაჭერის უზრუნველსაყოფად.

გამოხმაურების შეგროვება

მას შემდეგ, რაც მონაცემთა საწყობი ამოქმედდება, მომხმარებლებს შეუძლიათ გამოიყენონ i მონაცემები რომლებიც ცხოვრობენ მონაცემთა საწყობში სხვადასხვა მიზნებისათვის. ძირითადად, ანალიტიკოსები ან მომხმარებლები იყენებენ ი მონაცემები მონაცემთა საწყობში:

1 კომპანიის ტენდენციების იდენტიფიცირება
2 გაანალიზეთ შესყიდვის პროფილები მომხმარებელს
3 გაყავით i მომხმარებელს ედ
4 მიეცით საუკეთესო მომსახურება მომხმარებელს - სერვისების მორგება
5 ჩამოაყალიბეთ სტრატეგიები მარკეტინგული
6 უზრუნველყოთ კონკურენტული შეთავაზებები ხარჯების ანალიზისთვის და დაეხმარეთ კონტროლს
7 სტრატეგიული გადაწყვეტილების მიღების მხარდაჭერა
8 გამოავლინეთ გამორჩევის შესაძლებლობები
9 მიმდინარე ბიზნეს პროცესების ხარისხის გაუმჯობესება
10 შეამოწმეთ მოგება

მონაცემთა საწყობის განვითარების მიმართულების შემდეგ, სისტემაში შეიძლება ჩატარდეს მიმოხილვების სერია უკუკავშირის მისაღებად

როგორც განვითარების გუნდიდან, ასევე საბოლოო მომხმარებლის საზოგადოებისგან.
მიღებული შედეგები შეიძლება მხედველობაში მივიღოთ განვითარების შემდეგი ციკლისთვის.

ვინაიდან მონაცემთა საწყობს აქვს დამატებითი მიდგომა, მნიშვნელოვანია ვისწავლოთ წინა მოვლენების წარმატებებზე და შეცდომებზე.

2.5 რეზიუმე

ამ თავში განხილულია ლიტერატურაში არსებული მიდგომები. პირველ ნაწილში განხილული იყო მონაცემთა საწყობის კონცეფცია და მისი როლი გადაწყვეტილების მეცნიერებაში. მე-1 ნაწილში აღწერილია ძირითადი განსხვავებები მონაცემთა საწყობებსა და OLTP სისტემებს შორის. მე-2 ნაწილში განვიხილეთ მონაშის მონაცემთა საწყობის მოდელი, რომელიც გამოყენებული იყო მე-3 ნაწილში მონაცემთა საწყობის შემუშავების პროცესში ჩართული აქტივობების აღსაწერად, ეს თეზისები არ იყო დაფუძნებული მკაცრ კვლევებზე. ის, რაც სინამდვილეში ხდება, შეიძლება ძალიან განსხვავდებოდეს ლიტერატურისგან, თუმცა ეს შედეგები შეიძლება გამოყენებულ იქნას ძირითადი ფონის შესაქმნელად, რომელიც ხაზს უსვამს მონაცემთა საწყობის კონცეფციას ამ კვლევისთვის.

Თავი 3

კვლევისა და დიზაინის მეთოდები

ეს თავი ეხება კვლევისა და დიზაინის მეთოდებს ამ კვლევისთვის. პირველი ნაწილი გვიჩვენებს ზოგად ხედვას კვლევის მეთოდების შესახებ, რომლებიც ხელმისაწვდომია ინფორმაციის მოსაპოვებლად, ასევე განხილულია კონკრეტული კვლევისთვის საუკეთესო მეთოდის შერჩევის კრიტერიუმები. მე-2 სექციაში განხილულია ორი მეთოდი, რომელიც შერჩეულია ახლახან გამოვლენილი კრიტერიუმებით; მათგან ერთ-ერთი შეირჩევა და მიიღება მე-3 ნაწილში მითითებული მიზეზებით, სადაც ასევე მოცემულია სხვა კრიტერიუმის გამორიცხვის მიზეზები. მე-4 ნაწილში წარმოდგენილია კვლევის დიზაინი, ხოლო მე-5 ნაწილი - დასკვნები.

3.1 კვლევა საინფორმაციო სისტემებში

საინფორმაციო სისტემებში კვლევა არ შემოიფარგლება მხოლოდ ტექნოლოგიური დომენით, არამედ უნდა გაფართოვდეს ქცევითი და ორგანიზაციული მიზნებისთვის.
ჩვენ ეს გვმართებს სხვადასხვა დისციპლინის თეზისებს, დაწყებული სოციალურიდან საბუნებისმეტყველო მეცნიერებამდე; ეს იწვევს კვლევის მეთოდების გარკვეული სპექტრის აუცილებლობას, რომელიც მოიცავს რაოდენობრივ და ხარისხობრივ მეთოდებს საინფორმაციო სისტემებისთვის.
ყველა ხელმისაწვდომი კვლევის მეთოდი მნიშვნელოვანია, ფაქტობრივად რამდენიმე მკვლევარი, როგორიცაა ჯენკინსი (1985), ნუნამეიკერი და სხვ. (1991) და Galliers (1992) ამტკიცებენ, რომ არ არსებობს კონკრეტული უნივერსალური მეთოდი ინფორმაციული სისტემების სხვადასხვა სფეროში კვლევის ჩასატარებლად; სინამდვილეში მეთოდი შეიძლება იყოს შესაფერისი კონკრეტული კვლევისთვის, მაგრამ არა სხვებისთვის. ეს გვაიძულებს შევარჩიოთ მეთოდი, რომელიც შესაფერისია ჩვენი კონკრეტული კვლევის პროექტისთვის: ამ არჩევანისთვის Benbasat et al. (1987) აცხადებენ, რომ გასათვალისწინებელია კვლევის ბუნება და მიზანი.

3.1.1 კვლევის ბუნება

კვლევის ბუნებაზე დაფუძნებული სხვადასხვა მეთოდები შეიძლება დაიყოს სამ ტრადიციად, რომლებიც ფართოდ არის ცნობილი საინფორმაციო მეცნიერებაში: პოზიტივისტური, ინტერპრეტაციული და კრიტიკული კვლევა.

3.1.1.1 პოზიტივისტური კვლევა

პოზიტივისტური კვლევა ასევე ცნობილია როგორც სამეცნიერო ან ემპირიული კვლევა. ის ცდილობს: „ახსნას და იწინასწარმეტყველოს რა მოხდება სოციალურ სამყაროში კანონზომიერებებისა და მიზეზ-შედეგობრივი ურთიერთობების დათვალიერებით მის შემადგენელ ელემენტებს შორის“ (Shanks et al 1993).

პოზიტივისტურ კვლევას ასევე ახასიათებს განმეორებადობა, გამარტივება და უარყოფა. გარდა ამისა, პოზიტივისტური კვლევა აღიარებს შესწავლილ ფენომენებს შორის აპრიორული ურთიერთობის არსებობას.
გალიერსის (1992) მიხედვით ტაქსონომია არის პოზიტივისტურ პარადიგმაში შემავალი კვლევის მეთოდი, რომელიც თუმცა ამით არ შემოიფარგლება, სინამდვილეში არის ლაბორატორიული ექსპერიმენტები, საველე ექსპერიმენტები, შემთხვევის შესწავლა, თეორემების დემონსტრირება, პროგნოზები და სიმულაციები. ამ მეთოდების გამოყენებით, მკვლევარები აღიარებენ, რომ შესწავლილი ფენომენების დაკვირვება შესაძლებელია ობიექტურად და მკაცრად.

3.1.1.2 ინტერპრეტაციული კვლევა

ინტერპრეტაციულ კვლევას, რომელსაც ხშირად ფენომენოლოგიას ან ანტიპოზიტივიზმს უწოდებენ, ნეუმანმა (1994) აღწერა, როგორც „მოქმედების სოციალური მნიშვნელობის სისტემატური ანალიზი ბუნებრივ სიტუაციებში ადამიანებზე პირდაპირი და დეტალური დაკვირვებით, რათა მივიდეთ გაგებამდე და ინტერპრეტაცია იმისა, თუ როგორ ქმნიან და ინარჩუნებენ ადამიანები თავიანთ სოციალურ სამყაროს“. ინტერპრეტაციული კვლევები უარყოფს ვარაუდს, რომ დაკვირვებული ფენომენების ობიექტურად დაკვირვება შესაძლებელია. სინამდვილეში ისინი ეფუძნება სუბიექტურ ინტერპრეტაციებს. გარდა ამისა, ინტერპრეტაციის მკვლევარები არ აწესებენ აპრიორულ მნიშვნელობებს მათ მიერ შესწავლილ ფენომენებს.

ეს მეთოდი მოიცავს სუბიექტურ/არგუმენტირებულ კვლევებს, სამოქმედო კვლევას, აღწერით/ინტერპრეტაციულ კვლევებს, მომავალ კვლევას და როლურ თამაშებს. გარდა ამ გამოკითხვებისა და შემთხვევის შესწავლა შეიძლება ჩართული იყოს ამ მიდგომაში, რადგან ისინი ეხება ინდივიდების ან ორგანიზაციების კვლევებს რეალურ სამყაროში რთულ სიტუაციებში.

3.1.1.3 კრიტიკული კვლევა

კრიტიკული კვლევა ყველაზე ნაკლებად ცნობილი მიდგომაა სოციალურ მეცნიერებებში, მაგრამ ახლახანს მიიპყრო ყურადღება საინფორმაციო სისტემების მკვლევართა მხრიდან. ფილოსოფიური ვარაუდი, რომ სოციალური რეალობა ისტორიულად წარმოებულია და რეპროდუცირებულია ხალხის მიერ, ისევე როგორც სოციალური სისტემები მათი ქმედებებითა და ურთიერთქმედებებით. თუმცა, მათი შესაძლებლობები განპირობებულია მრავალი სოციალური, კულტურული და პოლიტიკური მოსაზრებებით.

ინტერპრეტაციული კვლევის მსგავსად, კრიტიკული კვლევა ამტკიცებს, რომ პოზიტივისტურ კვლევას საერთო არაფერი აქვს სოციალურ კონტექსტთან და უგულებელყოფს მის გავლენას ადამიანის ქმედებებზე.
მეორე მხრივ, კრიტიკული კვლევა აკრიტიკებს ინტერპრეტაციულ კვლევას იმის გამო, რომ ის ძალიან სუბიექტურია და არ არის მიზნად ისახავს დაეხმაროს ადამიანებს საკუთარი ცხოვრების გაუმჯობესებაში. ყველაზე დიდი განსხვავება კრიტიკულ კვლევასა და დანარჩენ ორ მიდგომას შორის არის მისი შეფასებითი განზომილება. მიუხედავად იმისა, რომ პოზიტივისტური და ინტერპრეტაციული ტრადიციების ობიექტურობა არის სტატუს კვოს ან სოციალური რეალობის პროგნოზირება ან ახსნა, კრიტიკული კვლევა მიზნად ისახავს შესწავლილი სოციალური რეალობის კრიტიკულად შეფასებას და გარდაქმნას.

კრიტიკული მკვლევარები, როგორც წესი, ეწინააღმდეგებიან სტატუს კვოს, რათა აღმოიფხვრას სოციალური განსხვავებები და გააუმჯობესოს სოციალური პირობები. კრიტიკულ კვლევას აქვს ინტერესი ფენომენების პროცესული ხედვის ვალდებულება და, შესაბამისად, ჩვეულებრივ გრძივია. კვლევის მეთოდების მაგალითებია გრძელვადიანი ისტორიული კვლევები და ეთნოგრაფიული კვლევები. თუმცა, კრიტიკული კვლევა ფართოდ არ ყოფილა გამოყენებული საინფორმაციო სისტემების კვლევაში

3.1.2 კვლევის მიზანი

კვლევის ხასიათთან ერთად, მისი დანიშნულება შეიძლება გამოვიყენოთ მკვლევარისთვის კვლევის კონკრეტული მეთოდის შერჩევისას. კვლევითი პროექტის მიზანი მჭიდროდ არის დაკავშირებული კვლევის პოზიციასთან კვლევის ციკლთან მიმართებაში, რომელიც შედგება სამი ფაზისგან: თეორიის აგება, თეორიის ტესტირება და თეორიის დახვეწა. ამრიგად, კვლევის ციკლის დროიდან გამომდინარე, კვლევით პროექტს შეიძლება ჰქონდეს განმარტებითი, აღწერილობითი, საძიებო ან პროგნოზირებადი მიზანი.

3.1.2.1 საძიებო კვლევა

საძიებო კვლევა მიზნად ისახავს სრულიად ახალი თემის გამოკვლევას და მომავალი კვლევისთვის კითხვებისა და ჰიპოთეზების ჩამოყალიბებას. ამ ტიპის კვლევა გამოიყენება თეორიის მშენებლობაში ახალ სფეროში საწყისი ცნობების მოსაპოვებლად. როგორც წესი, გამოიყენება თვისებრივი კვლევის მეთოდები, როგორიცაა შემთხვევის კვლევები ან ფენომენოლოგიური კვლევები.

თუმცა, ასევე შესაძლებელია რაოდენობრივი ტექნიკის გამოყენება, როგორიცაა საძიებო კვლევები ან ექსპერიმენტები.

3.1.3.3 აღწერილობითი ძიება

აღწერილობითი კვლევა მიზნად ისახავს კონკრეტული ორგანიზაციული სიტუაციის ან პრაქტიკის გაანალიზებას და დეტალურად აღწერას. ეს შესაფერისია თეორიების შესაქმნელად და ასევე შეიძლება გამოყენებულ იქნას ჰიპოთეზების დასადასტურებლად ან გასაჩივრებლად. აღწერილობითი კვლევა ჩვეულებრივ მოიცავს ზომებისა და ნიმუშების გამოყენებას. კვლევის ყველაზე შესაფერისი მეთოდები მოიცავს გამოკითხვებს და წინამორბედების ანალიზს.

3.1.2.3 განმარტებითი კვლევა

ახსნა-განმარტებითი კვლევა ცდილობს ახსნას რატომ ხდება მოვლენები. ის აგებულია უკვე შესწავლილ ფაქტებზე და ცდილობს ამ ფაქტების მიზეზებს.
ამრიგად, ახსნა-განმარტებითი კვლევა ჩვეულებრივ აგებულია საძიებო ან აღწერით კვლევაზე და არის დამხმარე თეორიების ტესტირებისა და დახვეწისთვის. ახსნა-განმარტებითი კვლევა ჩვეულებრივ იყენებს საქმის შესწავლას ან გამოკითხვაზე დაფუძნებულ კვლევის მეთოდებს.

3.1.2.4 პრევენციული კვლევა

პრევენციული კვლევა მიზნად ისახავს დაკვირვების ქვეშ მყოფი მოვლენებისა და ქცევების პროგნოზირებას, რომლებიც შესწავლილია (მარშალი და როსმანი 1995). წინასწარმეტყველება არის ჭეშმარიტების სტანდარტული სამეცნიერო ტესტი. ამ ტიპის კვლევა ძირითადად იყენებს გამოკითხვებს ან ანალიზს მონაცემები ისტორიკოსები. (იინი 1989)

ზემოაღნიშნული დისკუსია აჩვენებს, რომ არსებობს მრავალი შესაძლო კვლევის მეთოდი, რომელიც შეიძლება გამოყენებულ იქნას კონკრეტულ კვლევაში. თუმცა, უნდა არსებობდეს ერთი კონკრეტული მეთოდი, რომელიც სხვებზე უფრო შესაფერისია კონკრეტული ტიპის კვლევითი პროექტისთვის. (Galliers 1987, Yin 1989, De Vaus 1991). ამიტომ თითოეულმა მკვლევარმა გულდასმით უნდა შეაფასოს სხვადასხვა მეთოდის ძლიერი და სუსტი მხარეები, რათა გამოიყენოს კვლევის ყველაზე შესაფერისი და თავსებადი კვლევის მეთოდი კვლევით პროექტთან. (Jenkins 1985, Pervan and Klass 1992, Bonomia 1985, Yin 1989, Himilton and Ives 1992).

3.2. კვლევის შესაძლო მეთოდები

ამ პროექტის მიზანი იყო ავსტრალიურ ორგანიზაციებში გამოცდილების შესწავლა ი მონაცემები ინახება განვითარებით მონაცემთა საწყობი. დათო რომ ამჟამად ავსტრალიაში მონაცემთა საწყობის სფეროში კვლევების ნაკლებობაა, ეს კვლევითი პროექტი ჯერ კიდევ კვლევის ციკლის თეორიულ ფაზაშია და აქვს საძიებო დანიშნულება. გამოცდილების შესწავლა ავსტრალიურ ორგანიზაციებში, რომლებიც იღებენ მონაცემთა საწყობს, მოითხოვს რეალური საზოგადოების ინტერპრეტაციას. შესაბამისად, ფილოსოფიური დაშვება, რომელიც ემყარება კვლევით პროექტს, მიჰყვება ტრადიციულ ინტერპრეტაციას.

ხელმისაწვდომი მეთოდების მკაცრი შემოწმების შემდეგ, გამოვლინდა კვლევის ორი შესაძლო მეთოდი: გამოკითხვები და შემთხვევის შესწავლა, რომლებიც შეიძლება გამოყენებულ იქნას საძიებო კვლევისთვის (Shanks et al. 1993). Galliers (1992) ამტკიცებს ამ ორი მეთოდის ვარგისიანობას ამ კონკრეტული კვლევისთვის მის შესწორებულ ტაქსონომიაში იმით, რომ ისინი ვარგისია თეორიის შესაქმნელად. შემდეგი ორი ქვეთავი დეტალურად განიხილავს თითოეულ მეთოდს.

3.2.1 გამოკითხვის კვლევის მეთოდი

გამოკითხვის კვლევის მეთოდი მომდინარეობს უძველესი აღწერის მეთოდიდან. აღწერა მოიცავს ინფორმაციის შეგროვებას მთელი მოსახლეობისგან. ეს მეთოდი ძვირი და არაპრაქტიკულია, განსაკუთრებით თუ მოსახლეობა დიდია. ამგვარად, აღწერასთან შედარებით, გამოკითხვა ჩვეულებრივ ფოკუსირებულია ინფორმაციის შეგროვებაზე მოსახლეობის მცირე რაოდენობის ან ნიმუშისთვის (Fowler 1988, Neuman 1994). ნიმუში ასახავს პოპულაციას, საიდანაც იგი არის შედგენილი, სხვადასხვა დონის სიზუსტით, რაც დამოკიდებულია შერჩევის სტრუქტურის, ზომისა და გამოყენებული შერჩევის მეთოდზე (Fowler 1988, Babbie 1982, Neuman 1994).

გამოკითხვის მეთოდი განისაზღვრება, როგორც „პრაქტიკის, სიტუაციების ან შეხედულებების კადრები დროის კონკრეტულ მომენტში, მიღებული კითხვარების ან ინტერვიუების გამოყენებით, საიდანაც შეიძლება დასკვნის გაკეთება
დამზადებულია“ (Galliers 1992:153) [პრაქტიკის, სიტუაციების ან შეხედულებების სურათი დროის კონკრეტულ მომენტში, მიღებული კითხვარების ან ინტერვიუების გამოყენებით, საიდანაც შეიძლება დასკვნის გაკეთება]. გამოკითხვები ეხება ინფორმაციის შეგროვებას კვლევის ზოგიერთი ასპექტის შესახებ, მონაწილეთა გარკვეული რაოდენობისგან, კითხვების დასმით (Fowler 1988). ეს კითხვარები და ინტერვიუები, რომლებიც მოიცავს პირისპირ სატელეფონო ინტერვიუებს და სტრუქტურირებულ ინტერვიუებს, ასევე არის შეგროვების ტექნიკა. მონაცემები ყველაზე ხშირად გამოყენებული გამოკვლევებში (Blalock 1970, Nachmias and Nachmias 1976, Fowler 1988), დაკვირვებები და ანალიზი შეიძლება გამოყენებულ იქნას (Gable 1994). შეგროვების ყველა ამ მეთოდიდან მონაცემებიკითხვარის გამოყენება ყველაზე პოპულარული ტექნიკაა, რადგან ის უზრუნველყოფს ი მონაცემები

შეგროვებული არის სტრუქტურირებული და ფორმატირებული და, შესაბამისად, ხელს უწყობს ინფორმაციის კლასიფიკაციას (Hwang 1987, de Vaus 1991).

ანალიზისას ი მონაცემებიგამოძიების სტრატეგია ხშირად იყენებს რაოდენობრივ ტექნიკას, როგორიცაა სტატისტიკური ანალიზი, მაგრამ თვისებრივი ტექნიკის გამოყენებაც შეიძლება (Galliers 1992, Pervan

და Klass 1992, Gable 1994). ჩვეულებრივ, ი მონაცემები შეგროვებული გამოიყენება ასოციაციების განაწილებისა და შაბლონების გასაანალიზებლად (Fowler 1988).

მიუხედავად იმისა, რომ გამოკითხვები ზოგადად მიზანშეწონილია კვლევისთვის, რომელიც ეხება კითხვას "რა?" (რა) ან მისგან გამომდინარე, მაგალითად, „რამდენი“ და „რამდენი“, ისინი შეიძლება დაისვას კითხვით „რატომ“ (Sonquist and Dunkelberg 1977, Yin 1989). სონკვისტისა და დუნკელბერგის (1977) მიხედვით, საგამოძიებო კვლევა მიზნად ისახავს ჰიპოთეზების გამოწვევას, პროგრამების შეფასებას, მოსახლეობის აღწერას და ადამიანის ქცევის მოდელების შემუშავებას. გარდა ამისა, გამოკითხვები შეიძლება გამოყენებულ იქნას მოსახლეობის გარკვეული აზრის, პირობების, მოსაზრებების, მახასიათებლების, მოლოდინების და თუნდაც წარსული ან აწმყო ქცევების შესასწავლად (Neuman 1994).

გამოკითხვები საშუალებას აძლევს მკვლევარს აღმოაჩინოს ურთიერთობა პოპულაციას შორის და შედეგები ჩვეულებრივ უფრო ზოგადია, ვიდრე სხვა მეთოდები (Sonquist and Dunkelberg 1977, Gable 1994). გამოკითხვები საშუალებას აძლევს მკვლევარებს დაფარონ უფრო დიდი გეოგრაფიული არეალი და მიაღწიონ ბევრ რესპონდენტს (Blalock 1970, Sonquist and Dunkelberg 1977, Hwang and Lin 1987, Gable 1994, Neuman 1994). დაბოლოს, კვლევებმა შეიძლება მიაწოდოს ინფორმაცია, რომელიც არ არის ხელმისაწვდომი სხვაგან ან ანალიზისთვის საჭირო ფორმით (Fowler 1988).

თუმცა, არსებობს გარკვეული შეზღუდვები გამოკითხვის ჩატარებისას. მინუსი არის ის, რომ მკვლევარს არ შეუძლია მიიღოს ბევრი ინფორმაცია შესწავლილი ობიექტის შესახებ. ეს გამოწვეულია იმით, რომ კვლევები ტარდება მხოლოდ კონკრეტულ დროს და, შესაბამისად, არის შეზღუდული რაოდენობის ცვლადები და ადამიანები, რომლებიც მკვლევარს შეუძლია.

კვლევა (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). კიდევ ერთი მინუსი არის ის, რომ გამოკითხვის ჩატარება შეიძლება იყოს ძალიან ძვირი დროისა და რესურსების თვალსაზრისით, განსაკუთრებით თუ ის მოიცავს პირისპირ ინტერვიუს (Fowler 1988).

3.2.2. გამოკითხვის კვლევის მეთოდი

გამოკითხვის კვლევის მეთოდი გულისხმობს კონკრეტული სიტუაციის სიღრმისეულ შესწავლას მის რეალურ კონტექსტში დროის განსაზღვრულ პერიოდში, მკვლევარის ყოველგვარი ჩარევის გარეშე (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). ძირითადად ეს მეთოდი გამოიყენება კონკრეტულ სიტუაციაში შესწავლილ ცვლადებს შორის მიმართებების აღსაწერად (Galliers 1992). გამოძიება შეიძლება მოიცავდეს ერთ ან რამდენიმე შემთხვევას, გაანალიზებული ფენომენის მიხედვით (Franz and Robey 1987, Eisenhardt 1989, Yin 1989).

გამოკითხვის კვლევის მეთოდი განისაზღვრება, როგორც „ემპირიული კვლევა, რომელიც სწავლობს თანამედროვე ფენომენს მის ფაქტობრივ კონტექსტში, ერთი ან მეტი ერთეულისგან შეგროვებული მრავალი წყაროს გამოყენებით, როგორიცაა ადამიანები, ჯგუფები ან ორგანიზაციები“ (Yin 1989). არ არსებობს მკაფიო გამიჯვნა ფენომენსა და მის კონტექსტს შორის და არ არსებობს ცვლადების ექსპერიმენტული კონტროლი ან მანიპულირება (Yin 1989, Benbasat et al. 1987).

შეგროვების სხვადასხვა ტექნიკა არსებობს მონაცემები რომელიც შეიძლება გამოყენებულ იქნას გამოკითხვის მეთოდში, რომელიც მოიცავს პირდაპირ დაკვირვებას, საარქივო ჩანაწერების მიმოხილვას, კითხვარებს, დოკუმენტაციის მიმოხილვას და სტრუქტურირებულ ინტერვიუებს. მოსავლის აღების ტექნიკის მრავალფეროვანი სპექტრი მონაცემები, გამოკვლევები მკვლევარებს ორივესთან გამკლავების საშუალებას აძლევს მონაცემები ხარისხობრივი და რაოდენობრივი ამავე დროს (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). გამოკითხვის მეთოდის მსგავსად, გამოკითხვის მკვლევარი ემსახურება როგორც დამკვირვებელს ან მკვლევარს და არა როგორც შესწავლილ ორგანიზაციაში აქტიურ მონაწილეს.

ბენბასატი და სხვები (1987) ამტკიცებენ, რომ კვლევის მეთოდი განსაკუთრებით შესაფერისია კვლევის თეორიის შესაქმნელად, რომელიც იწყება კვლევის კითხვით და გრძელდება განათლებით.

თეორიის შეგროვების პროცესში მონაცემები. სცენისთვისაც ვარგა

თეორიის აგების შესახებ, ფრანცი და რობი (1987) ვარაუდობენ, რომ კვლევის მეთოდი ასევე შეიძლება გამოყენებულ იქნას კომპლექსური თეორიის ფაზაში. ამ შემთხვევაში, შეგროვებული მტკიცებულებების საფუძველზე, მოცემული თეორია ან ჰიპოთეზა მოწმდება ან უარყოფილია. გარდა ამისა, გამოკითხვა ასევე შესაფერისია კვლევისთვის, რომელიც ეხება „როგორ“ ან „რატომ“ კითხვებს (Yin 1989).

სხვა მეთოდებთან შედარებით, გამოკითხვები საშუალებას აძლევს მკვლევარს უფრო დეტალურად აღიქვას არსებითი ინფორმაცია (Galliers 1992, Shanks et al. 1993). გარდა ამისა, გამოკითხვები საშუალებას აძლევს მკვლევარს გაიგოს შესწავლილი პროცესების ბუნება და სირთულე (Benbasat et al. 1987).

გამოკითხვის მეთოდთან დაკავშირებული ოთხი ძირითადი მინუსია. პირველი არის კონტროლირებადი გამოქვითვების ნაკლებობა. მკვლევარის სუბიექტურობას შეუძლია შეცვალოს კვლევის შედეგები და დასკვნები (Yin 1989). მეორე მინუსი არის კონტროლირებადი დაკვირვების არარსებობა. ექსპერიმენტული მეთოდებისგან განსხვავებით, გამოკითხვის მკვლევარი ვერ აკონტროლებს შესწავლილ ფენომენებს, რადგან ისინი განიხილება მათ ბუნებრივ კონტექსტში (Gable 1994). მესამე მინუსი არის გამეორების ნაკლებობა. ეს იმიტომ ხდება, რომ მკვლევარი ნაკლებად სავარაუდოა, რომ დააკვირდეს ერთსა და იმავე მოვლენებს და ვერ ამოწმებს კონკრეტული კვლევის შედეგებს (ლი 1989). დაბოლოს, განუმეორებლობის შედეგად, ძნელია ერთი ან მეტი გამოკვლევის შედეგად მიღებული შედეგების განზოგადება (Galliers 1992, Shanks et al 1993). თუმცა, ყველა ეს პრობლემა არ არის გადაულახავი და, ფაქტობრივად, მკვლევარმა შეიძლება მინიმუმამდე დაიყვანოს შესაბამისი ქმედებების გამოყენებით (ლი 1989).

3.3. დაასაბუთეთ კვლევის მეთოდოლოგია მიღებული

ამ კვლევის ორი შესაძლო კვლევის მეთოდიდან გამოკითხვის მეთოდი ითვლება ყველაზე შესაფერისად. გამოძიება შეწყდა შესაბამისი საკითხების გულდასმით განხილვის შემდეგ

ღირსებები და სისუსტეები. თითოეული მეთოდის მიზანშეწონილობა ან შეუსაბამობა ამ კვლევისთვის განხილულია ქვემოთ.

3.3.1. კვლევის მეთოდის შეუსაბამობა გამოძიების

კვლევის მეთოდი მოითხოვს სიღრმისეულ შესწავლას კონკრეტული სიტუაციის შესახებ ერთ ან რამდენიმე ორგანიზაციაში გარკვეული პერიოდის განმავლობაში (Eisenhardt 1989). ამ შემთხვევაში, პერიოდი შეიძლება აღემატებოდეს ამ კვლევისთვის მოცემულ ვადას. კვლევის მეთოდის არმიღების კიდევ ერთი მიზეზი არის ის, რომ შედეგები შეიძლება განიცადოს სიმკაცრის ნაკლებობით (Yin 1989). მკვლევარის სუბიექტურობას შეუძლია გავლენა მოახდინოს შედეგებსა და დასკვნებზე. კიდევ ერთი მიზეზი არის ის, რომ ეს მეთოდი უფრო შესაფერისია „როგორ“ ან „რატომ“ ტიპის კითხვებზე კვლევისთვის (Yin 1989), მაშინ როდესაც კვლევის კითხვა ამ კვლევისთვის არის „რა“ ტიპის. დაბოლოს, რაც არანაკლებ მნიშვნელოვანია, ძნელია მხოლოდ ერთი ან რამდენიმე გამოკვლევის შედეგების განზოგადება (Galliers 1992, Shanks et al. 1993). ამ დასაბუთებიდან გამომდინარე, გამოკითხვის კვლევის მეთოდი არ იყო არჩეული, რადგან ის ამ კვლევისთვის შეუფერებელი იყო.

3.3.2. ძებნის მეთოდის მოხერხებულობა გამოძიება

როდესაც ეს კვლევა ჩატარდა, მონაცემთა შენახვის პრაქტიკა ფართოდ არ იყო მიღებული ავსტრალიური ორგანიზაციების მიერ. ასე რომ, არ იყო ბევრი ინფორმაცია მათი განხორციელების შესახებ ავსტრალიურ ორგანიზაციებში. ხელმისაწვდომი ინფორმაცია მოვიდა ორგანიზაციებისგან, რომლებმაც განახორციელეს ან გამოიყენეს ა მონაცემთა საწყობი. ამ შემთხვევაში გამოკითხვის კვლევის მეთოდი ყველაზე შესაფერისია, რადგან ის იძლევა ინფორმაციის მოპოვების საშუალებას, რომელიც არ არის ხელმისაწვდომი სხვაგან ან ანალიზისთვის საჭირო ფორმით (Fowler 1988). გარდა ამისა, გამოკითხვის კვლევის მეთოდი საშუალებას აძლევს მკვლევარს კარგი წარმოდგენა ჰქონდეს კონკრეტულ დროს პრაქტიკაში, სიტუაციებში ან შეხედულებებზე (Galliers 1992, Denscombe 1998). საჭირო იყო მიმოხილვა ავსტრალიის მონაცემთა შენახვის გამოცდილების შესახებ ცოდნის გასაზრდელად.

გარდა ამისა, Sonquist და Dunkelberg (1977) აცხადებენ, რომ კვლევის შედეგები უფრო ზოგადია, ვიდრე სხვა მეთოდები.

3.4. გამოკითხვის კვლევის დიზაინი

კვლევა მონაცემთა სასაწყობო პრაქტიკის შესახებ ჩატარდა 1999 წელს. სამიზნე პოპულაცია შედგებოდა ავსტრალიური ორგანიზაციებისგან, რომლებიც დაინტერესებულნი იყვნენ მონაცემთა საწყობის კვლევებით, რადგან ისინი ალბათ უკვე იყვნენ ინფორმირებული. მონაცემები რომ ისინი ინახავენ და, შესაბამისად, შეუძლიათ ამ კვლევისთვის სასარგებლო ინფორმაციის მიწოდება. სამიზნე პოპულაცია გამოვლინდა მონაცემთა შენახვის ინსტიტუტის (Tdwi-aap) ყველა ავსტრალიელი წევრის თავდაპირველი გამოკითხვით. ეს ნაწილი განიხილავს ამ კვლევის ემპირიული კვლევის ფაზის დიზაინს.

3.4.1. მოსავლის აღების ტექნიკა მონაცემები

სამი ტექნიკიდან, რომელიც ჩვეულებრივ გამოიყენება გამოკითხვის კვლევაში (მაგ. ფოსტით კითხვარი, სატელეფონო ინტერვიუ და პირადი ინტერვიუ) (Nachmias 1976, Fowler 1988, de Vaus 1991), ამ კვლევისთვის მიღებულ იქნა ფოსტის კითხვარი. ამ უკანასკნელის მიღების პირველი მიზეზი არის ის, რომ მას შეუძლია მიაღწიოს გეოგრაფიულად გაფანტულ მოსახლეობას (Blalock 1970, Nachmias and Nachmias 1976, Hwang and Lin 1987, de Vaus 1991, Gable 1994). მეორეც, ფოსტის კითხვარი შესაფერისია მაღალი განათლების მქონე მონაწილეებისთვის (Fowler 1988). ფოსტის კითხვარი ამ კვლევისთვის მიმართული იყო მონაცემთა შენახვის პროექტის სპონსორებისთვის, დირექტორებისთვის და/ან პროექტის მენეჯერებისთვის. მესამე, ფოსტის კითხვარები შესაფერისია, როდესაც ხელმისაწვდომია დაგზავნის უსაფრთხო სია (Salant and Dilman 1994). TDWI, ამ შემთხვევაში, სანდო მონაცემთა საწყობის ასოციაციამ წარმოადგინა თავისი ავსტრალიელი წევრების საფოსტო სია. ფოსტის კითხვარის კიდევ ერთი უპირატესობა სატელეფონო კითხვართან ან პირად ინტერვიუებთან შედარებით არის ის, რომ ის საშუალებას აძლევს რესპონდენტებს უფრო ზუსტად უპასუხონ, განსაკუთრებით მაშინ, როდესაც რესპონდენტებმა უნდა გაიარონ შენიშვნები ან განიხილონ კითხვები სხვა ადამიანებთან (Fowler 1988).

პოტენციური მინუსი შეიძლება იყოს კითხვარების ფოსტით ჩასატარებლად საჭირო დრო. ჩვეულებრივ, ფოსტით გამოკითხვა ტარდება ამ თანმიმდევრობით: ფოსტით წერილები, დაელოდეთ პასუხებს და გაგზავნეთ დადასტურება (Fowler 1988, Bainbridge 1989). ამრიგად, მთლიანი დრო შეიძლება იყოს უფრო მეტი, ვიდრე პირადი ინტერვიუებისთვის ან სატელეფონო ინტერვიუებისთვის საჭირო დრო. თუმცა, მთლიანი დრო შეიძლება წინასწარ იყოს ცნობილი (Fowler 1988, Denscombe 1998). პერსონალური ინტერვიუების ჩატარებაზე დახარჯული დრო წინასწარ არ შეიძლება იყოს ცნობილი, რადგან ის განსხვავდება ერთი ინტერვიუდან მეორეში (Fowler 1988). სატელეფონო ინტერვიუები შეიძლება იყოს უფრო სწრაფი, ვიდრე საფოსტო კითხვარები და პირადი ინტერვიუები, მაგრამ შეიძლება ჰქონდეს მაღალი უპასუხო მაჩვენებელი ზოგიერთი ადამიანის მიუწვდომლობის გამო (Fowler 1988). გარდა ამისა, სატელეფონო ინტერვიუები ზოგადად შემოიფარგლება კითხვების შედარებით მოკლე სიით (Bainbridge 1989).

ფოსტის კითხვარის კიდევ ერთი სისუსტე არის უპასუხო მაღალი მაჩვენებელი (Fowler 1988, Bainbridge 1989, Neuman 1994). თუმცა, მიღებული იქნა კონტრზომები ამ კვლევის ასოცირებით სანდო მონაცემთა სასაწყობო ინსტიტუტთან (მაგ. TDWI) (Bainbridge 1989, Neuman 1994), რომელიც აგზავნის ორ შეხსენების წერილს უპასუხოდ (Fowler 1988, Neuman 1994) და ასევე შეიცავს დამატებით წერილს. კვლევის მიზნის ახსნა (Neuman 1994).

3.4.2. ანალიზის ერთეული

ამ კვლევის მიზანია ინფორმაციის მოპოვება ავსტრალიურ ორგანიზაციებში მონაცემთა შენახვისა და მისი გამოყენების შესახებ. სამიზნე პოპულაცია შედგება ყველა ავსტრალიური ორგანიზაციისგან, რომლებმაც განახორციელეს ან ახორციელებენ ე.ი მონაცემთა საწყობი. შემდეგ ცალკეული ორგანიზაციები რეგისტრირდება სახელზე. კითხვარი ფოსტით გაიგზავნა მიმღებით დაინტერესებულ ორგანიზაციებს მონაცემთა საწყობი. ეს მეთოდი უზრუნველყოფს, რომ შეგროვებული ინფორმაცია მომდინარეობს თითოეული მონაწილე ორგანიზაციის ყველაზე შესაფერისი რესურსებიდან.

3.4.3. გამოკითხვის ნიმუში

კვლევის მონაწილეთა „დაგზავნის სია“ მიღებული იქნა TDWI-დან. ამ სიიდან შერჩევის საფუძვლად შეირჩა 3000 ავსტრალიური ორგანიზაცია. ნიმუშს გაეგზავნა დამატებითი წერილი, რომელშიც ახსნილია კვლევის პროექტი და მიზანი, პასუხების ფურცელთან და წინასწარ გადახდილ კონვერტთან ერთად შევსებული კითხვარის დასაბრუნებლად. 3000 ორგანიზაციიდან კვლევაში მონაწილეობაზე 198 დათანხმდა. ასეთი მცირე რაოდენობის პასუხები მოსალოდნელი იყო dato ავსტრალიური ორგანიზაციების დიდი რაოდენობა, რომლებიც მაშინ იღებდნენ ან იღებდნენ მონაცემთა შენახვის სტრატეგიას თავიანთ ორგანიზაციებში. ამრიგად, ამ კვლევის სამიზნე პოპულაცია მხოლოდ 198 ორგანიზაციისგან შედგება.

3.4.4. კითხვარის შინაარსი

კითხვარის სტრუქტურა ეფუძნებოდა მონაშის მონაცემთა საწყობის მოდელს (ადრე განხილული იყო 2.3 ნაწილში). კითხვარის შინაარსი ეყრდნობოდა მე-2 თავში წარმოდგენილ ლიტერატურის ანალიზს. გამოკითხვის მონაწილეებისთვის გაგზავნილი კითხვარის ასლი შეგიძლიათ იხილოთ დანართ B-ში. კითხვარი შედგება ექვსი განყოფილებისგან, რომლებიც მიჰყვება მოდელის ფაზებს. შემდეგი ექვსი აბზაცი მოკლედ აჯამებს თითოეული ნაწილის შინაარსს.

ნაწილი A: ძირითადი ინფორმაცია ორგანიზაციის შესახებ
ეს განყოფილება შეიცავს კითხვებს მონაწილე ორგანიზაციების პროფილთან დაკავშირებით. გარდა ამისა, ზოგიერთი შეკითხვა დაკავშირებულია მონაწილის მონაცემთა საწყობის პროექტის სტატუსთან. კონფიდენციალური ინფორმაცია, როგორიცაა ორგანიზაციის დასახელება, არ გამოვლინდა კვლევის ანალიზში.

სექცია B: დასაწყისი
ამ განყოფილების კითხვები დაკავშირებულია მონაცემთა შენახვის დაწყების ამოცანასთან. დაისვა კითხვები პროექტის ინიციატორების, გარანტიების, საჭირო უნარებისა და ცოდნის, მონაცემთა შენახვის განვითარების მიზნებისა და საბოლოო მომხმარებლის მოლოდინების შესახებ.

სექცია C: დიზაინი
ეს განყოფილება შეიცავს კითხვებს, რომლებიც დაკავშირებულია აქტივობების დაგეგმვასთან მონაცემთა საწყობი. კერძოდ, კითხვები ეხებოდა შესრულების მოცულობას, პროექტის ხანგრძლივობას, პროექტის ღირებულებას და ღირებულება/სარგებელი ანალიზს.

ნაწილი D: განვითარება
განვითარების განყოფილებაში არის კითხვები, რომლებიც ეხება განვითარების საქმიანობას მონაცემთა საწყობი: საბოლოო მომხმარებლის მოთხოვნების კოლექცია, წყაროები მონაცემები, ლოგიკური მოდელი მონაცემებიპროტოტიპები, სიმძლავრის დაგეგმვა, ტექნიკური არქიტექტურები და მონაცემთა საწყობის განვითარების ინსტრუმენტების შერჩევა.

ნაწილი E: ოპერაცია
ოპერაციული კითხვები, რომლებიც დაკავშირებულია ფუნქციონირებასთან და გაფართოებასთან მონაცემთა საწყობი, როგორ ვითარდება ის განვითარების მომდევნო ფაზაში. იქ მონაცემთა ხარისხი, განახლების სტრატეგიები მონაცემები, მარცვლოვნება მონაცემები, მასშტაბურობა მონაცემთა საწყობი და უსაფრთხოების საკითხები მონაცემთა საწყობი იყო დასმულ კითხვებს შორის.

ნაწილი F: განვითარება
ეს განყოფილება შეიცავს კითხვებს, რომლებიც დაკავშირებულია გამოყენებასთან მონაცემთა საწყობი საბოლოო მომხმარებლების მიერ. მკვლევარი დაინტერესდა მისი მიზნებითა და სარგებლიანობით მონაცემთა საწყობიმიღებულ იქნა მიმოხილვისა და ტრენინგის სტრატეგიები და კონტროლის სტრატეგია მონაცემთა საწყობი მიღებული.

3.4.5. Საპასუხო კურსი

მიუხედავად იმისა, რომ ფოსტით გამოკითხვებს აკრიტიკებენ დაბალი პასუხის მაჩვენებლის გამო, მიღებულია ზომები დაბრუნების კოეფიციენტის გაზრდის მიზნით (როგორც ზემოთ იყო განხილული ნაწილი 3.4.1). ტერმინი „პასუხის კოეფიციენტი“ აღნიშნავს გამოკითხვის კონკრეტულ ნიმუშში ადამიანთა პროცენტს, რომლებიც პასუხობენ კითხვარს (Denscombe 1998). ამ კვლევისთვის პასუხის სიჩქარის გამოსათვლელად გამოყენებული იყო შემდეგი ფორმულა:

გამოხმაურებულთა რაოდენობა
პასუხის კოეფიციენტი = —————————————————————————– X 100 გაგზავნილი კითხვარების საერთო რაოდენობა

3.4.6. პილოტის ტესტი

სანამ კითხვარი გაეგზავნებოდა ნიმუშს, კითხვები განიხილებოდა საპილოტე ტესტების ჩატარებით, როგორც ვარაუდობდნენ ლუკი და რუბინი (1987), ჯექსონი (1988) და დე ვაუსი (1991). საპილოტე ტესტების მიზანია გამოავლინოს უხერხული, ორაზროვანი გამონათქვამები და კითხვები, რომელთა ინტერპრეტაცია რთულია, ახსნას გამოყენებული განმარტებები და ტერმინები და დაადგინოს კითხვარის შევსებისთვის საჭირო სავარაუდო დრო (Warwick and Lininger 1975, Jackson 1988, Salant. და დილმანი 1994). საპილოტე ტესტები ჩატარდა სუბიექტების შერჩევით, რომლებსაც აქვთ საბოლოო საგნების მახასიათებლების მსგავსი მახასიათებლები, როგორც შემოთავაზებულია დევის ე. Cosenza (1993). ამ კვლევაში საპილოტე სუბიექტად შეირჩა მონაცემთა შენახვის ექვსი პროფესიონალი. ყოველი საპილოტე ტესტის შემდეგ გაკეთდა საჭირო კორექტივები. ჩატარებული საპილოტე ტესტებიდან მონაწილეებმა წვლილი შეიტანეს კითხვარის საბოლოო ვერსიის შეცვლასა და გადატვირთვაში.

3.4.7. ანალიზის მეთოდები By dati

I მონაცემები დახურული კითხვარებიდან შეგროვებული გამოკითხვები გაანალიზდა სტატისტიკური პროგრამის პაკეტის გამოყენებით, სახელწოდებით SPSS. ბევრი პასუხი გაანალიზდა აღწერილობითი სტატისტიკის გამოყენებით. რამდენიმე კითხვარი დაბრუნდა არასრულად. მათ უფრო დიდი სიფრთხილით ეპყრობოდნენ, რათა უზრუნველვყოთ, რომ ი მონაცემები დაკარგული არ იყო მონაცემთა შეყვანის შეცდომების შედეგი, არამედ იმიტომ, რომ კითხვები არ იყო შესაფერისი რეგისტრატორისთვის, ან რეგისტრატორმა გადაწყვიტა არ უპასუხა ერთ ან მეტ კონკრეტულ კითხვას. ეს გამოტოვებული პასუხები იგნორირებული იყო ანალიზის დროს მონაცემები და კოდირებული იყო როგორც '-9', რათა უზრუნველყოფილიყო მათი გამორიცხვა ანალიზის პროცესიდან.

კითხვარის მომზადებისას დახურული კითხვების წინასწარ კოდირება მოხდა თითოეული ვარიანტისთვის ნომრის მინიჭებით. შემდეგ რიცხვი გამოიყენებოდა მოსამზადებლად მონაცემები ანალიზის დროს (Denscombe 1998, Sapsford and Jupp 1996). მაგალითად, B სექციის 1-ლ კითხვაში ჩამოთვლილი იყო ექვსი ვარიანტი: დირექტორთა საბჭო, უფროსი აღმასრულებელი, IT დეპარტამენტი, ბიზნეს განყოფილება, კონსულტანტები და სხვა. ფაილში მონაცემები SPSS-ში შეიქმნა ცვლადი "პროექტის ინიციატორის" მითითებით, ექვსი მნიშვნელობით: "1" "დირექტორთა საბჭოსთვის", "2" "უმაღლესი აღმასრულებელი" და ა.შ. ლიკერტინის სკალის გამოყენება ზოგიერთ დახურულ კითხვაში ასევე იძლეოდა იდენტიფიკაციის საშუალებას SPSS-ში შეყვანილი შესაბამისი რიცხვითი მნიშვნელობების გამოყენების გათვალისწინებით. არასრული პასუხის მქონე კითხვებისთვის, რომლებიც არ იყო ურთიერთგამომრიცხავი, თითოეული ვარიანტი განიხილებოდა, როგორც ერთი ცვლადი ორი მნიშვნელობის ლეიბლით: „1“ „მონიშნული“ და „2“ „არ არის მონიშნული“.

ღია კითხვები განსხვავებულად განიხილებოდა დახურული კითხვებისგან. ამ კითხვებზე პასუხები არ იყო შესული SPSS-ში. სამაგიეროდ, ხელით გაანალიზეს. ამ ტიპის კითხვის გამოყენება საშუალებას გვაძლევს მივიღოთ ინფორმაცია რესპონდენტთა თავისუფლად გამოხატული იდეებისა და პირადი გამოცდილების შესახებ (Bainbridge 1989, Denscombe 1998). სადაც შესაძლებელი იყო, განხორციელდა პასუხების კატეგორიზაცია.

ანალიზისთვის მონაცემები, გამოიყენება მარტივი სტატისტიკური ანალიზის მეთოდები, როგორიცაა პასუხის სიხშირე, საშუალო, სტანდარტული გადახრა და მედიანა (Argyrous 1996, Denscombe 1998).
გამა ტესტი კარგად მოქმედებდა შორის ასოციაციების რაოდენობრივი ზომების მისაღებად მონაცემები ორდინალები (ნორუსისი 1983, არგიროსი 1996). ეს ტესტები იყო შესაბამისი, რადგან გამოყენებული რიგითი სკალები არ იყო ბევრი კატეგორიის და შეიძლება ნაჩვენები იყოს ცხრილში (Norusis 1983).

3.5 სომარიო

ამ თავში განხილული იყო ამ კვლევისთვის მიღებული კვლევის მეთოდოლოგია და დიზაინი.

კონკრეტული კვლევისთვის ყველაზე შესაფერისი კვლევის მეთოდის არჩევისას გათვალისწინებულია
რიგი წესების გათვალისწინება, მათ შორის კვლევის ბუნება და ტიპი, ასევე თითოეული შესაძლო მეთოდის უპირატესობები და სუსტი მხარეები (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987, yin 1989, Hamilton and ives 1992, Galliers 1992, Neuman 1994). ავსტრალიაში მონაცემთა შენახვის შესახებ არსებული ცოდნისა და თეორიის ნაკლებობის გათვალისწინებით, ეს კვლევის კვლევა მოითხოვს ინტერპრეტაციული კვლევის მეთოდს ავსტრალიური ორგანიზაციების გამოცდილების შესასწავლად საძიებო შესაძლებლობით. არჩეული კვლევის მეთოდი შეირჩა ინფორმაციის შესაგროვებლად ავსტრალიური ორგანიზაციების მიერ მონაცემთა შენახვის კონცეფციის მიღების შესახებ. შეგროვების ტექნიკად არჩეული იყო საფოსტო კითხვარი მონაცემები. კვლევის მეთოდისა და შეგროვების ტექნიკის დასაბუთება მონაცემები შერჩეული წარმოდგენილი იქნება ამ თავში. ასევე, გაიმართა დისკუსია ანალიზის ერთეულზე, გამოყენებულ ნიმუშზე, პასუხების პროცენტებზე, კითხვარის შინაარსზე, კითხვარის პრეტესტზე და ანალიზის მეთოდზე. მონაცემები.

დიზაინის ა მონაცემთა საწყობი:

ერთეულის ურთიერთობისა და განზომილებიანი მოდელირების გაერთიანება

რეფერატი
შენახვა ი მონაცემები მრავალი ორგანიზაციის მთავარი აქტუალური საკითხია. მთავარი საკითხი კომპიუტერის შენახვის განვითარებაში მონაცემები ეს მისი დიზაინია.
დიზაინმა ხელი უნდა შეუწყოს ცნებების გამოვლენას მონაცემთა საწყობი მემკვიდრეობით სისტემას და სხვა წყაროებს მონაცემები და ასევე მარტივი გაგება და ეფექტურობა განხორციელებაში მონაცემთა საწყობი.
შენახვის ლიტერატურის დიდი ნაწილი მონაცემები რეკომენდაციას იძლევა ერთეულების ურთიერთობის მოდელირების ან განზომილებიანი მოდელირების გამოყენებას დიზაინის წარმოსადგენად მონაცემთა საწყობი.
ამ ნაშრომში ჩვენ ვაჩვენებთ, თუ როგორ შეიძლება ორივე წარმოდგენა გაერთიანდეს ნახატის ერთ მიდგომაში მონაცემთა საწყობი. გამოყენებული მიდგომა არის სისტემატური

გამოკვლეულია საქმის შესწავლაში და იდენტიფიცირებულია პრაქტიკოსებთან მრავალი მნიშვნელოვანი შედეგის მიხედვით.

მონაცემთა საწყობი

Un მონაცემთა საწყობი ის ჩვეულებრივ განიმარტება, როგორც „სუბიექტზე ორიენტირებული, ინტეგრირებული, დროზე ვარიაციული და არასტაბილური მონაცემთა შეგროვება მენეჯმენტის გადაწყვეტილებების მხარდასაჭერად“ (Inmon and Hackathorn, 1994). სუბიექტზე ორიენტირებული და ინტეგრირებული მიუთითებს იმაზე, რომ მონაცემთა საწყობი შექმნილია Legaci სისტემების ფუნქციური საზღვრების გადაკვეთისთვის, რათა შემოგთავაზოთ ინტეგრირებული პერსპექტივა მონაცემები.
დროის ვარიაცია გავლენას ახდენს ისტორიულ ან დროულ ხასიათზე მონაცემები in un მონაცემთა საწყობი, რაც ტენდენციების გაანალიზების საშუალებას იძლევა. არასტაბილური მიუთითებს იმაზე, რომ მონაცემთა საწყობი ის არ არის მუდმივად განახლებული, როგორც ა მონაცემთა ბაზა OLTP-ის. უფრო მეტიც, ის პერიოდულად განახლდება, თან მონაცემები მოდის შიდა და გარე წყაროებიდან. The მონაცემთა საწყობი ის სპეციალურად შექმნილია საძიებლად და არა მთლიანობისა და ოპერაციის შესრულების განახლებისთვის.
შენახვის იდეა ი მონაცემები ახალი არ არის, ეს იყო მენეჯმენტის ერთ-ერთი მიზანი მონაცემები სამოციანი წლებიდან (The Martin, 1982).
I მონაცემთა საწყობი ისინი გვთავაზობენ ინფრასტრუქტურას მონაცემები მენეჯმენტის მხარდაჭერის სისტემებისთვის. მართვის მხარდაჭერის სისტემები მოიცავს გადაწყვეტილების მხარდაჭერის სისტემებს (DSS) და აღმასრულებელი საინფორმაციო სისტემებს (EIS). DSS არის კომპიუტერზე დაფუძნებული საინფორმაციო სისტემა, რომელიც შექმნილია ადამიანის გადაწყვეტილების მიღების გასაუმჯობესებლად. EIS, როგორც წესი, არის მიწოდების სისტემა მონაცემები რაც ბიზნესის ლიდერებს საშუალებას აძლევს ადვილად მიიღონ ხედვა მონაცემები.
ზოგადი არქიტექტურა ა მონაცემთა საწყობი ხაზს უსვამს როლს მონაცემთა საწყობი მენეჯმენტის მხარდაჭერაში. ასევე ინფრასტრუქტურის შეთავაზება მონაცემები EIS-ისთვის და DSS-ისთვის, ალ მონაცემთა საწყობი მასზე წვდომა შეიძლება უშუალოდ შეკითხვის საშუალებით. THE მონაცემები შედის ა მონაცემთა საწყობი დაფუძნებულია მენეჯმენტის ინფორმაციის მოთხოვნების ანალიზზე და მიღებულია სამი წყაროდან: შიდა მემკვიდრეობითი სისტემები, სპეციალური დანიშნულების მონაცემთა აღების სისტემები და მონაცემთა გარე წყაროები. THE მონაცემები შიდა მოძველებულ სისტემებში ისინი ხშირად არის ზედმეტი, არათანმიმდევრული, დაბალი ხარისხის და ინახება სხვადასხვა ფორმატში, ამიტომ ისინი უნდა იყოს შეჯერებული და გაწმენდილი, სანამ ისინი ჩაიტვირთება

მონაცემთა საწყობი (Inmon, 1992; McFadden, 1996). THE მონაცემები მომდინარეობს შენახვის სისტემებიდან მონაცემები ad hoc და წყაროებიდან მონაცემები გარე ხშირად გამოიყენება გასადიდებლად (განახლება, ჩანაცვლება) ი მონაცემები მემკვიდრეობითი სისტემებიდან.

მრავალი დამაჯერებელი მიზეზი არსებობს ა მონაცემთა საწყობი, რომელიც მოიცავს გადაწყვეტილების მიღების გაუმჯობესებას მეტი ინფორმაციის ეფექტური გამოყენების გზით (Ives 1995), მთლიან გარიგებებზე ფოკუსირების მხარდაჭერას (გრეჰემი 1996) და შემცირებას. მონაცემები EIS-ისთვის და DSS-ისთვის (Graham 1996, McFadden 1996).

ბოლოდროინდელმა ემპირიულმა კვლევამ აჩვენა, რომ საშუალოდ, ინვესტიციის დაბრუნება მონაცემთა საწყობი 401%-ით სამი წლის შემდეგ (გრეჰემი, 1996). თუმცა, სხვა ემპირიული კვლევები მონაცემთა საწყობი აღმოაჩინა მნიშვნელოვანი პრობლემები, მათ შორის სარგებლის გაზომვისა და მინიჭების სირთულე, მკაფიო მიზნის არარსებობა, სარგებლის შენახვის პროცესის მიზნისა და სირთულის შეუფასებლობა. მონაცემები, განსაკუთრებით წყაროებთან და სისუფთავესთან დაკავშირებით მონაცემები. შენახვა ი მონაცემები შეიძლება ჩაითვალოს მენეჯმენტის პრობლემის გადაწყვეტად მონაცემები ორგანიზაციებს შორის. მანიპულირება მონაცემები როგორც სოციალური რესურსი, ის მრავალი წლის განმავლობაში რჩება ერთ-ერთ მთავარ პრობლემად საინფორმაციო სისტემების მართვისას მთელს მსოფლიოში (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

მენეჯმენტის პოპულარული მიდგომა მონაცემები ოთხმოციან წლებში ეს იყო მოდელის შემუშავება მონაცემები სოციალური. მოდელი მონაცემები სოციალური შეიქმნა იმისათვის, რომ შესთავაზოს სტაბილური საფუძველი ახალი აპლიკაციის სისტემების განვითარებისთვის და მონაცემთა ბაზა და მემკვიდრეობითი სისტემების რეკონსტრუქცია და ინტეგრაცია (Brancheau et al.

1989, გუდჰიუ და სხვ. 1988: 1992, კიმი და ევერესტი 1994). თუმცა, ამ მიდგომასთან დაკავშირებით ბევრი პრობლემაა, კერძოდ, თითოეული ამოცანის სირთულე და ღირებულება და ხელშესახები შედეგების მისაღებად საჭირო დიდი დრო (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997 ).

Il მონაცემთა საწყობი ეს არის ცალკე მონაცემთა ბაზა, რომელიც თანაარსებობს მემკვიდრეობით მონაცემთა ბაზებთან და არა მათ შეცვლის. ამიტომ ის საშუალებას გაძლევთ მართოთ მენეჯმენტი მონაცემები და თავიდან აიცილოთ ძველი სისტემების ძვირადღირებული რეკონსტრუქცია.

არსებული მიდგომები მონაცემთა დიზაინისადმი

საწყობი

აგების და სრულყოფის პროცესი ა მონაცემთა საწყობი ის უფრო მეტად უნდა იქნას გაგებული, როგორც ევოლუციური პროცესი, ვიდრე ტრადიციული სისტემების განვითარების სასიცოცხლო ციკლი (დესიო, 1995, Shanks, O'Donnell and Arnott 1997a). პროექტში ბევრი პროცესია ჩართული მონაცემთა საწყობი როგორიცაა ინიციალიზაცია, დაგეგმვა; კომპანიის მენეჯერებისგან მოთხოვნილი მოთხოვნებიდან მიღებული ინფორმაცია; წყაროები, გარდაქმნები, გაწმენდა მონაცემები და სინქრონიზაცია ძველი სისტემებიდან და სხვა წყაროებიდან მონაცემები; მიწოდების სისტემები განვითარებაში; მონიტორინგი მონაცემთა საწყობი; და ევოლუციური პროცესისა და კონსტრუქციის უაზრობა ა მონაცემთა საწყობი (Stinchi, O'Donnell and Arnott 1997b). ამ ჟურნალში ჩვენ ყურადღებას ვამახვილებთ იმაზე, თუ როგორ დავხატოთ მონაცემები ინახება ამ სხვა პროცესების კონტექსტში. არსებობს არქიტექტურის რამდენიმე შემოთავაზებული მიდგომა მონაცემთა საწყობი ლიტერატურაში (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). თითოეულ ამ მეთოდოლოგიას აქვს მოკლე მიმოხილვა მათი ძლიერი და სუსტი მხარეების ანალიზით.

ინმონის (1994) მიდგომა მონაცემთა საწყობი დიზაინი

ინმონმა (1994) შესთავაზა ოთხი განმეორებითი ნაბიჯი ა მონაცემთა საწყობი (იხ. სურათი 2). პირველი ნაბიჯი არის შაბლონის შექმნა მონაცემები სოციალური რომ გავიგოთ როგორ მე მონაცემები ისინი შეიძლება იყოს ინტეგრირებული ორგანიზაციის ფარგლებში ფუნქციონალურ სფეროებში გაყოფით მონაცემები შენახვა რაიონებში. მოდელი მონაცემები დამზადებულია შესანახად მონაცემები გადაწყვეტილების მიღებასთან დაკავშირებით, მათ შორის მონაცემები ისტორიკოსები და მათ შორის მონაცემები გამოყვანილი და გაერთიანებული. მეორე ნაბიჯი არის განსახორციელებლად საგნობრივი სფეროების იდენტიფიცირება. ეს ეფუძნება კონკრეტული ორგანიზაციის მიერ განსაზღვრულ პრიორიტეტებს. მესამე ნაბიჯი მოიცავს ა მონაცემთა ბაზა საგნის სფეროსთვის განსაკუთრებული ყურადღება მიაქციეთ მარცვლოვნების შესაბამის დონეებს. ინმონი გვირჩევს ერთეულებისა და ურთიერთობების მოდელის გამოყენებას. მეოთხე ნაბიჯი არის წყაროს სისტემების იდენტიფიცირება მონაცემები საჭირო და განავითაროს ტრანსფორმაციის პროცესები, რათა აღბეჭდოს, გაწმინდოს და ფორმატირდეს i მონაცემები.

ინმონის მიდგომის ძლიერი მხარე არის ის, რომ მოდელი მონაცემები სოციალური უზრუნველყოფს ინტეგრაციის საფუძველს მონაცემები განმეორებითი განვითარების მხარდაჭერის ორგანიზებისა და დაგეგმვის ფარგლებში მონაცემთა საწყობი. მისი ნაკლი არის მოდელის დიზაინის სირთულე და ღირებულება მონაცემები სოციალური, ორივე მოდელში გამოყენებული ერთეულებისა და ურთიერთობების მოდელების გაგების სირთულე, რომ მონაცემები სოციალური და რომ მონაცემები ინახება საგნის არეალის მიხედვით და მიზანშეწონილობის მიხედვით მონაცემები ნახატის მონაცემთა საწყობი რეალიზაციისთვის მონაცემთა ბაზა ურთიერთობით, მაგრამ არა ამისთვის მონაცემთა ბაზა მრავალგანზომილებიანი.

Ives' (1995) მიდგომა მონაცემთა საწყობი დიზაინი

აივსი (1995) გვთავაზობს ოთხსაფეხურიან მიდგომას საინფორმაციო სისტემის შესაქმნელად, რომელიც, მისი აზრით, გამოიყენება საინფორმაციო სისტემის დიზაინში. მონაცემთა საწყობი (იხ. სურათი 3). მიდგომა დიდწილად ეფუძნება საინფორმაციო ინჟინერიას საინფორმაციო სისტემების განვითარებისათვის (მარტინი 1990). პირველი ნაბიჯი არის მიზნების, კრიტიკული და წარმატების ფაქტორების და შესრულების ძირითადი ინდიკატორების განსაზღვრა. ძირითადი ბიზნეს პროცესები და საჭირო ინფორმაცია მოდელირებულია იმისთვის, რომ მიგვიყვანოს მოდელამდე მონაცემები სოციალური. მეორე ნაბიჯი მოიცავს განმსაზღვრელი არქიტექტურის შემუშავებას მონაცემები შენახული ტერიტორიების მიხედვით, მონაცემთა ბაზა di მონაცემთა საწყობი, ტექნოლოგიური კომპონენტები, რომლებიც საჭიროა, ორგანიზაციული მხარდაჭერის კომპლექტი, რომელიც საჭიროა განხორციელებისა და მუშაობისთვის მონაცემთა საწყობი. მესამე ნაბიჯი მოიცავს საჭირო პროგრამული პაკეტებისა და ხელსაწყოების შერჩევას. მეოთხე ნაბიჯი არის დეტალური დიზაინი და მშენებლობა მონაცემთა საწყობი. აივსი აღნიშნავს, რომ შენახვა მონაცემები ეს არის შეზღუდული განმეორებითი პროცესი.

Ives-ის მიდგომის ძლიერი მხარეა კონკრეტული ტექნიკის გამოყენება ინფორმაციის მოთხოვნების დასადგენად, სტრუქტურირებული პროცესის გამოყენება ინტეგრაციის მხარდასაჭერად. მონაცემთა საწყობი, შესაბამისი აპარატურის და პროგრამული უზრუნველყოფის შერჩევა და მრავალი წარმოდგენის ტექნიკის გამოყენება მონაცემთა საწყობი. მისი ხარვეზები თანდაყოლილია სირთულესთან. სხვა მოიცავს სირთულეების განვითარებას მრავალი დონის მონაცემთა ბაზა all'interno del მონაცემთა საწყობი გონივრულ დროსა და ხარჯებში.

Kimball's (1994) მიდგომა მონაცემთა საწყობი დიზაინი

კიმბალმა (1994) შესთავაზა ხუთი განმეორებითი ნაბიჯი ა მონაცემთა საწყობი (იხ. სურათი 4). მისი მიდგომა განსაკუთრებით ეძღვნება სოლოს დიზაინს მონაცემთა საწყობი და განზომილებიანი მოდელების გამოყენებაზე უპირატესობა ერთეულებსა და ურთიერთობების მოდელებზე. კიმბალი აანალიზებს ამ განზომილებიან მოდელებს, რადგან ბიზნესის ლიდერებისთვის უფრო ადვილია ბიზნესის გაგება, უფრო ეფექტურია კომპლექსურ კონსულტაციებთან და დიზაინის დროს. მონაცემთა ბაზა ფიზიკური უფრო ეფექტურია (Kimball 1994). კიმბალი აღიარებს, რომ ა მონაცემთა საწყობი ეს არის განმეორებადი და ეს მონაცემთა საწყობი ცალკეული ცხრილების ინტეგრირება შესაძლებელია მათი საერთო განზომილებების ცხრილებად დაყოფით.

პირველი ნაბიჯი არის კონკრეტული საგნის სფეროს იდენტიფიცირება, რომელიც უნდა დასრულდეს. მეორე და მესამე საფეხური ეხება განზომილებიანი მოდელირებას. მეორე საფეხურზე ზომები იდენტიფიცირებს საგნობრივ ზონაში საინტერესო საგნებს და ჯგუფდება ფაქტების ცხრილში. მაგალითად, გაყიდვების საგანში, ინტერესის ზომებში შეიძლება შეიცავდეს გაყიდული ნივთების რაოდენობას და დოლარს, როგორც გაყიდვების ვალუტას. მესამე ნაბიჯი მოიცავს განზომილებების იდენტიფიცირებას, რომლებიც ფაქტების დაჯგუფების გზებს წარმოადგენს. გაყიდვების საგნის არეალში, შესაბამისი ზომები შეიძლება მოიცავდეს ერთეულს, მდებარეობას და დროის პერიოდს. ფაქტების ცხრილს აქვს მრავალნაწილიანი გასაღები, რომელიც აკავშირებს მას განზომილების თითოეულ ცხრილს და, როგორც წესი, შეიცავს ფაქტების ძალიან დიდ რაოდენობას. ამის საპირისპიროდ, განზომილების ცხრილები შეიცავს აღწერილ ინფორმაციას განზომილებებისა და სხვა ატრიბუტების შესახებ, რომლებიც შეიძლება გამოყენებულ იქნას ფაქტების დასაჯგუფებლად. ასოცირებული შემოთავაზებული ფაქტისა და განზომილების ცხრილი აყალიბებს იმას, რასაც ვარსკვლავის სქემას უწოდებენ მისი ფორმის გამო. მეოთხე ნაბიჯი მოიცავს ა მონაცემთა ბაზა მრავალგანზომილებიანი ვარსკვლავის ნიმუშის სრულყოფისთვის. საბოლოო ნაბიჯი არის წყაროს სისტემების იდენტიფიცირება მონაცემები საჭირო და განავითაროს ტრანსფორმაციის პროცესები, რათა აღბეჭდოს, გაწმინდოს და ფორმატირდეს i მონაცემები.

კიმბოლის მიდგომის ძლიერი მხარე მოიცავს განზომილებიანი მოდელების გამოყენებას მონაცემები ინახება, რაც აადვილებს მის გაგებას და იწვევს ეფექტურ ფიზიკურ დიზაინს. განზომილებიანი მოდელი, რომელიც ასევე ადვილად იყენებს ორივე სისტემას მონაცემთა ბაზა ურთიერთობითი შეიძლება დასრულდეს ან სისტემები მონაცემთა ბაზა მრავალგანზომილებიანი. მისი ხარვეზები მოიცავს გარკვეული ტექნიკის ნაკლებობას, რათა ხელი შეუწყოს მრავალი ვარსკვლავის ნიმუშის დაგეგმვას ან ინტეგრაციას ა მონაცემთა საწყობი და უკიდურესად დენორმალიზებული სტრუქტურიდან განზომილებიანი მოდელის დაპროექტების სირთულე ა მონაცემები მემკვიდრეობით სისტემაში.

მაკფადენის (1996) მიდგომა მონაცემთა მიმართ საწყობის დიზაინი

მაკფადენი (1996) გვთავაზობს ხუთსაფეხურიან მიდგომას ა მონაცემთა საწყობი (იხ. სურათი 5).
მისი მიდგომა ეფუძნება ლიტერატურის იდეების სინთეზს და ორიენტირებულია სინგლის დიზაინზე მონაცემთა საწყობი. პირველი ნაბიჯი მოიცავს მოთხოვნების ანალიზს. მიუხედავად იმისა, რომ ტექნიკური მახასიათებლები არ არის დადგენილი, მაკფადენის შენიშვნები განსაზღვრავს პირებს მონაცემები სპეციფიკაციები და მათი ატრიბუტები, და ეხება მკითხველებს Watson and Frolick (1993) მოთხოვნების დაფიქსირებისთვის.
მეორე საფეხურზე შექმნილია ერთეულების ურთიერთობის მოდელი მონაცემთა საწყობი და შემდეგ დადასტურებულია ბიზნესის ლიდერების მიერ. მესამე ნაბიჯი მოიცავს რუკების განსაზღვრას მემკვიდრეობითი სისტემებიდან და გარე წყაროებიდან მონაცემთა საწყობი. მეოთხე ნაბიჯი მოიცავს პროცესებს განვითარების, განლაგებისა და სინქრონიზაციის პროცესში მონაცემები in მონაცემთა საწყობი. საბოლოო ეტაპზე, სისტემის მიწოდება განვითარებულია მომხმარებლის ინტერფეისზე განსაკუთრებული აქცენტით. მაკფადენი აღნიშნავს, რომ ნახატის პროცესი ზოგადად განმეორებითია.

მაკფადენის მიდგომის ძლიერი მხარე მიუთითებს ბიზნეს ლიდერების მონაწილეობაზე მოთხოვნების განსაზღვრაში და ასევე რესურსების მნიშვნელობაზე. მონაცემები, მათი გაწმენდა და შეგროვება. მისი ხარვეზები მოიცავს დიდი პროექტის ჩაშლის პროცესის არარსებობას მონაცემთა საწყობი მრავალ ინტეგრირებულ ეტაპზე და

დიზაინის დროს გამოყენებული ერთეულისა და ურთიერთობის მოდელების გაგების სირთულე მონაცემთა საწყობი.

ჩვენთან ახლოს მყოფნი მხოლოდ ისინი არ არიან.

0/5 (0 მიმოხილვა)

შეიტყვეთ მეტი ონლაინ ვებ სააგენტოდან

გამოიწერეთ, რომ მიიღოთ უახლესი სტატიები ელექტრონული ფოსტით.

admin აღმასრულებელი დირექტორი

👍ონლაინ ვებ სააგენტო | ვებ სააგენტოს ექსპერტი ციფრული მარკეტინგისა და SEO-ში. ვებ სააგენტო ონლაინ არის ვებ სააგენტო. Agenzia Web Online-ისთვის წარმატება ციფრულ ტრანსფორმაციაში ემყარება Iron SEO ვერსიის 3-ის საფუძვლებს. სპეციალობები: სისტემური ინტეგრაცია, საწარმოს აპლიკაციების ინტეგრაცია, სერვისზე ორიენტირებული არქიტექტურა, ღრუბლოვანი გამოთვლა, მონაცემთა საწყობი, ბიზნეს ინტელექტი, დიდი მონაცემები, პორტალები, ინტრანეტები, ვებ აპლიკაციები. რელაციური და მრავალგანზომილებიანი მონაცემთა ბაზების დიზაინი და მართვა ციფრული მედიისთვის ინტერფეისების დიზაინი: გამოყენებადობა და გრაფიკა. ონლაინ ვებ სააგენტო კომპანიებს სთავაზობს შემდეგ სერვისებს: -SEO Google, Amazon, Bing, Yandex; -ვებ ანალიტიკა: Google Analytics, Google Tag Manager, Yandex Metrica; -მომხმარებლის კონვერტაციები: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM Google-ში, Bing-ში, Amazon Ads-ზე; -სოციალური მედიის მარკეტინგი (Facebook, Linkedin, Youtube, Instagram).

იხილეთ სრული ბიო

ციფრული მარკეტინგის მონაცემთა ბაზა DBMS მონაცემთა საწყობი მონაცემთა მეცნიერების რეკლამა ინფორმაციული ტექნოლოგიები ვებ სააგენტო Სარეკლამო სააგენტო მარკეტინგი

გაუზიარეთ:

მომწონს:

შეიტყვეთ მეტი ონლაინ ვებ სააგენტოდან