fbpx

Datu glabāšana un uzņēmuma resursu plānošana | DWH un ERP

ARHĪVS DATI CENTRĀLĀ: VĒSTURE ED EVOLŪCIJAS

Divas dominējošās korporatīvo tehnoloģiju tēmas 90. gados bija i datu noliktava un ERP. Ilgu laiku šīs divas spēcīgās straumes ir bijušas korporatīvās IT daļas, bez krustojumiem. Tas bija gandrīz tā, it kā tie būtu matērija un antimatērija. Taču abu parādību pieaugums neizbēgami ir novedis pie to krustošanās. Mūsdienās uzņēmumi saskaras ar problēmu, ko darīt ar ERP un datu noliktava. Šajā rakstā tiks izklāstītas problēmas un to, kā uzņēmumi tās risina.

SĀKUMĀ…

Sākumā bija datu noliktava. Datu noliktava tika izveidota, lai novērstu darījumu apstrādes lietojumprogrammu sistēmu. Pirmajās dienās iegaumēšana no dati tas bija domāts tikai kā pretpunkts darījumu apstrādes lietojumprogrammām. Taču mūsdienās ir daudz izsmalcinātāki uzskati par to, ko a datu noliktava. Mūsdienu pasaulē datu noliktava tas ir ievietots struktūrā, ko var saukt par Korporatīvās informācijas rūpnīcu.

KORPORATĪVĀ INFORMĀCIJAS Fabrika (CIF)

Korporatīvās informācijas rūpnīcai ir standarta arhitektūras komponenti: transformācijas un koda integrācijas līmenis, kas integrē dati kamēr es dati tie pārvietojas no lietojumprogrammas vides uz vidi datu noliktava no uzņēmuma; a datu noliktava uzņēmuma, kurā dati detalizēti un integrēti vēsturnieki. The datu noliktava uzņēmums kalpo par pamatu, uz kura var veidot visas pārējās vides daļas datu noliktava; operatīvo datu krātuve (ODS). ODS ir hibrīda struktūra, kas satur dažus ODS aspektus datu noliktava un citi OLTP vides aspekti; datu tirgus, kur dažādiem departamentiem var būt sava versija datu noliktava; a datu noliktava izpēti, kurā uzņēmuma “filozofi” var iesniegt savus jautājumus 72 stundu laikā bez kaitīgas ietekmes uz datu noliktava; un gandrīz līnijas atmiņa, kurā dati vecs un dati lielapjoma detaļas var uzglabāt lēti.

KUR ERP SAVIENOJAS AR KORPORATĪVĀS INFORMĀCIJAS Fabrika

ERP divās vietās apvienojas ar Korporatīvās informācijas fabriku. Vispirms kā pamata lietojumprogramma (bāzes līnija), kas nodrošina i dati no pieteikuma uz datu noliktava. Šajā gadījumā i dati, kas ģenerēti kā darījuma procesa blakusprodukts, tiek integrēti un ielādēti datu noliktava no uzņēmuma. Otrais savienojums starp ERP un CIF un ODS. Faktiski daudzās vidēs ERP tiek izmantota kā klasiska ODS.

Ja ERP tiek izmantota kā pamata lietojumprogramma, to pašu ERP var izmantot arī CIF kā ODS. Jebkurā gadījumā, ja ERP ir jāizmanto abās lomās, ir jābūt skaidrai atšķirībai starp abām entītijām. Citiem vārdiem sakot, ja ERP ir galvenā lietojumprogramma un ODS, ir jānošķir divas arhitektūras vienības. Ja viena ERP ieviešana mēģina vienlaikus veikt abas lomas, neizbēgami radīsies problēmas šīs struktūras izstrādē un ieviešanā.

Atsevišķas ODS UN PAMATA PIELIETOJUMS

Ir daudz iemeslu, kas noved pie arhitektūras komponentu sadalīšanas. Iespējams, ka vissvarīgākā problēma dažādu arhitektūras komponentu atdalīšanai ir tā, ka katram arhitektūras komponentam ir savs skatījums. Bāzes lietojumprogramma kalpo citam mērķim nekā ODS. Mēģiniet pārklāties

bāzes lietojumprogrammas skatījums uz ODS pasauli vai otrādi nav pareizais veids, kā strādāt.

Līdz ar to pirmā ERP problēma CIF ir pārbaudīt, vai pastāv atšķirība starp bāzes lietojumprogrammām un ODS.

DATU MODEĻI KORPORATĪVĀ INFORMĀCIJAS RŪPNĪCA

Lai panāktu kohēziju starp dažādiem CIF arhitektūras komponentiem, ir jābūt modelim dati. Modeļi no dati tie kalpo kā saikne starp dažādiem arhitektūras komponentiem, piemēram, bāzes lietojumprogrammām un ODS. Modeļi no dati tie kļūst par “intelektuālo ceļa karti”, lai iegūtu pareizo nozīmi no dažādām CIF arhitektūras sastāvdaļām.

Ejot roku rokā ar šo jēdzienu, ideja ir tāda, ka vajadzētu būt vienam lielam un vienotam modelim dati. Acīmredzot ir jābūt modelim dati katram komponentam, kā arī jābūt saprātīgam ceļam, kas savieno dažādus modeļus. Katrs arhitektūras komponents – ODS, bāzes lietojumprogrammas, datu noliktava uzņēmuma, un tā tālāk.. – vajag savu modeli dati. Un tāpēc ir jābūt precīzai definīcijai, kā šie modeļi dati tie saskaras viens ar otru.

PĀRVIETOJU I DATI PAR ERP DATOS NOLIKTAVU

Ja izcelsme dati ir bāzes lietojumprogramma un/vai ODS, kad ERP ievieto dati uz datu noliktava, šai ievietošanai jānotiek zemākajā "granulitātes" līmenī. Vienkārši apkopojiet vai apkopojiet i dati jo tie nāk no ERP bāzes lietojumprogrammas vai ERP ODS, nav pareizi rīkoties. THE dati ir nepieciešama informācija datu noliktava veidot DSS procesa pamatu. Tādas dati daudzos veidos tiks pārveidots, izmantojot datu tirgus un izpēti datu noliktava.

Pārcelšanās no dati no ERP bāzes lietojumprogrammas vides uz datu noliktava uzņēmuma darbība tiek veikta pietiekami nepiespiestā veidā. Šī pārvietošana notiek aptuveni 24 stundas pēc atjaunināšanas vai izveides ERP. Fakts, ka ir "slinks" kustība dati uz datu noliktava no uzņēmuma atļauj dati nāk no ERP uz "noguldījumu". Reiz i dati tiek saglabāti bāzes lietojumprogrammā, tad varat droši pārvietot dati ERP uzņēmumā. Vēl viens mērķis, kas sasniedzams, pateicoties "slinkajai" kustībai dati tā ir skaidra robeža starp darbības procesiem un DSS. Ar “ātru” kustību dati robežšķirtne starp DSS un operatīvo paliek neskaidra.

Kustība dati no ERP ODS uz datu noliktava uzņēmuma darbība tiek veikta periodiski, parasti reizi nedēļā vai mēnesī. Šajā gadījumā kustība dati tā pamatā ir nepieciešamība “tīrīt” vecos dati vēsturnieki. Protams, ODS satur i dati kas ir daudz jaunāki par dati vēsturnieki atrada datu noliktava.

Pārcelšanās no dati uz datu noliktava tas gandrīz nekad netiek darīts “vairumtirdzniecībā” (vairumtirgotāja veidā). Kopējiet tabulu no ERP vides uz datu noliktava tam nav jēgas. Daudz reālāka pieeja ir pārvietot atlasītās vienības dati. Tikai dati kas ir mainījušies kopš pēdējā atjauninājuma datu noliktava tie ir tie, kurus vajadzētu pārvietot uz datu noliktava. Viens veids, kā uzzināt, kuras dati ir mainījušies kopš pēdējā atjauninājuma ir apskatīt laika zīmogus dati atrodams ERP vidē. Dizainers atlasa visas izmaiņas, kas notikušas kopš pēdējās atjaunināšanas. Vēl viena pieeja ir izmaiņu uztveršanas tehnikas izmantošana dati. Izmantojot šīs metodes, žurnāli un žurnālu lentes tiek analizēti, lai noteiktu, kuri no tiem dati ir jāpārvieto no ERP vides uz vidi datu noliktava. Šīs metodes ir vislabākās, jo žurnālus un žurnālu lentes var nolasīt no ERP failiem, turpmāk neietekmējot citus ERP resursus.

CITAS KOMPlikācijas

Viena no CIF ERP problēmām ir tas, kas notiek ar citiem lietojumprogrammu avotiem vai ar tiem dati ONV, kas tām ir jāveicina datu noliktava bet tie nav daļa no ERP vides. Ņemot vērā ERP, īpaši SAP, slēgto raksturu, mēģinot integrēt atslēgas no ārējiem avotiem dati ar i dati kas nāk no ERP, pārvietojot dati uz datu noliktava, tas ir liels izaicinājums. Un tieši kādas ir varbūtības, ka i dati lietojumprogrammas vai ODS ārpus ERP vides tiks integrētas datu noliktava? Izredzes patiesībā ir ļoti augstas.

ATRAST DATI VĒSTURISKI NO ERP

Vēl viena problēma ar i dati ERP ir tas, kas izriet no nepieciešamības iegūt dati vēsturnieki ietvaros datu noliktava. Parasti datu noliktava vajadzībām dati vēsturnieki. Un ERP tehnoloģija parasti tos neuzglabā dati vēsturiski, vismaz ne līdz vietai, kur tas ir nepieciešams datu noliktava. Kad liels daudzums dati vēsture sāk pievienoties ERP vidē, šī vide ir jāsakopj. Piemēram, pieņemsim, ka a datu noliktava jāielādē ar pieciem gadiem dati vēsturiski, savukārt ERP saglabā ne vairāk kā sešus mēnešus dati. Kamēr uzņēmums ir apmierināts ar kolekcijas sēriju dati vēsturnieki laikam iet, tad nav problēmu izmantot ERP kā avotu datu noliktava. Bet, kad datu noliktava viņam ir jāatgriežas laikā un jāsaņem dievi dati vēstures, kuras iepriekš nav apkopojusi un saglabājusi ERP, tad ERP vide kļūst neefektīva.

ERP UN METADATI

Vēl viens apsvērums, kas jāņem vērā saistībā ar ERP e datu noliktava ir tas, kas atrodas ERP vidē esošajos metadatos. Tāpat kā metadati plūst no ERP vides uz datu noliktava, metadati ir jāpārvieto tādā pašā veidā. Turklāt metadati ir jāpārveido formātā un struktūrā, kas nepieciešama infrastruktūrai datu noliktava. Pastāv liela atšķirība starp operatīvajiem metadatiem un DSS metadatiem. Darbības metadati galvenokārt ir paredzēti izstrādātājam un

programmētājs. DSS metadati galvenokārt ir paredzēti gala lietotājam. Esošie metadati ERP lietojumprogrammās vai ODS ir jākonvertē, un šī konvertēšana ne vienmēr ir vienkārša un vienkārša.

ERP DATU IEGUVE

Ja ERP tiek izmantots kā piegādātājs dati uz datu noliktava jābūt stabilam interfeisam, kas pārvieto dati no ERP vides uz vidi datu noliktava. Interfeisam jābūt:

  • ▪ jābūt viegli lietojamam
  • ▪ atļaut piekļuvi dati no ERP
  • ▪ uztvert nozīmi dati kuras drīzumā tiks pārvietotas uz datu noliktava
  • ▪ zināt ERP ierobežojumus, kas var rasties, piekļūstot dati no ERP:
  • ▪ atsauces integritāte
  • ▪ hierarhiskas attiecības
  • ▪ netiešās loģiskās attiecības
  • ▪ pieteikšanās konvencija
  • ▪ visas struktūras dati atbalsta ERP un tā tālāk…
  • ▪ jābūt efektīvam piekļuvē dati, nodrošinot:
  • ▪ tieša kustība dati
  • ▪ izmaiņu iegūšana dati
  • ▪ nodrošināt savlaicīgu piekļuvi dati
  • ▪ saprast formātu dati, un tā tālāk… INTERFESES AR SAP Saskarne var būt divu veidu — pašmāju vai komerciāla. Dažas no galvenajām tirdzniecības saskarnēm ietver:
  • ▪ SAS
  • ▪ Prims Solutions
  • ▪ D2k un tā tālāk… VAIRĀKAS ERP TEHNOLOĢIJAS Attiekties pret ERP vidi tā, it kā tā būtu viena tehnoloģija, ir liela kļūda. Ir daudz ERP tehnoloģiju, katrai no tām ir savas stiprās puses. Tirgū pazīstamākie pārdevēji ir:
  • ▪ SAP
  • ▪ Oracle Financials
  • ▪ PeopleSoft
  • ▪ Dž.D. Edvards
  • ▪ Bāns SAP SAP ir lielākā un pilnīgākā ERP programmatūra. SAP lietojumprogrammas ietver daudzu veidu lietojumprogrammas daudzās jomās. SAP ir pazīstama kā:
  • ▪ ļoti liels
  • ▪ ļoti grūti un dārgi īstenojams
  • ▪ nepieciešams daudz cilvēku un konsultantu, lai tos īstenotu
  • ▪ īstenošanai nepieciešami specializēti cilvēki
  • ▪ ieviešana prasa ilgu laiku. Turklāt SAP ir slavena ar to, ka to iegaumē dati ļoti uzmanīgi, apgrūtinot piekļuvi tiem, kas atrodas ārpus SAP zonas. SAP stiprā puse ir tā, ka tā spēj uztvert un uzglabāt lielu daudzumu dati. Nesen SAP paziņoja par nodomu paplašināt savas lietojumprogrammas uz datu noliktava. SAP kā pārdevēja izmantošanai ir daudz plusi un mīnusi datu noliktava. Priekšrocība ir tā, ka SAP jau ir instalēts un ka lielākā daļa konsultantu jau zina SAP.
    SAP kā piegādātāja trūkumi datu noliktava ir daudz: SAP nav pieredzes pasaulē datu noliktava Ja SAP ir piegādātājs datu noliktava, nepieciešams “izņemt” i dati no SAP uz datu noliktava. Dato SAP slēgtā sistēmā ir maz ticams, ka būs viegli tajā iekļaut i no SAP (???). Ir daudzas mantotās vides, kas darbina SAP, piemēram, IMS, VSAM, ADABAS, ORACLE, DB2 utt. SAP uzstāj uz pieeju “nav izgudrots šeit”. SAP nevēlas sadarboties ar citiem piegādātājiem, lai izmantotu vai izveidotu datu noliktava. SAP pieprasa visu savu programmatūru ģenerēt pati.

Lai gan SAP ir liels un spēcīgs uzņēmums, kas cenšas pārrakstīt ELT, OLAP tehnoloģijas, sistēmas administrēšanu un pat pamata kodu. dbms tas ir vienkārši traki. Tā vietā, lai veidotu sadarbību ar piegādātājiem datu noliktava SAP jau sen ir ievērojis pieeju “viņi zina vislabāk”. Šāda attieksme kavē SAP panākumus šajā jomā datu noliktava.
SAP atteikums ļaut ārējiem pārdevējiem ātri un graciozi piekļūt saviem dati. Pati izmantošanas būtība a datu noliktava ir viegli piekļūt dati. Visa SAP vēsture ir balstīta uz piekļuves apgrūtināšanu dati.
SAP pieredzes trūkums darbā ar lieliem apjomiem dati; jomā datu noliktava ir apjomi dati nekad nav redzējis SAP, un pārvaldīt šos lielos daudzumus dati jums ir jābūt piemērotai tehnoloģijai. Acīmredzot SAP neapzinās šo tehnoloģisko barjeru, kas pastāv, lai iekļūtu jomā datu noliktava.
SAP korporatīvā kultūra: SAP ir veikusi uzņēmējdarbību, lai iegūtu dati no sistēmas. Bet, lai to izdarītu, jums ir jābūt citai mentalitātei. Tradicionāli programmatūras uzņēmumi, kas labi guvuši datus vidē, nav spējuši iegūt datus citā virzienā. Ja SAP izdosies veikt šāda veida pāreju, tas būs pirmais uzņēmums, kas to izdarīs.

Īsāk sakot, ir apšaubāms, vai uzņēmumam būtu jāizvēlas SAP kā piegādātājs datu noliktava. Ir ļoti nopietni riski, no vienas puses, un ļoti maz atlīdzības, no otras puses. Bet ir vēl viens iemesls, kas attur izvēlēties SAP kā piegādātāju datu noliktava. Jo katram uzņēmumam vajadzētu būt vienādam datu noliktava no visiem pārējiem uzņēmumiem? The datu noliktava tā ir konkurences priekšrocību pamatā. Ja katrs uzņēmums pieņemtu to pašu datu noliktava būtu grūti, lai gan ne neiespējami, sasniegt konkurences priekšrocības. Šķiet, ka SAP domā, ka a datu noliktava to var uzskatīt par sīkfailu, un tā ir vēl viena pazīme viņu lietojumprogrammu mentalitātei “iegūt datus”.

Neviens cits ERP pārdevējs nav tik dominējošs kā SAP. Neapšaubāmi, būs uzņēmumi, kas sekos SAP savam ceļam datu noliktava bet, domājams, šīs datu noliktava SAP izveide būs liela, dārga un laikietilpīga.

Šīs vides ietver tādas darbības kā bankas kases apstrāde, aviokompāniju rezervēšanas procesi, apdrošināšanas atlīdzību procesi utt. Jo efektīvāka bija darījumu sistēma, jo skaidrāka bija nepieciešamība nodalīt darbības procesu un DSS (lēmumu atbalsta sistēmu). Tomēr, izmantojot HR un personāla sistēmas, jūs nekad nesaskarsities ar lieliem darījumu apjomiem. Un, protams, kad persona tiek pieņemta darbā vai atstāj uzņēmumu, tas ir darījuma ieraksts. Taču, salīdzinot ar citām sistēmām, HR un personāla sistēmās vienkārši nav daudz darījumu. Tāpēc personāla un personāla sistēmās nav pilnīgi skaidrs, ka ir nepieciešama DataWarehouse. Daudzos veidos šīs sistēmas ir DSS sistēmu apvienojums.

Bet ir vēl viens faktors, kas jāņem vērā, ja jums ir darīšana ar datu noliktavām un PeopleSoft. Daudzās vidēs, t dati cilvēkresursi un personīgie resursi ir otršķirīgi uzņēmuma galvenajai darbībai. Lielākā daļa uzņēmumu nodarbojas ar ražošanu, pārdošanu, pakalpojumu sniegšanu utt. Cilvēkresursi un personāla sistēmas parasti ir sekundāras attiecībā uz uzņēmuma galveno darbības virzienu (vai atbalsta to). Tāpēc tas ir nepārprotami un neērti datu noliktava atsevišķi cilvēkresursiem un personāla atbalstam.

PeopleSoft šajā ziņā ļoti atšķiras no SAP. Izmantojot SAP, obligāti jābūt a datu noliktava. Ar PeopleSoft tas nav tik skaidrs. Izmantojot PeopleSoft, datu noliktava nav obligāta.

Labākais, ko var teikt par dati PeopleSoft ir tas datu noliktava var izmantot, lai arhivētu i dati kas attiecas uz veciem cilvēku un personīgajiem resursiem. Otrs iemesls, kāpēc uzņēmums vēlas izmantot a datu noliktava a

PeopleSoft vides kaitējums ir nodrošināt piekļuvi un brīvu piekļuvi analīzes rīkiem, lai dati autors PeopleSoft. Taču papildus šiem iemesliem var būt gadījumi, kad datu noliktavas nav vēlams dati PeopleSoft.

Kopsavilkumā

Ir daudz ideju par a būvniecību datu noliktava ERP programmatūras ietvaros.
Daži no tiem ir:

  • ▪ Ir jēga, ja ir a datu noliktava tas ir kā jebkas cits šajā nozarē?
  • ▪ Cik elastīga ir ERP datu noliktava programmatūra?
  • ▪ ERP datu noliktava programmatūra var apstrādāt lielu apjomu dati kas atrodas adatu noliktava arēna"?
  • ▪ Kāds ir izsekošanas ieraksts, ko ERP pārdevējs veic, ņemot vērā to, ka tas ir vienkāršs un lēts laika ziņā, dati? (kādi ir ERP pārdevēju sasniegumi par lētu, savlaicīgu un viegli pieejamu datu piegādi?)
  • ▪ Kāda ir ERP pārdevēja izpratne par DSS arhitektūru un korporatīvās informācijas rūpnīcu?
  • ▪ ERP pārdevēji saprot, kā sasniegt dati vidē, bet arī saprast, kā tos eksportēt?
  • ▪ Cik atvērts ir ERP piegādātājs datu noliktavas rīkiem?
    Visi šie apsvērumi ir jāņem vērā, nosakot, kur ievietot datu noliktava kas uzņems i dati no ERP un citiem dati. Parasti, ja vien nav pārliecinoša iemesla rīkoties citādi, ieteicams būvēt datu noliktava ārpus ERP piegādātāja vides. 1. NODAĻA Pārskats par BI organizācijas galvenajiem punktiem:
    Informācijas krātuves darbojas pretēji biznesa inteliģences (BI) arhitektūrai:
    Korporatīvā kultūra un IT var ierobežot panākumus BI organizāciju veidošanā.

Tehnoloģija vairs nav ierobežojošais faktors BI organizācijām. Arhitektiem un projektu plānotājiem jautājums nav par to, vai tehnoloģija pastāv, bet gan par to, vai viņi var efektīvi ieviest pieejamo tehnoloģiju.

Daudziem uzņēmumiem a datu noliktava tas ir nedaudz vairāk par pasīvu depozītu, kas izplata dati lietotājiem, kuriem tas ir nepieciešams. THE dati tie tiek iegūti no avota sistēmām un tiek ievietoti mērķa struktūrās datu noliktava. Es dati tos var arī iztīrīt ar jebkuru veiksmi. Tomēr nav pievienota vai savākta papildu vērtība dati šī procesa laikā.

Būtībā pasīvais Dw labākajā gadījumā nodrošina tikai i dati tīra un funkcionāla lietotāju asociācijām. Informācijas veidošana un analītiskā izpratne ir pilnībā atkarīga no lietotājiem. Spriediet, vai DW (Datu noliktava) vai veiksme ir subjektīva. Ja mēs vērtējam panākumus pēc spējas efektīvi savākt, integrēt un tīrīt dati korporatīvie uz paredzami pamata, tad jā, DW ir veiksmīgs. No otras puses, ja mēs skatāmies uz informācijas vākšanu, konsolidāciju un izmantošanu organizācijā kopumā, tad DW ir neveiksme. DW sniedz nelielu informācijas vērtību vai tās vispār nav. Rezultātā lietotāji ir spiesti iztikt, tādējādi radot informācijas tvertni. Šajā nodaļā ir sniegts visaptverošs skatījums, lai apkopotu uzņēmuma BI (Business Intelligence) arhitektūru. Mēs sākam ar BI aprakstu un pēc tam pārejam pie diskusijām par informācijas dizainu un attīstību, nevis vienkārši informācijas sniegšanu. dati lietotājiem. Pēc tam diskusijas koncentrējas uz jūsu BI centienu vērtības aprēķināšanu. Noslēgumā mēs definējam, kā IBM risina jūsu organizācijas BI arhitektūras prasības.

Arhitektūras apraksts BI organizācija

Jaudīgas uz darījumiem orientētas informācijas sistēmas tagad ir ikviena liela uzņēmuma parādība, kas efektīvi izlīdzina konkurences apstākļus korporācijām visā pasaulē.

Tomēr, lai saglabātu konkurētspēju, tagad ir nepieciešamas analītiski orientētas sistēmas, kas var mainīt uzņēmuma spēju no jauna atklāt un izmantot jau esošo informāciju. Šīs analītiskās sistēmas izriet no izpratnes par bagātību dati pieejams. BI var uzlabot veiktspēju visā uzņēmumā. Uzņēmumi var uzlabot klientu un piegādātāju attiecības, uzlabot produktu un pakalpojumu rentabilitāti, radīt jaunus un labākus piedāvājumus, kontrolēt risku un, cita starpā, ievērojami samazināt izdevumus. Izmantojot BI, jūsu uzņēmums beidzot sāk izmantot klientu informāciju kā konkurētspējīgu līdzekli, pateicoties lietojumprogrammām, kurām ir tirgus mērķi.

Pareizi biznesa rīki nozīmē, ka jums ir jābūt galīgām atbildēm uz tādiem galvenajiem jautājumiem kā:

  • ▪ Kurš no mūsu klienti vai viņi liek mums nopelnīt vairāk, vai tie liek mums zaudēt naudu?
  • ▪ Kur dzīvo mūsu labākie klienti saistībā ar veikals/ noliktava, ka viņi bieži?
  • ▪ Kurus no mūsu produktiem un pakalpojumiem var pārdot visefektīvāk un kam?
  • ▪ Kurus produktus var pārdot visefektīvāk un kam?
  • ▪ Kura pārdošanas kampaņa ir visveiksmīgākā un kāpēc?
  • ▪ Kuri pārdošanas kanāli kuriem produktiem ir visefektīvākie?
  • ▪ Kā mēs varam uzlabot attiecības ar mūsu labākajiem cilvēkiem klienti? Lielākajai daļai uzņēmumu ir dati aptuvens veids, kā atbildēt uz šiem jautājumiem.
    Operatīvās sistēmas rada lielu daudzumu produktu, klientu un dati tirgus no tirdzniecības vietām, rezervācijām, klientu apkalpošanas un tehniskā atbalsta sistēmām. Izaicinājums ir iegūt un izmantot šo informāciju. Daudzi uzņēmumi gūst peļņu tikai no nelielām savām daļām dati stratēģiskām analīzēm.
    I dati atlikušie, bieži vien kopā ar i dati kas iegūta no ārējiem avotiem, piemēram, valdības ziņojumiem un citas iegādātās informācijas, ir zelta raktuves, kas tikai gaida, lai to izpētītu, un dati tie vienkārši ir jāprecizē jūsu organizācijas informācijas kontekstā.

Šīs zināšanas var pielietot vairākos veidos, sākot no vispārējas korporatīvās stratēģijas izstrādes līdz personīgai saziņai ar piegādātājiem, izmantojot zvanu centrus, rēķinu izrakstīšanu, internets un citi punkti. Mūsdienu biznesa vide nosaka, ka DW un saistītie BI risinājumi attīstās tālāk par tradicionālo biznesa struktūru vadīšanu. dati piemēram, es dati normalizēts atomu līmenī un “zvaigžņu/kubu fermas”.

Lai saglabātu konkurētspēju, ir jāapvieno tradicionālas un progresīvas tehnoloģijas, cenšoties atbalstīt plašo analītisko ainavu.
Noslēgumā jāsaka, ka vispārējai videi ir jāuzlabo zināšanas par uzņēmumu kopumā, nodrošinot, ka veikto analīžu rezultātā veiktās darbības ir lietderīgas, lai ieguvēji būtu visi.

Piemēram, pieņemsim, ka jūs ranžējat savu klienti augsta vai zema riska kategorijās.
Ja šī informācija tiek ģenerēta, izmantojot modeļu izvilkšanas rīku vai citus līdzekļus, tā jāievieto DW un jāpadara pieejama ikvienam, izmantojot jebkuru piekļuves rīku, piemēram, statiskos pārskatus, izklājlapas, tabulas vai tiešsaistes analītisko apstrādi (OLAP). .

Tomēr pašlaik liela daļa šāda veida informācijas paliek tvertnēs dati analīzi veidojošās personas vai departamenti. Organizācijai kopumā izpratnei ir maz vai nav nekādas redzamības. Tikai apvienojot šāda veida informācijas saturu jūsu uzņēmuma DW, jūs varat novērst informācijas tvertni un uzlabot savu DW vidi.
BI organizācijas attīstībai ir divi galvenie šķēršļi.
Pirmkārt, mums ir pašas organizācijas un tās disciplīnas problēma.
Lai gan mēs nevaram palīdzēt ar organizācijas politikas izmaiņām, mēs varam palīdzēt izprast organizācijas BI sastāvdaļas, tās arhitektūru un to, kā IBM tehnoloģija veicina tās attīstību.
Otrs šķērslis, kas jāpārvar, ir integrētas tehnoloģijas un zināšanu trūkums par metodi, kas attiecas uz visu BI telpu, nevis tikai ar nelielu komponentu.

IBM saskaras ar izmaiņām integrācijas tehnoloģijā. Jūsu pienākums ir nodrošināt pārdomātu dizainu. Šī arhitektūra ir jāizstrādā, izmantojot tehnoloģiju, kas izvēlēta neierobežotai integrācijai, vai vismaz ar tehnoloģiju, kas atbilst atvērtiem standartiem. Turklāt jūsu uzņēmuma vadībai ir jānodrošina, ka BI apņemšanās tiek veikta saskaņā ar plānu un nepieļauj informācijas tvertņu veidošanos, kas izriet no pašmērķīgām programmām vai mērķiem.
Tas nenozīmē, ka BI vide nav jutīga, reaģējot uz dažādu lietotāju dažādajām vajadzībām un prasībām; tā vietā tas nozīmē, ka šo individuālo vajadzību un prasību īstenošana tiek veikta visas BI organizācijas labā.
BI organizācijas arhitektūras apraksts ir atrodams 9. attēlā. Arhitektūra demonstrē bagātīgu tehnoloģiju un paņēmienu kombināciju.
No tradicionālā viedokļa arhitektūra ietver šādas noliktavas sastāvdaļas

Atomu slānis (Atomu slānis).

Tas ir visa DW un līdz ar to arī stratēģiskās atskaites pamats, sirds.
I dati šeit glabātās saglabās vēsturisko integritāti, ziņojumi par dati un ietver atvasinātus rādītājus, kā arī tiek tīrīti, integrēti un uzglabāti, izmantojot modeļa izgūšanu.
Visa turpmākā to izmantošana dati un saistītā informācija tiek iegūta no šīs struktūras. Tas ir lielisks ieguves avots dati un pārskatiem ar strukturētiem SQL vaicājumiem

Operatīvā noliktava dati vai ziņojuma pamatā dati(Darbības datu krātuve (ODS) vai ziņošana datubāze.)

Šī ir struktūra dati īpaši izstrādāts tehniskajiem ziņojumiem.

I dati glabātās un ziņotās virs šīs struktūras beidzot var izplatīties noliktavā caur pieturas zonu, kur tās varētu izmantot stratēģiskai signalizācijai.

Pieturas zona.

Pirmā pietura lielākajai daļai dati paredzēta noliktavas videi, ir organizācijas zona.
Šeit es dati tiek integrēti, iztīrīti un pārveidoti par dati peļņa, kas aizpildīs noliktavas struktūru

Datums marts.

Šī arhitektūras daļa atspoguļo struktūru dati izmanto īpaši OLAP. Datu martu klātbūtne, ja i dati tiek saglabāti pārklājošajās zvaigžņu shēmās dati daudzdimensionāls relāciju vidē vai failos dati Konfidencialitāte, ko izmanto noteiktas OLAP tehnoloģijas, piemēram, DB2 OLAP Server, nav būtiskas.

Vienīgais ierobežojums ir tas, ka arhitektūra atvieglo izmantošanu dati daudzdimensionāls.
Arhitektūra ietver arī kritiskas Bi tehnoloģijas un metodes, kas izceļas kā:

Telpiskā analīze

Kosmoss analītiķim ir negaidīta informācija, un tā ir būtiska, lai pabeigtu izšķirtspēju. Kosmoss var attēlot informāciju par cilvēkiem, kas dzīvo noteiktā vietā, kā arī informāciju par to, kur šī vieta fiziski atrodas attiecībā pret pārējo pasauli.

Lai veiktu šo analīzi, vispirms ir jāsaista informācija ar platuma un garuma koordinātām. To dēvē par “ģeokodēšanu”, un tai ir jābūt daļai no izvilkšanas, pārveidošanas un iekraušanas (ETL) procesa jūsu noliktavas atomu līmenī.

Datu ieguve.

Iegūšana dati ļauj mūsu uzņēmumiem palielināt skaitu klienti, lai prognozētu pārdošanas tendences un ļautu pārvaldīt attiecības ar klienti (CRM), starp citām BI iniciatīvām.

Iegūšana dati tāpēc tas ir jāintegrē ar konstrukcijām dati Dwhouse un to atbalsta noliktavas procesi, lai nodrošinātu gan efektīvu, gan lietderīgu attiecīgo tehnoloģiju un metožu izmantošanu.

Kā norādīts BI arhitektūrā, Dwhouse atomu līmenis, kā arī datu marti ir lielisks avots dati ieguvei. Šīm pašām iekārtām ir jābūt arī ieguves rezultātu saņēmējām, lai nodrošinātu pieejamību visplašākajai auditorijai.

Aģenti.

Ir dažādi “aģenti”, lai pārbaudītu klientu par katru punktu, piemēram, uzņēmuma operētājsistēmu un pašu dw. Šie aģenti var būt uzlaboti neironu tīkli, kas apmācīti uzzināt par tendencēm katrā punktā, piemēram, nākotnes produktu pieprasījumu, pamatojoties uz pārdošanas veicināšanas pasākumiem, uz noteikumiem balstītus dzinējus, lai reaģētu uz dato apstākļu kopums vai pat vienkārši aģenti, kuri ziņo par izņēmumiem "augstākajiem vadītājiem". Šie procesi parasti notiek reāllaikā, un tāpēc tiem jābūt cieši saistītiem ar to kustību dati. Visas šīs struktūras dati, tehnoloģijas un paņēmieni garantē, ka jūs nepavadīsit nakti, veidojot savu BI organizāciju.

Šī aktivitāte tiks izstrādāta pakāpeniski, maziem punktiem.
Katrs solis ir neatkarīgs projekta darbs, un tas tiek saukts par iterāciju jūsu DW vai BI iniciatīvā. Iterācijas var ietvert jaunu tehnoloģiju ieviešanu, sākot ar jaunām metodēm, pievienojot jaunas struktūras dati , ielādēšana i dati papildu , vai ar jūsu vides analīzes paplašināšanu. Šī rindkopa ir sīkāk apspriesta 3. nodaļā.

Papildus tradicionālajām DW struktūrām un BI rīkiem ir arī citas jūsu BI organizācijas funkcijas, kas jums jāizstrādā, piemēram:

Klientu saskarsmes punkti (Customer touch punktus).

Tāpat kā jebkurā modernā organizācijā, ir vairāki klientu saskarsmes punkti, kas norāda, kā gūt pozitīvu pieredzi klienti. Ir tradicionāli kanāli, piemēram, mazumtirgotāji, centrāles operatori, tiešais pasts, multivide un drukātā reklāma, kā arī jaunāki kanāli, piemēram, e-pasts un tīmeklis, dati produkti ar kādu saskares punktu ir jāiegādājas, jātransportē, jātīra, jāapstrādā un pēc tam jāievieto objektos dati BI.

Pamati no dati operatīvās un lietotāju asociācijas (Operational

datu bāzes un lietotāju kopienas).
Beigās kontaktpunktu klienti pamati ir atrasti dati uzņēmuma lietojumprogrammu un lietotāju kopienas. THE dati esošie ir dati tradicionālā, kas ir jāapvieno un jāapvieno ar dati kas plūst no kontaktpunktiem, lai apmierinātu nepieciešamo informāciju.

Analītiķi. (Analītiķi)

Galvenais BI vides ieguvējs ir analītiķis. Tieši viņš gūst labumu no pašreizējās ieguves dati darbojas, integrēta ar dažādiem avotiem dati , papildināta ar tādām funkcijām kā ģeogrāfiskā analīze (ģeokodēšana) un piedāvāta BI tehnoloģijās, kas nodrošina izvilkšanu, OLAP, uzlaboto SQL atskaiti un ģeogrāfisko analīzi. Pārskatu vides primārā analītiķa saskarne ir BI portāls.

Tomēr analītiķis nav vienīgais, kurš gūst labumu no BI arhitektūras.
Vadītāji, lielas lietotāju asociācijas un pat dalībnieki, piegādātāji un i klienti vajadzētu atrast priekšrocības uzņēmuma BI.

Aizmugurējās padeves cilpa.

BI arhitektūra ir mācību vide. Raksturīgs attīstības princips ir pieļaut noturīgas struktūras dati jāatjaunina, izmantojot izmantoto BI tehnoloģiju un lietotāja veiktās darbības. Piemērs ir klientu vērtēšana.

Ja pārdošanas nodaļa modelē klientu rezultātus, lai izmantotu jaunu pakalpojumu, pārdošanas nodaļai nevajadzētu būt vienīgajai grupai, kas gūst labumu no pakalpojuma.

Tā vietā modeļu iegūšana jāveic kā dabiska datu plūsmas daļa uzņēmumā, un klientu rādītājiem jākļūst par integrētu noliktavas informācijas konteksta daļu, kas ir redzama visiem lietotājiem. Bi-bI orientētais IBM Suite, tostarp DB2 UDB, DB2 OLAP Server, ietver lielāko daļu galveno tehnoloģiju komponentu, kas definēts 1.1. attēlā.

Mēs izmantojam arhitektūru, kas parādīta šajā grāmatas ilustrācijā, lai nodrošinātu mums nepārtrauktības līmeni un parādītu, kā katrs IBM produkts iekļaujas kopējā BI shēmā.

Informācijas satura nodrošināšana (Providing informācijas saturs)

BI vides projektēšana, izstrāde un ieviešana ir biedējošs uzdevums. Dizainam ir jāatbilst gan pašreizējām, gan nākotnes biznesa prasībām. Arhitektūras rasējumā jābūt pilnīgam, lai tajā iekļautu visus projektēšanas posmā konstatētos secinājumus. Izpildei jāpaliek vienam mērķim: izstrādāt BI arhitektūru, kā tas ir oficiāli norādīts dizainā un pamatojoties uz biznesa prasībām.

Ir īpaši grūti apgalvot, ka disciplīna nodrošinās relatīvus panākumus.
Tas ir vienkārši, jo jūs neizstrādājat BI vidi uzreiz, bet gan laika gaitā mazos soļos.

Tomēr jūsu arhitektūras BI komponentu identificēšana ir svarīga divu iemeslu dēļ: jūs vadīsit visus turpmākos tehniskās arhitektūras lēmumus.
Jūs varēsiet apzināti plānot konkrētu tehnoloģiju lietojumu, pat ja jūs, iespējams, nesaņemsit atkārtotu tehnoloģiju nepieciešamību vairākus mēnešus.

Pietiekama jūsu biznesa prasību izpratne ietekmēs jūsu arhitektūrai iegādāto produktu veidu.
Arhitektūras projektēšana un attīstīšana nodrošina, ka jūsu noliktava ir

nevis nejaušs notikums, bet gan rūpīgi konstruēts “pārdomāts”. opera māksla kā jauktas tehnoloģijas mozaīka.

Dizaina informācijas saturs

Visai sākotnējai izstrādei ir jākoncentrējas uz galvenajiem BI komponentiem un jāidentificē tie, kas būs nepieciešami vispārējai videi tagad un nākotnē.
Ir svarīgi zināt biznesa prasības.

Pat pirms jebkāda formāla dizaina sākuma projekta plānotājs bieži var uzreiz identificēt vienu vai divus komponentus.
Tomēr to komponentu līdzsvaru, kas var būt nepieciešami jūsu arhitektūrai, nevar viegli atrast. Projektēšanas fāzē galvenā arhitektūras daļa saista lietojumprogrammu izstrādes (JAD) sesiju, lai noteiktu biznesa prasības.

Dažreiz šīs prasības var uzticēt vaicājumu un atskaišu rīkiem.
Piemēram, lietotāji norāda, ka, ja viņi vēlas automatizēt pašreizējo pārskatu, viņiem tas ir manuāli jāģenerē, integrējot divus pašreizējos pārskatus un pievienojot aprēķinus, kas iegūti, apvienojot dati.
Lai gan šī prasība ir vienkārša, tā definē noteiktu līdzekļa funkcionalitāti, kas jāiekļauj, pērkot atskaites rīkus savai organizācijai.

Projektētājam ir jāievēro arī papildu prasības, lai iegūtu pilnīgu attēlu. Vai lietotāji vēlas abonēt šo pārskatu?
Vai pārskatu apakškopas tiek ģenerētas un nosūtītas pa e-pastu dažādiem lietotājiem? Vai viņi vēlas redzēt šo ziņojumu uzņēmuma portālā? Visas šīs prasības ir daļa no vienkāršas nepieciešamības aizstāt manuālo pārskatu, kā to pieprasa lietotāji. Šāda veida prasību priekšrocība ir tāda, ka ikvienam, gan lietotājiem, gan izstrādātājiem, ir izpratne par pārskatu jēdzienu.

Tomēr ir arī citi uzņēmējdarbības veidi, kas mums ir jāplāno. Ja biznesa prasības ir izklāstītas stratēģisku biznesa jautājumu veidā, ekspertam dizainerim ir viegli saskatīt mēra/fakta un dimensijas prasības.

Ja JAD lietotāji nezina, kā norādīt savas prasības biznesa problēmas veidā, dizaineris bieži sniegs piemērus, lai sāktu prasību apkopošanas sesiju.
Eksperts dizainers var palīdzēt lietotājiem izprast ne tikai stratēģisko tirdzniecību, bet arī to, kā to veidot.
Prasību apkopošanas pieeja ir aplūkota 3. nodaļā; pagaidām mēs tikai vēlamies norādīt uz nepieciešamību izstrādāt visu veidu BI prasības.

Stratēģiska biznesa problēma ir ne tikai biznesa prasība, bet arī dizaina pavediens. Ja jāatbild uz daudzdimensionālu jautājumu, tad jāiegaumē, jāuzrāda i dati dimensiju, un, ja jums ir nepieciešams iegaumēt dati daudzdimensionāls, jums ir jāizlemj, kāda veida tehnoloģiju vai tehniku ​​jūs gatavojaties izmantot.

Vai ieviešat rezervētu kuba zvaigznīšu shēmu vai abus? Kā redzat, pat vienkārša biznesa problēma var būtiski ietekmēt dizainu. Taču šāda veida biznesa prasības ir ikdienišķas un saprotamas, vismaz dizaineriem un plānotājiem ar projektu pieredzi.

Ir bijis pietiekami daudz diskusiju par OLAP tehnoloģijām un atbalstu, un ir pieejams plašs risinājumu klāsts. Līdz šim esam minējuši nepieciešamību apvienot vienkāršus pārskatus ar biznesa dimensijas prasībām un to, kā šīs prasības ietekmē tehniskos arhitektūras lēmumus.

Bet kādas ir prasības, kuras lietotāji vai Dw komanda nesaprot? Vai jums kādreiz būs nepieciešama telpiskā analīze?
Kalnrūpniecības modeļi dati vai tie būs nepieciešama jūsu nākotnes sastāvdaļa? Kas zina?

Ir svarīgi atzīmēt, ka šāda veida tehnoloģijas nav labi zināmas vispārējai lietotāju kopienai un Dw komandas locekļiem, daļēji tas var būt tāpēc, ka ar tām parasti strādā daži iekšējie vai trešo pušu tehniskie eksperti. Tas ir ārkārtējs problēmu gadījums, ko rada šāda veida tehnoloģijas. Ja lietotāji nevar aprakstīt biznesa prasības vai formulēt tās tā, lai sniegtu norādījumus dizaineriem, viņi var palikt nepamanīti vai, vēl ļaunāk, vienkārši ignorēti.

Tas kļūst problemātiskāks, ja dizainers un izstrādātājs nevar atpazīt vienas no šīm progresīvajām, bet kritiskajām tehnoloģijām.
Kā mēs bieži esam dzirdējuši dizaineru sakām: “Kāpēc gan mēs to neatliekam malā, kamēr nesaņemsim šo citu lietu? “Vai viņus patiešām interesē prioritātes, vai arī viņi vienkārši izvairās no prasībām, kuras nesaprot? Visticamāk, tā ir pēdējā hipotēze. Pieņemsim, ka jūsu pārdošanas komanda ir paziņojusi par biznesa prasību, kā norādīts 1.3. attēlā, kā redzat, prasība ir formulēta biznesa problēmas formā. Atšķirība starp šo problēmu un tipisko izmēru problēmu ir attālums. Šajā gadījumā pārdošanas komanda katru mēnesi vēlas uzzināt kopējo pārdošanas apjomu no produktiem, noliktavām un klienti kuri dzīvo 5 jūdžu attālumā no noliktavas, kurā viņi iegādājas.

Diemžēl dizaineri vai arhitekti var vienkārši ignorēt telpisko komponentu, sakot: “mums ir klients, produkts un dati no depozīta. Ievērosim attālumu līdz citai iterācijai.

"Nepareiza atbilde. Šāda veida uzņēmējdarbības problēma ir saistīta ar BI. Tas atspoguļo dziļāku izpratni par mūsu biznesu un spēcīgu analītisko telpu mūsu analītiķiem. BI ir ārpus vienkāršas vaicāšanas vai standarta atskaites vai pat OLAP. Tas nenozīmē, ka šīs tehnoloģijas nav svarīgas jūsu BI, taču tās pašas neatspoguļo BI vidi.

Dizains informācijas kontekstam (Informācijas satura dizains)

Tagad, kad esam noteikuši biznesa prasības, kas atšķir dažādas pamatkomponentes, tās ir jāiekļauj vispārējā arhitektūras projektā. Daži BI komponenti ir daļa no mūsu sākotnējiem centieniem, savukārt daži netiks ieviesti vairākus mēnešus.

Taču visas zināmās prasības ir atspoguļotas dizainā, lai tad, kad mums ir jāievieš konkrēta tehnoloģija, mēs būtu gatavi to darīt. Kaut kas no projekta atspoguļos tradicionālo domāšanu.

Šis komplekts dati tiek izmantots, lai atbalstītu vēlākus lietojumus dati dimensiju, pamatojoties uz mūsu identificētajām uzņēmējdarbības problēmām. Kā tiek ģenerēti papildu dokumenti, piemēram, dizaina izstrāde dati, mēs sāksim formalizēt, kā i dati tie izplatās vidē. Mēs esam pārliecinājušies par nepieciešamību pārstāvēt i dati dimensiju veidā, sadalot tos (atbilstoši konkrētām specifiskām vajadzībām) datu centros.

Nākamais jautājums, uz kuru jāatbild, ir: kā tiks veidoti šie datu centri?
Vai jūs veidojat zvaigznes, lai atbalstītu kubus, vai tikai kubus, vai tikai zvaigznes? (vai labie kubi, vai labās zvaigznes). Ģenerējiet arhitektūru atkarīgiem datu tirgiem, kuriem visiem ir nepieciešams atomu slānis dati vai tu iegādājies? Ļaut neatkarīgiem datu tirgiem iegūt i dati tieši no operētājsistēmām?

Kādu Cube tehnoloģiju jūs mēģināt standartizēt?

Jums ir milzīgs daudzums dievu dati nepieciešami izmēru analīzei vai jums ir nepieciešami kubi no jūsu valsts pārdošanas darbiniekiem katru nedēļu, vai abi? Vai jūs veidojat kaut ko tik jaudīgu kā DB2 OLAP Server finansēm vai Cognos PowerPlay kubus savai pārdošanas organizācijai, vai abus? Šie ir lielie arhitektūras dizaina lēmumi, kas ietekmēs jūsu BI vidi no šī brīža. Jā, jūs esat konstatējis nepieciešamību pēc OLAP. Tagad, kā jūs īstenosit šāda veida tehniku ​​un tehnoloģiju?

Kā dažas no vismodernākajām tehnoloģijām ietekmē jūsu dizainu? Pieņemsim, ka savā organizācijā esat identificējis telpas nepieciešamību. Tagad jums ir jāatgādina arhitektūras zīmējumu izdevumi, pat ja jūs neplānojat veikt telpiskos komponentus vairākus mēnešus. Arhitektam šodien jāprojektē, pamatojoties uz to, kas nepieciešams. Paredzēt vajadzību pēc telpiskās analīzes, kas ģenerē, uzglabā, veic un nodrošina piekļuvi dati telpiskā. Tam, savukārt, vajadzētu būt ierobežojumam attiecībā uz programmatūras tehnoloģijas veidu un platformas specifikācijām, kuras pašlaik varat apsvērt. Piemēram, administrēšanas sistēma datu bāze relāciju slānim (RDBMS), ko veicat savam atomu slānim, ir jābūt pieejamam spēcīgam telpiskajam apjomam. Tas nodrošinātu maksimālu veiktspēju, izmantojot ģeometriju un telpiskos objektus analītiskajās lietojumprogrammās. Ja jūsu RDBMS nevar tikt galā ar dati (telpiski orientēts) iekšēji, tāpēc jums būs jāizveido a datu bāze (telpiski orientēts) ārējais. Tas sarežģī problēmu pārvaldību un apdraud jūsu vispārējo veiktspēju, nemaz nerunājot par papildu problēmām, kas radušās jūsu DBA, jo viņiem, iespējams, ir minimāla izpratne par dati arī telpiskā. No otras puses, ja jūsu RDMBS dzinējs apstrādā visus telpiskos komponentus un tā optimizētājs apzinās telpisko objektu īpašās vajadzības (piemēram, indeksēšanu), jūsu DBA var viegli pārvaldīt problēmas un jūs varat maksimāli palielināt veiktspēju.

Turklāt jums ir jāpielāgo pieturvietas apgabals un atomu vides slānis, lai iekļautu adreses tīrīšanu (a

telpiskās analīzes galvenais elements), kā arī turpmāka kosmosa objektu taupīšana. Zīmējumu izdevumu pēctecība turpinās tagad, kad esam ieviesuši skaidras virzības jēdzienu. Pirmkārt, šī lietojumprogramma noteiks programmatūras veidu, kas nepieciešams jūsu ETL darbam.

Vai jums ir nepieciešami tādi produkti kā Trillium, lai nodrošinātu tai tīru adresi, vai jūsu izvēlētais ETL pārdevējs, lai nodrošinātu šo funkcionalitāti?
Pagaidām ir svarīgi, lai jūs novērtētu dizaina līmeni, kas jāpabeidz, pirms sākat ieviest savu noliktavu. Iepriekš minētajos piemēros ir jāparāda daudzi dizaina lēmumi, kas jāveic pēc jebkuras konkrētas uzņēmējdarbības prasības noteikšanas. Ja tie tiek pieņemti pareizi, šie dizaina lēmumi veicina savstarpēju atkarību starp jūsu vides fiziskajām struktūrām, izmantotās tehnoloģijas izvēli un informācijas satura izplatīšanas plūsmu. Bez šīs parastās BI arhitektūras jūsu organizācija tiks pakļauta haotiskam esošo tehnoloģiju sajaukumam, kas labākajā gadījumā būs brīvi savienotas, lai nodrošinātu acīmredzamu stabilitāti.

Uzturēt informācijas saturu

Informācijas vērtības radīšana jūsu organizācijai ir ļoti grūts uzdevums. Bez pietiekamas izpratnes un pieredzes vai pareizas plānošanas un dizaina pat labākās komandas cietīs neveiksmi. No otras puses, ja jums ir lieliska intuīcija un detalizēta plānošana, bet nav disciplīnas izpildei, jūs vienkārši esat iztērējis savu naudu un laiku, jo jūsu pūles ir lemtas neveiksmei. Ziņojumam jābūt skaidram: ja jums trūkst vienas vai vairāku no šīm prasmēm, izpratnes/pieredzes vai plānošanas/projektēšanas vai ieviešanas disciplīnas, tas sabojās vai iznīcinās BI organizācijas ēku.

Vai jūsu komanda ir pietiekami sagatavota? Vai jūsu BI komandā ir kāds, kurš izprot plašo analītisko ainavu, kas pieejama BI vidēs, un metodes un tehnoloģijas, kas nepieciešamas šīs ainavas uzturēšanai? Vai jūsu komandā ir kāds, kurš var atpazīt pieteikšanās atšķirību starp progresīviem?

statiskā atskaite un OLAP, vai atšķirības starp ROLAP un OLAP? Vai kāds no jūsu komandas locekļiem skaidri apzinās, kā iegūt un kā tas var ietekmēt noliktavu vai kā noliktava var atbalstīt izvilkšanas veiktspēju? Komandas loceklis saprot vērtību dati kosmosa vai aģentu tehnoloģija? Vai jums ir kāds, kurš novērtē unikālo ETL rīku pielietojumu salīdzinājumā ar ziņojumu brokeru tehnoloģiju? Ja jums tāda nav, iegūstiet vienu. BI ir daudz lielāks nekā normalizēts atomu slānis, OLAP, zvaigžņu shēmas un ODS.

Izpratne un pieredze, lai atpazītu BI prasības un to risinājumus, ir būtiska, lai jūs varētu pareizi formalizēt lietotāju vajadzības un izstrādāt un ieviest to risinājumus. Ja jūsu lietotāju kopienai ir grūtības aprakstīt prasības, noliktavas komandas uzdevums ir nodrošināt šo izpratni. Bet ja noliktavas komanda

neatzīst konkrēto BI pielietojumu - piemēram, datu ieguvi -, tad nav tas labākais, ka BI vides bieži vien ir tikai pasīvas repozitorijas. Tomēr šo tehnoloģiju ignorēšana nemazina to nozīmi un ietekmi uz jūsu organizācijas biznesa informācijas spēju rašanos, kā arī informācijas ainavu, kuru plānojat veicināt.

Plānošanā jāiekļauj zīmēšanas jēdziens, un abiem ir nepieciešama kompetenta persona. Turklāt projektēšanai ir nepieciešama komandas noliktavas filozofija un standartu ievērošana. Piemēram, ja jūsu uzņēmums ir izveidojis standarta platformu vai ir identificējis konkrētu RDBVS, kuru vēlaties standartizēt visā platformā, visiem komandas locekļiem ir pienākums ievērot šos standartus. Parasti komanda pakļauj standartizācijas nepieciešamību (lietotāju kopienām), bet pati komanda nevēlas ievērot standartus, kas noteikti arī citās uzņēmuma jomās vai, iespējams, pat līdzīgos uzņēmumos. Tas ir ne tikai liekulīgi, bet arī liecina, ka uzņēmums nespēj izmantot esošos resursus un ieguldījumus. Tas nenozīmē, ka nav situāciju, kas garantētu nestandartizētu platformu vai tehnoloģiju; tomēr noliktavas centieni

viņiem greizsirdīgi jāsargā uzņēmuma standarti, kamēr biznesa prasības nenosaka citādi.

Trešā galvenā sastāvdaļa, kas nepieciešama, lai izveidotu BI organizāciju, ir disciplīna.
Tas kopumā ir atkarīgs vienlīdz no indivīdiem un vides. Projektu plānotājiem, sponsoriem, arhitektiem un lietotājiem ir jānovērtē disciplīna, kas nepieciešama uzņēmuma informācijas ainavas veidošanai. Dizaineriem ir jāvirza savi projektēšanas centieni tā, lai tie papildinātu citus nepieciešamos sabiedrības centienus.

Piemēram, pieņemsim, ka jūsu uzņēmums izveido ERP lietojumprogrammu, kurā ir noliktavas komponents.
Tāpēc ERP dizaineru pienākums ir sadarboties ar noliktavas vides komandu, lai nekonkurētu vai nedublētos jau iesāktais darbs.

Disciplīna ir arī tēma, kas jārisina visai organizācijai, un tā parasti tiek noteikta un uzticēta izpildvaras līmenim.
Vai vadītāji ir gatavi ievērot izstrādātu pieeju? Pieeja, kas sola radīt informācijas saturu, kas galu galā radīs vērtību visās uzņēmuma jomās, bet, iespējams, apdraud individuālās vai departamentu dienaskārtības? Atcerieties teicienu "Domāt par visu ir svarīgāk nekā domāt tikai par vienu lietu". Šis teiciens attiecas uz BI organizācijām.

Diemžēl daudzas noliktavas koncentrējas uz to, lai mēģinātu mērķēt un radīt vērtību konkrētam departamentam vai konkrētiem lietotājiem, neņemot vērā organizāciju kopumā. Pieņemsim, ka izpilddirektors lūdz palīdzību no washouse komandas. Komanda reaģē ar 90 dienu pūlēm, kas ietver ne tikai vadītāja noteikto paziņojumu prasību sniegšanu, bet arī visu dati Bāzes tiek sajauktas atomu līmenī, pirms tās tiek ieviestas ierosinātajā kubu tehnoloģijā.
Šis inženiertehniskais papildinājums nodrošina, ka washouse uzņēmums gūs labumu dati vajadzīgs vadītājam.
Tomēr izpilddirektors runāja ar ārējiem konsultāciju uzņēmumiem, kuri ierosināja līdzīgu pieteikumu ar piegādi mazāk nekā 4 nedēļu laikā.

Pieņemot, ka iekšējās noliktavas komanda ir kompetenta, izpildvarai ir izvēle. Kurš var atbalstīt papildu inženierzinātņu disciplīnu, kas nepieciešams, lai attīstītu informācijas līdzekļu uzņēmumu, vai var izvēlēties ātri izveidot savu risinājumu. Pēdējais, šķiet, tiek izvēlēts pārāk bieži, un tas kalpo tikai, lai izveidotu informācijas konteinerus, kas gūst labumu tikai dažiem vai indivīdam.

Īstermiņa un ilgtermiņa mērķi

Arhitektiem un projektu dizaineriem ir jāformulē ilgtermiņa redzējums par vispārējo arhitektūru un BI organizācijas izaugsmes plāniem. Šī īstermiņa ieguvumu un ilgtermiņa plānošanas kombinācija atspoguļo BI centienu abas puses. Īstermiņa ieguvums ir BI aspekts, kas saistīts ar jūsu noliktavas iterācijām.

Šeit plānotāji, arhitekti un sponsori koncentrējas uz konkrētu komerciālo prasību izpildi. Tieši šajā līmenī tiek būvētas fiziskās būves, iegādātas tehnoloģijas un ieviestas tehnikas. Tie nekādā gadījumā nav izstrādāti, lai apmierinātu īpašas prasības, ko nosaka noteiktas lietotāju kopienas. Viss tiek darīts, lai apmierinātu konkrētas kopienas noteiktās prasības.
Tomēr ilgtermiņa plānošana ir otrs BI aspekts. Tieši šeit plāni un projekti nodrošināja, ka jebkura fiziska struktūra tika uzbūvēta, izvēlētās tehnoloģijas un ieviestās tehnikas tika veiktas, ņemot vērā uzņēmumu. Tā ir ilgtermiņa plānošana, kas nodrošina kohēziju, kas nepieciešama, lai nodrošinātu, ka biznesa ieguvumi rodas no jebkādiem īstermiņa ieguvumiem.

Pamatojiet savus BI centienus

Un datu noliktava pašam par sevi tai nav raksturīgas vērtības. Citiem vārdiem sakot, starp noliktavas tehnoloģijām un ieviešanas metodēm nav raksturīgas vērtības.

Jebkuras noliktavas piepūles vērtība ir atrodama darbībās, kas tiek veiktas noliktavas vides un laika gaitā izkoptā informācijas satura rezultātā. Šis ir kritisks punkts, kas jāsaprot, pirms mēģināt novērtēt jebkuras wherehouse iniciatīvas vērtību.

Pārāk bieži arhitekti un dizaineri mēģina piemērot vērtību noliktavas fiziskajiem un tehniskajiem komponentiem, lai gan patiesībā vērtība ir balstīta uz biznesa procesiem, kurus pozitīvi ietekmē noliktava un labi iegūtā informācija.

Šeit ir BI izveides izaicinājums: kā jūs attaisnojat ieguldījumu? Ja pašai vietai nav patiesas vērtības, projektu izstrādātājiem ir jāizpēta, jādefinē un jāformalizē ieguvumi, ko gūst tās personas, kuras izmantos noliktavu, lai uzlabotu konkrētus biznesa procesus vai aizsargātās informācijas vērtību, vai abus.

Lai sarežģītu situāciju, jebkurš biznesa process, ko ietekmē noliktavas centieni, varētu sniegt “ievērojamus” vai “niecīgus” ieguvumus. Ievērojami ieguvumi nodrošina taustāmu metriku, lai novērtētu ieguldījumu atdevi (IA), piemēram, krājumu pagriešana uz papildu laiku noteiktā periodā vai zemākas transportēšanas izmaksas par vienu sūtījumu. Ir grūtāk definēt smalkas priekšrocības, piemēram, uzlabotu piekļuvi informācijai taustāmas vērtības izteiksmē.

Savienojiet savu projektu, lai uzzinātu biznesa pieprasījumi

Pārāk bieži projektu plānotāji mēģina saistīt noliktavas vērtību ar amorfiem uzņēmuma mērķiem. Paziņojot, ka "noliktavas vērtība ir balstīta uz mūsu spēju apmierināt stratēģiskos pieprasījumus", mēs atklājam diskusiju patīkamā veidā. Taču ar to vien nepietiek, lai noteiktu, vai ir jēga ieguldīt krājumos. Vislabāk ir saistīt noliktavas iterācijas ar konkrētām, zināmām biznesa prasībām.

Izmēriet IA

ROI aprēķināšana noliktavas iestatījumos var būt īpaši sarežģīta. Tas ir īpaši grūti, ja priekšrocība

konkrēta atkārtojuma princips ir kaut kas tāds, kas nav taustāms vai viegli izmērāms. Viens pētījums atklāja, ka lietotāji uztver divus galvenos BI iniciatīvu ieguvumus:

  • ▪ Radīt spēju pieņemt lēmumus
  • ▪ Izveidot piekļuvi informācijai
    Šīs priekšrocības ir mīkstas (vai vieglas) priekšrocības. Ir viegli saprast, kā mēs varam aprēķināt IA, pamatojoties uz smagu (vai būtisku) ieguvumu, piemēram, samazinātām transporta izmaksām, taču kā mēs novērtējam spēju pieņemt labākus lēmumus?
    Tas noteikti ir izaicinājums projektu plānotājiem, cenšoties pārliecināt uzņēmumu ieguldīt konkrētā noliktavas darbā. Pārdošanas apjoma palielināšana vai izmaksu samazināšana vairs nav galvenās tēmas, kas virza BI vidi.
    Tā vietā jūs skatāties uz biznesa pieprasījumiem labākai piekļuvei informācijai, lai konkrēta nodaļa varētu pieņemt ātrākus lēmumus. Tie ir stratēģiski virzītāji, kas uzņēmumam ir vienlīdz svarīgi, taču ir daudz neskaidrāki un grūtāk raksturojami ar taustāmu metriku. Šādā gadījumā ROI aprēķināšana var būt maldinoša, ja ne nebūtiska.
    Projektu plānotājiem jāspēj demonstrēt taustāmu vērtību vadītājiem, lai izlemtu, vai ieguldījums konkrētā iterācijā ir tā vērts. Tomēr mēs neierosināsim jaunu metodi ROI aprēķināšanai, kā arī neizteiksim argumentus par vai pret.
    Ir pieejami daudzi raksti un grāmatas, kas apspriež IA aprēķināšanas pamatprincipus. Varat izpētīt īpašus vērtību piedāvājumus, piemēram, ieguldījumu vērtību (VOI), ko piedāvā tādas grupas kā Gartner. Tā vietā mēs koncentrēsimies uz jebkura IA galvenajiem aspektiem vai citiem vērtību piedāvājumiem, kas jums jāņem vērā. ROI piemērošana Papildus argumentam par “smagajiem” ieguvumiem un “maigajiem” ieguvumiem, kas saistīti ar BI centieniem, ir arī citi jautājumi, kas jāņem vērā, piemērojot IA. Piemēram:

Pārāk daudz ietaupījumu attieciniet uz DW centieniem, kas tik un tā būtu
Pieņemsim, ka jūsu uzņēmums ir pārcēlies no lieldatoru arhitektūras uz izplatītu UNIX vidi. Tāpēc jebkādus ietaupījumus, ko var (vai var ne) realizēt no šīm pūlēm, nevajadzētu attiecināt tikai uz noliktavu, ja vispār (?).

Neuzskaitīt visu ir dārgi. Un ir daudzas lietas, kas jāņem vērā. Apsveriet šādu sarakstu:

  • ▪ Sākuma izmaksas, tostarp iespējamība.
  • ▪ Īpašas aparatūras izmaksas ar saistīto krātuvi un sakariem
  • ▪ Programmatūras izmaksas, ieskaitot pārvaldību dati un klienta/servera paplašinājumi, ETL programmatūra, DSS tehnoloģijas, vizualizācijas rīki, plānošanas un darbplūsmas lietojumprogrammas un uzraudzības programmatūra, .
  • ▪ Struktūras projektēšanas izmaksas dati, izveidojot un optimizējot
  • ▪ Programmatūras izstrādes izmaksas, kas tieši saistītas ar BI
  • ▪ Izmaksas par atbalstu uz vietas, tostarp veiktspējas optimizāciju, ieskaitot programmatūras versiju kontroli un palīdzības darbības Izmantojiet “Big-Bang” IA. Noliktavas celtniecība kā vienots, milzīgs darbs ir lemts neveiksmei, tāpēc pat aprēķiniet IA liela uzņēmuma iniciatīvai Piedāvājums ir pārsteidzošs, un plānotāji turpina veikt vājus mēģinājumus novērtēt visu pūļu vērtību. Kāpēc plānotāji cenšas biznesa iniciatīvai piešķirt naudas vērtību, ja ir plaši zināms un pieņemts, ka noteiktu atkārtojumu skaitu ir grūti novērtēt? Kā tas ir iespējams? Ar dažiem izņēmumiem tas nav iespējams. Nedari to. Tagad, kad esam noskaidrojuši, ko nevajadzētu darīt, aprēķinot IA, šeit ir daži punkti, kas palīdzēs mums izveidot uzticamu procesu, lai novērtētu jūsu BI centienu vērtību.

IA vienprātības iegūšana. Neatkarīgi no jūsu izvēlētās metodes, lai novērtētu jūsu BI centienu vērtību, par to ir jāvienojas visām pusēm, tostarp projektu dizaineriem, sponsoriem un uzņēmumu vadītājiem.

Samaziniet ROI identificējamās daļās. Nepieciešams solis ceļā uz saprātīgu ROI aprēķināšanu ir koncentrēt šo aprēķinu uz konkrētu projektu. Tas ļauj novērtēt vērtību, pamatojoties uz konkrētām biznesa prasībām, kas tiek izpildītas

Definējiet izmaksas. Kā jau minēts, ir jāņem vērā daudzas izmaksas. Turklāt izmaksās jāietver ne tikai tās, kas saistītas ar vienu atkārtojumu, bet arī izmaksas, kas saistītas ar atbilstības nodrošināšanu uzņēmuma standartiem.

Definējiet priekšrocības. Skaidri saistot IA ar konkrētām uzņēmējdarbības prasībām, mums jāspēj noteikt ieguvumus, kas nodrošinās prasību izpildi.

Samaziniet izmaksas un ieguvumus ar nenovēršamu peļņu. Tas ir labākais veids, kā balstīt savus vērtējumus uz neto pašreizējo vērtību (NPV), nevis mēģināt prognozēt nākotnes ieņēmumu vērtību nākotnē.

Samaziniet IA sadalīšanas laiku līdz minimumam. Tas ir labi dokumentēts ilgā laika periodā, kad tas ir izmantots jūsu IA.

Izmantojiet vairāk nekā vienu ROI formulu. Ir daudzas IA prognozēšanas metodes, un jums ir jāplāno, vai izmantot vienu vai vairākas no tām, tostarp neto pašreizējā vērtība, iekšējā atdeves likme (IRR) un atmaksāšanās.

Definējiet atkārtojamu procesu. Tas ir ļoti svarīgi jebkuras ilgtermiņa vērtības aprēķināšanai. Jādokumentē viens atkārtojams process, lai varētu sekot visām projekta sekām.

Norādītās problēmas ir visizplatītākās, ko definējuši washouse vides eksperti. Vadības uzstājība nodrošināt “Big-Bang” IA ir ļoti dezorientējoša. Ja sākat visus savus IA aprēķinus, sadalot tos identificējamos, taustāmos gabalos, jums ir labas izredzes novērtēt precīzu IA vērtējumu.

Jautājumi par IA priekšrocībām

Neatkarīgi no jūsu ieguvumiem, mīkstajiem vai cietajiem, varat izmantot dažus pamatjautājumus, lai noteiktu to vērtību. Piemēram, izmantojot vienkāršu mērogošanas sistēmu no 1 līdz 10, varat izmērīt jebkura piepūles ietekmi, izmantojot šādus jautājumus:

  • Kā jūs novērtētu izpratni par dati sekojat šim jūsu uzņēmuma projektam?
  • Kā jūs novērtētu procesa uzlabojumus šī projekta rezultātā?
  • Kā jūs novērtētu jauno ieskatu un secinājumu ietekmi, kas tagad ir pieejami šīs iterācijas rezultātā
  • Kāda bija jaunu un veiktspējīgu skaitļošanas vides ietekme, kas gūta apgūtā? Ja atbilžu uz šiem jautājumiem ir maz, iespējams, uzņēmums nav ieguldīto ieguldījumu vērts. Jautājumi ar augstu punktu skaitu norāda uz ievērojamu vērtības pieaugumu, un tiem vajadzētu kalpot par ceļvedi turpmākai izmeklēšanai. Piemēram, augstam procesa uzlabojumu rezultātam vajadzētu likt dizaineriem pārbaudīt, kā procesi ir uzlaboti. Jūs varat atklāt, ka daži vai visi gūtie ieguvumi ir taustāmi, un tāpēc to var viegli izmantot naudas izteiksmē. Iegūstiet maksimālu labumu no pirmās iterācijas noliktava Lielākais jūsu uzņēmuma pūliņu rezultāts bieži vien ir pirmajās iterācijās. Šie agrīnie centieni tradicionāli nosaka sabiedrībai visnoderīgāko informācijas saturu un palīdz izveidot tehnoloģisko pamatu turpmākajām BI lietojumprogrammām. Parasti katra nākamā secība dati noliktavu projekti sniedz arvien mazāku papildu vērtību uzņēmumam kopumā. Tas jo īpaši attiecas uz gadījumiem, kad iterācija nepievieno jaunas tēmas vai neatbilst jaunas lietotāju kopienas vajadzībām.

Šī glabāšanas funkcija attiecas arī uz pieaugošo kaudzēm dati vēsturnieki. Tā kā turpmākie centieni prasa vairāk dati un kā vēl dati laika gaitā tiek iebērti noliktavā, lielākā daļa no dati tas kļūst mazāk saistīts ar izmantoto analīzi. Šie dati tos bieži sauc dati neaktivizējas, un to uzturēšana vienmēr ir dārga, jo tos gandrīz nekad neizmanto.

Ko tas nozīmē projektu sponsoriem? Būtībā agrīnie sponsori dala vairāk, nekā izmaksā ieguldījums. Tas ir galvenais, jo tie ir stimuls, lai izveidotu noliktavas plašo tehnoloģiju un resursu vides slāni, tostarp organisko.

Taču šie pirmie soļi sniedz visaugstāko vērtību, un tāpēc projektu dizaineriem bieži vien ir jāpamato ieguldījums.
Projektiem, kas veikti pēc jūsu BI iniciatīvas, var būt zemākas (salīdzinājumā ar pirmo) un tiešās izmaksas, taču tie sniedz mazāku vērtību uzņēmumam.

Un organizāciju īpašniekiem jāsāk apsvērt iespēju izmest uzkrājumu dati un mazāk atbilstošas ​​tehnoloģijas.

Datu ieguve: ieguve Dati

Daudzām arhitektūras sastāvdaļām ir nepieciešamas datu ieguves tehnoloģiju un metožu atšķirības.
piemēram, dažādie "aģenti", lai pārbaudītu interesējošās vietas klienti, uzņēmuma operētājsistēmām un pašam dw. Šie aģenti var būt uzlaboti neironu tīkli, kas apmācīti par POT tendencēm, piemēram, nākotnes produktu pieprasījumu, pamatojoties uz pārdošanas veicināšanas pasākumiem; uz noteikumiem balstīti dzinēji, lai reaģētu uz komplektu dato apstākļus, piemēram, medicīniskās diagnozes un ārstēšanas ieteikumus; vai pat vienkārši aģenti, kuru uzdevums ir ziņot par izņēmumiem augstākajiem vadītājiem. Parasti šie ekstrakcijas procesi dati si

pārbaudīt reāllaikā; tāpēc tiem jābūt pilnībā apvienotiem ar kustību dati paši.

Tiešsaistes analītiskās apstrādes apstrāde

Tiešsaistes analītika

Iespēja griezt šķēlēs, kubiņos, ripināt, urbt un veikt analīzi
Kā būtu, ja tas ir IBM tehnoloģiju komplekta darbības jomā. Piemēram, DB2 pastāv tiešsaistes analītiskās apstrādes (OLAP) funkcijas, kas programmatūras dzinējā ienes dimensiju analīzi. datubāze tas pats.

Funkcijas pievieno SQL dimensiju utilītu, vienlaikus izmantojot visas priekšrocības, ko sniedz DB2 dabiskajai daļai. Vēl viens OLAP integrācijas piemērs ir izvilkšanas rīks DB2 OLAP Server Analyzer. Šī tehnoloģija ļauj ātri un automātiski analizēt DB2 OLAP Server kubus, lai atrastu vērtību vērtības un ziņotu par tām. dati neparasts vai negaidīts visā kubā biznesa analītiķim. Visbeidzot, DW centra līdzekļi nodrošina iespēju arhitektiem cita starpā kontrolēt DB2 OLAP servera kuba profilu kā dabisku ETL procesu sastāvdaļu.

Telpiskā analīze Telpiskā analīze

Kosmoss ir puse no analītiskajiem enkuriem (vadiem), kas nepieciešami panorāmai
analītiski plašs (laiks ir otra puse). Noliktavas atomu līmenis, kas attēlots 1.1. attēlā, ietver gan laika, gan telpas pamatus. Laika zīmogi enkura analīzi pēc laika un adreses informācijas enkura analīzi pēc telpas. Laikspiedoli veic laika analīzi, un adreses informācija veic analīzi pēc telpas. Diagrammā parādīta ģeokodēšana – adrešu konvertēšanas process punktos kartē vai punktos telpā, lai analīzē varētu izmantot tādus jēdzienus kā attālums un iekšpuse/ārpuse – tiek veikta atomu līmenī un telpiskā analīze, kas ir pieejama analītiķis. IBM nodrošina telpiskos paplašinājumus, kas izstrādāti kopā ar Vides sistēmu pētniecības institūtu (ESRI). datubāze DB2, lai kosmosa objektus varētu uzglabāt kā parastu daļu datubāze relāciju. db2

Telpiskie paplašinātāji nodrošina arī visus SQL paplašinājumus, lai izmantotu telpiskās analīzes priekšrocības. Piemēram, SQL paplašinājumi, pret kuriem veikt vaicājumu
attālums starp adresēm vai tas, vai punkts atrodas noteiktā daudzstūra apgabalā vai ārpus tā, ir analītisks standarts ar telpisko paplašinātāju. Plašāku informāciju skatiet 16. nodaļā.

Datubāze-Resident Tools Tools Datubāze-Iedzīvotājs

DB2 ir daudz BI rezidentu SQL līdzekļu, kas palīdz veikt analīzi. Tie ietver:

  • Rekursijas funkcijas analīzes veikšanai, piemēram, “visu iespējamo lidojuma trajektoriju atrašana no Sanfrancisko a NY".
  • Analītiskās funkcijas ranžēšanai, kumulatīvās funkcijas, kubs un apkopojums, lai atvieglotu uzdevumu izpildi, kas parasti notiek tikai ar OLAP tehnoloģiju, tagad ir dabiska dzinēja sastāvdaļa. datubāze
  • Iespēja izveidot tabulas, kas satur rezultātus
    Pārdevēji datubāze vadītāji apvieno vairāk BI iespēju datubāze tāpat.
    Galvenie piegādātāji datu bāze viņi apvieno vairāk BI iespēju datubāze tāpat.
    Tas nodrošina labāku veiktspēju un vairāk izpildes iespēju BI risinājumiem.
    DB2 V8 līdzekļi un funkcijas ir detalizēti apskatītas šādās nodaļās:
    Tehniskā arhitektūra un datu pārvaldības pamati (5. nodaļa)
  • DB2 BI pamati (6. nodaļa)
  • DB2 materializētās vaicājumu tabulas (7. nodaļa)
  • DB2 OLAP funkcijas (13. nodaļa)
  • DB2 uzlabotās BI līdzekļi un funkcijas (15. nodaļa) Vienkāršota datu piegādes sistēma Piegādes sistēma dati vienkāršots

1.1. attēlā attēlotā arhitektūra ietver daudzas struktūras dati fiziskais. Viena ir noliktava dati darbojas. Parasti ODS ir uz priekšmetu orientēts, integrēts un aktuāls objekts. Jūs varētu izveidot ODS, lai atbalstītu, piemēram, tirdzniecības biroju. ODS pārdošana papildinātu dati no daudzām dažādām sistēmām, bet saglabātu tikai, piemēram, šodienas darījumus. ODS var arī atjaunināt vairākas reizes dienā. Tajā pašā laikā procesi nospiež dati integrēta citās lietojumprogrammās. Šī struktūra ir īpaši izstrādāta integrācijai dati aktuāls un dinamisks, un tas, iespējams, varētu atbalstīt reāllaika analīzi, piemēram, nodrošināt pakalpojumu aģentiem klienti klienta pašreizējo pārdošanas informāciju, iegūstot informāciju par pārdošanas tendencēm no pašas noliktavas. Cita struktūra, kas parādīta 1.1. attēlā, ir formāls dw stāvoklis. Šī ir ne tikai vieta, kur tiek veikta nepieciešamā integrācija, kvalitāte dati, un pārveidošanu dati ienākošās noliktavas, bet tā ir arī uzticama un īslaicīga uzglabāšanas vieta dati replikācijas, ko varētu izmantot reāllaika analīzēs. Ja nolemjat izmantot ODS vai pieturvietu zonu, tas ir viens no labākajiem rīkiem šo struktūru aizpildīšanai dati Izmantojot dažādus darbības avotus, ir DB2 neviendabīgais izplatītais vaicājums. Šo iespēju nodrošina izvēles DB2 līdzeklis, ko sauc par DB2 Relational Connect (tikai vaicājums) un DB2 DataJoiner (atsevišķs produkts, kas nodrošina vaicājuma, ievietošanas, atjaunināšanas un dzēšanas iespējas neviendabīgi sadalītām RDBMS).

Šī tehnoloģija ļauj arhitektiem dati sasiet dati ražošana ar analītiskajiem procesiem. Tehnoloģija var ne tikai pielāgoties praktiski jebkurai replikācijas prasībām, kas var rasties, izmantojot reāllaika analīzi, bet arī var izveidot savienojumu ar dažādām datu bāzēm. dati populārākie, tostarp DB2, Oracle, Sybase, SQL Server, Informix un citi. DB2 DataJoiner var izmantot, lai aizpildītu struktūru dati formāla kā ODS vai pat pastāvīga tabula, kas pārstāvēta noliktavā, kas paredzēta ātrai tūlītēju atjauninājumu atjaunošanai vai pārdošanai. Protams, šīs pašas struktūras dati var aizpildīt, izmantojot

vēl viena svarīga tehnoloģija, kas paredzēta, lai replikētu dati, IBM DataPropagator Relational. (DataPropagator ir atsevišķs produkts centrālajām sistēmām. DB2 UNIX, Linux, Windows un OS/2 ietver datu replikācijas pakalpojumus dati kā standarta funkcija).
Vēl viena pārvietošanās metode dati kas darbojas visā uzņēmumā, ir uzņēmuma lietojumprogrammu integrators, kas citādi pazīstams kā ziņojumu brokeris. Šī unikālā tehnoloģija nodrošina nepārspējamu mērķauditorijas atlases un pārvietošanas kontroli dati ap uzņēmumu. IBM ir visplašāk izmantotais ziņojumu starpnieks MQSeries vai produkta variants, kas ietver prasības E-komercijas, IBM WebSphere MQ.
Lai iegūtu plašāku diskusiju par to, kā izmantot MQ, lai atbalstītu noliktavu un BI vidi, apmeklējiet vietni tīmekļa vietne no grāmatas. Pagaidām pietiek pateikt, ka šī tehnoloģija ir lielisks līdzeklis uztveršanai un pārveidošanai (izmantojot MQSeries Integrator) dati centrēti (mērķtiecīgi) operatori, kas pieņemti darbā BI risinājumiem. MQ tehnoloģija ir integrēta un iepakota UDB V8, kas nozīmē, ka ziņojumu rindas tagad var pārvaldīt tā, it kā tās būtu DB2 tabulas. Rindas ziņojumu metināšanas jēdziens un visums datubāze relāciju virzās uz spēcīgu piegādes vidi dati.

Nulles latentums Nulles latentums

IBM galvenais stratēģiskais mērķis ir nulles latentuma analīze. Kā definējis
Gartner, BI sistēmai jāspēj secināt, asimilēt un sniegt informāciju analītiķiem pēc pieprasījuma. Protams, izaicinājums ir, kā sajaukt dati pašreizējā un reāllaika ar nepieciešamo vēsturisko informāciju, piemēram, i dati saistīts modelis/tendence vai iegūta izpratne, piemēram, klientu profilēšana.

Šāda informācija ietver, piemēram, identifikāciju klienti augsts vai zems risks vai kādi produkti i klienti viņi, visticamāk, iegādāsies, ja iepirkumu grozos jau ir siers.

Nulles latentuma sasniegšana faktiski ir atkarīga no diviem pamatmehānismiem:

  • Pilnīga savienība dati kas tiek analizēti ar BI izveidotajām metodēm un rīkiem
  • Piegādes sistēma dati efektīvi, lai nodrošinātu, ka reāllaika analīze patiešām ir pieejama. Šie nulles latentuma priekšnoteikumi neatšķiras no diviem IBM izvirzītajiem un iepriekš aprakstītajiem mērķiem. Cieša pārošanās dati Tā ir daļa no IBM vienmērīgās integrācijas programmas. Un izveidojiet piegādes sistēmu dati efektivitāte ir pilnībā atkarīga no pieejamās tehnoloģijas, kas vienkāršo piegādes procesu dati. Rezultātā divi no trim IBM mērķiem ir būtiski, lai realizētu trešo. IBM apzināti attīsta savu tehnoloģiju, lai nodrošinātu nulles latentuma realitāti noliktavas centienos. Kopsavilkums / Sintēze BI organizācija nodrošina ceļvedi jūsu vides veidošanai
    iteratīvi. Tas ir jāpielāgo, lai atspoguļotu jūsu biznesa vajadzības gan pašreizējās, gan nākotnes. Bez plašas arhitektūras vīzijas noliktavas iterācijas ir tikai nejaušas centrālās noliktavas ieviešanas iespējas, kas maz palīdz izveidot plašu, informatīvu uzņēmumu. Pirmais šķērslis projektu vadītājiem ir tas, kā pamatot investīcijas, kas nepieciešamas BI organizācijas attīstībai. Lai gan IA aprēķins joprojām ir noliktavas ieviešanas pamats, to precīzi prognozēt kļūst arvien grūtāk. Tas ir novedis pie citām metodēm, lai noteiktu, vai jūs saņemat savu naudu. Piemēram, ieguldījumu vērtība2 (VOI) tiek reklamēta kā risinājums. Tas ir arhitektiem dati un projektu plānotāji apzināti ģenerē un sniedz informāciju lietotāju asociācijām, nevis vienkārši sniedz tām pakalpojumu dati. Starp abiem ir milzīga atšķirība. Informācija ir kaut kas tāds, kas ietekmē lēmumu pieņemšanu un efektivitāti; relatīvi, t.i dati tie ir šīs informācijas iegūšanas pamatelementi.

Pat ja tā ir kritiska pret avotu dati Lai risinātu biznesa pieprasījumus, BI videi būtu jākalpo lielākai lomai informācijas satura veidošanā. Mums ir jāveic papildu darbības, lai attīrītu, integrētu, pārveidotu vai citādi izveidotu informācijas saturu, pēc kura lietotāji var rīkoties, un pēc tam mums jānodrošina, lai šīs darbības un lēmumi, ja tas ir saprātīgi, tiktu atspoguļoti BI vidē. Ja mēs novirzām noliktavu tikai uz apkalpošanu dati, tiek nodrošināts, ka lietotāju asociācijas izveidos informācijas saturu, kas nepieciešams darbības veikšanai. Tas nodrošina, ka viņu kopiena varēs pieņemt labākus lēmumus, bet uzņēmums cieš no zināšanu trūkuma, ko viņi ir izmantojuši. Dato Tā kā arhitekti un projektu plānotāji iniciē konkrētus projektus BI vidē, viņi joprojām ir atbildīgi visa uzņēmuma priekšā. Vienkāršs šīs BI iterāciju divpusējās īpašības piemērs ir atrodams avotā dati. Visi dati Saņemtie konkrētiem biznesa pieprasījumiem ir jāaizpilda pirmajā atomu slānī. Tas nodrošina uzņēmuma informācijas līdzekļa attīstību, kā arī pārvalda, risina iterācijā definētos konkrētos lietotāju pieprasījumus.

Kas irDatu noliktava?

Datu noliktava kopš 1990. gada tā ir bijusi informācijas sistēmu arhitektūras sirds un atbalsta informācijas procesus, piedāvājot stabilu integrētu platformu dati vēsturiskos datus, ko izmanto par pamatu turpmākajām analīzēm. THE datu noliktava tie piedāvā vieglu integrāciju nesaderīgu lietojumprogrammu sistēmu pasaulē. Datu noliktava tā ir kļuvusi par tendenci. Datu noliktava organizēt un iegaumēt i dati nepieciešami informācijas un analītiskajiem procesiem, kas balstīti uz ilgu vēsturisku laika perspektīvu. Tas viss ir saistīts ar ievērojamu un pastāvīgu apņemšanos celtniecībā un uzturēšanā datu noliktava.

Tātad, kas ir a datu noliktava? datu noliktava un:

  • ▪ uz priekšmetu orientēts
  • ▪ integrēta sistēma
  • ▪ varianta laiks
  • ▪ nepastāvīgs (nevar izdzēst)

kolekcija dati izmanto, lai atbalstītu vadības lēmumus procesu īstenošanā.
I dati ievietots datu noliktava vairumā gadījumu tie izriet no darbības vides. The datu noliktava to izveido uzglabāšanas vienība, kas ir fiziski atdalīta no pārējās tajā esošās sistēmas dati iepriekš pārveidotas ar lietojumprogrammām, kas darbojas ar informāciju, kas iegūta no darbības vides.

Burtiskā definīcija a datu noliktava ir pelnījis padziļinātu skaidrojumu, jo ir svarīga motivācija un pamatā esošās nozīmes, kas raksturo noliktavas īpašības.

PRIEKŠMETA ORIENTĀCIJA TEMATISKS

Pirmā iezīme a datu noliktava ir tas, ka tas ir orientēts uz galvenajiem uzņēmuma dalībniekiem. Izmēģinājumu ceļvedis caur dati tā ir pretstatā klasiskākajai metodei, kas ietver lietojumprogrammu orientāciju uz procesiem un funkcijām, un šo metodi galvenokārt izmanto lielākā daļa jaunāko vadības sistēmu.

Darbības pasaule ir veidota, pamatojoties uz lietojumprogrammām un funkcijām, piemēram, aizdevumiem, uzkrājumiem, bankas kartēm un finanšu iestādes uzticību. Dw pasaule ir organizēta ap tādiem galvenajiem priekšmetiem kā klients, pārdevējs, produkts un darbība. Saskaņošana ap tēmām ietekmē izstrādi un ieviešanu dati atrasts dw. Vēl svarīgāk ir tas, ka galvenā tēma ietekmē svarīgāko atslēgas struktūras daļu.

Lietojumprogrammas pasauli ietekmē gan datu bāzes dizains, gan procesa dizains. Dw pasaule ir vērsta tikai uz modelēšanu dati un par dizainu datubāze. Procesu dizains (tā klasiskajā formā) neietilpst dw vidē.

Atšķirības starp procesa/funkcijas lietojumprogrammas izvēli un priekšmeta izvēli atklājas arī kā satura atšķirības. dati detalizētā līmenī. THE dati del dw neietver i dati kas netiks izmantoti DSS procesam lietojumprogrammu laikā

orientēts uz darbību dati satur i dati lai nekavējoties izpildītu funkcionālās/apstrādes prasības, kas var būt vai nebūt noderīgas DSS analītiķim.
Vēl viens svarīgs veids, kā uz darbību orientētas lietojumprogrammas dati atšķiras no dati dw ir ziņojumos par dati. Es dati darbības uztur nepārtrauktu saikni starp divām vai vairākām tabulām, pamatojoties uz uzņēmējdarbības noteikumu, kas ir aktīvs. THE dati dw šķērso laika spektru, un dw atrodamās attiecības ir daudzas. Daudzi tirdzniecības noteikumi (un attiecīgi daudzas attiecības dati ) ir pārstāvēti krājumos dati starp diviem vai vairākiem galdiem.

(Lai iegūtu detalizētu skaidrojumu par to, kā attiecības starp dati tiek izskatīti DW, par šo jautājumu mēs atsaucamies uz tehnisko tēmu.)
Vai nav lielāka atšķirība starp operētājsistēmām un priekšmeta izvēli, izņemot būtisku atšķirību starp funkcionālās/procesa lietojumprogrammas izvēli un priekšmeta izvēli. dati un DW.

INTEGRĀCIJA INTEGRĀCIJA

Vissvarīgākais dw vides aspekts ir tas, ka i dati atrodamie dw ir viegli integrējami. VIENMĒR. BEZ IZŅĒMUMIEM. Pati dw vides būtība ir tāda, ka i dati noliktavas robežās ir integrēti.

Integrācija izpaužas daudzos dažādos veidos – konsekventās identificētās konvencijās, konsekventos mainīgos mērījumos, konsekventās kodētās struktūrās, fiziskajos atribūtos. dati konsekventi utt.

Gadu gaitā dažādu lietojumprogrammu dizaineri ir pieņēmuši daudzus lēmumus par to, kā lietojumprogramma būtu jāizstrādā. Dizaineru lietojumprogrammu stils un individualizētie dizaina lēmumi atklājas simts veidos: atšķirības kodēšanā, atslēgas struktūrā, fiziskajās īpašībās, identifikācijas konvencijās utt. Daudzu lietojumprogrammu izstrādātāju kolektīvās spējas izveidot nekonsekventas lietojumprogrammas ir leģendāras. 3. attēlā ir parādītas dažas no vissvarīgākajām lietojumprogrammu izstrādes veidu atšķirībām.

Kodējums: Kodēt:

Aplikāciju dizaineri ir izvēlējušies lauka – dzimuma – kodējumu dažādos veidos. Dizaineris pārstāv seksu kā “m” un “f”. Cits dizainers dzimumu attēlo kā “1” un “0”. Cits dizainers pārstāv seksu kā “x” un “y”. Cits dizainers pārstāv seksu kā “vīriešus” un “sievietes”. Nav lielas nozīmes tam, kā sekss nonāk DW. “M” un “F”, iespējams, ir tikpat labi kā visa luga.

Svarīgi ir tas, ka neatkarīgi no dzimuma lauka izcelsmes, šis lauks nonāk DW konsekventā integrētā stāvoklī. Līdz ar to, kad lauks tiek ielādēts DW no lietojumprogrammas, kurā tas ir attēlots formātā “M” un “F”, dati jākonvertē DW formātā.

Atribūtu mērīšana: Measurement of Atribūti:

Lietojumprogrammu dizaineri gadu gaitā ir izvēlējušies izmērīt cauruļvadu dažādos veidos. Dizainers uzglabā dati cauruļvada centimetros. Cits lietojumprogrammu dizainers uzglabā dati cauruļvada collās. Cits lietojumprogrammu dizainers uzglabā dati cauruļvada miljonos kubikpēdu sekundē. Un cits dizainers glabā cauruļvadu informāciju par pagalmiem. Neatkarīgi no avota, kad cauruļvada informācija nonāk DW, tā jāmēra tādā pašā veidā.

Saskaņā ar 3. attēlā redzamajām norādēm integrācijas problēmas ietekmē gandrīz katru projekta aspektu – tā fiziskās īpašības dati, dilemma ir vairāk nekā viens avots dati, jautājums par nekonsekventiem identificētiem paraugiem, formātiem dati nekonsekventi utt.

Neatkarīgi no dizaina tēmas rezultāts ir vienāds – t.i dati ir jāsaglabā DW atsevišķā un globāli pieņemamā veidā, pat ja pamatā esošās operētājsistēmas tos glabā atšķirīgi dati.

Kad DSS analītiķis aplūko DW, analītiķa mērķim vajadzētu būt izmantot dati kas atrodas noliktavā,

nevis prātot par uzticamību vai konsekvenci dati.

LAIKA VARIANCIJA

Visi dati DW tie ir precīzi noteiktā laika posmā. Šī pamatīpašība dati DW ir ļoti atšķirīgs no dati atrodami darbības vidē. THE dati ir tikpat precīzi kā piekļuves brīdī. Citiem vārdiem sakot, darbības vidē, kad tiek piekļūts diskam dati, sagaidāms, ka tas atspoguļos precīzas vērtības piekļuves brīdī. Tāpēc es dati DW ir precīzi, jo kādā brīdī (t.i., nevis “pašlaik”), tiek teikts, ka es dati atrodami DW ir “laika dispersija”.
Laika novirze no dati DW ir minēts daudzos veidos.
Vienkāršākais veids ir tas, ka i dati no DW pārstāv dati ilgā laika posmā – piecus līdz desmit gadus. Darbības vides laika horizonts ir daudz īsāks nekā šodienas pašreizējās vērtības no līdz pat sešdesmit deviņdesmit
Lietojumprogrammām, kurām jāfunkcionē labi un kurām jābūt pieejamām darījumu apstrādei, jābūt minimālajam apjomam dati ja tie pieļauj jebkādu elastības pakāpi. Tātad darbības lietojumprogrammām ir īss laika horizonts, piemēram, audio lietojumprogrammu dizaina tēmai.
Otrs veids, kā “laika dispersija” parādās DW, ir atslēgas struktūrā. Katra DW atslēgas struktūra netieši vai tieši satur laika elementu, piemēram, dienu, nedēļu, mēnesi utt. Laika elements gandrīz vienmēr atrodas DW sasaistītās atslēgas apakšā. Šādos gadījumos laika elements pastāvēs netieši, piemēram, ja mēneša vai ceturkšņa beigās tiek dublēts viss fails.
Trešais veids, kā tiek parādīta laika novirze, ir tas, ka i dati DW, kad tas ir pareizi reģistrēts, nevar atjaunināt. THE dati no DW praktiskiem nolūkiem ir gara momentuzņēmumu sērija. Protams, ja momentuzņēmumi tika uzņemti nepareizi, tad momentuzņēmumus var modificēt. Bet, pieņemot, ka momentuzņēmumi ir uzņemti pareizi, tie netiek mainīti, tiklīdz tie tiek uzņemti. Dažos

Dažos gadījumos momentuzņēmumu modificēšana DW var būt neētiska vai pat nederīga. THE dati darbojas, jo tie ir precīzi piekļuves brīdī, tos var atjaunināt pēc vajadzības.

NAV GAISTĪGI

Ceturtā svarīga DW īpašība ir tā, ka tā ir nepastāvīga.
Operatīvās vides atjauninājumi, ievietošana, dzēšana un modifikācijas tiek regulāri veiktas katram ierakstam. Bet pamata manipulācijas ar dati kas nepieciešami DW, ir daudz vienkāršāk. DW notiek tikai divu veidu darbības – sākotnējā ielāde dati un piekļuvi dati. Nav atjauninājumu dati (vispārējā atjaunināšanas nozīmē) DW kā parastu apstrādes darbību. Šai pamata atšķirībai starp operatīvo apstrādi un DW apstrādi ir dažas ļoti spēcīgas sekas. Dizaina līmenī nepieciešamība būt piesardzīgam attiecībā uz anomālu atjaunināšanu nav DW faktors, jo dati netiek veikta. Tas nozīmē, ka fiziskā dizaina līmenī var izmantot brīvības, lai optimizētu piekļuvi dati, jo īpaši risinot fiziskās normalizācijas un denormalizācijas tēmas. Vēl viena DW darbību vienkāršības sekas ir pamatā esošā tehnoloģija, ko izmanto DW vides palaišanai. Lai atbalstītu iekļautos ierakstus pēc ieraksta atjauninājumus (kā tas bieži notiek ar operatīvo apstrādi), tehnoloģijai ir jābūt ļoti sarežģītam pamatam ar acīmredzamu vienkāršību.
Tehnoloģija, kas atbalsta dublēšanu un atkopšanu, darījumus un integritāti dati un strupceļa stāvokļa noteikšana un novēršana ir diezgan sarežģīta un nav nepieciešama DW apstrādei. DW īpašības, dizaina orientācija, integrācija dati DW ietvaros laika atšķirības un pārvaldības vienkāršība dati, tas viss noved pie vides, kas ļoti, ļoti atšķiras no klasiskās darbības vides. Gandrīz visa avots dati DW ir darbības vide. Ir vilinoši domāt, ka pastāv milzīga atlaišana dati starp abām vidēm.
Patiesībā pirmais iespaids, kas daudziem cilvēkiem ir, ir liels atlaišana dati starp darbības vidi un vidi

DW. Šāda interpretācija ir virspusēja un parāda izpratnes trūkumu par to, kas notiek DW.
Patiešām, ir minimāla atlaišana dati starp darbības vidi un i dati no DW. Apsveriet sekojošo: I dati tie tiek filtrēti dato pārslēgšanās no darbības vides uz DW vidi. Daudzi dati tie nekad neiziet ārpus darbības vides. Izņemot to, ka i dati kas ir nepieciešami DSS apstrādei, atrod savu virzienu vidē

▪ laika horizonts dati tā dažādās vidēs ir ļoti atšķirīga. THE dati darbības vidē tie ir ļoti svaigi. THE dati DW viņi ir daudz vecāki. Tikai no laika horizonta viedokļa starp darbības vidi un DW ir ļoti maza pārklāšanās.

▪ DW satur dati kopsavilkums, kas nekad nav atrodams vidē

▪ es dati pāriet uz 3. attēlu, kas parāda, ka lielākā daļa dati tiek būtiski mainīti, ja tie ir atlasīti un pārvietoti uz DW. Citiem vārdiem sakot, lielākā daļa no dati tas tiek fiziski un radikāli mainīts, kad tas tiek pārvietots uz DW. No integrācijas viedokļa tie nav viens un tas pats dati kas atrodas darbības vidē. Ņemot vērā šos faktorus, atlaišana no dati starp abām vidēm ir rets notikums, kā rezultātā starp abām vidēm ir mazāk nekā 1%. NOLIKTUVES STRUKTŪRA DW ir atšķirīga struktūra. Ir dažādi kopsavilkuma un detalizācijas līmeņi, kas norobežo DW.
Dažādas DW sastāvdaļas ir:

  • Metadati
  • Dati pašreizējās detaļas
  • Dati no vecām detaļām
  • Dati nedaudz apkopota
  • Dati ļoti apkopoti

Līdz šim galvenās rūpes ir par i dati pašreizējās detaļas. Tas rada galvenās bažas, jo:

  • I dati aktuālās detaļas atspoguļo jaunākos notikumus, par kuriem vienmēr ir liela interese un
  • i dati pašreizējā detaļa ir apjomīga, jo tā tiek glabāta zemākajā precizitātes līmenī un
  • i dati Pašreizējā informācija gandrīz vienmēr tiek saglabāta diska atmiņā, kas ir ātri pieejama, bet dārga un sarežģīta dati detaļas ir vecākas dati kas ir saglabāti kādā atmiņā masa. Tam tiek piekļūts sporādiski, un tas tiek glabāts tādā detalizācijas līmenī, kas ir saderīgs ar dati pašreizējās detaļas. Lai gan tas nav obligāti jāuzglabā alternatīvā datu nesējā, jo ir liels apjoms dati apvienojumā ar sporādisku piekļuvi dati, datu nesējs, kas paredzēts dati vecāki detalizēti dati parasti netiek saglabāti diskā. THE dati viegli apkopoti tie ir dati kas tiek destilēti no zemās detalizācijas pakāpes līdz pašreizējam detalizācijas līmenim. Šis DW līmenis gandrīz vienmēr tiek saglabāts diska krātuvē. Projektēšanas problēmas, ar kurām saskaras arhitekts dati šī līmeņa DW būvniecībā ir:
  • Kāda laika vienība ir iepriekš sniegtajā kopsavilkumā
  • Kurš saturs, atribūti nedaudz apkopos saturu dati Nākamais līmenis dati atrodams DW ir tas, kas dati ļoti apkopoti. THE dati ļoti apkopoti ir kompakti un viegli pieejami. THE dati ļoti apkopoti dažkārt ir atrodami DW vidē un citos gadījumos i dati ļoti apkopoti ir atrodami ārpus tiešās tehnoloģijas, kurā atrodas DW, sienām. (jebkurā gadījumā t.i dati ļoti apkopoti ir daļa no DW neatkarīgi no tā, kur i dati ir fiziski izmitināti). DW pēdējā sastāvdaļa ir metadati. Daudzos aspektos metadati atrodas citā dimensijā nekā citi dati DW, jo metadatos nav neviena dato ņemti tieši no darbības vides. Metadatiem ir īpaša un ļoti svarīga loma DW. Metadati tiek izmantoti kā:
  • direktoriju, kas palīdz DSS analītiķim atrast DW saturu,
  • ceļvedis kartēšanai dati par to, kā es dati ir pārveidoti no darbības vides uz DW vidi,
  • ceļvedis par algoritmiem, ko izmanto kopsavilkumam starp dati pašreizējās detaļas ei dati nedaudz rezumējot, t.i dati ļoti rezumējot, metadatiem ir daudz lielāka loma DW vidē nekā jebkad bijusi darbības vidē. VECE DETALU GLABĀŠANAS VEDIS Šāda veida uzglabāšanai var izmantot magnētisko lenti dati. Faktiski ir plašs datu nesēju klāsts, kas jāņem vērā vecai uzglabāšanai dati detaļu. Atkarībā no apjoma dati, piekļuves biežums, rīku izmaksas un piekļuves veids, ir pilnīgi iespējams, ka citiem rīkiem būs nepieciešams vecais DW detalizācijas līmenis. DATU PLŪSMA Ir normāla un paredzama plūsma dati DW ietvaros.
    I dati tie nonāk DW no darbības vides. (PIEZĪME. Šim noteikumam ir daži ļoti interesanti izņēmumi. Tomēr gandrīz visi dati ievadiet DW no darbības vides). Dato ka es dati ievadiet DW no darbības vides, tas tiek pārveidots, kā aprakstīts iepriekš. Ar nosacījumu, ka iekļūst DW, t.i dati ievadiet pašreizējo detalizācijas līmeni, kā parādīts attēlā. Tas atrodas tur un tiek izmantots, līdz notiek viens no trim notikumiem:
  • ir attīrīts,
  • ir apkopots, un/vai ▪è Novecojušais process DW ietvaros pārvieto i dati pašreizējā informācija a dati detaļu vecs, atbilstoši vecumam dati. Process

kopsavilkumā tiek izmantota informācija par dati lai aprēķinātu dati nedaudz apkopoti un ļoti apkopoti līmeņi dati. Parādītajai plūsmai ir daži izņēmumi (tiks apspriests vēlāk). Tomēr parasti lielākajai daļai no dati atrodams DW, plūsma dati tas ir kā pārstāvēts.

DATU KRĀTUVES IZMANTOŠANA

Nav pārsteidzoši dažādi līmeņi dati DW ietvaros tie nesaņem dažādus lietošanas līmeņus. Parasti, jo augstāks ir apkopojuma līmenis, jo vairāk i dati tie tiek izmantoti.
Daudzi lietojumi notiek dati ļoti apkopoti, savukārt vecais dati detaļu gandrīz nekad neizmanto. Ir labs iemesls pārcelt organizāciju uz resursu izmantošanas paradigmu. Vairāk rezumējot i dati, jo ātrāk un efektīvāk to sasniegt dati. Ja veikals konstatē, ka tas veic daudzus procesus DW detalizācijas līmenī, tad tiek patērēts atbilstošs liels mašīnu resursu daudzums. Ikviena interesēs ir pēc iespējas ātrāk apstrādāt pēc iespējas augstāka līmeņa apkopojumu.

Daudziem veikaliem DSS analītiķis ir izmantojis vidē pirms DW dati detalizācijas līmenī. Daudzos aspektos ierašanās plkst dati detalizēts kopsavilkums atgādina drošības segu, pat ja ir pieejami citi kopsavilkuma līmeņi. Viena no arhitekta aktivitātēm dati ir atradināt DSS lietotāju no pastāvīgas lietošanas dati zemākajā detalizācijas līmenī. Arhitektam ir pieejamas divas motivācijas dati:

  • uzstādot atmaksas sistēmu, kur gala lietotājs maksā par patērētajiem resursiem un
  • kas norāda, ka ļoti labu reakcijas laiku var sasniegt, ja uzvedība ar i dati ir augstā kopsavilkuma līmenī, savukārt slikts reakcijas laiks ir saistīts ar uzvedību dati zemā līmenī CITI APSVĒRUMI Ir daži citi DW būvniecības un pārvaldības apsvērumi.
    Pirmais apsvērums attiecas uz indeksiem. THE dati augstākos apkopojuma līmeņos tos var brīvi indeksēt, savukārt i dati

zemākos detalizācijas līmeņos tie ir tik apjomīgi, ka tos var taupīgi indeksēt. No tā paša zīme, t.i dati augstā detalizācijas līmenī var salīdzinoši viegli pārstrukturēt, savukārt apjoms dati zemākajos līmeņos tas ir tik liels, ka i dati tos nevar viegli atjaunot. Līdz ar to modelis no dati un oficiālais projektēšanas darbs lika pamatu DW, kas tiek izmantots gandrīz tikai pašreizējā detalizācijas līmenī. Citiem vārdiem sakot, modelēšanas darbības dati gandrīz visos gadījumos tie neattiecas uz apkopojuma līmeņiem. Vēl viens strukturāls apsvērums ir apakšnodalījums dati autors DW.

Sadalīšanu var veikt divos līmeņos – līmenī dbms un lietojumprogrammas līmenī. Divīzijā līmenī dbms, tad dbms ir informēts par nodaļām un attiecīgi tās kontrolē. Sadalīšanas gadījumā lietojumprogrammas līmenī par sadalījumiem tiek informēts tikai programmētājs un atbildība par to administrēšanu tiek atstāta viņam

Zem līmeņa dbms, liels darbs tiek veikts automātiski. Ar automātisku sadalījumu administrēšanu ir saistīta liela neelastība. Gadījumā, ja sadalīšana notiek pieteikuma līmenī dati del datu noliktava, programmētāju noslogo liels darbs, bet gala rezultāts ir administrēšanas elastība dati uz datu noliktava

CITAS ANOMĀLIJAS

Kamēr sastāvdaļas datu noliktava Tie darbojas, kā aprakstīts gandrīz visiem dati, ir daži noderīgi izņēmumi, kas jāapspriež. Izņēmums ir no dati publiski kopsavilkuma dati. Šie ir dati kopsavilkumi, kas ir aprēķināti no datu noliktava bet sabiedrība tos izmanto. THE dati publiskie kopsavilkumi tiek glabāti un pārvaldīti datu noliktava, lai gan, kā minēts iepriekš, tie ir aprēķināti. Grāmatveži strādā, lai šādus ražotu reizi ceturksnī dati piemēram, ienākumi, ceturkšņa izdevumi, ceturkšņa peļņa utt. Grāmatvežu darbs ir ārējs datu noliktava. Tomēr i dati tiek lietoti “iekšēji” uzņēmuma iekšienē – no mārketings, pārdošana utt. Vēl viena anomālija, kas netiks apspriesta, ir dati ārējā.

Vēl viens izcils veids dati ko var atrast a datu noliktava ir pastāvīgajiem detalizētajiem datiem. Tas rada nepieciešamību pastāvīgi uzglabāt dati ētisku vai juridisku iemeslu dēļ. Ja uzņēmums pakļauj savus darbiniekus bīstamām vielām, tas ir nepieciešams dati detalizēts un pastāvīgs. Ja uzņēmums ražo produktu, kas saistīts ar sabiedrības drošību, piemēram, lidmašīnu daļas, tas ir nepieciešams dati pastāvīgas detaļas, kā arī, ja uzņēmums slēdz bīstamus līgumus.

Uzņēmums nevar atļauties neievērot detaļas, jo tuvāko gadu laikā tiesas prāvas gadījumā atsaukšana, strīdīgs būvniecības defekts utt. uzņēmuma ekspozīcija varētu būt liela. Tā rezultātā ir unikāls veids dati pazīstami kā pastāvīgi detalizēti dati.

KOPSAVILKUMS

Un datu noliktava ir uz objektu orientēts, integrēts, laika variants, kolekcija dati nepastāvīgs, lai atbalstītu administrācijas lēmumu pieņemšanas vajadzības. Katra no svarīgākajām a datu noliktava ir savas sekas. Turklāt ir četri līmeņi dati del datu noliktava:

  • Veca detaļa
  • Pašreizējā detaļa
  • Dati nedaudz apkopota
  • Dati ļoti apkopoti metadati ir arī svarīga daļa no datu noliktava. KOPSAVILKUMS Uzglabāšanas jēdziens dati Tas pēdējā laikā ir saņēmis lielu uzmanību un ir kļuvis par 90. gadu tendenci. Tas ir saistīts ar spēju a datu noliktava pārvarēt ierobežojumus vadības atbalsta sistēmām, piemēram, lēmumu atbalsta sistēmām (DSS) un izpildvaras informācijas sistēmām (EIS). Pat ja jēdziens datu noliktava izskatās daudzsološi, īstenot i datu noliktava var būt problemātiska liela mēroga noliktavas procesu dēļ. Neskatoties uz noliktavu projektu sarežģītību dati, daudzi piegādātāji un konsultanti, kas noliktavā dati viņi apgalvo, ka uzglabāšana dati strāva nerada nekādas problēmas. Tomēr šī pētniecības projekta sākumā gandrīz neviens neatkarīgs, stingrs un sistemātisks pētījums nebija veikts. Līdz ar to ir grūti pateikt, kas patiesībā notiek nozarē, kad tās tiek būvētas datu noliktava. Šajā pētījumā tika pētīta noliktavas prakse dati laikabiedriem, kura mērķis ir attīstīt bagātāku izpratni par Austrālijas praksi. Literatūras apskats nodrošināja empīriskā pētījuma kontekstu un pamatu. No šī pētījuma ir vairāki atklājumi. Pirmkārt, šis pētījums atklāja aktivitātes, kas radās izstrādes laikā datu noliktava. Daudzās jomās, t dati apkopotie apstiprināja literatūrā aprakstīto praksi. Otrkārt, jautājumi un problēmas, kas var ietekmēt attīstību datu noliktava tika identificēti ar šo pētījumu. Visbeidzot, ieguvumi, ko guvušas Austrālijas organizācijas, kas saistītas ar izmantošanu datu noliktava ir atklāti.

1. nodaļa

Meklēšanas konteksts

Datu noliktavas koncepcija tika plaši izplatīta un kļuva par jaunu tendenci 90. gados (McFadden 1996, TDWI 1996, Shah and Milstein 1997, Shanks et al. 1997, Eckerson 1998, Adelman un Oates 2000). To var redzēt no pieaugošā rakstu skaita par datu glabāšanu tirdzniecības izdevumos (Little and Gibson 1999). Daudzi raksti (sk., piemēram, Fisher 1995, Hackathorn 1995, Morris 1995a, Bramblett and King 1996, Graham et al. 1996, Sakaguchi and Frolick 1996, Alvarez 1997, Brousell 1997, Don Care 1997, 1997, 1997). Edwards 1998, TDWI 1999) ir ziņojuši par ievērojamiem ieguvumiem, ko guvušas organizācijas, kas ievieš i. datu noliktava. Viņi atbalstīja savu teoriju ar anekdotiskiem pierādījumiem par veiksmīgu ieviešanu, augstu ieguldījumu atdeves (IA) rādītājiem, kā arī sniedzot vadlīnijas vai metodoloģijas datu noliktava

(Shanks et al. 1997, Seddon and Benjamin 1998, Little and Gibson 1999). Ārkārtējā gadījumā Grehems et al. (1996) ziņoja par vidējo atdevi no trīs gadu ieguldījuma 401%.

Tomēr liela daļa pašreizējās literatūras nav ņēmusi vērā sarežģījumus, kas saistīti ar šādu projektu uzņemšanos. Projekti no datu noliktava tie parasti ir sarežģīti un liela mēroga, un tādēļ tiem ir liela neveiksmes iespējamība, ja tie netiek rūpīgi kontrolēti (Shah un Milstein 1997, Eckerson 1997, Foley 1997b, Zimmer 1997, Bort 1998, Gibbs and Clymer 1998, Rao 1998). Tie prasa milzīgus cilvēkresursus un finanšu resursus, kā arī laiku un pūles, lai tos izveidotu (Hill 1998, Crofts 1998). Parasti nepieciešamie laika un finanšu līdzekļi ir attiecīgi aptuveni divi gadi un divi līdz trīs miljoni dolāru (Braly 1995, Foley 1997b, Bort 1998, Humphries et al. 1999). Šis laiks un finanšu līdzekļi ir nepieciešami, lai kontrolētu un konsolidētu daudzus dažādus datu noliktavas aspektus (Cafasso 1995, Hill 1998). Līdzās aparatūras un programmatūras apsvērumiem, citas funkcijas, kas atšķiras no ieguves dati iekraušanas procesiem dati, atmiņas ietilpība, lai pārvaldītu atjauninājumus un meta dati lietotāju apmācībai, ir jāapsver.

Laikā, kad sākās šis pētniecības projekts, datu noliktavas jomā tika veikts ļoti maz akadēmisko pētījumu, īpaši Austrālijā. Tas bija skaidrs, jo žurnālos vai citos tā laika akadēmiskos rakstos trūkst publicēto rakstu par datu glabāšanu. Daudzi pieejamie akadēmiskie raksti aprakstīja ASV pieredzi. Akadēmisko pētījumu trūkums datu noliktavas jomā ir izraisījis stingrus pētījumus un empīriskus pētījumus (McFadden 1996, Shanks et al. 1997, Little and Gibson 1999). Jo īpaši pētījumi par īstenošanas procesu datu noliktava jāveic, lai paplašinātu vispārējās zināšanas par ieviešanu datu noliktava un kalpos par pamatu turpmākam pētījumam (Shanks et al. 1997, Little and Gibson 1999).

Tāpēc šī pētījuma mērķis ir izpētīt, kas patiesībā notiek, kad organizācijas veic un izmanto i datu noliktava Austrālijā. Konkrēti, šis pētījums ietvers visa a. izstrādes procesa analīzi datu noliktava, sākot no uzsākšanas un plānošanas līdz projektēšanai un ieviešanai un turpmākai izmantošanai Austrālijas organizācijās. Turklāt pētījums arī veicinās pašreizējo praksi, nosakot jomas, kurās var vēl vairāk uzlabot praksi un samazināt neefektivitāti un riskus vai izvairīties no tiem. Turklāt tas kalpos par pamatu citiem pētījumiem par datu noliktava Austrālijā un aizpildīs to robu, kas pašlaik pastāv literatūrā.

Pētījuma jautājumi

Šī pētījuma mērķis ir izpētīt īstenošanas aktivitātes datu noliktava un to izmantošanu Austrālijas organizācijās. Jo īpaši tiek pētīti elementi, kas attiecas uz projekta plānošanu, izstrādi, darbību, izmantošanu un saistītajiem riskiem. Tātad šī pētījuma jautājums ir:

“Kā ir pašreizējā prakse datu noliktava Austrālijā?"

Lai efektīvi atbildētu uz šo jautājumu, ir nepieciešami vairāki papildu izpētes jautājumi. Jo īpaši no literatūras, kas ir izklāstīta 2. nodaļā, tika identificēti trīs apakšjautājumi, lai vadītu šo pētniecības projektu: Kā notiek datu noliktava no Austrālijas organizācijām? Ar kādām problēmām esat saskāries?

Kādas ir pieredzes priekšrocības?
Atbildot uz šiem jautājumiem, tika izmantots pētniecisks pētījums, izmantojot aptauju. Kā pētniecisks pētījums, atbildes uz iepriekš minētajiem jautājumiem nav pilnīgas (Shanks et al. 1993, Denscombe 1998). Šajā gadījumā ir nepieciešama triangulācija, lai uzlabotu atbildes uz šiem jautājumiem. Tomēr izmeklēšana sniegs stabilu pamatu turpmākajam darbam, pārbaudot šos jautājumus. Detalizēta diskusija par pētījuma metodes pamatojumu un izstrādi ir sniegta 3. nodaļā.

Pētījuma projekta struktūra

Šis pētījuma projekts ir sadalīts divās daļās: datu noliktavas koncepcijas kontekstuālā izpēte un empīriskais pētījums (skat. 1.1. attēlu), no kuriem katrs ir aplūkots turpmāk.

I daļa: Kontekstuālā izpēte

Pirmajā pētījuma daļā tika apskatīta aktuālā literatūra par dažādiem datu glabāšanas veidiem, tostarp lēmumu atbalsta sistēmas (DSS), izpildvaras informācijas sistēmas (EIS), gadījumu izpēte. datu noliktava un jēdzieni datu noliktava. Turklāt forumu rezultāti datu noliktava un ekspertu un praktiķu tikšanās grupas, ko vadīja Monash DSS pētnieku grupa, piedalījās šajā pētījuma posmā, kura mērķis bija gūt ieskatu datu noliktava un identificēt ar to pieņemšanu saistītos riskus. Šajā kontekstuālā pētījuma periodā tika izveidota izpratne par problēmu jomu, lai sniegtu pamatzināšanas turpmākiem empīriskiem pētījumiem. Tomēr tas bija nepārtraukts process pētījuma veikšanas laikā.

II daļa: Empīriskie pētījumi

Salīdzinoši jaunais datu noliktavas jēdziens, īpaši Austrālijā, ir radījis vajadzību pēc aptaujas, lai iegūtu plašu priekšstatu par lietotāju pieredzi. Šī daļa tika veikta pēc tam, kad problēmas joma bija noteikta, veicot plašu literatūras pārskatu. Kontekstuālā pētījuma fāzē izveidotā datu uzglabāšanas koncepcija tika izmantota kā ievade šī pētījuma sākotnējai anketai. Pēc tam anketa tika pārbaudīta. Jūs esat eksperti datu noliktava piedalījās testā. Sākotnējās anketas testēšanas mērķis bija pārbaudīt jautājumu pilnīgumu un precizitāti. Pamatojoties uz testa rezultātiem, anketa tika modificēta un modificētā versija tika nosūtīta aptaujas dalībniekiem. Pēc tam atgrieztās anketas tika analizētas i dati tabulās, diagrammās un citos formātos. THE

analīzes rezultāti dati tie veido momentuzņēmumu par datu noliktavas praksi Austrālijā.

DATU GLABĀŠANAS PĀRSKATS

Datu noliktavas jēdziens ir attīstījies līdz ar datortehnoloģiju uzlabojumiem.
Tā mērķis ir pārvarēt problēmas, ar kurām saskaras lietojumprogrammu atbalsta grupas, piemēram, lēmumu atbalsta sistēma (DSS) un izpildvaras informācijas sistēma (EIS).

Agrāk lielākais šo lietojumprogrammu šķērslis bija šo lietojumprogrammu nespēja nodrošināt a datu bāze nepieciešams analīzei.
To galvenokārt izraisa vadības darba raksturs. Uzņēmuma vadības intereses pastāvīgi atšķiras atkarībā no aptveramās jomas. Tāpēc i dati Šiem lietojumiem ir jāspēj ātri mainīties atkarībā no apstrādājamās daļas.
Tas nozīmē, ka i dati jābūt pieejamai pieprasītajām analīzēm atbilstošā formā. Faktiski lietojumprogrammu atbalsta grupām agrāk bija ļoti grūti apkopot un integrēt dati no sarežģītiem un dažādiem avotiem.

Šīs sadaļas atlikušajā daļā ir sniegts pārskats par datu noliktavas jēdzienu un apspriests, kā datu noliktava var pārvarēt pieteikumu atbalsta grupu problēmas.
Termins “Datu noliktava” 1990. gadā popularizēja Viljams Inmons. Viņa bieži citētā definīcija redz Datu noliktava kā kolekcija dati uz priekšmetu orientēta, integrēta, nepastāvīga un laika gaitā mainīga, lai atbalstītu vadības lēmumus.

Izmantojot šo definīciju, Inmons norāda, ka i dati kas dzīvo a datu noliktava tiem ir jābūt šādām 4 īpašībām:

  • ▪ Uz priekšmetu orientēts
  • ▪ Integrēts
  • ▪ nepastāvīgs
  • ▪ Mainīgs laika gaitā Uz priekšmetu orientēts Inmon nozīmē, ka i dati uz datu noliktava lielākajās organizatoriskajās jomās, kas ir bijušas

definēts modelī dati. Piemēram, visas dati attiecībā uz i klienti ir ietverti priekšmetu apgabalā KLIENTI. Līdzīgi visi dati kas attiecas uz produktiem, ir ietverti PRODUCTS priekšmetā.

Ar Integrated Inmon nozīmē, ka i dati no dažādām platformām, sistēmām un vietām tiek apvienotas un glabātas vienuviet. Līdz ar to dati līdzīgi ir jāpārveido konsekventos formātos, lai tos varētu viegli pievienot un salīdzināt.
Piemēram, vīriešu un sieviešu dzimumu vienā sistēmā apzīmē ar burtiem M un F, bet citā ar 1 un 0. Lai tos pareizi integrētu, viens vai abi formāti ir jāpārveido tā, lai abi formāti būtu vienādi. Šajā gadījumā mēs varētu mainīt M uz 1 un F uz 0 vai otrādi. Uz priekšmetu orientēta un integrēta norāda, ka datu noliktava ir izstrādāts, lai nodrošinātu funkcionālu un transversālu redzējumu dati ko uzņēmums.

Ar nepastāvīgu viņš domā, ka i dati uz datu noliktava saglabāt konsekvenci un atjaunināt dati tas nav nepieciešams. Tā vietā katras izmaiņas dati oriģināli tiek pievienoti datubāze del datu noliktava. Tas nozīmē, ka vēsturiskā dei dati ir ietverts datu noliktava.

Mainīgajiem ar laiku Inmon norāda, ka i dati uz datu noliktava vienmēr satur tempa rādītājus ei dati tie parasti šķērso noteiktu laika horizontu. Piemēram a
datu noliktava var saturēt 5 gadu vēsturiskās vērtības klienti no 1993. līdz 1997. gadam. Vēstures un laika rindas pieejamība dati ļauj analizēt tendences.

Un datu noliktava viņš var savākt savu dati no OLTP sistēmām; dati ārpus organizācijas un/vai ar citiem īpašiem uztveršanas sistēmu projektiem dati.
I dati ekstrakti var iziet cauri tīrīšanas procesam, šajā gadījumā i dati tiek pārveidoti un integrēti pirms uzglabāšanas datubāze del datu noliktava. Tad es dati

kas dzīvo iekšā datubāze del datu noliktava ir pieejami galalietotāju pieteikšanās un atkopšanas rīkiem. Izmantojot šos rīkus, galalietotājs var piekļūt integrētajam organizācijas skatam dati.

I dati kas dzīvo iekšā datubāze del datu noliktava tie tiek glabāti gan detalizēti, gan kopsavilkuma formātos.
Kopsavilkuma līmenis var būt atkarīgs no rakstura dati. Es dati detalizēts var sastāvēt no dati pašreizējo un dati vēsturnieki
I dati reālie nav iekļauti datu noliktava līdz i dati uz datu noliktava tiek atkārtoti atjaunināti.
Papildus uzglabāšanai dati paši, a datu noliktava tajā var uzglabāt arī cita veida dato sauc METADATI, kas apraksta dati kas dzīvo viņa datubāze.
Ir divu veidu metadati: izstrādes metadati un analītikas metadati.
Izstrādes metadati tiek izmantoti, lai pārvaldītu un automatizētu ieguves, tīrīšanas, kartēšanas un ielādes procesus dati uz datu noliktava.
Izstrādes metadatos ietvertā informācija var ietvert informāciju par operētājsistēmām, informāciju par izvelkamajiem elementiem, modeli dati del datu noliktava un uzņēmējdarbības noteikumi konvertēšanai dati.

Otrs metadatu veids, kas pazīstams kā analītikas metadati, ļauj galalietotājam izpētīt datu noliktava lai atrastu dati pieejamo informāciju un to nozīmi skaidrā un netehniskā izteiksmē.

Tāpēc analītikas metadati darbojas kā tilts starp datu noliktava un galalietotāju lietojumprogrammas. Šajos metadatos var būt ietverts uzņēmējdarbības modelis, apraksti dati biznesa modelim atbilstošs, iepriekš noteikti vaicājumi un atskaites, informācija lietotāja piekļuvei un indekss.

Lai pareizi darbotos, analīzes un izstrādes metadati ir jāapvieno vienā integrētā ierobežojuma metadatos.

Diemžēl daudziem no esošajiem rīkiem ir savi metadati, un pašlaik tiem nav nekādu standartu

ļaut datu noliktavas rīkiem integrēt šos metadatus. Lai labotu šo situāciju, daudzi galveno datu noliktavas rīku tirgotāji izveidoja Meta Data Council, kas vēlāk kļuva par Meta Data Coalition.

Šīs koalīcijas mērķis ir izveidot standarta metadatu kopu, kas ļauj dažādiem datu noliktavas rīkiem pārveidot metadatus
Viņu pūliņu rezultātā tika izveidota Meta Data Interchange Specification (MDIS), kas ļaus apmainīties ar informāciju starp Microsoft arhīviem un saistītajiem MDIS failiem.

Esamība dati gan apkopots/indeksēts, gan detalizēts sniedz lietotājam iespēju veikt URBJU DROWN (urbšanu) no plkst. dati indeksēti uz detalizētiem un otrādi. Esamība dati detalizēta vēsture ļauj izveidot tendenču analīzes laika gaitā. Turklāt analītikas metadatus var izmantot kā direktoriju datubāze del datu noliktava lai palīdzētu gala lietotājiem atrast dati nepieciešams.

Salīdzinot ar OLTP sistēmām, ar to spēju atbalstīt analīzi dati un ziņošana, datu noliktava tā tiek uzskatīta par piemērotāku sistēmu informācijas procesiem, piemēram, vaicājumu veikšanai un atbildēšanai uz tiem un atskaišu sagatavošanai. Nākamajā sadaļā tiks detalizēti uzsvērtas abu sistēmu atšķirības.

DATU NOLIKTAVA PRET OLTP SISTĒMĀM

Daudzas informācijas sistēmas organizācijās ir paredzētas ikdienas darbību atbalstam. Šīs sistēmas, kas pazīstamas kā OLTP SISTĒMAS, tver pastāvīgi atjauninātus ikdienas darījumus.

I dati šajās sistēmās tās bieži tiek pārveidotas, pievienotas vai dzēstas. Piemēram, klienta adrese mainās, kad viņš pārvietojas no vienas vietas uz citu. Šajā gadījumā jaunā adrese tiks reģistrēta, mainot adreses lauku datubāze. Šo sistēmu galvenais mērķis ir samazināt darījumu izmaksas un vienlaikus samazināt apstrādes laiku. OLTP sistēmu piemēri ietver kritiskas darbības, piemēram, pasūtījuma ievadīšanu, algu sarakstu, rēķinu, ražošanu, klientu apkalpošanu klienti.

Atšķirībā no OLTP sistēmām, kas tika izveidotas uz darījumiem un notikumiem balstītiem procesiem, t datu noliktava tika izveidoti, lai nodrošinātu atbalstu uz analīzi balstītiem procesiem dati un lēmumu pieņemšanas procesi.

To parasti panāk, integrējot i dati no dažādām OLTP un ārējām sistēmām vienā “konteinerā”. dati, kā aprakstīts iepriekšējā sadaļā.

Monash datu noliktavas procesa modelis

Procesa modelis priekš datu noliktava Monash izstrādāja Monash DSS Research Group pētnieki, un tā pamatā ir literatūra par datu noliktava, par pieredzi sistēmu jomu izstrādes atbalstīšanā, par diskusijām ar lietojumprogrammu pārdevējiem lietošanai uz datu noliktava, par ekspertu grupu lietošanā datu noliktava.

Fāzes ir šādas: uzsākšana, plānošana, izstrāde, darbība un skaidrojumi. Diagramma izskaidro a attīstības iteratīvo vai evolucionāro raksturu datu noliktava procesu, izmantojot divvirzienu bultiņas, kas novietotas starp dažādām fāzēm. Šajā kontekstā “iteratīvs” un “evolucionārs” nozīmē, ka katrā procesa posmā īstenošanas darbības vienmēr var virzīties atpakaļ uz iepriekšējo posmu. Tas ir saistīts ar projekta būtību datu noliktava kurā jebkurā laikā rodas papildu pieprasījumi no galalietotāja. Piemēram, procesa izstrādes posmā datu noliktava, galalietotājs pieprasa jaunu dimensiju vai priekšmetu jomu, kas nebija daļa no sākotnējā plāna, tas ir jāpievieno sistēmai. Tas rada izmaiņas projektā. Rezultāts ir tāds, ka projektēšanas komandai projektēšanas posmā ir jāmaina līdz šim izveidoto dokumentu prasības. Daudzos gadījumos projekta pašreizējais stāvoklis ir jāatgriežas līdz projektēšanas fāzei, kurā ir jāpievieno un jādokumentē jaunā prasība. Galalietotājam ir jāredz konkrētā izskatītā dokumentācija un izstrādes posmā veiktās izmaiņas. Šī izstrādes cikla beigās projektam jāsaņem lieliskas atsauksmes gan no izstrādātāju, gan lietotāju komandām. Pēc tam atsauksmes tiek atkārtoti izmantotas, lai uzlabotu turpmāko projektu.

Jaudas plānošana
Dw mēdz būt ļoti liela izmēra un aug ļoti ātri (Best 1995, Rudin 1997a) daudzuma dēļ. dati vēstures, ko tās saglabā no sava ilguma. Izaugsmi var izraisīt arī dati lietotāju pieprasītie papildinājumi, lai palielinātu vērtību dati kas viņiem jau ir. Attiecīgi uzglabāšanas prasības attiecībā uz dati var ievērojami uzlabot (Eckerson 1997). Tādējādi, veicot jaudas plānošanu, ir būtiski nodrošināt, ka uzbūvētā sistēma var augt, pieaugot vajadzībām (Best 1995, LaPlante 1996, Lang 1997, Eckerson 1997, Rudin 1997a, Foley 1997a).
Plānojot datu bāzes mērogojamību, ir jāzina paredzamais noliktavas lieluma pieaugums, iespējamie vaicājumu veidi un atbalstīto gala lietotāju skaits (Best 1995, Rudin 1997b, Foley 1997a). Mērogojamu lietojumprogrammu izveidei ir nepieciešamas mērogojamu serveru tehnoloģiju un mērogojamu lietojumprogrammu projektēšanas metožu kombinācija (Best 1995, Rudin 1997b. Abi ir nepieciešami, lai izveidotu ļoti mērogojamu lietojumprogrammu. Mērogojamu serveru tehnoloģijas var atvieglot un izdevīgi pievienot krātuvi, atmiņu un centrālo procesoru, nepazeminot to izpildījums (Lang 1997, Telefonija 1997).

Ir divas galvenās mērogojamās serveru tehnoloģijas: simetriskā daudzkārtējā apstrāde (SMP) un masveidā paralēlā apstrāde (MPP) (IDC 1997, Humphries et al. 1999). SMP serverim parasti ir vairāki procesori, kas koplieto atmiņu, sistēmas kopni un citus resursus (IDC 1997, Humphries et al. 1999). Lai to palielinātu, var pievienot papildu procesorus jauda skaitļošanas. Vēl viena metode, kā palielināt jauda SMP servera mērķis ir apvienot daudzas SMP iekārtas. Šī metode ir pazīstama kā klasteru veidošana (Humphries et al. 1999). No otras puses, MPP serverim ir vairāki procesori, katrs ar savu atmiņu, kopnes sistēmu un citiem resursiem (IDC 1997, Humphries et al. 1999). Katru procesoru sauc par mezglu. Palielinājums jauda skaitļošanas var iegūt

papildu mezglu pievienošana MPP serveriem (Humphries et al. 1999).

SMP serveru vājums ir tāds, ka pārāk daudz ievades-izejas (I/O) operāciju var pārslogot sistēmas kopni (IDC 1997). Šī problēma nerodas MPP serveros, jo katram procesoram ir sava kopnes sistēma. Tomēr starpsavienojumi starp katru mezglu parasti ir daudz lēnāki nekā SMP kopņu sistēma. Turklāt MPP serveri var pievienot papildu sarežģītības līmeni lietojumprogrammu izstrādātājiem (IDC 1997). Tādējādi izvēli starp SMP un MPP serveriem var ietekmēt daudzi faktori, tostarp lietojumprogrammu sarežģītība, cenas / veiktspējas attiecība, nepieciešamā apstrādes jauda, ​​bloķētās dw lietojumprogrammas un lietojumprogrammu lieluma palielināšanās. datubāze dw un gala lietotāju skaitu.

Jaudas plānošanā var izmantot daudzas mērogojamas lietojumprogrammu projektēšanas metodes. Tiek izmantoti dažādi paziņošanas periodi, piemēram, dienas, nedēļas, mēneši un gadi. Ņemot vērā dažādus paziņošanas periodus, datubāze to var sadalīt pārvaldāmi grupētās daļās (Inmon et al. 1997). Vēl viens paņēmiens ir izmantot kopsavilkuma tabulas, kuras tiek veidotas, apkopojot dati da dati detalizēti. Tādējādi i dati apkopotie ir kompaktāki nekā detalizēti, kas prasa mazāk vietas atmiņā. Tātad dati detaļu var uzglabāt lētākā uzglabāšanas vienībā, kas ietaupa vēl vairāk vietas. Lai gan kopsavilkuma tabulu izmantošana var ietaupīt vietu atmiņā, tās prasa daudz pūļu, lai tās būtu atjauninātas un atbilstu biznesa vajadzībām. Tomēr šis paņēmiens tiek plaši izmantots un bieži tiek izmantots kopā ar iepriekšējo paņēmienu (Best 1995, Inmon 1996a, Chauduri un Dayal
1997).

Definēšana Datu noliktava Tehniskās arhitektūras Dw arhitektūras metožu definīcija

Agrīnie datu noliktavas lietotāji galvenokārt domāja par centralizētu dw ieviešanu, kurā visi dati, ieskaitot i dati ārējie, tika integrēti vienā,
fiziskā krātuve (Inmon 1996a, Bresnahan 1996, Peacock 1998).

Šīs pieejas galvenā priekšrocība ir tā, ka galalietotāji var piekļūt uzņēmuma mēroga skatam dati organizatoriskā (Ovum 1998). Vēl viena priekšrocība ir tā, ka tā piedāvā standartizāciju dati izmantojot organizāciju, kas nozīmē, ka katrai dw repozitorijā (metadatos) izmantotajai terminoloģijai ir tikai viena versija vai definīcija (Flanagan un Safdie 1997, Ovum 1998). No otras puses, šīs pieejas trūkums ir dārgs un grūti konstruējams (Flanagan un Safdie 1997, Ovum 1998, Inmon et al. 1998). Neilgi pēc krātuves arhitektūras dati centralizēts kļuva populārs, attīstījās mazāku apakškopu iegūšanas koncepcija dati lai atbalstītu specifisku lietojumu vajadzības (Varney 1996, IDC 1997, Berson and Smith 1997, peacock 1998). Šīs mazās sistēmas ir lielākās sistēmas atvasinājumi datu noliktava centralizēti. Tie ir nosaukti datu noliktava atkarīgie departamentu vai atkarīgie datu centri. Atkarīgā datu mart arhitektūra ir pazīstama kā trīspakāpju arhitektūra, kur pirmais līmenis sastāv no datu noliktava centralizēti, otro veido noguldījumi dati departamenta un trešais sastāv no piekļuves dati un ar analīzes rīkiem (Demarest 1994, Inmon et al. 1997).

Datu marts parasti tiek veidots pēc datu noliktava centralizēta tika uzbūvēta, lai apmierinātu konkrētu vienību vajadzības (White 1995, Varney 1996).
Datu marts veikals i dati ļoti būtiski saistībā ar konkrētām vienībām (Inmon et al. 1997, Inmon et al. 1998, IA 1998).

Šīs metodes priekšrocība ir tāda, ka nebūs dato nav integrēta un ka i dati būs mazāk lieki datu tirgū kā visi dati nāk no depozīta dati integrēta. Vēl viena priekšrocība ir tā, ka starp katru datu tirgu un tā avotiem būs maz savienojumu dati jo katram datu tirgum ir tikai viens avots dati. Turklāt, izmantojot šo arhitektūru, galalietotāji joprojām var piekļūt pārskatam par dati

korporatīvajām organizācijām. Šī metode ir pazīstama kā lejupejošā metode, kurā datu centri tiek veidoti pēc datu noliktava (pāvs 1998, Goff 1998).
Palielinot vajadzību laikus parādīt rezultātus, dažas organizācijas ir sākušas veidot neatkarīgus datu centrus (Flanagan un Safdie 1997, White 2000). Šajā gadījumā datu tirgus iegūst savu dati tieši no pamatiem dati OLTP, nevis no centralizētās un integrētās noliktavas, tādējādi novēršot nepieciešamību pēc centrālās noliktavas uz vietas.

Katram datu tirgum ir nepieciešama vismaz viena saite uz tā avotiem dati. Trūkums, ja katram datu tirgum ir vairāki savienojumi, ir tas, ka salīdzinājumā ar iepriekšējām divām arhitektūrām ir pārpilnība dati ievērojami palielinās.

Katram datu tirgum ir jāsaglabā viss dati nepieciešams lokāli, lai neietekmētu OLTP sistēmas. Tas izraisa to, ka i dati tie tiek glabāti dažādos datu centros (Inmon et al. 1997). Vēl viens šīs arhitektūras trūkums ir tāds, ka tas rada sarežģītus starpsavienojumus starp datu tirgiem un to datu avotiem. dati kuras ir grūti īstenot un kontrolēt (Inmon et al. 1997).

Vēl viens trūkums ir tas, ka galalietotāji nevar piekļūt uzņēmuma informācijas pārskatam, jo ​​i dati no dažādiem datu tirgiem nav integrēti (Ovum 1998).
Vēl viens trūkums ir tas, ka katrai terminoloģijai, ko izmanto datu centros, var būt vairāk nekā viena definīcija, kas rada pretrunas dati organizācijā (Ovum 1998).
Neskatoties uz iepriekš apspriestajiem trūkumiem, neatkarīgi datu tirgi joprojām piesaista daudzu organizāciju interesi (IDC 1997). Viens no faktoriem, kas padara tos pievilcīgus, ir tas, ka tie attīstās ātrāk un prasa mazāk laika un resursu (Bresnahan 1996, Berson and Smith 1997, Ovum 1998). Līdz ar to tie galvenokārt kalpo kā testa projekti, kurus var izmantot, lai ātri identificētu projekta priekšrocības un/vai nepilnības (Parsaye 1995, Braly 1995, Newing 1996). Šajā gadījumā pilotprojektā īstenojamai daļai jābūt mazai, bet organizācijai svarīgai (Newing 1996, Mansell-Lewis 1996).

Izpētot prototipu, gala lietotāji un administrācija var izlemt, vai projektu turpināt vai apturēt (Flanagan un Safdie 1997).
Ja tiek pieņemts lēmums turpināt, citu nozaru datu centri būtu jāveido pa vienam. Galalietotājiem ir divas iespējas, pamatojoties uz viņu vajadzībām neatkarīgu datu matricu veidošanā: integrēta/federēta un neintegrēta (Ovum 1998)

Pirmajā metodē katrs jauns datu tirgus ir jāveido, pamatojoties uz pašreizējiem datu martiem un modeli dati izmanto uzņēmums (Varney 1996, Berson and Smith 1997, Peacock 1998). Nepieciešamība izmantot modeli dati Uzņēmuma jēdziens nozīmē, ka ir jānodrošina tikai viena definīcija katrai terminoloģijai, kas tiek izmantota visos datu centros, kā arī lai nodrošinātu, ka dažādus datu tirgus var apvienot, lai sniegtu pārskatu par uzņēmuma informāciju (Bresnahan 1996). Šo metodi sauc par augšupēju, un tā ir vislabākā, ja pastāv finanšu līdzekļu un laika ierobežojumi (Flanagan un Safdie 1997, Ovum 1998, Peacock 1998, Goff 1998). Otrajā metodē konstruētie datu marti var apmierināt tikai konkrētas vienības vajadzības. Apvienotā datu tirgus variants ir datu noliktava izplatīts, kurā datubāze Hub Server starpprogrammatūra tiek izmantota, lai apvienotu daudzus datu tirgus vienā repozitorijā dati izplatīts (Balts 1995). Šajā gadījumā i dati uzņēmumi tiek izplatīti vairākos datu centros. Galalietotāju pieprasījumi tiek pārsūtīti uz datubāze centrmezgla servera starpprogrammatūra, kas izvelk visu dati to pieprasa Data Marts un atgriež rezultātus galalietotāju lietojumprogrammām. Šī metode sniedz biznesa informāciju gala lietotājiem. Tomēr neatkarīgo datu tirgu problēmas joprojām nav novērstas. Ir vēl viena arhitektūra, ko var izmantot, ko sauc par datu noliktava virtuāls (White 1995). Tomēr šī arhitektūra, kas aprakstīta 2.9. attēlā, nav datu uzglabāšanas arhitektūra. dati reāls, jo tas nepārvieto ielādi no OLTP sistēmām uz datu noliktava (Demarest 1994).

Faktiski pieprasījumi no dati no galalietotājiem tiek nodoti OLTP sistēmām, kas atgriež rezultātus pēc lietotāju pieprasījumu apstrādes. Lai gan šī arhitektūra ļauj galalietotājiem ģenerēt atskaites un veikt pieprasījumus, tā nevar nodrošināt

dati uzņēmuma informācijas vēsture un pārskats kā i dati no dažādām OLTP sistēmām nav integrētas. Tādējādi šī arhitektūra nevar apmierināt analīzi dati tādas sarežģītas kā prognozes.

Piekļuves un atkopšanas lietojumprogrammu izvēle dati

Ēkas mērķis a datu noliktava ir informācijas nodošana galalietotājiem (Inmon et al. 1997, Poe 1996, McFadden 1996, Shanks et al. 1997, Hammergren 1998); viena vai vairākas piekļuves un atkopšanas lietojumprogrammas dati ir jānodrošina. Līdz šim ir pieejams plašs šo lietojumprogrammu klāsts, no kuriem lietotājs var izvēlēties (Hammergren 1998, Humphries et al. 1999). Jūsu atlasītās lietojumprogrammas nosaka jūsu noliktavas darbu panākumus dati organizācijā, jo pieteikumi ir redzamākā daļa datu noliktava gala lietotājam (Inmon et al. 1997, Poe 1996). Lai gūtu panākumus a datu noliktava, jāspēj atbalstīt analīzes darbības dati gala lietotāja (Poe 1996, Seddon and Benjamin 1998, Eckerson 1999). Tādējādi ir jānosaka galalietotāja vēlmju “līmenis” (Poe 1996, Mattison 1996, Inmon et al. 1997, Humphries et al. 1999).

Kopumā galalietotājus var iedalīt trīs kategorijās: vadošie lietotāji, biznesa analītiķi un elektroenerģijas lietotāji (Poe 1996, Humphries et al. 1999). Vadošiem lietotājiem ir nepieciešama viegla piekļuve iepriekš definētām atskaišu kopām (Humphries et al. 1999). Šīs attiecības var viegli piekļūt, izmantojot izvēlņu navigāciju (Poe 1996). Turklāt pārskatos ir jāsniedz informācija, izmantojot grafisku attēlojumu, piemēram, tabulas un veidnes, lai ātri nodotu informāciju (Humphries et al. 1999). Biznesa analītiķiem, kuriem, iespējams, nav tehnisko iespēju pašiem izstrādāt pārskatus no nulles, ir jāspēj modificēt pašreizējos pārskatus, lai tie atbilstu viņu īpašajām vajadzībām (Poe 1996, Humphries et al. 1999). No otras puses, enerģētiskie lietotāji ir galalietotāji, kuriem ir iespēja ģenerēt un rakstīt pieprasījumus un atskaites no nulles (Poe 1996, Humphries et al. 1999). Viņi ir tie, kuri

viņi izstrādā pārskatus cita veida lietotājiem (Poe 1996, Humphries et al. 1999).

Kad gala lietotāja prasības ir noteiktas, ir jāizvēlas piekļuves un atkopšanas lietojumprogrammas dati starp visiem pieejamajiem (Poe 1996, Inmon et al. 1997).
Piekļuve dati un izguves rīkus var iedalīt 4 veidos: OLAP rīki, EIS/DSS rīki, vaicājumu un atskaišu rīki un datu ieguves rīki.

OLAP rīki ļauj lietotājiem izveidot ad hoc vaicājumus, kā arī tos, kas veikti vietnē datubāze del datu noliktava. Turklāt šie produkti ļauj lietotājiem izpētīt informāciju no dati no vispārīgiem līdz detalizētiem.

EIS/DSS rīki nodrošina izpildvaras pārskatus, piemēram, “kā būtu, ja” analīzi un piekļuvi izvēlnēs balstītiem pārskatiem. Pārskatiem jābūt iepriekš definētiem un apvienotiem ar izvēlnēm, lai atvieglotu navigāciju.
Vaicājumu un atskaišu veidošanas rīki ļauj lietotājiem izveidot iepriekš definētus un specifiskus pārskatus.

Datu ieguves rīki tiek izmantoti, lai identificētu attiecības, kas varētu parādīt jaunu gaismu par aizmirstajām operācijām programmā dati no datu noliktavas.

Līdzās katra lietotāja veida prasību optimizēšanai atlasītajiem rīkiem jābūt intuitīviem, efektīviem un ērti lietojamiem. Tām arī jābūt saderīgām ar citām arhitektūras daļām un jāspēj strādāt ar esošajām sistēmām. Tāpat ieteicams izvēlēties datu piekļuves un izguves rīkus ar saprātīgām cenām un veiktspēju. Citi kritēriji, kas jāņem vērā, ietver rīka pārdevēja apņemšanos atbalstīt savu produktu un to, kā tas attīstīsies turpmākajos laidienos. Lai nodrošinātu lietotāju iesaistīšanos datu noliktavas izmantošanā, izstrādes komanda iesaista lietotājus rīku atlases procesā. Šajā gadījumā ir jāveic praktisks lietotāja novērtējums.

Lai uzlabotu datu noliktavas vērtību, izstrādes komanda var nodrošināt arī tīmekļa piekļuvi savai datu noliktavai. Tīmeklī iespējota datu noliktava ļauj lietotājiem piekļūt dati no attālām vietām vai ceļojuma laikā. Turklāt informācija var

nodrošināt par zemākām izmaksām, samazinot apmācības izmaksas.

2.4.3 Datu noliktava Darbības fāze

Šis posms sastāv no trim aktivitātēm: datu atsvaidzināšanas stratēģiju noteikšana, datu noliktavas darbību kontrole un datu noliktavas drošības pārvaldība.

Datu atsvaidzināšanas stratēģiju definīcija

Pēc sākotnējās iekraušanas, t.i dati uz datubāze no datu noliktavas ir periodiski jāatsvaidzina, lai reproducētu tajos veiktās izmaiņas dati oriģināli. Tāpēc jums ir jāizlemj, kad atsvaidzināt, cik bieži atsvaidzināšana jāieplāno un kā atsvaidzināt datus dati. Ieteicams atsvaidzināt dati kad sistēmu var izmantot bezsaistē. Atsvaidzināšanas biežumu nosaka izstrādes komanda, pamatojoties uz lietotāja prasībām. Ir divas pieejas datu noliktavas atsvaidzināšanai: pilnīga atsvaidzināšana un nepārtraukta izmaiņu ielāde.

Pirmā pieeja, pilnīga atsvaidzināšana, prasa visu atkārtoti ielādēt dati no nekā. Tas nozīmē, ka viss dati nepieciešamais ir jāizņem, jāiztīra, jāpārveido un jāintegrē katrā atsvaidzināšanā. No šādas pieejas, cik vien iespējams, vajadzētu izvairīties, jo tā prasa daudz laika un resursu.

Alternatīva pieeja ir nepārtraukta izmaiņu augšupielāde. Tas pievieno i dati kas ir mainīti kopš pēdējā datu noliktavas atsvaidzināšanas cikla. Jaunu vai modificētu ierakstu identificēšana ievērojami samazina to apjomu dati kas katrā atjauninājumā ir jāpārnes uz datu noliktavu, jo tikai šie dati tiks pievienots datubāze no datu noliktavas.

Ir vismaz 5 pieejas, ko var izmantot, lai atsauktu i dati jauns vai pārveidots. Lai iegūtu efektīvu datu atsvaidzināšanas stratēģiju dati var būt noderīga šo pieeju kombinācija, kas aptver visas izmaiņas sistēmā.

Pirmā pieeja, kas izmanto laikspiedolus, pieņem, ka visi ir piešķirti dati rediģēja un atjaunināja laikspiedolu, lai jūs varētu viegli identificēt visu dati modificēts un jauns. Tomēr šī pieeja nav plaši izmantota lielākajā daļā mūsdienu operētājsistēmu.
Otrā pieeja ir izmantot delta failu, ko ģenerējusi lietojumprogramma, kurā ir tikai veiktās izmaiņas dati. Šī faila izmantošana arī pastiprina atjaunināšanas ciklu. Tomēr pat šī metode nav izmantota daudzās lietojumprogrammās.
Trešā pieeja ir skenēt žurnālfailu, kas būtībā satur informāciju, kas ir līdzīga delta failam. Vienīgā atšķirība ir tā, ka atkopšanas procesam tiek izveidots žurnālfails, un to var būt grūti saprast.
Ceturtā pieeja ir modificēt lietojumprogrammas kodu. Tomēr lielākā daļa lietojumprogrammu koda ir vecs un trausls; tāpēc no šīs tehnikas jāizvairās.
Pēdējā pieeja ir salīdzināt dati avoti ar galveno dei failu dati.

Datu noliktavas darbību kontrole

Kad datu noliktava ir izlaista lietotājiem, tā laika gaitā ir jāuzrauga. Šajā gadījumā datu noliktavas administrators var izmantot vienu vai vairākus pārvaldības un kontroles rīkus, lai uzraudzītu datu noliktavas izmantošanu. Jo īpaši var apkopot informāciju par cilvēkiem un laiku, kurā viņi piekļūst datu noliktavai. Aiziet dati apkopots, var izveidot veiktā darba profilu, ko var izmantot kā ievadi lietotāja atmaksas ieviešanā. Maksājuma atdošana ļauj lietotājiem būt informētiem par datu noliktavas apstrādes izmaksām.

Turklāt datu noliktavas auditu var izmantot arī, lai identificētu vaicājumu veidus, to lielumu, vaicājumu skaitu dienā, vaicājuma reakcijas laikus, sasniegtos sektorus un pieprasījumu apjomu. dati apstrādāts. Vēl viens datu noliktavas audita mērķis ir identificēt dati kuras netiek lietotas. Šīs dati tos var izņemt no datu noliktavas, lai uzlabotu laiku

vaicājuma izpildes atbildi un uzraudzīt izaugsmi dati kas atrodas iekšā datu bāze no datu noliktavas.

Datu noliktavas drošības pārvaldība

Datu noliktava satur dati integrēts, kritisks, jutīgs, ko var viegli sasniegt. Šī iemesla dēļ tas ir jāaizsargā no nesankcionētiem lietotājiem. Viens no veidiem, kā ieviest drošību, ir izmantot funkciju del DBVS lai piešķirtu dažādas privilēģijas dažāda veida lietotājiem. Tādā veidā katram lietotāja veidam ir jāuztur piekļuves profils. Vēl viens veids, kā nodrošināt datu noliktavu, ir šifrēt to, kā rakstīts datu bāze no datu noliktavas. Piekļuve dati un izguves rīkiem ir jāatšifrē dati pirms rezultātu prezentēšanas lietotājiem.

2.4.4 Datu noliktava Izvēršanas fāze

Tas ir pēdējais posms datu noliktavas ieviešanas ciklā. Šajā posmā veicamās darbības ietver lietotāju apmācību izmantot datu noliktavu un datu noliktavas pārskatu veikšanu.

Lietotāju apmācība

Pirms piekļuves ir jāveic lietotāju apmācība dati datu noliktavas un izguves rīku izmantošana. Parasti sesijām jāsākas ar ievadu uzglabāšanas jēdzienā dati, datu noliktavas saturs, meta dati un instrumentu pamatfunkcijas. Pēc tam pieredzējušāki lietotāji varētu arī izpētīt datu piekļuves un izguves rīku fiziskās tabulas un lietotāju funkcijas.

Ir daudzas pieejas lietotāju apmācībai. Viens no tiem ietver daudzu lietotāju vai analītiķu atlasi no lietotāju kopas, pamatojoties uz viņu vadības un komunikācijas prasmēm. Viņi ir personīgi apmācīti par visu, kas viņiem jāzina, lai iepazītos ar sistēmu. Kad apmācība ir pabeigta, viņi atgriežas savā darbā un sāk mācīt citiem lietotājiem, kā izmantot sistēmu. Uz

Pamatojoties uz to, ko viņi ir iemācījušies, citi lietotāji var sākt izpētīt datu noliktavu.
Vēl viena pieeja ir apmācīt daudzus lietotājus vienlaikus, it kā jūs apmeklētu mācību kursu. Šī metode ir piemērota, ja ir daudz lietotāju, kuri jāapmāca vienlaikus. Vēl viena metode ir apmācīt katru lietotāju atsevišķi, pa vienam. Šī metode ir piemērota, ja lietotāju ir maz.

Lietotāju apmācības mērķis ir iepazīstināt jūs ar piekļuvi dati un izguves rīkus, kā arī datu noliktavas saturu. Tomēr dažus lietotājus var pārņemt apmācības laikā sniegtās informācijas apjoms. Tāpēc, lai sniegtu palīdzību un atbildētu uz konkrētiem jautājumiem, ir jāveic noteikts skaits atsvaidzināšanas sesiju. Dažos gadījumos tiek izveidota lietotāju grupa, lai sniegtu šāda veida atbalstu.

Atsauksmju vākšana

Kad datu noliktava ir ieviesta, lietotāji var izmantot i dati kas atrodas datu noliktavā dažādiem mērķiem. Pārsvarā analītiķi vai lietotāji izmanto i dati datu noliktavā, lai:

  1. 1 Nosakiet uzņēmuma tendences
  2. 2. Analizējiet iepirkumu profilus klienti
  3. 3 Sadaliet i klienti un
  4. 4 Nodrošiniet vislabākos pakalpojumus klienti - pielāgot pakalpojumus
  5. 5 Formulējiet stratēģijas mārketings
  6. 6 Sniedziet konkurētspējīgus piedāvājumus izmaksu analīzei un palīdziet kontrolēt
  7. 7 Atbalstīt stratēģisku lēmumu pieņemšanu
  8. 8 Nosakiet iespējas izcelties
  9. 9 Uzlabojiet pašreizējo biznesa procesu kvalitāti
  10. 10. Pārbaudiet peļņu

Sekojot datu noliktavas attīstības virzienam, sistēmai var tikt veikta virkne pārskatu, lai iegūtu atgriezenisko saiti

gan no izstrādes komandas, gan no galalietotāju kopienas.
Iegūtos rezultātus var ņemt vērā nākamajā izstrādes ciklā.

Tā kā datu noliktavai ir pakāpeniska pieeja, ir ļoti svarīgi mācīties no iepriekšējo izstrāžu panākumiem un kļūdām.

2.5. Kopsavilkums

Šajā nodaļā ir apskatītas literatūrā esošās pieejas. 1. sadaļā tika apspriests datu noliktavas jēdziens un tā loma lēmumu zinātnē. 2. sadaļā tika aprakstītas galvenās atšķirības starp datu noliktavām un OLTP sistēmām. 3. sadaļā mēs apspriedām Monash datu noliktavas modeli, kas tika izmantots 4. sadaļā, lai aprakstītu darbības, kas saistītas ar datu noliktavas izstrādes procesu, šīs tēzes nebija balstītas uz rūpīgu izpēti. Tas, kas notiek patiesībā, var ļoti atšķirties no literatūrā ziņotā, tomēr šos rezultātus var izmantot, lai izveidotu pamata fonu, kas pasvītro šī pētījuma datu noliktavas jēdzienu.

3. nodaļa

Pētījumu un projektēšanas metodes

Šajā nodaļā ir aplūkotas šī pētījuma izpētes un projektēšanas metodes. Pirmajā daļā ir sniegts vispārīgs skatījums uz informācijas izguvei pieejamajām pētījumu metodēm, kā arī apskatīti kritēriji, pēc kuriem izvēlēties labāko metodi konkrētajam pētījumam. Pēc tam 2. sadaļā tiek apspriestas divas metodes, kas atlasītas pēc tikko atklātajiem kritērijiem; no tiem viens tiks izvēlēts un pieņemts ar 3. iedaļā izklāstītajiem iemesliem, kur ir izklāstīti arī cita kritērija izslēgšanas iemesli. 4. sadaļā ir izklāstīts pētījuma plāns, bet 5. sadaļā – secinājumi.

3.1 Informācijas sistēmu pētniecība

Informācijas sistēmu pētniecība neaprobežojas tikai ar tehnoloģiju jomu, bet arī jāpaplašina, iekļaujot uzvedības un organizatoriskos mērķus.
Mēs to esam parādā dažādu disciplīnu tēzēm, sākot no sociālajām un beidzot ar dabaszinātnēm; tas rada nepieciešamību pēc noteikta pētniecības metožu spektra, kas ietver kvantitatīvās un kvalitatīvās metodes, kas izmantojamas informācijas sistēmās.
Visas pieejamās pētniecības metodes ir svarīgas, patiesībā vairāki pētnieki, piemēram, Dženkinss (1985), Nunamaker et al. (1991) un Galliers (1992) apgalvo, ka nav īpašas universālas metodes pētījumu veikšanai dažādās informācijas sistēmu jomās; patiesībā metode var būt piemērota konkrētam pētījumam, bet ne citiem. Tas rada nepieciešamību izvēlēties metodi, kas ir piemērota mūsu konkrētajam pētniecības projektam: šai izvēlei Benbasat et al. (1987) norāda, ka jāņem vērā pētījuma būtība un mērķis.

3.1.1. Pētījuma būtība

Dažādās metodes, kuru pamatā ir pētījuma būtība, var iedalīt trīs informācijas zinātnē plaši pazīstamās tradīcijās: pozitīvisma, interpretācijas un kritiskās izpētes.

3.1.1.1. Pozitīvisma pētījumi

Pozitīvisma pētījumi ir pazīstami arī kā zinātniski vai empīriski pētījumi. Tā cenšas: “izskaidrot un paredzēt, kas notiks sociālajā pasaulē, aplūkojot likumsakarības un cēloņsakarības starp elementiem, kas to veido” (Shanks et al 1993).

Pozitīvistisko pētījumu raksturo arī atkārtojamība, vienkāršojumi un atspēkojumi. Turklāt pozitīvisma pētījumi atzīst, ka starp pētītajām parādībām pastāv a priori attiecības.
Pēc Galliers (1992) domām, taksonomija ir pozitīvisma paradigmā iekļauta pētniecības metode, kas tomēr neaprobežojas ar to, patiesībā ir laboratorijas eksperimenti, lauka eksperimenti, gadījumu izpēte, teorēmu demonstrācijas, prognozes un simulācijas. Izmantojot šīs metodes, pētnieki atzīst, ka pētītās parādības var novērot objektīvi un stingri.

3.1.1.2. Interpretatīvais pētījums

Interpretatīvo pētījumu, ko bieži sauc par fenomenoloģiju vai antipozitīvismu, Neumans (1994) raksturo kā “darbības sociālās nozīmes sistemātisku analīzi, tieši un detalizēti novērojot cilvēkus dabiskās situācijās, lai panāktu izpratni un interpretācijai par to, kā cilvēki veido un uztur savu sociālo pasauli. Interpretējošie pētījumi noraida pieņēmumu, ka novērotās parādības var novērot objektīvi. Faktiski tie ir balstīti uz subjektīvām interpretācijām. Turklāt interpretācijas pētnieki pētāmajām parādībām neuzliek a priori nozīmes.

Šī metode ietver subjektīvos/argumentatīvos pētījumus, darbības izpēti, aprakstošos/interpretējošos pētījumus, nākotnes pētījumus un lomu spēles. Papildus šīm aptaujām un gadījumu izpēti var iekļaut šajā pieejā, jo tie attiecas uz indivīdu vai organizāciju pētījumiem sarežģītās reālās pasaules situācijās.

3.1.1.3. Kritiskā izpēte

Kritiskā izmeklēšana ir vismazāk zināmā pieeja sociālajās zinātnēs, taču nesen tai ir pievērsta informācijas sistēmu pētnieku uzmanība. Filozofisks pieņēmums, ka sociālo realitāti vēsturiski veido un atveido cilvēki, kā arī sociālās sistēmas ar savām darbībām un mijiedarbību. Tomēr viņu spējas ir saistītas ar vairākiem sociāliem, kultūras un politiskiem apsvērumiem.

Tāpat kā interpretācijas pētījumi, arī kritiskie pētījumi apgalvo, ka pozitīvisma pētījumiem nav nekāda sakara ar sociālo kontekstu un tiek ignorēta tā ietekme uz cilvēka rīcību.
Savukārt kritiskie pētījumi kritizē interpretācijas pētījumus par to, ka tie ir pārāk subjektīvi un to mērķis nav palīdzēt cilvēkiem uzlabot viņu dzīvi. Lielākā atšķirība starp kritisko izpēti un pārējām divām pieejām ir tās vērtēšanas dimensija. Kamēr pozitīvisma un interpretācijas tradīciju objektivitāte ir prognozēt vai izskaidrot status quo vai sociālo realitāti, kritisko pētījumu mērķis ir kritiski novērtēt un pārveidot pētāmo sociālo realitāti.

Kritiskie pētnieki parasti iebilst pret status quo, lai novērstu sociālās atšķirības un uzlabotu sociālos apstākļus. Kritiskie pētījumi ir saistīti ar procesuālu skatījumu uz interesējošām parādībām, un tāpēc parasti tie ir gareniski. Pētniecības metožu piemēri ir ilgtermiņa vēstures pētījumi un etnogrāfiskie pētījumi. Tomēr kritiskie pētījumi informācijas sistēmu pētījumos nav plaši izmantoti

3.1.2. Pētījuma mērķis

Līdz ar pētījuma būtību tā mērķis var tikt izmantots, lai virzītu pētnieku konkrētas pētījuma metodes izvēlē. Pētījuma projekta mērķis ir cieši saistīts ar pētījuma pozīciju attiecībā pret pētījumu ciklu, kas sastāv no trim fāzēm: teorijas veidošana, teorijas pārbaude un teorijas pilnveidošana. Tādējādi, pamatojoties uz izpētes cikla laiku, pētniecības projektam var būt skaidrojošs, aprakstošs, pētniecisks vai prognozējošs mērķis.

3.1.2.1. Izpētes izpēte

Pētnieciskā pētījuma mērķis ir izpētīt pilnīgi jaunu tēmu un formulēt jautājumus un hipotēzes turpmākajiem pētījumiem. Šāda veida pētījumi tiek izmantoti teorijas veidošanā, lai iegūtu sākotnējās atsauces jaunā jomā. Parasti tiek izmantotas kvalitatīvas izpētes metodes, piemēram, gadījumu izpēte vai fenomenoloģiskie pētījumi.

Tomēr ir iespējams izmantot arī kvantitatīvus paņēmienus, piemēram, izpētes apsekojumus vai eksperimentus.

3.1.3.3. Aprakstošā izpēte

Aprakstošā pētījuma mērķis ir ļoti detalizēti analizēt un aprakstīt konkrētu organizatorisko situāciju vai praksi. Tas ir piemērots teoriju veidošanai, un to var izmantot arī hipotēžu apstiprināšanai vai apstrīdēšanai. Aprakstošā izpēte parasti ietver mēru un paraugu izmantošanu. Vispiemērotākās pētniecības metodes ir aptaujas un priekšteču analīze.

3.1.2.3. Skaidrojošie pētījumi

Izskaidrojošie pētījumi mēģina izskaidrot, kāpēc lietas notiek. Tā balstās uz jau izpētītiem faktiem un mēģina atrast šo faktu iemeslus.
Tādējādi skaidrojošie pētījumi parasti balstās uz pētnieciskiem vai aprakstošiem pētījumiem un ir palīglīdzekļi teoriju pārbaudīšanai un pilnveidošanai. Izskaidrojošajos pētījumos parasti izmanto gadījumu izpēti vai uz aptauju balstītas pētniecības metodes.

3.1.2.4. Profilaktiskā izpēte

Preventīvo pētījumu mērķis ir prognozēt novērojamos notikumus un uzvedību, kas tiek pētīta (Marshall un Rossman 1995). Prognozēšana ir standarta zinātnisks patiesības tests. Šāda veida pētījumos parasti tiek izmantotas aptaujas vai analīze dati vēsturnieki. (Yin 1989)

Iepriekš minētā diskusija parāda, ka ir vairākas iespējamās izpētes metodes, kuras var izmantot konkrētā pētījumā. Tomēr ir jābūt vienai konkrētai metodei, kas ir piemērotāka par citām konkrēta veida pētniecības projektam. (Galliers 1987, Yin 1989, De Vaus 1991). Tāpēc katram pētniekam rūpīgi jāizvērtē dažādu metožu stiprās un vājās puses, lai izvēlētos vispiemērotāko un pētniecības projektam saderīgāko pētījuma metodi. (Jenkins 1985, Pervan un Klass 1992, Bonomia 1985, Yin 1989, Himilton un Ives 1992).

3.2. Iespējamās izpētes metodes

Šī projekta mērķis bija izpētīt pieredzi Austrālijas organizācijās ar i dati glabājas ar attīstību datu noliktava. Dato ka pašlaik Austrālijā trūkst pētījumu datu noliktavas jomā, šis pētniecības projekts joprojām ir pētījuma cikla teorētiskajā fāzē un tam ir pētniecisks mērķis. Lai izpētītu pieredzi Austrālijas organizācijās, kas pieņem datu noliktavu, ir nepieciešama reālās sabiedrības interpretācija. Līdz ar to pētījuma projekta pamatā esošais filozofiskais pieņēmums seko tradicionālajai interpretācijai.

Pēc pieejamo metožu rūpīgas pārbaudes tika noteiktas divas iespējamās pētniecības metodes: aptaujas un gadījumu izpēte, ko var izmantot pētnieciskiem pētījumiem (Shanks et al. 1993). Galliers (1992) argumentē par šo divu metožu piemērotību šim konkrētajam pētījumam savā pārskatītajā taksonomijā, sakot, ka tās ir piemērotas teorijas veidošanai. Nākamajās divās apakšnodaļās katra metode ir detalizēti aplūkota.

3.2.1. Aptaujas pētījuma metode

Aptaujas izpētes metode nāk no senās tautas skaitīšanas metodes. Tautas skaitīšana sastāv no informācijas vākšanas no visiem iedzīvotājiem. Šī metode ir dārga un nepraktiska, īpaši, ja iedzīvotāju skaits ir liels. Tādējādi, salīdzinot ar tautas skaitīšanu, aptauja parasti koncentrējas uz informācijas vākšanu nelielam skaitam iedzīvotāju pārstāvju vai izlases (Fowler 1988, Neuman 1994). Paraugs atspoguļo populāciju, no kuras tā ir izveidota, ar dažādu precizitātes līmeni atkarībā no izlases struktūras, lieluma un izmantotās atlases metodes (Fowler 1988, Babbie 1982, Neuman 1994).

Aptaujas metode ir definēta kā “prakses, situāciju vai viedokļu momentuzņēmumi noteiktā brīdī, kas veikti, izmantojot anketas vai intervijas, no kuriem var izdarīt secinājumus
veikts” (Galliers 1992:153) [momentuzņēmums par praksi, situācijām vai uzskatiem noteiktā brīdī, kas veikts, izmantojot anketas vai intervijas, no kurām var izdarīt secinājumus]. Aptaujas nodarbojas ar informācijas vākšanu par kādu pētījuma aspektu no noteikta dalībnieku skaita, uzdodot jautājumus (Fowler 1988). Šīs anketas un intervijas, kas ietver klātienes telefonintervijas un strukturētās intervijas, ir arī apkopošanas metodes. dati visbiežāk izmanto pētījumos (Blalock 1970, Nachmias and Nachmias 1976, Fowler 1988), var izmantot novērojumus un analīzes (Gable 1994). No visām šīm savākšanas metodēm dati, anketas izmantošana ir vispopulārākais paņēmiens, jo tas nodrošina, ka i dati

savāktie ir strukturēti un formatēti, un tāpēc atvieglo informācijas klasifikāciju (Hwang 1987, de Vaus 1991).

Analizējot i dati, izmeklēšanas stratēģijā bieži tiek izmantotas kvantitatīvās metodes, piemēram, statistiskā analīze, taču var izmantot arī kvalitatīvas metodes (Galliers 1992, Pervan

un Klass 1992, Gable 1994). Parasti t.i dati savāktie tiek izmantoti, lai analizētu asociāciju sadalījumu un modeļus (Fowler 1988).

Lai gan aptaujas parasti ir piemērotas pētījumiem, kas attiecas uz jautājumu "kas?" (kas) vai izriet no tā, piemēram, "cik daudz" un "cik daudz", tos var uzdot, izmantojot jautājumu "kāpēc" (Sonquist un Dunkelberg 1977, Yin 1989). Saskaņā ar Sonquist un Dunkelberg (1977), izpētes pētījumu mērķis ir apstrīdēt hipotēzes, novērtēt programmas, raksturot populāciju un izstrādāt cilvēku uzvedības modeļus. Turklāt aptaujas var izmantot, lai izpētītu noteiktu iedzīvotāju viedokli, apstākļus, viedokļus, īpašības, cerības un pat pagātnes vai pašreizējo uzvedību (Neuman 1994).

Aptaujas ļauj pētniekam atklāt attiecības starp iedzīvotājiem, un rezultāti parasti ir vispārīgāki nekā citas metodes (Sonquist un Dunkelberg 1977, Gable 1994). Aptaujas ļauj pētniekiem aptvert lielāku ģeogrāfisko apgabalu un sasniegt daudzus respondentus (Blalock 1970, Sonquist un Dunkelberg 1977, Hwang and Lin 1987, Gable 1994, Neuman 1994). Visbeidzot, aptaujas var sniegt informāciju, kas nav pieejama citur vai analīzēm nepieciešamajā formā (Fowler 1988).

Tomēr aptaujas veikšanai ir daži ierobežojumi. Trūkums ir tāds, ka pētnieks nevar iegūt daudz informācijas par pētāmo objektu. Tas ir saistīts ar faktu, ka aptaujas tiek veiktas tikai noteiktā laikā un tāpēc ir ierobežots mainīgo un cilvēku skaits, ko pētnieks var

pētījums (Yin 1989, de Vaus 1991, Gable 1994, Denscombe 1998). Vēl viens trūkums ir tas, ka aptaujas veikšana var būt ļoti dārga laika un resursu ziņā, īpaši, ja tā ietver intervijas klātienē (Fowler 1988).

3.2.2. Izziņas izpētes metode

Izpētes izpētes metode ietver padziļinātu konkrētas situācijas izpēti tās reālās pasaules kontekstā noteiktā laika periodā bez pētnieka iejaukšanās (Shanks & C. 1993, Eisenhardt 1989, Jenkins 1985). Galvenokārt šī metode tiek izmantota, lai aprakstītu attiecības starp mainīgajiem, kas tiek pētīti konkrētā situācijā (Galliers 1992). Izmeklēšana var ietvert vienu vai vairākus gadījumus atkarībā no analizētās parādības (Franz un Robey 1987, Eisenhardt 1989, Yin 1989).

Izpētes izpētes metode ir definēta kā "empīrisks pētījums, kas pēta mūsdienu parādību tās faktiskā kontekstā, izmantojot vairākus avotus, kas savākti no vienas vai vairākām vienībām, piemēram, cilvēkiem, grupām vai organizācijām" (Yin 1989). Nav skaidras nodalīšanas starp fenomenu un tās kontekstu, kā arī nav eksperimentālas kontroles vai manipulācijas ar mainīgajiem lielumiem (Yin 1989, Benbasat et al. 1987).

Ir dažādi paņēmieni, kā savākt dati ko var izmantot aptaujas metodē, kas ietver tiešus novērojumus, arhīvu ierakstu apskatus, anketas, dokumentācijas pārbaudi un strukturētas intervijas. Ar daudzveidīgu ražas novākšanas paņēmienu klāstu dati, pētījumi ļauj pētniekiem tikt galā ar abiem dati kvalitatīvi un kvantitatīvi vienlaikus (Bonoma 1985, Eisenhardt 1989, Yin 1989, Gable 1994). Tāpat kā aptaujas metodes gadījumā, aptaujas pētnieks kalpo kā novērotājs vai pētnieks, nevis kā aktīvs dalībnieks pētāmajā organizācijā.

Benbasats et al (1987) apgalvo, ka aptaujas metode ir īpaši piemērota pētniecības teorijas veidošanai, kas sākas ar pētījuma jautājumu un turpinās ar izglītību.

teoriju savākšanas procesā dati. Būdams arī skatuvei piemērots

Par teorijas veidošanu Franz un Robey (1987) ierosina, ka aptaujas metodi var izmantot arī sarežģītajā teorijas fāzē. Šajā gadījumā, pamatojoties uz savāktajiem pierādījumiem, dotā teorija vai hipotēze tiek pārbaudīta vai atspēkota. Turklāt aptauja ir piemērota arī pētījumiem, kas nodarbojas ar jautājumiem “kā” vai “kāpēc” (Yin 1989).

Salīdzinājumā ar citām metodēm aptaujas ļauj pētniekam iegūt būtisku informāciju detalizētāk (Galliers 1992, Shanks et al. 1993). Turklāt aptaujas ļauj pētniekam izprast pētīto procesu būtību un sarežģītību (Benbasat et al. 1987).

Ar aptaujas metodi ir saistīti četri galvenie trūkumi. Pirmais ir kontrolētu atskaitījumu trūkums. Pētnieka subjektivitāte var mainīt pētījuma rezultātus un secinājumus (Yin 1989). Otrs trūkums ir kontrolētas novērošanas trūkums. Atšķirībā no eksperimentālajām metodēm, pētnieks nevar kontrolēt pētītās parādības, jo tās tiek pārbaudītas to dabiskajā kontekstā (Gable 1994). Trešais trūkums ir atkārtojamības trūkums. Tas ir tāpēc, ka pētnieks, visticamāk, nenovēros vienus un tos pašus notikumus un nevar pārbaudīt konkrēta pētījuma rezultātus (Lee 1989). Visbeidzot, nereplicējamības dēļ ir grūti vispārināt vienā vai vairākos pētījumos iegūtos rezultātus (Galliers 1992, Shanks et al. 1993). Tomēr visas šīs problēmas nav nepārvaramas, un patiesībā pētnieks var tās samazināt, veicot atbilstošas ​​​​darbības (Lee 1989).

3.3. Pamato pētījuma metodoloģiju pieņemts

No divām iespējamām šī pētījuma pētījuma metodēm par piemērotāko tiek uzskatīta aptaujas metode. Izmeklēšana tika noraidīta, rūpīgi izvērtējot attiecīgos

priekšrocības un trūkumi. Katras metodes piemērotība vai nepiemērotība šim pētījumam ir aplūkota turpmāk.

3.3.1. Pētījuma metodes neatbilstība izmeklēšanu

Aptaujas metode prasa padziļinātu izpēti par konkrētu situāciju vienā vai vairākās organizācijās noteiktā laika periodā (Eisenhardt 1989). Šajā gadījumā periods var pārsniegt šim pētījumam noteikto laika posmu. Vēl viens iemesls aptaujas metodes nepieņemšanai ir tas, ka rezultāti var ciest no stingrības trūkuma (Yin 1989). Rezultātus un secinājumus var ietekmēt pētnieka subjektivitāte. Vēl viens iemesls ir tas, ka šī metode ir vairāk piemērota pētniecībai par “kā” vai “kāpēc” tipa jautājumiem (Yin 1989), savukārt šī pētījuma izpētes jautājums ir “kas” tipa. Visbeidzot, ir grūti vispārināt tikai viena vai dažu pētījumu rezultātus (Galliers 1992, Shanks et al. 1993). Pamatojoties uz šo pamatojumu, aptaujas pētījuma metode netika izvēlēta, jo tā nebija piemērota šim pētījumam.

3.3.2. Meklēšanas metodes ērtība izmeklēšana

Kad šis pētījums tika veikts, Austrālijas organizācijas nebija plaši pārņēmušas datu noliktavas praksi. Tātad nebija daudz informācijas par to ieviešanu Austrālijas organizācijās. Pieejamā informācija tika iegūta no organizācijām, kas bija ieviesušas vai izmantojušas a datu noliktava. Šajā gadījumā vispiemērotākā ir aptaujas pētījuma metode, jo tā ļauj iegūt informāciju, kas citur nav pieejama vai analīzei nepieciešamajā formā (Fowler 1988). Turklāt aptaujas pētījuma metode ļauj pētniekam gūt labu ieskatu praksē, situācijās vai uzskatos konkrētajā laikā (Galliers 1992, Denscombe 1998). Pārskats bija nepieciešams, lai palielinātu zināšanas par Austrālijas datu noliktavas pieredzi.

Turklāt Sonquist un Dunkelberg (1977) apgalvo, ka aptaujas pētījuma rezultāti ir vispārīgāki nekā citas metodes.

3.4. Aptaujas izpētes dizains

Aptauja par datu noliktavas praksi tika veikta 1999. gadā. Mērķa populāciju veidoja Austrālijas organizācijas, kuras bija ieinteresētas datu noliktavas pētījumos, jo tās, iespējams, jau bija informētas par dati ko viņi glabā un tādējādi varētu sniegt noderīgu informāciju šim pētījumam. Mērķa populācija tika noteikta, veicot sākotnējo aptauju, kurā piedalījās visi Austrālijas Datu noliktavas institūta (Tdwi-aap) locekļi. Šajā sadaļā ir apskatīts šī pētījuma empīriskās izpētes posma dizains.

3.4.1. Ražas novākšanas tehnika dati

No trim aptauju pētījumos parasti izmantotajām metodēm (t.i., pasta anketa, telefona intervija un personiskā intervija) (Nachmias 1976, Fowler 1988, de Vaus 1991), šim pētījumam tika izmantota pasta anketa. Pirmais iemesls, lai pieņemtu pēdējo, ir tas, ka tas var sasniegt ģeogrāfiski izkliedētu populāciju (Blalock 1970, Nachmias and Nachmias 1976, Hwang and Lin 1987, de Vaus 1991, Gable 1994). Otrkārt, pasta anketa ir piemērota augsti izglītotiem dalībniekiem (Fowler 1988). Šī pētījuma pasta anketa bija adresēta datu noliktavas projektu sponsoriem, direktoriem un/vai projektu vadītājiem. Treškārt, pasta anketas ir piemērotas, ja ir pieejams drošs adresātu saraksts (Salant un Dilman 1994). TDWI, šajā gadījumā uzticama datu noliktavas asociācija ir nodrošinājusi savu Austrālijas dalībnieku adresātu sarakstu. Vēl viena pasta anketas priekšrocība salīdzinājumā ar telefona anketu vai personiskajām intervijām ir tā, ka tā ļauj respondentiem atbildēt precīzāk, it īpaši, ja respondentiem ir jāapskata piezīmes vai jāapspriež jautājumi ar citiem cilvēkiem (Fowler 1988).

Iespējamais trūkums var būt laiks, kas nepieciešams anketu aizpildīšanai pa pastu. Parasti pasta aptauja tiek veikta šādā secībā: nosūtiet vēstules, gaidiet atbildes un nosūtiet apstiprinājumu (Fowler 1988, Bainbridge 1989). Tādējādi kopējais laiks var būt ilgāks par laiku, kas nepieciešams personiskām intervijām vai telefonintervijām. Tomēr kopējo laiku var zināt iepriekš (Fowler 1988, Denscombe 1998). Personisko interviju veikšanai pavadīto laiku nevar iepriekš zināt, jo tas dažādās intervijās atšķiras (Fowler, 1988). Telefona intervijas var būt ātrākas nekā anketas pa pastu un personiskās intervijas, taču dažu cilvēku nepieejamības dēļ tām var būt augsts atbildes trūkums (Fowler 1988). Turklāt telefonintervijas parasti aprobežojas ar salīdzinoši īsiem jautājumu sarakstiem (Bainbridge 1989).

Vēl viena pasta anketas vājā puse ir augstais neatbildēšanas līmenis (Fowler 1988, Bainbridge 1989, Neuman 1994). Tomēr ir veikti pretpasākumi, saistot šo pētījumu ar uzticamu datu noliktavas iestādi (t.i., TDWI) (Bainbridge 1989, Neuman 1994), kas nosūta divas atgādinājuma vēstules neatbildētājiem (Fowler 1988, Neuman 1994), kā arī iekļauj papildu vēstuli. izskaidrojot pētījuma mērķi (Neuman 1994).

3.4.2. Analīzes vienība

Šī pētījuma mērķis ir iegūt informāciju par datu noliktavas ieviešanu un izmantošanu Austrālijas organizācijās. Mērķa populācija sastāv no visām Austrālijas organizācijām, kuras ir ieviesušas vai īsteno, t.i datu noliktava. Pēc tam atsevišķas organizācijas tiek reģistrētas ar nosaukumu. Anketa tika nosūtīta pa pastu organizācijām, kuras interesējas par adopciju datu noliktava. Šī metode nodrošina, ka savāktā informācija nāk no katras iesaistītās organizācijas vispiemērotākajiem resursiem.

3.4.3. Aptaujas paraugs

Aptaujas dalībnieku “adresātu saraksts” tika iegūts no TDWI. No šī saraksta par paraugu ņemšanas pamatu tika atlasītas 3000 Austrālijas organizācijas. Izlasei tika nosūtīta papildu vēstule, kurā izskaidrots projekts un aptaujas mērķis, kopā ar atbilžu lapu un priekšapmaksas aploksni aizpildītās anketas atgriešanai. No 3000 organizācijām 198 piekrita piedalīties pētījumā. Tika gaidīts tik mazs atbilžu skaits dato lielais skaits Austrālijas organizāciju, kuras toreiz bija pieņēmušas vai izmantoja datu noliktavas stratēģiju savās organizācijās. Tādējādi šī pētījuma mērķauditoriju veido tikai 198 organizācijas.

3.4.4. Anketas saturs

Anketas struktūra tika balstīta uz Monash datu noliktavas modeli (par to iepriekš tika runāts 2.3. daļā). Anketas saturs tika veidots, pamatojoties uz 2. nodaļā sniegto literatūras analīzi. Aptaujas dalībniekiem nosūtītās anketas kopija ir atrodama B pielikumā. Anketa sastāv no sešām sadaļām, kas seko aplūkotā modeļa fāzēm. Nākamajās sešās rindkopās ir īsi apkopots katras sadaļas saturs.

A sadaļa: Pamatinformācija par organizāciju
Šajā sadaļā ir jautājumi par iesaistīto organizāciju profilu. Turklāt daži jautājumi ir saistīti ar dalībnieka datu noliktavas projekta statusu. Aptaujas analīzē netika atklāta tāda konfidenciāla informācija kā organizācijas nosaukums.

B sadaļa: Sākums
Šīs sadaļas jautājumi ir saistīti ar datu noliktavas uzsākšanas uzdevumu. Tika uzdoti jautājumi par projekta iniciatoriem, galvotājiem, nepieciešamajām prasmēm un zināšanām, datu noliktavas attīstības mērķiem un galalietotāju vēlmēm.

C sadaļa: Dizains
Šajā sadaļā ir jautājumi, kas saistīti ar plānošanas aktivitātēm datu noliktava. Jo īpaši jautājumi bija par izpildes apjomu, projekta ilgumu, projekta izmaksām un izmaksu/ieguvumu analīzi.

D sadaļa: Attīstība
Attīstības sadaļā ir jautājumi, kas saistīti ar attīstības aktivitātēm datu noliktava: galalietotāju prasību apkopojums, avoti dati, loģiskais modelis dati, prototipi, jaudas plānošana, tehniskās arhitektūras un datu noliktavas izstrādes rīku izvēle.

E sadaļa: Darbība
Darbības jautājumi, kas saistīti ar darbību un paplašināmību datu noliktava, kā tas attīstās nākamajā attīstības fāzē. Tur datu kvalitāte, atsvaidzināšanas stratēģijas dati, precizitāte dati, mērogojamība datu noliktava un drošības jautājumiem datu noliktava bija starp uzdotajiem jautājumiem.

F sadaļa: Attīstība
Šajā sadaļā ir jautājumi, kas saistīti ar lietošanu datu noliktava galalietotāji. Pētnieku interesēja mērķis un lietderība datu noliktava, pieņemtās pārskatīšanas un apmācības stratēģijas un kontroles stratēģija datu noliktava pieņemts.

3.4.5. Reakcijas ātrums

Lai gan pasta aptaujas tiek kritizētas par zemo atbilžu īpatsvaru, ir veikti pasākumi, lai palielinātu atgriešanas līmeni (kā minēts iepriekš 3.4.1. daļā). Termins “atbilžu līmenis” attiecas uz to cilvēku procentuālo daļu konkrētā aptaujas izlasē, kuri atbild uz anketas jautājumiem (Denscombe 1998). Lai aprēķinātu šī pētījuma atbildes līmeni, tika izmantota šāda formula:

Cilvēku skaits, kas atbildēja
Atbilžu skaits = ——————————————————————————— X 100 Kopējais nosūtīto anketu skaits

3.4.6. Izmēģinājuma tests

Pirms anketas nosūtīšanas izlasei, jautājumi tika izskatīti, veicot pilottestus, kā to ierosināja Luck and Rubin (1987), Džeksons (1988) un de Vaus (1991). Pilottestu mērķis ir atklāt jebkādus neērtus, neskaidrus izteicienus un grūti interpretējamus jautājumus, precizēt izmantotās definīcijas un terminus un noteikt aptuveno laiku, kas nepieciešams anketas aizpildīšanai (Warwick and Lininger 1975, Jackson 1988, Salant un Dilman 1994). Izmēģinājuma testi tika veikti, atlasot priekšmetus, kuru īpašības ir līdzīgas pēdējo priekšmetu īpašībām, kā ierosināja Deiviss e. Cosenza (1993). Šajā pētījumā kā izmēģinājuma subjekti tika izvēlēti seši datu noliktavas profesionāļi. Pēc katra izmēģinājuma testa tika veikti nepieciešamie labojumi. No veiktajiem izmēģinājuma testiem dalībnieki piedalījās anketas galīgās versijas pārveidē un atiestatīšanā.

3.4.7. Analīzes metodes Autors Dati

I dati no slēgtajām anketām savākto aptauju tika analizētas, izmantojot statistikas programmu paketi, ko sauc par SPSS. Daudzas atbildes tika analizētas, izmantojot aprakstošo statistiku. Vairākas anketas tika atgrieztas nepilnīgas. Tie tika apstrādāti ar lielāku rūpību, lai nodrošinātu, ka i dati Trūkumi nebija datu ievades kļūdu sekas, bet gan tāpēc, ka jautājumi nebija piemēroti reģistrētājam vai arī reģistrētājs nolēma neatbildēt uz vienu vai vairākiem konkrētiem jautājumiem. Šīs trūkstošās atbildes analīzes laikā tika ignorētas dati un tika kodēti ar “-9”, lai nodrošinātu to izslēgšanu no analīzes procesa.

Sagatavojot anketu, slēgtie jautājumi tika iepriekš kodēti, katram variantam piešķirot numuru. Pēc tam numurs tika izmantots, lai sagatavotu dati analīzes laikā (Denscombe 1998, Sapsford un Jupp 1996). Piemēram, B sadaļas 1. jautājumā bija norādītas sešas iespējas: direktoru padome, augstākā līmeņa vadītājs, IT nodaļa, biznesa vienība, konsultanti un citi. Failā dati SPSS, tika ģenerēts mainīgais, lai norādītu "projekta iniciatoru" ar sešām vērtību etiķetēm: "1" - "direktoru padome", "2" - "vecākais vadītājs" un tā tālāk. Likertīna skalas izmantošana dažos slēgtajos jautājumos ļāva arī bez piepūles identificēt, ņemot vērā atbilstošo SPSS ievadīto skaitlisko vērtību izmantošanu. Jautājumiem ar nepilnīgām atbildēm, kas viena otru neizslēdza, katra opcija tika uzskatīta par vienu mainīgo ar diviem vērtību apzīmējumiem: “1” nozīmē “atzīmēts” un “2” nozīmē “nav atzīmēts”.

Atvērtie jautājumi tika traktēti atšķirīgi no slēgtajiem jautājumiem. Atbildes uz šiem jautājumiem netika ievadītas SPSS. Tā vietā tie tika analizēti ar roku. Šāda veida jautājumu izmantošana ļauj iegūt informāciju par respondentu brīvi izteiktajām idejām un personīgo pieredzi (Bainbridge 1989, Denscombe 1998). Ja iespējams, atbildes tika iedalītas kategorijās.

Lai veiktu analīzi dati, tiek izmantotas vienkāršas statistiskās analīzes metodes, piemēram, atbildes biežums, vidējais, standartnovirze un mediāna (Argyrous 1996, Denscombe 1998).
Gamma tests darbojās labi, lai iegūtu kvantitatīvus asociāciju mērījumus starp dati kārtas vārdi (Norusis 1983, Argyrous 1996). Šie testi bija piemēroti, jo izmantotajām kārtas skalām nebija daudz kategoriju un tās varēja parādīt tabulā (Norusis 1983).

3.5 Kopsavilkums

Šajā nodaļā tika apspriesta šim pētījumam pieņemtā pētījuma metodoloģija un dizains.

Izvēloties konkrētam pētījumam piemērotāko pētījuma metodi, tiek ņemta vērā
vairāku noteikumu apsvēršana, tostarp izpētes raksturs un veids, kā arī katras iespējamās metodes priekšrocības un trūkumi (Jenkins 1985, Benbasat et al. 1097, Galliers and Land 1987, Yin 1989, Hamilton and ives 1992, Galliers 1992, Neuman 1994). Ņemot vērā esošo zināšanu un teorijas trūkumu par datu noliktavas ieviešanu Austrālijā, šim pētījumam ir nepieciešama interpretējoša pētījuma metode ar pētniecisku spēju izpētīt Austrālijas organizāciju pieredzi. Izvēlētā pētījuma metode tika izvēlēta, lai apkopotu informāciju par datu noliktavas koncepcijas pieņemšanu Austrālijas organizācijās. Kā vākšanas tehnika tika izvēlēta pasta anketa dati. Pētījuma metodes un vākšanas tehnikas pamatojums dati atlasītie tiks sniegti šajā nodaļā. Turklāt tika prezentēta diskusija par analīzes vienību, izmantoto paraugu, atbilžu procentiem, anketas saturu, anketas priekšpārbaudi un anketas analīzes metodi. dati.

Projektēšana a Datu noliktava:

Entītiju attiecību un dimensiju modelēšanas apvienošana

ANOTĀCIJA
Uzglabāšana i dati ir aktuāla problēma daudzām organizācijām. Galvenais jautājums datoru krātuves attīstībā dati tas ir viņa dizains.
Dizainam ir jāatbalsta jēdzienu noteikšana datu noliktava mantotajai sistēmai un citiem avotiem dati kā arī viegla izpratne un efektivitāte ieviešanā datu noliktava.
Liela daļa uzglabāšanas literatūras dati iesaka izmantot entītiju attiecību modelēšanu vai dimensiju modelēšanu, lai attēlotu dizainu datu noliktava.
Šajā rakstā mēs parādām, kā abus attēlojumus var apvienot vienā zīmēšanas pieejā datu noliktava. Izmantotā pieeja ir sistemātiska

pārbaudīts gadījuma izpētē un ir identificēts vairākās svarīgās ietekmes uz praktizējošiem speciālistiem.

DATU UZGLABĀŠANA

Un datu noliktava to parasti definē kā “subjektu orientētu, integrētu, laika variāciju un nemainīgu datu vākšanu vadības lēmumu atbalstam” (Inmon un Hackathorn, 1994). Uz priekšmetu orientēta un integrēta norāda, ka datu noliktava ir izstrādāts, lai šķērsotu Legaci sistēmu funkcionālās robežas, lai piedāvātu integrētu perspektīvu dati.
Laika variants ietekmē vēsturisko vai laikrindu raksturu dati in datu noliktava, kas ļauj analizēt tendences. Negaistošs norāda, ka datu noliktava tas netiek pastāvīgi atjaunināts, piemēram, a datubāze OLTP. Drīzāk tas tiek periodiski atjaunināts, ar dati kas nāk no iekšējiem un ārējiem avotiem. The datu noliktava tas ir īpaši izstrādāts meklēšanai, nevis integritātes un darbības veiktspējas atjaunināšanai.
Ideja par i dati nav jaunums, tas bija viens no pārvaldības mērķiem dati kopš sešdesmitajiem gadiem (The Martin, 1982).
I datu noliktava viņi piedāvā infrastruktūru dati vadības atbalsta sistēmām. Vadības atbalsta sistēmas ietver lēmumu atbalsta sistēmas (DSS) un izpildvaras informācijas sistēmas (EIS). DSS ir datorizēta informācijas sistēma, kas izstrādāta, lai uzlabotu cilvēku lēmumu pieņemšanu. EIS parasti ir piegādes sistēma dati kas ļauj uzņēmumu vadītājiem viegli piekļūt skatam dati.
Vispārējā arhitektūra a datu noliktava izceļ lomu datu noliktava vadības atbalstā. Kā arī piedāvājot infrastruktūru dati EIS un DSS, al datu noliktava tai var piekļūt tieši, izmantojot vaicājumus. THE dati iekļauts a datu noliktava ir balstīti uz vadības informācijas prasību analīzi un tiek iegūti no trim avotiem: iekšējām mantotajām sistēmām, īpašam nolūkam paredzētām datu uztveršanas sistēmām un ārējiem datu avotiem. THE dati iekšējās mantotās sistēmās tie bieži ir lieki, nekonsekventi, zemas kvalitātes un tiek glabāti dažādos formātos, tāpēc tie ir jāsaskaņo un jāiztīra, pirms tos var ielādēt

datu noliktava (Inmon, 1992; McFadden, 1996). THE dati nāk no uzglabāšanas sistēmām dati ad hoc un no avotiem dati ārējos bieži izmanto, lai palielinātu (atjauninātu, aizstātu) i dati no mantotajām sistēmām.

Ir daudz pārliecinošu iemeslu, lai izstrādātu a datu noliktava, kas ietver uzlabotu lēmumu pieņemšanu, efektīvi izmantojot vairāk informācijas (Ives 1995), atbalstu koncentrēšanās uz veseliem darījumiem (Graham 1996) un samazināšanu dati EIS un DSS (Graham 1996, McFadden 1996).

Nesen veikts empīrisks pētījums atklāja, ka vidēji atdeva no ieguldījumiem datu noliktava par 401% pēc trim gadiem (Graham, 1996). Tomēr citi empīriskie pētījumi par datu noliktava konstatēja būtiskas problēmas, tostarp grūtības novērtēt un piešķirt pabalstus, skaidra mērķa trūkums, nepietiekami novērtēts ieguvumu uzglabāšanas mērķis un sarežģītība dati, jo īpaši attiecībā uz avotiem un tīrību dati. Uzglabāšana i dati var uzskatīt par vadības problēmas risinājumu dati starp organizācijām. Manipulācija ar dati kā sociālais resurss tas ir palicis viena no galvenajām problēmām informācijas sistēmu pārvaldībā visā pasaulē daudzus gadus (Brancheau et al. 1996, Galliers et al. 1994, Niederman et al. 1990, Pervan 1993).

Populāra pieeja vadībai dati astoņdesmitajos gados tā bija modeļa izstrāde dati sociālā. Modelis dati sociālais tika izstrādāts, lai piedāvātu stabilu pamatu jaunu lietojumprogrammu sistēmu izstrādei un datubāze un mantoto sistēmu rekonstrukcija un integrācija (Brancheau et al.

1989, Goodhue et al. 1988:1992, Kims un Everests 1994). Tomēr šai pieejai ir daudz problēmu, jo īpaši katra uzdevuma sarežģītība un izmaksas, kā arī ilgs laiks, kas nepieciešams taustāmu rezultātu sasniegšanai (Beynon-Davies 1994, Earl 1993, Goodhue et al. 1992, Periasamy 1994, Shanks 1997). ).

Il datu noliktava tā ir atsevišķa datu bāze, kas pastāv līdzās mantotajām datu bāzēm, nevis aizstāj tās. Tādējādi tas ļauj jums vadīt vadību dati un izvairīties no dārgas mantoto sistēmu rekonstrukcijas.

ESOŠĀS PIEEJAS DATU DIZAINĒ

NOLIKTAVU

Celtniecības un pilnveidošanas process a datu noliktava tas vairāk jāsaprot kā evolūcijas process, nevis tradicionālo sistēmu attīstības dzīves cikls (Vēlme, 1995, Shanks, O'Donnell un Arnott 1997a). Projektā ir iesaistīti daudzi procesi datu noliktava piemēram, inicializācija, plānošana; informācija, kas iegūta no uzņēmumu vadītāju prasībām; avoti, pārvērtības, tīrīšana dati un sinhronizācija no mantotajām sistēmām un citiem avotiem dati; piegādes sistēmas izstrādes stadijā; uzraudzību datu noliktava; un evolūcijas procesa bezjēdzība un a datu noliktava (Stinchi, O'Donnell un Arnott 1997b). Šajā žurnālā mēs koncentrējamies uz to, kā zīmēt dati glabājas šo citu procesu kontekstā. Ir vairākas piedāvātās pieejas arhitektūrai datu noliktava literatūrā (Inmon 1994, Ives 1995, Kimball 1994 McFadden 1996). Katrai no šīm metodoloģijām ir īss pārskats ar to stipro un vājo pušu analīzi.

Inmon's (1994) Approach for Datu noliktava Dizains

Inmons (1994) ierosināja četrus iteratīvus soļus, lai izstrādātu a datu noliktava (skat. 2. attēlu). Pirmais solis ir izveidot veidni dati sociāli, lai saprastu, kā es dati tās var integrēt dažādās organizācijas funkcionālajās jomās, sadalot dati uzglabāt vietās. Modelis dati tas ir paredzēts uzglabāšanai dati kas attiecas uz lēmumu pieņemšanu, tostarp dati vēsturnieki, un tajā skaitā dati secināts un apkopots. Otrais solis ir noteikt īstenošanas priekšmetu jomas. Tie ir balstīti uz prioritātēm, ko nosaka konkrēta organizācija. Trešais solis ietver a zīmēšanu datubāze priekšmeta jomā īpašu uzmanību pievērsiet atbilstošu precizitātes līmeņu iekļaušanai. Inmon iesaka izmantot entītiju un attiecību modeli. Ceturtais solis ir avota sistēmu identificēšana dati nepieciešami un izstrādāt transformācijas procesus, lai uztvertu, notīrītu un formatētu i dati.

Inmon pieejas stiprās puses ir tādas, ka modelis dati sociālais nodrošina pamatu integrācijai dati atbalsta organizēšanas un plānošanas ietvaros iteratīvai attīstībai datu noliktava. Tās trūkumi ir modeļa izstrādes grūtības un izmaksas dati sociālā, grūtības izprast abos modeļos izmantotos entītiju un attiecību modeļus, ka dati sociālo un ka no dati glabājas pēc tematiskās jomas un atbilstības dati no zīmējuma datu noliktava realizācijai datubāze relāciju, bet ne priekš datubāze daudzdimensiju.

Ivesa (1995) Approach to Datu noliktava Dizains

Ives (1995) piedāvā četru soļu pieeju informācijas sistēmas projektēšanai, kas, viņaprāt, ir piemērojama sistēmas projektēšanai. datu noliktava (skat. 3. attēlu). Šī pieeja lielā mērā ir balstīta uz informācijas inženieriju informācijas sistēmu izstrādei (Martin 1990). Pirmais solis ir noteikt mērķus, kritiskos un veiksmes faktorus un galvenos darbības rādītājus. Galvenie biznesa procesi un nepieciešamā informācija ir modelēti, lai mūs vadītu pie modeļa dati sociālais. Otrais solis ietver definējošas arhitektūras izstrādi dati uzglabā pa apgabaliem, datubāze di datu noliktava, nepieciešamie tehnoloģiju komponenti, organizatoriskā atbalsta kopums, kas nepieciešams ieviešanai un darbībai datu noliktava. Trešais solis ietver nepieciešamo programmatūras pakotņu un rīku izvēli. Ceturtais solis ir detalizēts projektēšana un konstrukcija datu noliktava. Ives atzīmē, ka uzglabāšana dati tas ir ierobežots iteratīvs process.

Ives pieejas stiprās puses ir specifisku paņēmienu izmantošana informācijas prasību noteikšanai, strukturēta procesa izmantošana, lai atbalstītu datu noliktava, atbilstošas ​​aparatūras un programmatūras izvēle un vairāku attēlojuma metožu izmantošana datu noliktava. Tās trūkumi ir raksturīgi sarežģītībai. Citi ietver grūtības attīstīt daudzus līmeņus datubāze ietvaros datu noliktava saprātīgos laikos un izmaksās.

Kimbala (1994) pieeja Datu noliktava Dizains

Kimball (1994) ierosināja piecus iteratīvus soļus, lai izstrādātu a datu noliktava (sk. 4. attēlu). Viņa pieeja ir īpaši veltīta solo dizainam datu noliktava un par dimensiju modeļu izmantošanu, nevis entītiju un attiecību modeļiem. Kimball analizē šos dimensiju modeļus, jo uzņēmumu vadītājiem ir vieglāk izprast uzņēmējdarbību, tas ir efektīvāks, strādājot ar sarežģītām konsultācijām un datubāze fiziskā ir efektīvāka (Kimball 1994). Kimball atzīst, ka attīstība a datu noliktava tas ir iteratīvs, un tas datu noliktava atsevišķas tabulas var integrēt, sadalot tās kopīgu izmēru tabulās.

Pirmais solis ir noteikt konkrēto priekšmetu jomu, kas jāpilnveido. Otrais un trešais solis attiecas uz dimensiju modelēšanu. Otrajā posmā pasākumi identificē interesējošās lietas attiecīgajā jomā un sagrupē faktu tabulā. Piemēram, pārdošanas priekšmetu apgabalā interešu rādītāji var ietvert pārdoto preču daudzumu un dolāru kā pārdošanas valūtu. Trešais solis ietver dimensiju noteikšanu, kas ir veidi, kā faktus var grupēt. Pārdošanas tēmas apgabalā atbilstošās dimensijas var ietvert preci, atrašanās vietu un laika periodu. Faktu tabulai ir vairāku daļu atslēga, lai to saistītu ar katru dimensiju tabulu, un parasti tajā ir ļoti daudz faktu. Turpretim dimensiju tabulas satur aprakstošu informāciju par dimensijām un citiem atribūtiem, ko var izmantot faktu grupēšanai. Saistītā ierosinātā faktu un dimensiju tabula veido tā saukto zvaigznes shēmu tās formas dēļ. Ceturtais solis ietver a veidošanu datubāze daudzdimensionāls, lai pilnveidotu zvaigžņu rakstu. Pēdējais solis ir avota sistēmu identificēšana dati nepieciešami un izstrādāt transformācijas procesus, lai uztvertu, notīrītu un formatētu i dati.

Kimbala pieejas stiprās puses ietver dimensiju modeļu izmantošanu, lai attēlotu dati saglabāts, kas padara to viegli saprotamu un nodrošina efektīvu fizisko dizainu. Dimensiju modelis, kas arī viegli izmanto abas sistēmas datubāze relāciju var pilnveidot vai sistēmas datubāze daudzdimensionāls. Tās trūkumi ietver dažu paņēmienu trūkumu, kas atvieglotu daudzu zvaigžņu modeļu plānošanu vai integrāciju a datu noliktava un grūtības projektēt no galēji denormalizētas struktūras uz izmēru modeli a dati mantotajā sistēmā.

Makfadena (1996) pieeja datiem Noliktavas dizains

McFadden (1996) piedāvā piecu soļu pieeju a projektēšanai datu noliktava (skat. 5. attēlu).
Viņa pieeja ir balstīta uz ideju sintēzi no literatūras un ir vērsta uz singla dizainu datu noliktava. Pirmais solis ietver prasību analīzi. Lai gan tehniskās specifikācijas nav noteiktas, Makfadena piezīmēs ir identificētas entītijas dati specifikācijas un to atribūtus, un atsaucas uz lasītājiem Watson un Frolick (1993) par prasību uztveršanu.
Otrajā solī tiek izstrādāts entītiju attiecību modelis datu noliktava un pēc tam apstiprinājuši uzņēmumu vadītāji. Trešais solis ietver kartēšanas noteikšanu no mantotajām sistēmām un ārējiem avotiem datu noliktava. Ceturtais solis ietver izstrādes, izvietošanas un sinhronizācijas procesus dati uz datu noliktava. Pēdējā posmā tiek izstrādāta sistēmas piegāde, īpašu uzmanību pievēršot lietotāja interfeisam. McFadden atzīmē, ka zīmēšanas process parasti ir iteratīvs.

Makfadena pieejas stiprās puses norāda uz uzņēmumu līderu līdzdalību prasību noteikšanā, kā arī uz resursu nozīmi. dati, to tīrīšana un savākšana. Tās trūkumi ietver liela projekta izjaukšanas procesa trūkumu datu noliktava daudzos integrētos posmos un

grūtības izprast vienību un attiecību modeļus, kas izmantoti projektēšanā datu noliktava.

Mūs izvēlas ne tikai tie, kas ir tuvu mums.

    0/5 (0 atsauksmes)
    0/5 (0 atsauksmes)
    0/5 (0 atsauksmes)

    Uzziniet vairāk tiešsaistes tīmekļa aģentūrā

    Abonējiet, lai saņemtu jaunākos rakstus pa e-pastu.

    autora iemiesojums
    admin Vadītājs
    👍Tīmekļa tiešsaistes aģentūra | Tīmekļa aģentūras eksperts digitālā mārketinga un SEO jomā. Web Agency Online ir tīmekļa aģentūra. Agenzia Web Online panākumi digitālajā transformācijā ir balstīti uz Iron SEO versijas 3 pamatiem. Specialitātes: sistēmu integrācija, uzņēmuma lietojumprogrammu integrācija, uz pakalpojumiem orientēta arhitektūra, mākoņdatošana, datu noliktava, biznesa inteliģence, lielie dati, portāli, iekštīkli, tīmekļa lietojumprogramma Relāciju un daudzdimensiju datu bāzu projektēšana un pārvaldība Digitālo mediju saskarņu projektēšana: lietojamība un grafika. Tiešsaistes tīmekļa aģentūra piedāvā uzņēmumiem sekojošus pakalpojumus: -SEO Google, Amazon, Bing, Yandex; -Web Analytics: Google Analytics, Google tagu pārvaldnieks, Yandex Metrica; -Lietotāju reklāmguvumi: Google Analytics, Microsoft Clarity, Yandex Metrica; -SEM Google, Bing, Amazon reklāmās; -Sociālo mediju mārketings (Facebook, Linkedin, Youtube, Instagram).
    Mana Agile Privātums
    Šī vietne izmanto tehniskās un profilēšanas sīkdatnes. Noklikšķinot uz Piekrist, jūs atļaujat visas profilēšanas sīkdatnes. Noklikšķinot uz noraidīt vai X, visi profilēšanas sīkfaili tiek noraidīti. Noklikšķinot uz pielāgot, ir iespējams izvēlēties, kuras profilēšanas sīkdatnes aktivizēt.
    Šī vietne atbilst Datu aizsardzības likumam (LPD), Šveices 25. gada 2020. septembra federālajam likumam un GDPR, ES Regulai 2016/679, kas attiecas uz personas datu aizsardzību, kā arī šādu datu brīvu apriti.