Datawarehousing Basi dati dei sistemi decisionali: ! Insieme di dati + ! strumenti per effettuare vari tipi di interrogazioni a carattere statistico e analitico (operatori OLAP) Business Intelligence Modello dei dati Federica Cena Modello dei dati ! ! Analisi dimensionale DW basati sul concetto di FATTO di INTERESSE Si basa su modello dei dati multidimensionale ! Modello - - - 2 dimensionale Semplice da capire Non ambiguo Riflette il modo in cui i decision maker pensano Federica Cena Domande cui vogliono rispondere i decisori: ! Informazioni riassuntive, con la possibilità di dettagliare i riassunti ! Analisi delle informazioni riassuntive in base a componenti organizzative come “aree” e “dipartimenti” ! Possibilità di “slice”(affettare) and “dice” (tagliare a dadini) delle informazioni ! Possibilità di vedere le informazioni nel tempo ! Vedere le informazioni sia in forma tabulare che grafica 3 4 Federica Cena- 1 Analisi dimensionale Modello dei dati multidimensionale È un metodo di progettazione del DW ! Consiste nell’intervistare i decision maker e chiedere in quale ! - - Subject area sono maggiormente interessati Quali sono le più importanti dimensioni di analisi ! ! Fatto: concetto di interesse per il processo decisionale (ad esempio, vendite) Misure: proprietà numerica di un fatto, descrive un aspetto quantitativo (quantità venduta, incasso) Dimensioni: proprietà con un dominio finito di un fatto, descrive una coordinata di analisi (luogo, prodotto) Un fatto è analizzato attraverso tante dimensioni. 5 Federica Cena Federica Cena- Modello multidimensionale Esempio di analisi Fatti: behavioural, dati comportamentali, derivano da interazione utente con il sistema, dinamici, cambiano Dimensioni: circumstances (attributi), cambiano meno ! Possibili 6 dimensioni Prodotto (tipo di prodotto) " Tempo (mese, bimestre, anno) " Cliente (dettaglio, grossista, diretto) " Responsabilità (punto vendita, rivenditore) " ! Lo schema multidimensionale favorisce la multidimensionalità del ragionamento Ma i cambiamenti dei behavioural dipendono da circumstances: bisogna gestire il cambiamento delle dimensioni - Tempo di validità: da .. A.. - Tabella in relazione 1:m con la dimensione " 7 Che cosa? chi? Quanto? Come? Dove? 8 Federica Cena- 2 Esempio di analisi Esempio di analisi I dati vengono analizzati per identificare tendenze e, quindi, facilitare il processo decisionale " " Quale e’ il mese con le maggiori vendite? Quali sono stati i primi cinque prodotti venduti a Pisa? Interessano non solo i dati ma anche le loro aggregazioni (media, il minimo, massimo, somma, etc) 9 10 Datawarehouse: obiettivi ! Rappresentazione Federica Cena 11 a matrice Federica Cena 12 3 Modello multidimensionale ! Le dimensioni possono essere più di tre, ma non è intuitivo immaginarlo ! Anche le misure possono essere più di una (nella cella ci saranno più valori) 14 Federica Cena 15 16 4 Caratteristiche dei DW Cubo Assi: tempo, cliente, prodotto misura: vendita Ogni elemento del cubo (minicubo) contiene i valori di vendita per un particolare cliente, prodotto at un tempo particolare 17 Federica Cena- Federica Cena Gerarchia delle dimensioni Gerarchia delle dimensioni ! Ogni esempio dimensione tempo dimensione può essere strutturata in una gerarchia di variabili che rappresentano diversi livelli di aggregazione ! esempio dimensione punto vendita 19 18 20 5 Gerarchia delle dimensioni esempio dimensione prodotto Modello Concettuale 21 Modello concettuale dei dati Modello concettuale: tipi ! Dimensional ! A Fact Model [GolfarelliRizzi] (DFM) e’ un modello concettuale grafico per DW che contiene fatti, dimensioni, gerarchie. DFM definisce una visione concettuale astratta di ogni fatto disponibile nel sistema ! A stella fiocco di neve (snowflakes) ! 23 Federica Cena 24 6 Modello concettuale: modalità di rappresentazione Modello concettuale (E-R) ! Si puo’ rappresentare con Schema E-R " DOT model (rappresenta i fatti come punti) " Punto vendita prodotto 1:n N:1 vendita 1:n tempo 25 26 Modello concettuale (Dot Model) Sesso Stato Civile Dimensione Operatori Localizzazione città Clienti Regione Provincia_dest Localizz_dest Provincia Professio ne Modello Logico Regione Categoria Viaggi Mezzi Sistemazione Periodo 7 1) Modello a stella 1) Modello a stella implementato 29 2) Modello a snowflake 30 Modello a sowflakes implementato 31 32 8 Modello logico ! Prodotto (id_prodotto, nome) (id_punto, città, regione) ! Tempo (id_tempo,mese, anno) ! Vendite (id_prodotto, id_punto, id_tempo, quantità) ! Punto_vendita Federica Cena 33 9
© Copyright 2024 Paperzz