3. DW_modello_dati - Dipartimento di Informatica

Datawarehousing
Basi dati dei sistemi decisionali:
!  Insieme di dati +
!  strumenti per effettuare vari tipi di
interrogazioni a carattere statistico e
analitico (operatori OLAP)
Business Intelligence
Modello dei dati
Federica Cena
Modello dei dati
! 
! 
Analisi dimensionale
DW basati sul concetto di FATTO di INTERESSE
Si basa su modello dei dati multidimensionale
!  Modello
- 
- 
- 
2
dimensionale
Semplice da capire
Non ambiguo
Riflette il modo in cui i decision maker pensano
Federica Cena
Domande cui vogliono rispondere i decisori:
!  Informazioni riassuntive, con la possibilità di
dettagliare i riassunti
!  Analisi delle informazioni riassuntive in base a
componenti organizzative come “aree” e
“dipartimenti”
!  Possibilità di “slice”(affettare) and “dice” (tagliare
a dadini) delle informazioni
!  Possibilità di vedere le informazioni nel tempo
!  Vedere le informazioni sia in forma tabulare che
grafica
3
4
Federica Cena-
1
Analisi dimensionale
Modello dei dati multidimensionale
È un metodo di progettazione del DW
! 
Consiste nell’intervistare i decision maker e
chiedere in quale
! 
- 
- 
Subject area sono maggiormente interessati
Quali sono le più importanti dimensioni di analisi
! 
! 
Fatto: concetto di interesse per il processo
decisionale (ad esempio, vendite)
Misure: proprietà numerica di un fatto, descrive
un aspetto quantitativo (quantità venduta,
incasso)
Dimensioni: proprietà con un dominio finito di
un fatto, descrive una coordinata di analisi
(luogo, prodotto)
Un fatto è analizzato attraverso tante dimensioni.
5
Federica Cena
Federica Cena-
Modello multidimensionale
Esempio di analisi
Fatti: behavioural, dati comportamentali, derivano
da interazione utente con il sistema, dinamici,
cambiano
Dimensioni: circumstances (attributi), cambiano
meno
!  Possibili
6
dimensioni
Prodotto (tipo di prodotto)
"  Tempo (mese, bimestre, anno)
"  Cliente (dettaglio, grossista, diretto)
"  Responsabilità (punto vendita, rivenditore)
" 
!  Lo
schema multidimensionale favorisce la
multidimensionalità del ragionamento
Ma i cambiamenti dei behavioural dipendono da
circumstances: bisogna gestire il cambiamento
delle dimensioni
-  Tempo di validità: da .. A..
-  Tabella in relazione 1:m con la dimensione
" 
7
Che cosa? chi? Quanto? Come? Dove?
8
Federica Cena-
2
Esempio di analisi
Esempio di analisi
I dati vengono analizzati per identificare
tendenze e, quindi, facilitare il processo
decisionale
" 
" 
Quale e’ il mese con le maggiori vendite?
Quali sono stati i primi cinque prodotti venduti
a Pisa?
Interessano non solo i dati ma anche le loro
aggregazioni (media, il minimo,
massimo, somma, etc)
9
10
Datawarehouse: obiettivi
!  Rappresentazione
Federica Cena
11
a matrice
Federica Cena
12
3
Modello multidimensionale
!  Le
dimensioni possono essere più di tre,
ma non è intuitivo immaginarlo
!  Anche le misure possono essere più di una
(nella cella ci saranno più valori)
14
Federica Cena
15
16
4
Caratteristiche dei DW
Cubo
Assi: tempo, cliente, prodotto
misura: vendita
Ogni elemento del cubo (minicubo) contiene i valori
di vendita per un particolare cliente, prodotto at
un tempo particolare
17
Federica Cena-
Federica Cena
Gerarchia delle dimensioni
Gerarchia delle dimensioni
!  Ogni
esempio dimensione tempo
dimensione può essere strutturata in
una gerarchia di variabili che rappresentano
diversi livelli di aggregazione
!  esempio dimensione punto vendita
19
18
20
5
Gerarchia delle dimensioni
esempio dimensione prodotto
Modello Concettuale
21
Modello concettuale dei dati
Modello concettuale: tipi
!  Dimensional
!  A
Fact Model [GolfarelliRizzi] (DFM) e’ un modello concettuale
grafico per DW che contiene fatti,
dimensioni, gerarchie. DFM definisce una
visione concettuale astratta di ogni fatto
disponibile nel sistema
!  A
stella
fiocco di neve (snowflakes)
! 
23
Federica Cena
24
6
Modello concettuale: modalità di
rappresentazione
Modello concettuale (E-R)
!  Si
puo’ rappresentare con
Schema E-R
"  DOT model (rappresenta i fatti come
punti)
" 
Punto
vendita
prodotto
1:n
N:1
vendita
1:n
tempo
25
26
Modello concettuale (Dot Model)
Sesso
Stato Civile
Dimensione
Operatori
Localizzazione città
Clienti
Regione
Provincia_dest
Localizz_dest
Provincia
Professio
ne
Modello Logico
Regione
Categoria
Viaggi
Mezzi
Sistemazione
Periodo
7
1) Modello a stella
1) Modello a stella implementato
29
2) Modello a snowflake
30
Modello a sowflakes implementato
31
32
8
Modello logico
!  Prodotto
(id_prodotto, nome)
(id_punto, città, regione)
!  Tempo (id_tempo,mese, anno)
!  Vendite (id_prodotto, id_punto, id_tempo,
quantità)
!  Punto_vendita
Federica Cena
33
9