Presentazione di PowerPoint

Linee, direzione e densità
XII Modulo
4 maggio 2016
Fiorenza Deriu
Dipartimento di
Scienze Statistiche
La teoria dei grafi
•
L’approccio matematico della teoria dei grafi fornisce un linguaggio formale per la
descrizione delle reti e dei loro caratteri
•
La teoria dei grafi offre una traduzione dei dati delle matrici in concetti formali e
teoremi che possono essere rapportati ai caratteri essenziali delle reti sociali
•
La teoria dei grafi è alla base di software come Ucinet o Gradap
•
La teoria dei grafi riguarda insiemi di elementi (punti, vertici o nodi) e le relazioni
tra di essi (linee, spigoli o archi)  una matrice che descrive le relazioni fra un
gruppo di persone può essere convertita in un grafo di punti collegati da linee
•
Il sociogramma è un tipo di grafo  rete sociale
•
I grafi di reti esprimono modelli qualitativi di connessione tra punti (attori sociali)
Linee, direzione e densità
I grafi
•
Ciò che importa in un grafo è il modello di connessioni che rappresenta
•
Non rilevano:
- la posizione effettiva di un punto su una pagina
- la lunghezza delle linee tracciate tra due punti
- la dimensione del carattere usato per indicare i punti
•
I concetti di posizione e lunghezza nella teoria dei grafi assumono un significato
diverso da quello a noi familiare
•
Per convenzione, in genere, la lunghezza delle linee tra i punti è sempre uguale,
salvo i casi in cui per motivi estetici di rappresentazione alcune linee sono più
lunghe di altre  NON esiste un modo «corretto» di disegnare un grafo
Linee, direzione e densità
Esempio
Linee, direzione e densità
Concetti di base della teoria dei grafi
•
I tipi di linee che possono essere usate nella costruzione dei grafi in base allo
schema sottostante, sono:
Tipo di valori
Dati relazionali
Non orientati
Orientati
Binari
1
3
Numerici
2
4
a) Linee orientate e non orientate (dati binari)
b) Linee non orientate con valori numerici
c) Linee orientate con valori numerici
Linee, direzione e densità
Esempio di grafo non orientato e orientato e matrici
corrispondenti
Grafo non orientato
Grafo orientato
NB: grafo orientato è detto «digrafo»
Linee, direzione e densità
L’intensità di una relazione
Se si vuole evidenziare l’intensità di una relazione, il ricercatore
può costruire un grafo «segnato» (valued graph), contrassegnato
cioè da un valore riportato su ciascuna linea
Linee, direzione e densità
Le misure di intensità
• La più semplice misura di intensità di una relazione è la molteplicità
Numero di contatti distinti che costituiscono
una relazione
B
2
A
Le società A e B hanno due consiglieri di
amministrazione in comune – la linea (A,B)
ha molteplicità 2
Linee, direzione e densità
Adiacenza, vicinato e grado
• Due punti collegati da una linea si dicono adiacenti
B
Gli attori A e B sono in connessione
diretta tra loro
B
A
• I punti a cui un determinato punto è
adiacente costituiscono il suo vicinato.
• Il numero totale dei punti del vicinato
rappresenta il grado di un punto. Il
grado è il valore numerico che esprime
la dimensione del suo vicinato (somma
dei valori di riga o colonna della matrice
di adiacenza)
Linee, direzione e densità
A ha grado 3
A
C
D
Gradi e linee
Totale di coppie di
punti in un grafo
Linee, direzione e densità
Perché le linee
che collegano
due punti sono
la metà dei
punti medesimi
2/2=1)
Percorsi, lunghezze e distanze
• I punti di un grafo possono essere collegati direttamente da una linea oppure
indirettamente da una sequenza di linee
«sentiero»
Un sentiero in cui ogni punto e ogni linea dono
diversi si chiama percorso (path)
Concetto chiave nella teoria dei grafi
La lunghezza di un percorso è data dal numero di
linee che lo costituiscono
Linee, direzione e densità
Esempio di percorso tra 2 punti e di calcolo della sua
lunghezza
• lunghezza percorso da A a D = 2 (ABD)
Linee, direzione e densità
Il concetto di distanza
• La distanza tra due punti esprime un concetto diverso da quello di lunghezza del
percorso tra 2 punti
• Distanza e lunghezza sono da intendersi diversamente dai loro significati fisici
quotidiani
La lunghezza di un percorso è data dal numero di linee
che lo costituiscono- è il numero di passi necessari per
andare da un punto all’altro
La distanza fra due punti è la lunghezza del percorso
più breve cheli collega (distanza geodetica)
Esempio: da A a D
Lunghezza percorsi
Distanza
AD (1)
1
ACD (2)
ABCD (3)
Linee, direzione e densità
Varianti dei grafi orientati
• Occorre tener conto della direzione della relazione che ouò essere diversa da A a B
rispetto a quella da B a A
• Viene a mancare la simmetria matriciale
Il grado si distingue in:
a) Grado in entrata: numero totale dei punti che hanno
linee ad esso dirette (valori in colonna – Totale di
colonna)
b) Grado in uscita: numero totale di punti verso cui un
punto orienta le sue linee (valori in riga – totale di riga)
In un grafo orientato occorre tener conto solo dei percorsi fatti da linee che
vanno nella stessa direzione (flussi informazioni)
Linee, direzione e densità
La densità di una rete
• Descrive il livello generale dei legami fra i punti in un determinato grafo
• Un grafo si dice completo quando tutti i punti di sono adiacenti l’uno all’altro,
cioè ogni punto è collegato direttamente a ognuno degli altri  situazione
rarissima
• Il concetto di densità va quindi a misurare quanto ci si trovi distanti da tale
situazione di completezza
• Tanto più numerose saranno le linee, tanto più il grafo sarà denso
• D (I, G) la densità dipenda da altri due parametri della struttura della rete:
l’inclusività e la somma dei gradi dei suoi punti
Linee, direzione e densità
L’inclusività di una rete
• Numero dei punti inclusi nelle varie parti collegate del grafo  è data quindi dal
numero totale dei punti meno il numero di punti isolati
• Per esprimere in termini relativi tale misura (proporzione) si rapportano i punti
collegati al numero totale dei punti
Esempio: grafo con 20 punti di cui 5 isolati
PC = 20-5 = 15
I = 15/20 = 0,75
 0,75*100 = 75%
Il 75% dei punti della rete sono collegati tra
loro
• Quanto più il grafo è inclusivo tanto più sarà denso
Linee, direzione e densità
Il grado di connessione dei nodi
• Il grado di connessione di punti tra loro collegati può variare: alcuni saranno
collegati con più punti rispetto ad altri
• Quanto più elevati sono i gradi dei punti tanto maggiore sarà la densità della rete
• Per tener conti anche di questo parametro nel calcolo della densità occorre
confrontare il numero effettivo di linee presenti e il numero di linee che si
avrebbe in un grafo completo
Somma dei gradi
di un grafo diviso 2
Linee, direzione e densità
Confronti di densità
Linee, direzione e densità
La densità in grafi orientati
Linee, direzione e densità
Reti ego-centrate e socio-centriche
Reti ego-centrate
Si ancorano le reti
determinati attori –
intorno
Reti socio-centriche
a
L’analisi della densità è interessata
alla densità dei legami che
circondano determinati attori
Si trascura dunque l’attore e ci si
concentra solo sui legami tra i
contatti della sua rete
Linee, direzione e densità
Si focalizza l’attenzione sul modello
delle connessioni nella rete come un
«tutto», contributo per Barnes distintivo
dell’analisi delle reti sociali
L’analisi della densità è quella dell’intera
rete e no semplicemente delle reti
personali di singoli attori
La misura ego-centrica della densità
6 nodi due densità diverse
Linee, direzione e densità
La densità dei grafi segnati (valued graphs)
•
Non c’è accordo su come calcolare la densità su queste reti
a) Ignorare i valori sulle linee e trattare il grafo come se fosse semplicemente orientato o non
orientato  notevole perdita di informazione
b) Usare il valore della molteplicità delle linee come peso dei legami (linea con m=3 avrà peso
3 – varrà come tre linee)  totale ponderato delle linee effettivamente presenti in un grafo
c) Problema del denominatore  numero max delle linee che un grafo può contenere deve
basarsi su qualche ipotesi sul valore massimo che la molteplicità può assumere nella rete
oggetto di studio  la molteplicità più alta rilevata nella rete; il numero max di consiglieri in
un cda; il numero massimo di cariche cumulabili, etc…
Linee, direzione e densità
Problema della dipendenza della densità dalla
dimensione del grafo
a) Rende impossibile confrontare misure di densità di grafi di dimensione diversa
b) La densità varia in ragione del rapporto tra le linee effettivamente presenti e quelle
teoricamente possibili
c) Grafi più grandi hanno densità più basse rispetto a grafi più piccoli
d) Ciò è anche dovuto a un altro fattore: il tempo
e) Mayhew e Levinger (1976) sostengono che esistono limiti alla quantità di tempo che certi
attori sono disposti a investire nell’intraprendere e mantenere relazioni  il tempo è limitato,
quindi diminuisce all’aumentare dei contatti (d mai superiore a 0,5)
f)
Occorre poi considerare il tipo di relazione: amore, amicizia (la prima ha densità più bassa –
possono conoscere tante persone ma amarne solo alcune)
Linee, direzione e densità
Stima della densità di una rete sulla base di dati
campionari
Linee, direzione e densità
Metodo di stima della densità di Granovetter (1976)
• Metodo da usare quando si è incerti sulla attendibilità della stima iniziale del grado
medio
• Sconsiglia di ricorrere a un unico grande campione e di preferire invece un certo
numero di sotto-campioni (es.: pop. 100.000 attori è opportuno selezionare sottocampioni da 100 (almeno 5) o 200 attori (ne basterebbero 2))
• Si calcola la densità in ciascun sotto-campione
• Poi si procede con il calcolo della media delle densità calcolate  stima attendibile
della densità della rete globale
Linee, direzione e densità
Ora esercitiamoci insieme…
•
•
•
•
•
Impariamo a calcolare il grado (in-degrees e out-degrees) dei punti di una
rete
Calcoliamo i k-core
Calcoliamo l’indice di inclusività
Calcoliamo le distanze
Calcoliamo e rappresentiamo reti ego-centriche
Linee, direzione e densità
Grazie!
…ora proseguiamo con qualche esercizio
Linee, direzione e densità