25-Dimensione degli effetti e 26-Metanalisi vers

Elementi di Psicometria con Laboratorio di SPSS 1
25-Dimensione degli effetti e 26-Metanalisi
vers. 1.0 (2 dicembre 2014)
Germano Rossi1
[email protected]
1 Dipartimento
di Psicologia, Università di Milano-Bicocca
2014-2015
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
1 / 24
Saltare
Saltare
i paragrafi 25.5 e 25.6 (relativi al test di
Mann-Whitney e all’Anova)
e 26.5 e seguenti
che non sono in programma
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
2 / 24
Introduzione
La ricerca usa la statistica per verificare le sue ipotesi di lavoro,
tramite la falsificazione dell’ipotesi nulla
Le domande della ricerca cadono in due categorie:
teorico-metodologico
statistiche
A livello teorico-metodologico ci si chiede se i risultati della ricerca
sono importanti per capire la realtà, se hanno una rilevanza
pratica. . .
A livello statistico ci si chiede se il risultato ottenuto è “veramente”
vero
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
3 / 24
Introduzione
Uno dei problemi teorici e statistici della ricerca è l’errore di
misurazione
Ogni misurazione che noi facciamo è soggetta alla possibilità
dell’errore (ad es. uno strumento impreciso oppure una nostra
operazionalizzazione errata)
misurare l’età di un adulto in anni è sufficientemente buona per
tutte le occasioni
misurare in anni l’età di un bambino può essere impreciso (in certi
periodi un bambino cambia molto in un anno)
questo pone un problema di affidabilità della misurazione
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
4 / 24
Introduzione
l’età di una persona può essere misurata in molti modi: chiedendo
ad un amico, alla persona stessa, chiedendo la data di nascita, la
data e l’ora di nascita, chiedendo il certificato di nascita che
dovrebbe riportare la data e l’ora di nascita vere (ma solo in paesi
in cui è l’ospedale a denunciare la nascita)
anche far misurare qualcosa a due persone diverse, può portare
ad avere una misurazione non affidabile
In teoria, possiamo stimare quanto sono affidabili due misurazioni
tramite una formula:
rxy
rx∞ y∞ = √
rxx ryy
dove rx∞ y∞ è il coefficiente di attenuazione; rxy è la correlazione
fra due misurazioni, mentre rxx e ryy sono i coefficienti di
affidabilità delle due misurazioni singole
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
5 / 24
Introduzione
Questo potrebbe permetterci di aggiustare una misurazione
inaffidabili tramite il sui coefficiente di attenuazione con un’altra
affidabile
purtroppo quasi mai conosciamo l’inaffidabilità di una misurazione
(soprattutto in psicologia)
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
6 / 24
Dimensione dell’effetto: Introduzione
Tramite il test della differenza delle medie (t-test) abbiamo visto se due
medie sono diverse ovvero se i campioni su cui le medie sono state
calcolate provengono da popolazioni con parametri statistici uguali o
diversi
questa informazione però è solamente vero/falso: o c’è differenza
oppure no
Inoltre l’eventuale differenza delle medie va interpretata come un
risultato che potrebbe non essere “sicuro”
ma anche come un differenza relativa
se la religiosità estrinseca personale è diversa in base al genere e
vediamo che la media dei maschi è minore di quella delle femmine non
possiamo interpretare nulla di più della diversità
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
7 / 24
Introduzione
Se leggo che “i maschi (M=14.72) risultano significativamente più
aggressivi delle femmine (M=13.15)”, penso ad una grande
differenza
poi vado a vedere com’è stata costruita la variabile di aggressività
usata e vedo che ha un intervallo di 10 (min 5, max 15)
e allora penso che in fondo entrambi sono “aggressivi” anche se i
maschi hanno una media un pochino più alta
ma se l’intervallo fosse di 40 (min 10, max 50)?
diremmo che le due medie di 14.72 e 13.15 sono molto vicine fra
loro e molto basse
ma allora la differenza fra 14.72 e 13.15, visto che è
statisticamente significativa, è una differenza “importante”?
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
8 / 24
Introduzione
Abbiamo già visto che certe statistiche dipendono dall’ampiezza del
campione: più un campione è ampio, più le statistiche sono in grado di
“trovare” un effetto
ad es. una correlazione di .75 NON è significativa con un campione di 6
osservazioni, ma lo è con 8 osservazioni
Nel t-test, l’errore standard diminuisce all’aumentare del campione e il
valore di t diventa più grande
D’altra parte, una correlazione di .15 equivale al 2,25% di varianza in
comune, mentre una correlazione di .75 equivale al 56.25% di varianza
comune
Quindi, l’effetto trovato (correlazione, t-test, chi-quadro. . . .) dipende
anche da quanto è grande l’effetto che sto misurando
Se un effetto è grande, lo troverò anche con campioni piccoli, se è
piccolo mi servirà un campione ampio
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
9 / 24
Dimensione dell’effetto (Effect size)
L’effect size è un indice di quanto è ampia la dimensione
dell’effetto trovato: se è piccolo, medio o grande
Il concetto di dimensione dell’effetto è teorico e si può applicare a
qualunque risultato di analisi dei dati
In alcuni casi non è facilmente stimabile
Ci sono sostanzialmente due modi di stimare la dimensione
dell’effetto
1
2
uno relativo e basato sulla statistica usata
uno più comparabile, basato sul concetto di correlazione, cioè
sull’associazione fra effetto e variabile misurata
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
10 / 24
Dimensione dell’effetto (t-test)
Uno dei primi autori a proporre una possibile stima della
dimensione dell’effetto fu Cohen
ragionando sulla differenza delle medie, propose di misurare la
dimensione con qualcosa di simile a
d=
µ1 − µ2
σcombinata
ovvero la differenza delle medie delle due popolazioni diviso la
deviazione standard delle popolazioni combinate fra loro
La dimensione dell’effetto è qui vista come una misura
standardizzata della differenza delle medie
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
11 / 24
Dimensione dell’effetto (t-test)
Cohen pensava che d dovesse oscillare fra 0 e 1
e propose una interpretazione generica di d
d = .20, effetto piccolo
d = .50, effetto medio
d = .80, effetto grande
ma spesso d supera il valore 1 e in letteratura si trovano che
questi valori vengono generalmente considerati giganti (huge)
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
12 / 24
Dimensione dell’effetto (t-test)
Una possibile formula per il t-test (per campioni indipendenti) è
stata proposta da Hedge:
g=q
X1 − X2
(N1 −1)s21 +(N2 −1)s22
N1 +N2 −2
in cui il denominatore è la varianza combinata dei due campioni
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
13 / 24
Dimensione dell’effetto (t-test)
Dal momento che sia g sia t usano la varianza combinata,
g=q
X1 − X2
(N1 −1)s21 +(N2 −1)s22
N1 +N2 −2
t= r
X1 − X2
2
(N1 −1)s21 +(N2 −1)s2
N1 +N2 −2
1
N1
+
1
N2
conoscendo le numerosità e il valore di t, si può calcolare g anche
come:
r
t
N1 + N2
g=q
=t
N1 N2
N1 N2
N1 +N2
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
14 / 24
Dimensione dell’effetto (t-test)
Ovviamente, usando le forme inverse, possiamo calcolare t
usando g
Se i due gruppi non hanno la stessa numerosità:
r
N1 N2
t=g
N1 + N2
Ma è più facile avere t che non g, in quanto molti software
calcolano t, ma non g
SPSS non calcola g
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
15 / 24
Esempio di uso di d
Fondamentalismo
Intrinseco
Estrinseco
Italiano
M
s
75,35 32,03
22,25
4,57
15,94
5,29
Originale
M
s
84,6 33
37,2 5,8
25,6 5,7
Test t
p
.003
<.001
<.001
d
-0.28
-2.64
-1.71
Esempio
“Confrontando il nostro campione con quello originale, osserviamo che ci sono alcune
differenze. Mentre il t-test sembra evidenziare che la popolazione canadese è più
fondamentalista di quella italiana, l’effect size ci dece che la differenza è piccola
(d=-0.28). La situazione cambia per quanto riguarda l’orientamento religioso: ci sono
differenze più grandi tra le 2 popolazioni sia per quanto riguarda la religiosità
intrinseca che per quella estrinseca. Infatti i valori della d di Cohen sono decisamente
giganti.”
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
16 / 24
Esempio di uso di d
Fondamentalismo
Intrinseco
Estrinseco
Estrinseco Personale
Estrinseco Sociale
Primo
M
s
75,35 32,03
21,37
5,41
15,94
5,29
9,45
3,12
6,45
3,13
Secondo
M
s
81,7 31,59
23,4
5,66
16,1
5,21
10,21
3,32
5,94
3,01
Test t
p
.034
<.001
n.s.
.013
n.s.
d
.20
-.36
-.23
.17
Esempio
“I risultati del nostro campione sono stati confrontati con quelli di un campione italiano
precedente. Attraverso il test t osserviamo che vi sono tre variabili statisticamente
diverse. Tuttavia le differenze riscontrate sono minime, infatti l’effect size più elevato è
di solo .36, quindi le dimensioni degli effetti sono tutte piccole. Questo ci
permetterebbe di affermare che potrebbe esiste comunque una somiglianza tra i 2
campioni italiani, la cui diversità potrebbe anche essere casuale.”
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
17 / 24
Dimensione dell’effetto come associazione
La dimensione dell’effetto indica la relazione esistente fra una
variabile e l’altra, espressa in modo standardizzato
la d di Cohen (e la g di Hodge) non ci riescono
Tuttavia abbiamo visto un’indice statistico che esprime
esattamente l’associazione di due variabili: la correlazione
Per questo motivo, sono state sviluppate delle formule che
esprimono la dimensione dell’effetto in termini di associazione
(cioè di correlazione)
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
18 / 24
Dimensione dell’effetto come associazione
Il coefficiente phi è anche un indice di associazione fra le due
variabili
Un indice di associazione misura la “forza” con cui le due variabili
sono legate fra loro
Per questo motivo, φ misura anche la dimensione dell’effetto
Il χ2 ci dice che le due variabili sono fra di loro dipendenti o
indipendenti ed effettua un test probabilistico
Rifiutando l’ipotesi nulla, stiamo solo dicendo che, probabilmente,
c’è un legame fra le variabili all’interno della popolazione da cui
abbiamo estratto il campione
φ ci dice invece quanto le due variabili sono legate fra loro
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
19 / 24
Dimensione dell’effetto come associazione
r
φ in una tabella 2x2 corrisponde
ad una r di Pearson
il coefficiente di contingenza (C)
è proposto dal vostro libro come
un sostituto di φ per tabelle
diverse da 2x2 ma, anche se
oscilla fra 0 e 1, non è
propriamente una correlazione
Anche il V di Cramer è un effect
size per tabelle diverse da 2x2 ed
è considerato una stima migliore
di C (Ellis, 2010)
G. Rossi (Dip. Psicologia)
ElemPsico
rφ = φ =
s
C=
χ2
N
χ2
N + χ2
s
V di Cramer =
χ2
N (k − 1)
con k = min(r, c)
2014-2015
20 / 24
Dimensione dell’effetto come associazione
Anche nel caso di un t-test per campioni indipendenti si può
calcolare una misura di associazione
Se indichiamo i due gruppi con 0 e 1, la normale correlazione di
Pearson corrisponde a una correlazione punto-biseriale (rbis o rpb )
ma è più semplice usare una formula che trasforma t in r
s
t2
rbis =
t2 + df
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
21 / 24
Utilizzo della dimensione dell’effetto
La dimensione dell’effetto è importante in ambito statistico perché
ha aperto la strada ad almeno due approcci nuovi
L’analisi della potenza: lo studio dell’errore di II tipo (o β)
[capitolo 29]
La metanalisi: le ricerche sulle ricerche su uno stesso argomento
La metanalisi è una tecnica statistica che studia i risultati di
ricerca, in particolare i risultati delle analisi statistiche di diverse
ricerche per vedere se gli effetti riscontrati sono in qualche modo
legati a caratteristiche particolari.
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
22 / 24
Utilizzo della dimensione dell’effetto
La metanalisi sta sostituendo le rassegne bibliografiche perché le
migliora
Una ricerca bibliografica è la raccolta/riassunto di articoli di ricerca
su un particolare argomento
lo scopo è quello di riassumere i risultati ottenuti e le situazioni in
cui un determinato strumento funziona (oppure in quali
circostanze si presenta un certo effetto)
I lavori trovati vengono generalmente
accostati l’uno all’altro per variabili misurate
confrontati per tipo di campione
tipo di variabili dipendenti (misurazioni diverse dello stesso
costrutto)
variabili indipendenti usate
risultati ottenuti
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
23 / 24
Utilizzo della dimensione dell’effetto
La metanalisi permette di confrontare queste ricerche, non solo
teoricamente, ma anche statisticamente
la dimensione dell’effetto di ogni ricerca, diventa la misura su cui
valutare le ricerche
e su cui applicare le analisi statistiche comuni (in genere l’analisi
della varianza)
in questo modo si può vedere se gli effetti sono più grandi in un
certo tipo di campione oppure con certi tipi di strumenti (variabili
indipendenti)
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
24 / 24