Strumenti Informatici 13.2 Post-hoc Friedman

Chiorri, C. (2014). Fondamenti di psicometria - Strumenti Informatici 13.2
1
Strumenti informatici 13.2
I test post-hoc nel caso del confronto fra tre o più campioni dipendenti su
scala ordinale e la realizzazione dei test di Friedman e Page in SPSS
Nel caso dei test post-hoc per il test di Friedman, le ipotesi sono:
H0: Mε1 = Mε2 → la distribuzione dei punteggi, e quindi la mediana, della popolazione 1 è uguale
alla distribuzione dei punteggi, e quindi alla mediana, della popolazione 2
H1: Mε1 ≠ Mε2 → la distribuzione dei punteggi, e quindi la mediana, della popolazione 1 è diversa
dalla distribuzione dei punteggi, e quindi dalla mediana, della popolazione 2
I test post-hoc per il test di Friedman sono molto simili a quelli per il test di Kruskal-Wallis. In
questo caso vengono prese in considerazione le differenze in valore assoluto fra le somme dei
ranghi (R) di due condizioni (e non i ranghi medi, come nel test di Kruskal-Wallis), trasformate a
punto z con la formula:
| R1 − R2 |
z=
nk (k + 1)
6
dove n è il numero totale di soggetti e k il numero di condizioni. I dati necessari sono riportati in
Tabella 1.
Tabella 1 Dati necessari per realizzare i test post-hoc nel caso del test di Friedman
Inizio
3 mesi
6 mesi
Paziente
Punteggio Rango
Punteggio Rango
Punteggio Rango
A
3
5
6
1
2
3
B
4
5
7
1
2
3
C
5
6
7
1
2
3
D
3
3
5
1,5
1,5
3
E
2
1
5
2
1
3
F
1
4
7
1
2
3
G
0
3
2
1
3
2
H
2
2
2
0,33
0,33
0,33
I
3
3
4
1,5
1,5
3
J
2
1
4
2
1
3
Somma
14
18
28
Media
1,4
1,8
2,8
La regola di decisione è:
se |z calcolato| > |z critico| → è troppo improbabile che i dati osservati siano il risultato del fatto che
H0 è vera, per cui la rifiutiamo → la mediana della popolazione 1 è diversa dalla mediana della
popolazione 2
se |z calcolato| < |z critico|→ non è così improbabile che i dati osservati siano il risultato del fatto
che H0 è vera, per cui la accettiamo → la mediana della popolazione 1 è uguale alla mediana
della popolazione 2
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Strumenti Informatici 13.2
2
Per individuare lo z critico dobbiamo tenere conto del numero di confronti che realizziamo per
evitare l’inflazione dell’errore di I tipo, ossia della probabilità di respingere un’ipotesi nulla vera in
almeno un confronto. In questo caso realizziamo k(k−1)/2 = 3(3−1)/2 = 3 confronti, avremo che
αcomaprisonwise = ,05/3 = ,0167, ma dato che l’ipotesi alternativa è bidirezionale dobbiamo trovare lo z
critico per αcomaprisonwise/2 = ,0167/2 = ,0083, che è 2,39. Eseguiamo quindi i confronti:
Inizio vs 3 mesi: z =
Inizio vs 6 mesi: z =
3 mesi vs 6 mesi: z =
| R1 − R2 |
nk (k + 1)
6
| R1 − R2 |
nk (k + 1)
6
| R1 − R2 |
nk (k + 1)
6
=
=
=
| 14 − 18 |
10 × 3 × (3 + 1)
6
| 14 − 28 |
10 × 3 × (3 + 1)
6
| 18 − 28 |
10 × 3 × (3 + 1)
6
= 0,89 < 2,39 → Accettiamo H0
= 3,13 > 2,39 → Rifiutiamo H0
= 2,24 < 2,39 → Accettiamo H0
Conclusione: Possiamo rifiutare l’ipotesi nulla solo nel caso del confronto fra l’Inizio e 6 mesi. I
risultati suggeriscono che la soddisfazione di vita dei pazienti con disturbo di personalità aumenta
nel corso della terapia, ma gli effetti sono evidenti solo dopo 6 mesi.
Rappresentiamo graficamente i dati mediante un box-and-whisker (Figura 1).
Figura 1 Grafico Box-and-whisker del punteggio di soddisfazione di vita di 10 pazienti con disturbo di
personalità in base al momento della rilevazione nel corso della psicoterapia
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Strumenti Informatici 13.2
3
Per calcolare la dimensione dell'effetto dei post-hoc l’indice r calcolato con la formula:
r=
z
nk
dove n = numero di casi e k = numero di osservazioni.
Nel caso che stiamo considerando, n = 10, k = 3, per cui:
Inizio vs 3 mesi: r =
Inizio vs 6 mesi: r =
3 mesi vs 6 mesi: r =
z
nk
z
nk
z
nk
=
0,89
=
3,13
=
= 0,16 → Effetto Piccolo
3 × 10
= 0,57 → Effetto Grande
3 × 10
2,24
3 × 10
= 0,41 → Effetto Moderato
Il test L di Page
Nel caso che abbiamo appena visto era lecito aspettarsi che, se la psicoterapia avesse funzionato, i
punteggi della soddisfazione di vita sarebbero aumentati col procedere della psicoterapia. Le
condizioni, quindi, potevano essere ordinate e si poteva tener conto nell’analisi di questa loro
caratteristica mediante il test per lo studio degli andamenti di Page (Page, 1963)1. L’ipotesi nulla
del test di Page è identica a quella del test di Friedman, mentre l’ipotesi alternativa è la seguente:
H1: MεInizio < Mε3 mesi < Mε6 mesi → i tre campioni di osservazioni non provengono da popolazioni
che hanno la stessa distribuzione del livello di soddisfazione e le mediane delle popolazioni
seguono una tendenza crescente
Tale ipotesi per sua natura è monodirezionale.
Il valore L di Page si calcola mediante una somma ponderata delle somme dei ranghi per ogni
condizione. In pratica, in base alla teoria e/o alle aspettative si assegna rango 1 alla condizione con
la somma dei ranghi minore, 2 alla condizione successiva, 3 a quella che segue, etc. Nel nostro caso
la somma dei ranghi minore è quella della condizione Inizio (14), per cui questa avrà rango 1. A
questo punto, quella che dovrebbe seguire in base alla teoria è la condizione 3mesi, che quindi avrà
rango 2. Infine, la condizione 6mesi avrà rango 3. Calcoliamo il valore L di Page:
k
L = ∑ jR j = R1 + 2 R2 + 3R3 + 4 R4 + ... + kRk
j =1
dove j è la posizione della condizione. Nel nostro caso avremo quindi:
k
L = ∑ jR j = 14 + 2 × 18 + 3 × 28 = 134
j =1
1
Page, E. B. (1963). Ordered hypotheses for multiple treatments: A significance test for linear ranks. Journal of the
Americal Statistical Association, 58, 216-230.
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Strumenti Informatici 13.2
4
Per campioni piccoli, ossia n ≤ 12, esistono delle Tavole per l’individuazione di L critico (vedi
Appendice in questo documento), per cui la regola di decisione sarà:
se |L calcolato| > |L critico| → è troppo improbabile che i dati osservati siano il risultato del fatto
che H0 è vera, per cui la rifiutiamo → vi è un ordinamento fra le mediane delle tre condizioni
se |L calcolato| < |L critico|→ non è così improbabile che i dati osservati siano il risultato del fatto
che H0 è vera, per cui la accettiamo → non vi è un ordinamento fra le mediane delle tre
condizioni
In base alla Tavola di L troviamo che il valore di L critico è 128 (Figura 2)
Figura 2 Individuazione del valore critico di L di Page per numero di soggetti n = 10, numero di condizioni 3 e
livello α di significatività ,05.
Conclusione: Poiché L calcolato > L critico (134 > 128), è troppo improbabile che quanto osservato
sia il risultato di un’ipotesi nulla vera, per cui la rifiutiamo. Questi risultati suggeriscono che molto
probabilmente vi è un ordinamento crescente nel delle mediane delle tre condizioni.
Eventualmente, i test post-hoc possono essere eseguiti come illustrato per il test di Friedman.
Se n > 12, si può utilizzare l’approssimazione alla distribuzione normale standardizzata
mediante la formula:
 nk (k + 1) 2 
L−

4


z=
3
2
n( k − k )
144(k − 1)
La regola di decisione sarà quella che conosciamo:
se |z calcolato| > |z critico| → è troppo improbabile che i dati osservati siano il risultato del fatto che
H0 è vera, per cui la rifiutiamo → vi è un ordinamento fra le mediane delle tre condizioni
se |z calcolato| < |z critico|→ non è così improbabile che i dati osservati siano il risultato del fatto
che H0 è vera, per cui la accettiamo → non vi è un ordinamento fra le mediane delle tre
condizioni
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Strumenti Informatici 13.2
5
A puro scopo illustrativo, vediamo quale sarebbe stato il risultato utilizzando i dati della Tabella 1 e
il valore di L appena calcolato. Se consideriamo un livello di significatività α = ,05, il valore critico
di z a una coda è 1,65.
 nk (k + 1) 2 
10 × 3 × (3 + 1) 2 
L−
 134 − 

4
4

=

 = 3,13
z=
3
2
3
2
n( k − k )
10 × (3 − 3)
144(k − 1)
144 × (3 − 1)
Poiché z calcolato > z critico (3,13 > 1,65), possiamo rifiutare l’ipotesi nulla e concludere come
mostrato in precedenza.
Per calcolare la dimensione dell'effetto per il test L di Page, che per n > 12 viene
approssimato alla distribuzione normale standardizzata, si può utilizzare la trasformazione di z in r,
mediante la formula:
r=
z
nk
=
3,13
3 × 10
= 0,57 → Effetto Grande
Realizzare il test di Friedman e il test di Page con SPSS
In SPSS occorre organizzare i dati in modo appaiato (Figura 3) condizione per condizione e seguire
il percorso Analyze → Nonparametric Tests → K Related Samples (Figura 3) (oppure Analyze →
Nonparametric Tests → Legacy Dialogs → K Related Samples).
Figura 3 Percorso di SPSS per realizzare il test di Friedman
Nella finestra che si apre (Figura 4), le tre variabili che contengono le osservazioni vanno inserite
nel campo Test Variables, e nel riquadro Test Type va spuntato Friedman, che ad ogni modo è
l’opzione di default.
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Strumenti Informatici 13.2
6
Figura 4 Impostazioni di SPSS per la realizzazione del test di Friedman
Le altre due opzioni di analisi sono il test di Cochran (Strumenti Informatici 12.1) e il test W di
Kendall, che verifica l’ipotesi che 3 o più campioni dipendenti provengano dalla stessa popolazione
e che misura l’accordo fra giudici. In altri termini, ogni caso o soggetto è considerato un giudice e
ogni variabile un oggetto o una persona che viene valutata. Il valore del W di Kendall può oscillare
da 0 (nessun accordo) a 1 (accordo perfetto). Exact e Statistics offrono le stesse opzioni degli altri
test non parametrici. In questo senso, scegliere l'opzione Exact dopo aver premuto il bottone Exact
permette di ottenere anche la probabilità esatta, oltre a quella asintotica, ossia quel valore da riferire
nel caso di campioni piccoli.
Il risultato del test di Friedman è riportato in Figura 5
Ranks
Inizio
3 mesi
6 mesi
Mean Rank
1,40
1,80
2,80
Figura 5 Output di SPSS per il test di Friedman
La prima tabella (Ranks) riporta i ranghi medi di ogni condizione, mentre la seconda tabella (test
Statistics) riporta il test di significatività. Per quanto eseguito sugli stessi dati della soddisfazione di
vita dei pazienti con disturbo di personalità in terapia, il valore di chi-quadrato è diverso poiché
SPSS usa un aggiustamento per i punteggi con lo stesso rango diverso da quello illustrato in questo
testo.
Per quanto riguarda l'esecuzione del test L di Page, nemmeno le ultime versioni di SPSS
offrono questa possibilità (per quanto, come vedremo fra poco, consentano l'esecuzione dei posthoc per il test di Friedman). Ad ogni modo, la IBM, che nel momento in cui scrivo è detentrice dei
diritti del software, ha messo a disposizione una sintassi che consente l'esecuzione di questo
particolare test statistico (http://www-01.ibm.com/support/docview.wss?uid=swg21479169) e che
qui ripropongo in versione leggermente modificata.
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Strumenti Informatici 13.2
7
Il problema delle sintassi è che necessitano di essere modificate ogni volta che si esegue
l'analisi su un campione diverso, me in questo caso la cosa è relativamente semplice. Innanzitutto
apriamo una finestra di sintassi in SPSS seguendo File→New→Syntax. Incolliamo poi il seguente
testo (si ignorino i numeri di riga, che servono da riferimento per i commenti successivi).
1
2
3
4
5
6
7
8
9
10
11
12
13
DATA LIST LIST / mesi6 mesi3 inizio.
BEGIN DATA
356
457
567
335
215
147
032
222
334
214
END DATA.
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
FLIP.
RANK VARIABLES=var001 TO var010
/PRINT=NO .
COMPUTE sumranks=SUM(Rvar001 TO Rvar010).
COMPUTE varrank=$CASENUM.
COMPUTE l=varrank*sumranks.
MATRIX.
GET ldata /VAR=l.
GET dimens /VAR=var001 TO var010.
COMPUTE l=MSUM(ldata).
COMPUTE n=NROW(dimens).
COMPUTE k=NCOL(dimens).
COMPUTE z=SQRT(((12*l-3*k*n*(n+1)**2)**2)/(k*n**2*(n**2-1)*(n+1))).
COMPUTE sig1tail=CDFNORM(-abs(z)).
COMPUTE sig2tail=sig1tail*2.
PRINT {z,sig2tail,sig1tail}.
END MATRIX.
Il risultato è quello di Figura 6.
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Strumenti Informatici 13.2
8
Figura 6 Finestra di sintassi di SPSS con il testo necessario per realizzare il test L di page
Innanzitutto occorre avere un file di dati di SPSS aperto, anche vuoto.
Una volta incollata la sintassi nel file di sintassi, occorre eventualmente modificare i nomi
delle variabili alla riga 1. In questo caso si sono scelti i nomi mesi6 mesi3 e inizio. Si presti
attenzione a due cose: primo, i nomi delle variabili non devono contenere più di 8 caratteri, non
possono iniziare con un numero, non possono contenere spazi (si può però utilizzare l'underscore
"_") o altri caratteri particolari. Secondo, vanno messi in ordine contrario a quello ipotizzato in
ipotesi alternativa (che in questo esempio è MεInizio < Mε3 mesi < Mε6 mesi). Si noti inoltre che dopo
l'ultimo nome delle variabili va inserito un punto a chiudere la riga di comando.
A partire dalla riga 3 iniziano i dati, che vanno inseriti come solo testo, con le colonne
separate da uno spazio. Per ottenere facilmente i dati in questo formato, basta avere i dati in un file
di Excel. Selezioniamo la matrice che contiene i dati, tasto destro del mouse, Copia e incolliamo in
un file di Word. I dati incollati sono in formato tabella. Dopo aver selezionando tutta la tabella,
basta andare al menu Tabella (vecchie versioni di Word) o Layout (nuove versioni di Word, estrema
destra della barra degli strumenti nella parte superiore della pagina) e scegliere Converti in testo. Si
aprirà una finestra nella quale selezioniamo Altro e nel campo relativo inseriamo uno spazio con la
barra spaziatrice (Figura 7).
Figura 7 Convertire una tabella in testo separato da spazio in Word
A questo punto i dati sono pronti per essere copiati e incollati nel file di sintassi di SPSS fra i
comandi BEGIN DATA e END DATA.
Le altre righe che dobbiamo ricordarci di modificare ogni volta sono le righe 16 e 18. In
questo esempio abbiamo var010, in quanto sono dieci i soggetti in esame. Il valore numerico dopo
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Strumenti Informatici 13.2
9
var deve quindi corrispondere al numero di soggetti della vostra analisi, per cui avrete var006 se
avete sei soggetti, var020 se ne avete 20, e così via.
in alto nella barra degli strumenti del file di sintassi e
A questo punto clickate sul tasto
nel file di output otterrete l'output di Figura 8
Figura 8 Risultato dell'analisi L di page eseguita con la sintassi di SPSS
Il valore di z calcolato in Figura 8 è lo stesso che abbiamo ottenuto in precedenza. Gli altri valori
sono la probabilità per l'ipotesi alternativa a due e una coda, rispettivamente da sinistra a destra. I
test post-hoc possono essere eseguiti come abbiamo visto per il test di Friedman.
Nelle più recenti versioni di SPSS sono stati implementati anche i test post-hoc per il test di
Friedman. A questo punto seguiamo Analyze→Nonparametric Tests→ Related Samples (Figura
9a), nella finestra che si apre (Figura 9b) selezioniamo la linguetta Fields, e inseriamo le variabili
che rappresentano le misure ripetute Test Fields (Figura 9c; NB: tali variabili, come abbiamo visto
nel caso del test di Page, devono essere state definite come Scale, quindi prima di eseguire l'analisi
vale la pena controllare nel foglio Variable View che le variabili siano così definite nella colonna
Measure, la seconda da destra). Selezioniamo poi la linguetta Settings e qui spuntiamo Customize
tests, e poi Kruskal-Wallis 1-way ANOVA (k samples) e Test for ordered alternatives (JonckheereTerpstra for k samples). Le opzioni di default per i post-hoc sono in entrambi i casi All pairwise
(Figura 9d).
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Strumenti Informatici 13.2
10
(a)
(b)
(c)
(d)
Figura 9 Impostazione per il test di Friedman con SPSS
A questo punto clickiamo Run e otteniamo nel file di output il risultato, che è una singola tabella
con il risultato del test omnibus (Figura 10)
Figura 10 Output di base di SPSS per il test di Friedman
Facendo doppio click col tasto destro del mouse sulla tabella, però, si apre la finestra Model Viewer
nella quale troviamo tutta una serie di informazioni. In particolare, nella parte destra della finestra
troviamo un grafico e i dettagli del test (Figura 11). Il valore di chi-quadrato è diverso da quello del
manuale poiché SPSS usa una formula diversa.
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Strumenti Informatici 13.2
11
Figura 11 Model viewer di SPSS per il test di Friedman
Nella parte bassa della finestra, è possibile modificare il menu View da Related Samples Test View a
Pairwise Comparisons (Figura 12).
Figura 12 Richiedere i risultati dei test post-hoc per il test di Friedman
I risultati dei test post-hoc sono di fatto gli stessi di quelli ottenuti col calcolo manuale (Figura
13Errore. L'origine riferimento non è stata trovata.).
Figura 13 Risultati dei test post-hoc per il test di Friedman
Il diagramma in Errore. L'origine riferimento non è stata trovata. permette una rapida
visualizzazione dei risultati dei post-hoc in quanto le linee nere uniscono coppie di gruppi i cui
punteggi non sono statisticamente diversi, mentre le linee gialle quelli in cui la differenza è
statisticamente significativa.
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Strumenti Informatici 13.2
12
Per realizzare il grafico, dobbiamo utilizzare un boxplot. Seguiamo Graph → Boxplot (o nelle
versioni più recenti Graph → Legacy Dialogs → Boxplot), scegliamo Summaries of separate
variables e nella nuova finestra inserire le variabili Inizio, Mesi3 e Mesi6 nel campo Boxes
Represent, lasciando il resto invariato. Il risultato sarà quello di Figura 1.
Riportare i risultati
In un articolo scientifico o in una tesi di laurea riporteremo la tabella con le statistiche descrittive, il
grafico in Figura 1 e scriveremo:
E’ stato eseguito un test di Friedman per verificare se vi erano differenze nelle
mediane del livello di soddisfazione di vita in tre diversi momenti della psicoterapia
(Inizio, dopo 3 mesi, dopo 6 mesi). Il test si è rivelato significativo, X2 (2, n = 10) =
12,24, p = ,002, w = 0,59. I successivi test post-hoc, eseguiti con correzione
Bonferroni del livello di significatività, hanno mostrato come l’unica differenza
significativa fosse quella fra Inizio e 6 mesi (z = 3,13, p = ,005; r = 0,57), con livello
di soddisfazione di vita maggiore dopo 6 mesi. Il test L di Page ha mostrato che vi è
una significativa tendenza all’aumento della soddisfazione di vita nel corso del tempo
(z = 3,13, p < ,001, r = 0,57).
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Chiorri, C. (2014). Fondamenti di psicometria - Strumenti Informatici 13.2
13
Appendice
Valori critici di L per il test di Page sull’andamento in campioni dipendenti
n
2
3
4
5
6
7
8
9
10
11
12
α
,001
,01
,05
,001
,01
,05
,001
,01
,05
,001
,01
,05
,001
,01
,05
,001
,01
,05
,001
,01
,05
,001
,01
,05
,001
,01
,05
,001
,01
,05
,001
,01
,05
3
28
42
41
56
55
54
70
68
66
83
81
79
96
93
91
109
106
104
121
119
116
134
131
128
147
144
141
160
156
153
Numero condizioni
4
5
109
60
106
58
103
89
160
87
155
84
150
117
210
114
204
111
197
145
259
141
251
137
244
172
307
167
299
163
291
198
355
193
346
189
338
225
403
220
393
214
384
252
451
246
441
240
431
278
499
272
487
266
477
305
546
298
534
292
523
331
593
324
581
317
570
6
178
173
166
260
252
244
341
331
321
420
409
397
499
486
474
577
563
550
655
640
625
733
717
701
811
793
777
888
869
852
965
946
928
Copyright ©2014 The McGraw-Hill Companies S.r.l., Publishing Group Italia