Studi caso-controllo - Università degli Studi di Cassino

Studi caso-controllo
Con gli studi di tipo descrittivo e trasversale si
possono formulare ipotesi sulla presenza di
fattori di rischio, ma non dimostrare la presenza
reale di un nesso causale tra il fattore e la
malattia: ciò può essere possibile invece negli
studi caso-controllo e di coorte.
Lo
studio
caso-controllo
è
tipicamente
retrospettivo, nel senso che si raccolgono
informazioni sul passato, ovvero dopo che la
malattia si è già verificata e sono noti coloro che
sono malati (i casi) e coloro che non lo sono (i
controlli).
Esempio:
Grande cena per un matrimonio. Il giorno dopo la
cena, tra i 600 invitati si verificano 200 casi di
intossicazione
alimentare
con
febbre,
dissenteria e dolori addominali.
Questi 200 ammalati rappresentano i “casi”,
mentre i 400 sani sono i “controlli”.
La prima azione in questi casi è raccogliere
informazioni sugli alimenti consumati durante la
cena, e creare una serie di tabelle 2x2 per ogni
alimento.
Dalla tabella 2x2 del gelato alla crema, ad esempio,
si nota come la percentuale di soggetti che hanno
consumato il gelato sia 7 volte più elevata tra i
casi (i malati) rispetto ai controlli (i sani).
Casi
(malati)
Controlli
(sani)
Totale
Esposti
(consumo
di gelato)
140
40
180
Non esposti
(no gelato)
60
360
420
Totale
200
400
600
In questo caso, è ovvio ipotizzare che il gelato alla
crema possa essere stato contaminato.
Ma sono necessarie a questo punto due ulteriori
precisazioni. In primo luogo, 60 soggetti hanno
contratto
l’intossicazione
nonostante
non
abbiano consumato il gelato.
Per tale motivo, si dovrebbe valutare se anche
altri alimenti risultano associati alla patologia.
In secondo luogo, occorre tenere presente
bias
ecologico
(o
l’eventualità
di
un
confondimento).
Se infatti, valutando le altre tabelle 2x2 relative
agli altri alimenti, risultasse che tutti e 200 i
casi avevano consumato le tartine al salmone e
solo 10 dei 400 controlli le avevano toccate,
sembra evidente ritenere
che l’alimento
realmente responsabile dell’intossicazione non
sia il salmone, bensì le tartine.
Il fatto che dei 200 che avevano consumato le
tartine 140 avessero consumato anche il gelato,
ci ha fatto incorrere nel più classico dei
confondimenti.
Le persone alle quali piaceva il gelato erano
evidentemente le stesse alle quali piacevano le
tartine.
Casi
(malati)
Controlli
(sani)
Totale
Esposti
(consumo
di tartine)
200
10
210
Non esposti
(no tartine)
0
390
390
Totale
200
400
600
La metodologia tipica degli studi caso-controllo è
retrospettiva, e prevede che si sappia già chi
sono i casi e chi sono i controlli.
E’ chiaro che tale metodologia può non essere
semplice come nell’esempio appena illustrato: i
casi e i controlli devono essere il più possibile
simili per quanto concerne gli aspetti
demografici e devono provenire dalla stessa
popolazione.
Per chiarire meglio questo concetto, veniamo a
pregi e difetti di questo tipo di studio.
Gli studi caso-controllo sono abbastanza semplici,
solitamente brevi e poco costosi.
Tuttavia, hanno una serie di difetti molto
importanti.
In primo luogo, poiché devono essere già noti i
malati e i sani, non permettono di calcolare
l’incidenza, cioè il numero di nuovi casi nella
popolazione in un determinato periodo di tempo,
perché si conosce solo il numero di casi che già ci
sono.
In secondo luogo, poiché i rilevamenti sono svolti
sul passato, i dati potrebbero non essere
attendibili.
Infine, nel caso l’espisizione fosse rara (ovvero nel
caso in cui l’alimento incriminato fosse stato, ad
esempio, consumato solo da 5 persone), sarebbe
molto difficile provare l’esistenza reale di
un’associazione. Visti dei numeri così scarsi, il
margine di errore sarebbe molto elevato.
Per queste ragioni, quando è possibile si preferisce
svolgere uno studio di coorte, più preciso e
affidabile. Tuttavia, gli studi caso-controllo sono
molto diffusi in diverse situazioni in cui non è
possibile effettuare uno studio di coorte.
In primo luogo, quando vi sono pochi fondi e non si
è certi della relazione che si intende studiare, è
sempre utile svolgere prima uno studio casocontrollo, e solo nel caso che questo confermi
l’ipotesi, provare uno studio di coorte.
In secondo luogo, esistono tante situazioni in cui
davvero uno studio di coorte risulta impossibile,
e l’unico disegno di studio praticabile è il casocontrollo.
Ciò si verifica, ad esempio, quando la patologia da
studiare è rara.
Tipicamente, tante patologie di tumori rare sono
studiate tramite studi caso-controllo
Studi Caso-Controllo
Esposti
Non esposti
Esposti
Non esposti
Passato
Malati
Non
malati
Presente
Retrospettivi
Futuro
Uno studio caso-controllo
Casi
Controlli
Misure di frequenza: prevalenza e
incidenza
Le misure epidemiologiche fondamentali, che
derivano
solitamente dalle tabelle 2x2,
rappresentano i risultati finali che si ottengono
dagli studi epidemiologici.
In altri termini, si conducono gli studi
epidemiologici proprio per arrivare ad ottenere
queste misure.
Conoscere il significato dei termini prevalenza,
incidenza e rischio relativo è un prerequisito
indispensabile per chiunque si trovi a decidere di
(o a commentare su…) politiche di intervento,
perché esse devono basarsi sui risultati di
evidenze scientifiche, e queste evidenze sono
proprio gli studi epidemiologici.
Prevalenza
Sebbene esprimano due concetti simili, si
distinguono due tipi di prevalenza: la prevalenza
puntuale e quella periodale.
La prevalenza puntuale ad es. di una determinata
patologia è il rapporto tra il n. di malati presenti
in una popolazione in un certo momento e il n.
totale di individui (malati e non) in quella
popolazione in quel momento.
Si tratta quindi della fotografia di una particolare
situazione in un momento specifico, da noi scelto.
La prevalenza puntuale è una semplice percentuale
e varia da 0 a 100% (o da 0 a 1).
La prevalenza che incorpora il fattore “tempo”
viene chiamata prevalenza periodale.
E’ data dal rapporto tra il n. di malati (vecchi e
nuovi) presenti in una popolazione durante un
determinato periodo di tempo, e il n. totale di
soggetti di quella popolazione nello stesso
periodo di tempo.
In ogni caso, sia la prevalenza puntuale che quella
periodale esprimono lo stesso concetto di fondo:
la prevalenza è un indice della probabilità di
essere malati in un certo momento (puntuale)
o periodo (periodale).
Prevalenza puntuale =
N. di malati presenti nella popolazione in un determinato momento
_________________________________________
N. totale di persone (malati e sani) nella popolazione
Prevalenza periodale=
N. di malati (vecchi e nuovi) presenti nella popolazione in un certo
periodo
_________________________________________________
N. totale di persone (malati e sani) nella popolazione in quel
periodo
Per chiarire quanto detto, prendiamo come
esempio una patologia di lunga durata come la
tubercolosi (può durare da pochi mesi a diversi
anni).
Se noi volessimo calcolare la prevalenza periodale
di tubercolotici in Italia nell’anno 2005, al
numeratore dovremmo sommare i casi già
esistenti di TBC al 1 gennaio, e tutti i casi che
invece si sono ammalati durante l’anno, fino al 31
dicembre (i “nuovi” casi).
Al denominatore dovremmo invece mettere la
media della popolazione italiana durante l’anno
2005.
In conclusione, è chiaro che la prevalenza puntuale
comprende al numeratore solo coloro che sono
già malati in quel momento, ed è quindi una stima
della probabilità di essere malati in quel
momento preciso.
Se essa, ad es., è pari a 3.3%, ciò significa che ogni
individuo di quella popolazione ha il 3.3% di
probabilità di essere malato della patologia che
si sta valutando.
La prevalenza periodale è molto simile: il fatto che
essa includa al numeratore sia i casi vecchi sia
quelli nuovi fa sì che anch’essa sia una misura
della probabilità di essere malati, ma in un
determinato periodo.
In ogni caso, il dato è molto importante: per es.,
conoscere la prevalenza di malati di TBC
nell’anno 2012 permette di programmare quanti
farmaci ordinare per l’anno successivo, il n. di
posti letto dedicati ai reparti di Pneumologia etc.
Incidenza
Mentre la prevalenza include al numeratore tutti i
casi di malattia, sia vecchi sia nuovi, l’incidenza
viene invece calcolata escludendo tutti i casi
“vecchi”, ovvero gli individui già malati al
momento della rilevazione, sia dal numeratore
che dal denominatore.
Infatti, l’incidenza è il rapporto tra il n. di nuovi
casi di malattia che si verificano in un certo
periodo di tempo in una popolazione e il n.
complessivo di persone che compongono questa
popolazione e che possono essere a rischio di
insorgenza di malattia in quel periodo.
Incidenza cumulativa=
N. di nuovi casi malattia nella popolazione in un determinato
periodo
_____________________________________________
N. totale di persone sane nella popolazione all’inizio di quel periodo
Tasso di incidenza=
N. di nuovi casi malattia nella popolazione in un determinato
periodo
_________________________________________________
N. totale di unità di tempo di osservazione
Esempio:
L’incidenza di TBC in Italia nel 2005 è pari al n. di
persone che si sono ammalate di TBC nel corso
del 2005, diviso per un n. che deriva dalla media
della popolazione italiana nel 2005, sottratta di
quegli individui che erano già malati all’inizio
dell’anno, e che non potevano quindi riammalarsi.
L’incidenza quindi, rispetto alla prevalenza, misura
solo i nuovi casi e non tutti i casi.
Per questo motivo, i casi vecchi devono anche
essere esclusi dal totale della popolazione (dal
denominatore), poiché essendo già malati non
potrebbero riammalarsi.
Misure di associazione: rischio
relativo e affini
Insieme alle principali misure di frequenza
(prevalenza e incidenza), le misure di
associazione
rappresentano
le
misure
fondamentali di tutti gli studi epidemiologici.
Rischio relativo:
Il Rischio relativo (RR) viene calcolato partendo da
una tabella 2x2. Esso è sempre riferito a una
patologia
(o
evento
che
ci
interessa,
comunemente chiamato outcome), e a un fattore
di rischio o esposizione.
Se ad es. la nostra esposizione è il fumo e la
nostra patologia è il tumore del polmone, il
rischio relativo ci dice quanto i fumatori (gli
esposti) sono a rischio di sviluppare un tumore
rispetto ai non fumatori (i non esposti).
Facendo un altro esempio, prendiamo stavolta
come esposizione le radiazioni ionizzanti (a basse
dosi); la patologia è il tumore della tiroide.
Le radiazioni ionizzanti sono associate a un
maggior rischio di sviluppare il cancro della
tiroide. Tuttavia, se questo rischio non fosse più
alto dello 0.01% non ci preoccuperemmo più di
tanto, mentre se fosse del 10% dovremmo fare
molta attenzione.
Tutta l’epidemiologia si basa sul concetto di
esposizione associata a malattia, ma questa
associazione va assolutamente quantificata.
Il rischio relativo risulta quindi fondamentale
poiché fornisce una stima della forza
dell’associazione tra fattore di rischio e
malattia.
Esso non è altro che il rapporto tra l’incidenza di
malattia negli esposti e l’incidenza di malattie
nei non esposti.
Esempio: richiamiamo la tabella già fornita per gli
studi di coorte. In questa tabella avevamo visto
che l’incidenza di patologie respiratorie negli
esposti (tassisti di città più inquinate) era pari al
25%, mentre la percentuale nei non esposti
(tassisti di città meno inquinate) era pari al 20%.
Studi di coorte: tabella 2x2
Malati
Sani
Totale
Esposti
(residenti in città
inquinate)
100
300
400
Non esposti
(residenti in città
meno inquinate)
60
240
300
Totale
160
540
700
Riferendoci a questo esempio, il RR è molto facile
da calcolare: basta dividere l’incidenza negli
esposti (100/400 x 100) per quella nei non
esposti (60/300 x 100).
Nel nostro caso, quindi, il RR sarà 25%/20% =
1.25%.
Il dato ottenuto significa che gli esposti hanno un
rischio di sviluppare patologie respiratorie più
alto del 25% rispetto ai non esposti.
Come è facilmente intuibile considerando che esso
è un rapporto, il RR può assumere valori compresi
tra 0 e infinito.
RR = 1 ----------
l’esposizione non è
associata alla malattia
RR > 1 ----------
l’esposizione è associata a
un maggior rischio di
malattia – fattore di
rischio
RR < 1 ----------
l’esposizione è associata a
un minor rischio di
malattia – fattore
protettivo
Se il RR risulta un valore maggiore di 1, questo
significa che la percentuale di malati negli
esposti (numeratore) è più grande della
percentuale di malati nei non esposti
(denominatore).
Di conseguenza, concluderemo che l’esposizione è
associata a un maggior rischio di malattia, ovvero
essa è un fattore che predispone allo sviluppo
della stessa.
Se invece il RR risulta minore di 1, questo significa
che il denominatore (malati tra i non esposti) è
più alto del numeratore (malati tra gli esposti).
Ovviamente ciò ci porta a pensare che il rischio sia
minore tra gli esposti, e quindi che l’esposizione
sia un fattore protettivo (es. carnagione scura
associata a un RR < 1 per il melanoma)
Odds Ratio:
Nonostante il RR sia una misura fondamentale,
esso può essere calcolato negli studi di coorte
ma non negli studi trasversali o caso-controllo.
Questo perché solo negli studi di coorte è
possibile calcolare l’incidenza, da cui il RR deriva.
Per gli studi caso-controllo o trasversali, la misura
utilizzata è l’Odds ratio (OR).
Anche l’OR come il RR, è una stima della forza di
un’associazione tra un’esposizione e una
patologia, e va interpretata in tutto e per tutto
in modo analogo al RR.
Per comprendere questa misura, occorre
introdurre il concetto di "odds" (termine che non
ha un corrispondente in italiano; può essere reso
con "probabilità a favore"). Gli odds sono
rappresentati dal il rapporto fra il numero di
volte in cui l'evento si verifica (o si è verificato)
ed il numero di volte in cui l'evento non si
verifica ( o si è verificato).
Gli odds si utilizzano nel mondo delle scommesse,
perché consentono allo scommettitore di
calcolare facilmente la somma da incassare.
Ad esempio, la vittoria della nazionale italiana di
calcio nella semifinale Italia-Francia ai mondiali
del 1998 era data dai bookmakers a 4:1 "a
sfavore". Questo equivale a dire che, su una
scala da 1 a 5, le probabilità di sconfitta (p)
dell'Italia erano considerate 4 volte più alte di
quelle di una sua vittoria (1-p), e quindi la vittoria
dell’Italia sarebbe stata pagata 4 volte la cifra
scommessa [per i curiosi: vinse la Francia 4-3 ai
rigori].
L'"odds ratio" si calcola attraverso i semplici
rapporti (odds) fra le frequenze osservate e non
attraverso le proporzioni.
Notare che si utilizzano i semplici rapporti tra le
frequenze osservate (a/c, b/d) e non le
proporzioni (a/a+c e b/b+d). Notare anche che,
applicando le proprietà delle frazioni, l'odds
ratio può venire più facilmente calcolato
attraverso i prodotti delle celle incrociate della
tabella (a*d e b*c); perciò viene anche detto, in
italiano, "rapporto incrociato".
Calcolo dell’Odds ratio:
Malattia
Esposizione
OR = a/c
+
-
+
A
B
-
C
D
axd
------ = -------
b/d
bxc
In termini matematici, non è importante se l'OR
viene calcolato come (a/c)/(b/d) oppure come
(a/b)/(c/d), perché in entrambi i casi si ottiene
lo stesso rapporto incrociato: ad/bc. Tuttavia, in
termini razionali non ha senso usare la seconda
formula. Infatti in uno studio retrospettivo, il
rapporto a/b (così come il rapporto c/d), non
dipende dalla malattia né dall'esposizione, ma
bensì soltanto dallo sperimentatore stesso che
ha avuto libertà di reclutare un numero di casi e
di controlli a suo piacimento.
Esempio:
Vogliamo capire se l’uso di lampade abbronzanti
superiore a 5 volte al mese con regolarità è
associata a un maggior rischio di melanoma.
Finito lo studio, con i dati dei 600 partecipanti
possiamo costruire una tabella 2x2.
La frequenza di esposti tra i casi è del 10%,
mentre tra i controlli è solo del 2.5%
E’ possibile calcolare la nostra OR che sarà pari a
4.3 (20x390)/(10x180).
Questo valore significa che chi fa uso di lampade
abbronzanti almeno 5 volte al mese ha circa 4
volte in più il rischio di ammalarsi di melanoma
rispetto a chi ne fa un uso minore.
Casi
Controlli
Totale
Esposti
(5 o più lampade
UV al mese)
20
10
30
Non esposti
(meno di 5
lampade UV
al mese)
180
390
570
Totale
200
400
600
Riprendiamo la tabella 2x2 relativa a uno studio
trasversale. Se dobbiamo calcolare il RR di
essere stressati, questo sarebbe pari a
16.7%/3% = 5.6.
Ciò significherebbe che gli esposti rispetto ai non
esposti hanno un rischio pari circa a 6, ovvero
superiore del 500% di avere un forte stato di
stress. Questo RR in particolare descrive il
rapporto tra due prevalenze, non tra due
incidenze, ed è anch’esso denominato RR, più
specificatamente RR di prevalenza (Prevalence
Ratio).
Il
Prevalence
Ratio
esprime
la
forza
dell’associazione tra un fattore e la presenza di
malattia, non l’insorgenza della stessa (che è
misurata dal RR classico, basato sull’incidenza)
Malati
(forte stress)
Non malati
(no stress)
Totale
Esposti
(fumatori)
50
250
300
Non esposti
(non fumatori)
21
679
700
Totale
71
929
1000
Risultati dello studio
Percentuale (prevalenza puntuale) di stressati nel
campione totale = 71/1000 = 7.1%
Percentuale (prevalenza puntuale) di stressati negli
esposti = 50/250 = 16.7%
Percentuale (prevalenza puntuale) di stressati nei non
esposti = 21/700 = 3%
Rischio relativo di essere stressati = 16.7%/3% = 5.6
(prevalence ratio)
Odds ratio di essere stressati = (50x679)/(21x250)
= 6.5
Essendo anche l’OR una misura di rischio relativo,
esso può assumere valori da 0 a infinito, e
l’interpretazione è identica al RR.
Però, a causa della modalità di calcolo, l’OR è
spesso meno preciso dell’RR nella stima della
forza di un’associazione, e questo deve
assolutamente essere tenuto presente.
In particolare, l’OR tende ad aumentare i risultati:
l’OR è sempre più alto del RR se questo è
maggiore di 1; è invece sempre più basso se
questo è minore di 1.
Tale approssimazione è trascurabile negli studi in
cui l’incidenza o la prevalenza della malattia siano
relativamente basse (meno del 15%) nel campione
(sia negli esposti sia nei non esposti): in questi
casi l’OR e il RR sono quasi coincidenti.
La differenza tra OR e RR diviene invece tanto più
grande quanto più l’incidenza e la prevalenza sono
elevate.
La sovrastima della forza dell’associazione da
parte dell’OR è tanto più marcata quanto più si
nota un’incidenza o prevalenza elevata.
Nell’esempio precedente, si può notare come, a un
valore di prevalenza puntuale pari al 16.% negli
esposti, l’RR sia pari a 5.6, mentre l’OR risulti
6.5.
Se ci basiamo sul RR concludiamo che il rischio per
gli esposti è maggiore del 460%, mentre se ci
basiamo sull’OR concludiamo invece che il rischio
è superiore del 560%
A rigore, l‘OR non è una autentica misura del
rischio in quanto si riferisce alla probabilità di
avere già una malattia, mentre nel termine
"rischio" è implicita l'idea di un evento che si
verificherà in futuro. Tuttavia, se si suppone che
la durata media della malattia negli esposti sia
simile a quella nei non-esposti (e che la malattia
non influenzi lo stato di esposizione), allora l‘OR
rappresenta una buona misura del rischio
relativo.
Negli studi retrospettivi caso-controllo, dove
non viene studiata l'efficacia di un intervento ma
piuttosto il nesso causale tra un outcome già
presente al tempo zero e una pregressa
esposizione a qualche fattore che si suppone in
grado di condizionare l'outcome, l'OR è l'unica
unità di misura che può essere utilizzata per
descrivere l'avvenuta esposizione.