Statistical methods in longitudinal studies

Tilastomenetelmiä
lääketieteessä
Jouko Miettunen, Professori, Akatemiatutkija
Elinikäisen terveyden tutkimusyksikkö
Oulun yliopisto
[email protected]
Sisältö

Tilastomenetelmien valinta

Regressiomallit

Monitestaus

Tilastollinen voima

Lähteitä
2
Menetelmän valinta (2 ryhmää)
EI, koska laatua
mittaava vaste
Voiko
keskiarvoa
käyttää?
EI, koska
vasteen jakauma
hyvin vino
Kyllä
Ristiintaulukko
- prosentit
- khiin neliötesti
Vertaile keskiarvoja
ryhmien välillä
- kahden
riippumattoman
ryhmän t-testi
Ilmoita mediaanit
- parametriton
testi: MannWhitneyn testi
Menetelmän valinta (> 2 ryhmää)
Ei, koska vaste
laatua mittaava
Voiko
keskiarvoa
käyttää?
Ei, koska vasteen
jakauma hyvin
vino
Kyllä
Muodosta
ristiintaulukko
Vertaile keskiarvoja
ryhmissä
- muista prosentit
- ryhmittäiset
tunnusluvut
- khin neliön
testi
-varianssianalyysi
Ilmoita mediaanit
Valitse parametriton
testi
- KruskalWallisin testi
Regressiomallit
Tutkitaan yhden tai useamman selittävän
muuttujan vaikutusta selitettävään muuttujaan

Logistinen regressioanalyysi
Lineaarinen regressioanalyysi
Coxin regressioanalyysi

Poissonin regressioanalyysi


5
Uhari ja Nieminen (2001). Epidemiologia ja Biostatistiikka.
6
Logistinen regressioanalyysi



Vaste on kaksiluokkainen, esim.
Kyllä/Ei, Sairas/Terve
Ennustemuuttujat (altisteet) voivat olla
kaksiluokkaisia tai jatkuvia
Kovariaatit joko aiemmin tunnettuja
tekijöitä tai aineistoon perustuvia
sekoittavia tekijöitä


Liittyvät sekä altisteeseen että vasteeseen
Muuttujien lukumäärä riippuu
aineiston koosta
7
Example question
Northern Finland 1966 Birth Cohort



What predicts rehospitalization in psychoses?
N = 158 hospital treated cases
Exposure variables






sex
father’s social class (1980)
familial risk
onset age
length of first hospitalization
diagnosis (schz / other psychosis)
8
SPSS Output (1)
Categorical Variables Codings
Fathers social class 1980
Parent has psychotic dg 1972-2000
Sex
Diagnosis
Length of first hospitalization
I,II
III,IV
V
no
yes
male
female
schizophrenia
other psych
< 1 month
> 1 month
Frequency
48
96
14
133
25
93
65
108
50
94
64
Parameter coding
(1)
(2)
,000
,000
1,000
,000
,000
1,000
,000
1,000
1,000
,000
1,000
,000
1,000
,000
9
SPSS Output (2)
Odds Ratio (OR)
Variables in the Equation
Length of 1st hospital.(1)
Sex(1)
Onset age
Diagnosis(1)
FSC 1980
FSC 1980(1)
FSC 1980(2)
Parental psych(1)
Constant
B
1,048
-,559
-,047
,839
S.E.
,375
,366
,043
,385
,309
,109
,612
,488
,392
,647
,513
1,100
Wald
7,805
2,331
1,199
4,740
,651
,622
,028
1,423
,197
p-arvo
df
1
1
1
1
2
1
1
1
1
Sig.
,005
,127
,274
,029
,722
,430
,866
,233
,657
Exp(B)
2,852
,572
,954
2,314
1,362
1,115
1,845
1,629
95,0% C.I.for EXP(B)
Lower
Upper
1,367
5,948
,279
1,172
,876
1,038
1,087
4,926
,632
,314
,675
2,934
3,960
5,045
OR:n 95% luottamusväli
10
Elinaika-analyysi
(survival analysis)

Tutkitaan aikaan kahden tapahtuman
välillä





Syntymästä sairastumiseen
Sairastumisesta kuolemaan
Hoidon lopusta relapsiin
Jne.
Kaplan-Meier mallilla ennustetaan
tapahtuman todennälöisyytte ajan eri
pisteissä
11
Elinaika-analyysi

Tarvitaan tieto
 Tapahtuma (0,1)
 Aika tapahtumaan (päiviä, kuukausia
tms.) tai sensorointiin
 Seuranta lopetetaan (sensuroidaan)
 Seuranta-aika loppuu
 Menetetään kontakti (esim. muutto)
 Henkilö kuoleen muusta syystä
12
Example question
Northern Finland 1966 Birth Cohort



What predicts age of suicide?
People alive and living in Finland at
16 years (N=10,934)
Data till end of 2001




58 (0.5%) suicides
140 (1.3%) other deaths
10,736 (98.2%) alive
Predictor variable:

family type at birth (full, single)
13
SPSS Output (1)
Survival Functions
1,000
,999
,998
,997
,996
,995
family type 1966
,994
Cum Survival
,993
full
,992
full-censored
,991
single
,990
,989
single-censored
15
20
25
30
35
age (years)
Test Statistics for Equality of Survival Distributions
log rank test, p=0.002
14
Example question (2)
Age of suicide and family type
 Possible confounding variables






sex
social class 1966 (I-II,III-IV,V)
average school mark at 14
psychiatric diagnosis (no, yes)
crime (no, violent, non-violent)
Coxin regressioanalyysi
15
SPSS Output (3)
Cox regression analysis
Categorical Variable Codings
Sex
1=male
2=female
Psych dg 0=healthy
1=any dg
Fathers Social 1=I,II
Class 1966
2=III,IV
3=V
Marital status 1=single
2=full
Criminality 0=no crimes
1=violent
2=nonviolent
Frequency
5425
5222
10197
450
783
7823
2041
1975
8672
10019
200
428
Family type
1966
(1)
(2)
1
0
0
1
0
1
0
1
0
0
1
0
0
0
1
0
0
1
16
SPSS Output (4)
Cox regression analysis
Variables in the Equation
B
SEX
PSYCH DG
FAM TYPE
FSC 1966
FSC 1966(1)
FSC 1966(2)
SCHOOL MARK
CRIMES
CRIMES(1)
CRIMES(2)
,812
2,463
,728
SE
,340
,303
,287
,451
,536
-,276
,715
,436
,164
,239
-1,011
,454
,625
Wald
5,720
66,085
6,429
1,514
,398
1,513
2,825
3,398
,276
2,613
df
1
1
1
2
1
1
1
2
1
1
Sig.
,017
,000
,011
,469
,528
,219
,093
,183
,600
,106
Exp(B)
2,253
11,740
2,072
95,0% CI for Exp(B)
Lower
Upper
1,158
4,383
6,483
21,260
1,180
3,637
1,570
1,710
,759
,386
,727
,550
6,377
4,018
1,047
1,269
,364
,521
,107
3,093
1,239
17
Analysis of variance

ANOVA


MANOVA


Same measurements are made several times
on each subject
ANOVA, MANOVA and rANOVA


Several continuous outcome variables
Repeated measurements ANOVA


One continuous outcome (dependent) variable
Only categorical predictors
ANCOVA, MANCOVA, rANCOVA

Also continuous predictors
18
Example question
Difference in size of hippocampus
 Northern Finland 1966 Birth Cohort



Follow-up study 1999-2001
Schizophrenia patients (N=56) vs.
healthy controls (N=104)
Repeated measurements ANCOVA

Measurements of right and left side
were thought as repeated measurements
19
Example table
Schizophrenia and Comparison subjects
Hippocampus volumes
Model 1
Within effect: side
Diagnosis
Gender
Model 2
Within effect: side
Covariate: brain vol.
Diagnosis
Gender
Familial psychosis
Perinatal risk
Handedness
F
Sig.
20.3
1.2
6.5
< 0.001
0.28
0.01
0.81
35.0
< 0.01
0.7
1.9
0.8
0.3
0.37
< 0.001
0.89
0.41
0.17
0.38
0.61
Tanskanen et al. Schizophrenia Research (in press)
20
Uhari ja Nieminen (2001). Epidemiologia ja Biostatistiikka.
21
Testien oletukset

Normaalijakautuneisuus

Visuaalinen tarkastelu

Keskiarvo vs. mediaani

Regressioanalyysin oletus

Muunnokset (logaritmi tms.)

Voivat vaikeuttaa tulkintaa
Osborne and Waters 2002
22
Testien oletukset

Havaintojen riippumattomuus

Jos hyvin suunniteltu tutkimus ei ole
yleensä ongelma


Isoissa tutkimuksissa ei ole ongelma
Mittauksien luotettavuus

Huono luotettavuus vähentää tilastollista
voimaa!
Osborne and Waters 2002
23
Testien oletukset

Homoskedastisuus

Eli varianssin tulisi olla sama muuttujan
eri tasoilla

Oletus regressioanalyysissa

Korkea heteroskedastisuus vähentää
tilastollista voimaa!
Osborne and Waters 2002
24
Testien oletukset

Ei-lineariset yhteydet vähentävät voimaa
normaalissa regressioanalyysissa
Osborne and Waters 2002
25
Monitestaus
26
Monitestaus



Hypoteesin asettaminen on tärkeää!
Data louhinta tai kalastelu (data fishing,
data mining)
Monitestaus korjaukset

esim. Bonferroni korjaus



yksinkertainen, mutta konservatiivinen
Bootstrap- menetelmä
Post-Hoc testaus varianssianalyysissa
27
Tulkinta



Tilastollinen merkitsevyys vs.
vaikutus (effect) ?
“The difference between
‘significant’ and ‘not
significant’ is not itself
statistically significant”
”Absence of evidence is not
evidence of absence”
28
Voima
29
Voima-analyysit
Tarvittavat tiedot

Tutkittavien määrä

Tärkeimmän vasteen esiintyvyys
(odotettu vastetapahtumien määrä)
Tehtävät oletukset

Vaikutuksen koko

Tilastollisen merkitsevyyden raja (α)

Tilastollinen voima (1-β)
30

Alfa eli merkitsevyystaso (esim. 0.05 tai 5%)


Beta eli voima (esim 0.8 tai 80%)


Todennäköisyys että ero löytyy vaikka sitä ei ole
olemassa (väärä positiivinen löydös)
Todennäköisyys että löydetty ero on todellinen
Välianalyysit (interim analyses) ovat etukäteen
(a priori) suunniteltuja analyyseja meneillään
olevaan kliiniseen kokeeseen



Syyt eettisiä tai taloudellisia
α – virhe kasvaa
Voima voi jäädä riittämättömäksi?
Suresh KP & Chandrashekara S. J Hum Reprod Sci 2012; 5: 7–13.
31

Erilaisia asetelmia




Keskiarvojen erot
Osuuksien erot
Monimuuttujamallit
Erilaisia ohjelmia


Nettilaskurit
Spesifit ohjelmat

SPSS sample power, …
http://homepage.stat.uiowa.edu/~rlenth/Power/index.html
32

Tutkimusasetelma


Kliinisissä kokeissa pienempi otoskoko on riittävä
Varianssi

Suurempi varianssi vaatii isompaa aineistoa
ryhmäerojen löytämiseksi

Seurantatutkimukset

Huomioi kato (muutot, kuolemat, kieltäytymiset)
Suresh KP & Chandrashekara S. J Hum Reprod Sci 2012; 5: 7–13.
33
Miten ei tule raportoida eimerkitseviä tuloksia!
•
•
•
•
•
•
•
•
•
•
•
•
•
•
a clear, strong trend (p=0.09)
an encouraging trend (p<0.1)
an important trend (p=0.066)
approached conventional levels of significance (p<0.10)
below (but verging on) the statistical significant level (p>0.05)
difference was apparent (p=0.07)
essentially significant (p=0.10)
failed to reach significance on this occasion (p=0.09)
flirting with conventional levels of significance (p>0.1)
leaning towards significance (p=0.15)
narrowly escaped significance (p=0.08)
not conventionally significant (p=0.089), but..
not significant in the narrow sense of the word (p=0.29)
on the very fringes of significance (p=0.099)
http://mchankins.wordpress.com/2013/04/21/still-not-significant-2/
34
35
Muita menetelmiä




Faktorianalyysi
Latent Class analyysi,
klusterianalyysi
Multiple Imputation,
painotus
Rakenneyhtälömallitus,
SEM
36
Kirjallisuutta

Altman DG. Statistics and ethics in medical research. Misuse of statistics is unethical. Br
Med J 1980; 281: 1182–4.

Blackford JU. Leveraging statistical methods to improve validity and reproducibility of
research findings. JAMA Psychiatry. 2017 Feb 1;74(2):119-120.

Easterbrook PJ, et al. Publication bias in clinical research. Lancet 1991; 337:867–72.

Gardenier J & Resnik D. The misuse of statistics: concepts, tools, and a research agenda.
Accountability in Research: Policies and Quality Assurance 2002; 9:65-74.

Greenland S, et al. Statistical tests, p-values, confidence intervals, and power: a guide to
misinterpretations. Draft 1 Mar 2016.

Ioannidis JPA. Why most published research findings are false. PLOS Medicine
2005;2:e124.

Lang T. Twenty statistical errors even you can find in biomedical research articles. Croatian
Med J 2004; 45:361-70.
37
Kirjallisuutta

Mark DB, et al. Understanding the role of p values and hypothesis tests in clinical
research. JAMA Cardiol. 2016; 1(9):1048-1054.

Moher D, et al. CONSORT 2010 explanation and elaboration: updated guidelines for
reporting parallel group randomised trials. BMJ 2010; 340:c869.

Osborne JW & Waters E. Four assumptions of multiple regression that researchers
should always test. Practical Assessment, Research, and Evaluation 2002: 8 (available
online).

Suresh KP & Chandrashekara S. Sample size estimation and power analysis for
clinical research studies. J Hum Reprod Sci 2012; 5: 7–13.

Uhari M & Nieminen P. Epidemiologia ja Biostatistiikka. 2. painos. Duodecim, 2012.
[email protected]
38