Tilastomenetelmiä lääketieteessä Jouko Miettunen, Professori, Akatemiatutkija Elinikäisen terveyden tutkimusyksikkö Oulun yliopisto [email protected] Sisältö Tilastomenetelmien valinta Regressiomallit Monitestaus Tilastollinen voima Lähteitä 2 Menetelmän valinta (2 ryhmää) EI, koska laatua mittaava vaste Voiko keskiarvoa käyttää? EI, koska vasteen jakauma hyvin vino Kyllä Ristiintaulukko - prosentit - khiin neliötesti Vertaile keskiarvoja ryhmien välillä - kahden riippumattoman ryhmän t-testi Ilmoita mediaanit - parametriton testi: MannWhitneyn testi Menetelmän valinta (> 2 ryhmää) Ei, koska vaste laatua mittaava Voiko keskiarvoa käyttää? Ei, koska vasteen jakauma hyvin vino Kyllä Muodosta ristiintaulukko Vertaile keskiarvoja ryhmissä - muista prosentit - ryhmittäiset tunnusluvut - khin neliön testi -varianssianalyysi Ilmoita mediaanit Valitse parametriton testi - KruskalWallisin testi Regressiomallit Tutkitaan yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan Logistinen regressioanalyysi Lineaarinen regressioanalyysi Coxin regressioanalyysi Poissonin regressioanalyysi 5 Uhari ja Nieminen (2001). Epidemiologia ja Biostatistiikka. 6 Logistinen regressioanalyysi Vaste on kaksiluokkainen, esim. Kyllä/Ei, Sairas/Terve Ennustemuuttujat (altisteet) voivat olla kaksiluokkaisia tai jatkuvia Kovariaatit joko aiemmin tunnettuja tekijöitä tai aineistoon perustuvia sekoittavia tekijöitä Liittyvät sekä altisteeseen että vasteeseen Muuttujien lukumäärä riippuu aineiston koosta 7 Example question Northern Finland 1966 Birth Cohort What predicts rehospitalization in psychoses? N = 158 hospital treated cases Exposure variables sex father’s social class (1980) familial risk onset age length of first hospitalization diagnosis (schz / other psychosis) 8 SPSS Output (1) Categorical Variables Codings Fathers social class 1980 Parent has psychotic dg 1972-2000 Sex Diagnosis Length of first hospitalization I,II III,IV V no yes male female schizophrenia other psych < 1 month > 1 month Frequency 48 96 14 133 25 93 65 108 50 94 64 Parameter coding (1) (2) ,000 ,000 1,000 ,000 ,000 1,000 ,000 1,000 1,000 ,000 1,000 ,000 1,000 ,000 9 SPSS Output (2) Odds Ratio (OR) Variables in the Equation Length of 1st hospital.(1) Sex(1) Onset age Diagnosis(1) FSC 1980 FSC 1980(1) FSC 1980(2) Parental psych(1) Constant B 1,048 -,559 -,047 ,839 S.E. ,375 ,366 ,043 ,385 ,309 ,109 ,612 ,488 ,392 ,647 ,513 1,100 Wald 7,805 2,331 1,199 4,740 ,651 ,622 ,028 1,423 ,197 p-arvo df 1 1 1 1 2 1 1 1 1 Sig. ,005 ,127 ,274 ,029 ,722 ,430 ,866 ,233 ,657 Exp(B) 2,852 ,572 ,954 2,314 1,362 1,115 1,845 1,629 95,0% C.I.for EXP(B) Lower Upper 1,367 5,948 ,279 1,172 ,876 1,038 1,087 4,926 ,632 ,314 ,675 2,934 3,960 5,045 OR:n 95% luottamusväli 10 Elinaika-analyysi (survival analysis) Tutkitaan aikaan kahden tapahtuman välillä Syntymästä sairastumiseen Sairastumisesta kuolemaan Hoidon lopusta relapsiin Jne. Kaplan-Meier mallilla ennustetaan tapahtuman todennälöisyytte ajan eri pisteissä 11 Elinaika-analyysi Tarvitaan tieto Tapahtuma (0,1) Aika tapahtumaan (päiviä, kuukausia tms.) tai sensorointiin Seuranta lopetetaan (sensuroidaan) Seuranta-aika loppuu Menetetään kontakti (esim. muutto) Henkilö kuoleen muusta syystä 12 Example question Northern Finland 1966 Birth Cohort What predicts age of suicide? People alive and living in Finland at 16 years (N=10,934) Data till end of 2001 58 (0.5%) suicides 140 (1.3%) other deaths 10,736 (98.2%) alive Predictor variable: family type at birth (full, single) 13 SPSS Output (1) Survival Functions 1,000 ,999 ,998 ,997 ,996 ,995 family type 1966 ,994 Cum Survival ,993 full ,992 full-censored ,991 single ,990 ,989 single-censored 15 20 25 30 35 age (years) Test Statistics for Equality of Survival Distributions log rank test, p=0.002 14 Example question (2) Age of suicide and family type Possible confounding variables sex social class 1966 (I-II,III-IV,V) average school mark at 14 psychiatric diagnosis (no, yes) crime (no, violent, non-violent) Coxin regressioanalyysi 15 SPSS Output (3) Cox regression analysis Categorical Variable Codings Sex 1=male 2=female Psych dg 0=healthy 1=any dg Fathers Social 1=I,II Class 1966 2=III,IV 3=V Marital status 1=single 2=full Criminality 0=no crimes 1=violent 2=nonviolent Frequency 5425 5222 10197 450 783 7823 2041 1975 8672 10019 200 428 Family type 1966 (1) (2) 1 0 0 1 0 1 0 1 0 0 1 0 0 0 1 0 0 1 16 SPSS Output (4) Cox regression analysis Variables in the Equation B SEX PSYCH DG FAM TYPE FSC 1966 FSC 1966(1) FSC 1966(2) SCHOOL MARK CRIMES CRIMES(1) CRIMES(2) ,812 2,463 ,728 SE ,340 ,303 ,287 ,451 ,536 -,276 ,715 ,436 ,164 ,239 -1,011 ,454 ,625 Wald 5,720 66,085 6,429 1,514 ,398 1,513 2,825 3,398 ,276 2,613 df 1 1 1 2 1 1 1 2 1 1 Sig. ,017 ,000 ,011 ,469 ,528 ,219 ,093 ,183 ,600 ,106 Exp(B) 2,253 11,740 2,072 95,0% CI for Exp(B) Lower Upper 1,158 4,383 6,483 21,260 1,180 3,637 1,570 1,710 ,759 ,386 ,727 ,550 6,377 4,018 1,047 1,269 ,364 ,521 ,107 3,093 1,239 17 Analysis of variance ANOVA MANOVA Same measurements are made several times on each subject ANOVA, MANOVA and rANOVA Several continuous outcome variables Repeated measurements ANOVA One continuous outcome (dependent) variable Only categorical predictors ANCOVA, MANCOVA, rANCOVA Also continuous predictors 18 Example question Difference in size of hippocampus Northern Finland 1966 Birth Cohort Follow-up study 1999-2001 Schizophrenia patients (N=56) vs. healthy controls (N=104) Repeated measurements ANCOVA Measurements of right and left side were thought as repeated measurements 19 Example table Schizophrenia and Comparison subjects Hippocampus volumes Model 1 Within effect: side Diagnosis Gender Model 2 Within effect: side Covariate: brain vol. Diagnosis Gender Familial psychosis Perinatal risk Handedness F Sig. 20.3 1.2 6.5 < 0.001 0.28 0.01 0.81 35.0 < 0.01 0.7 1.9 0.8 0.3 0.37 < 0.001 0.89 0.41 0.17 0.38 0.61 Tanskanen et al. Schizophrenia Research (in press) 20 Uhari ja Nieminen (2001). Epidemiologia ja Biostatistiikka. 21 Testien oletukset Normaalijakautuneisuus Visuaalinen tarkastelu Keskiarvo vs. mediaani Regressioanalyysin oletus Muunnokset (logaritmi tms.) Voivat vaikeuttaa tulkintaa Osborne and Waters 2002 22 Testien oletukset Havaintojen riippumattomuus Jos hyvin suunniteltu tutkimus ei ole yleensä ongelma Isoissa tutkimuksissa ei ole ongelma Mittauksien luotettavuus Huono luotettavuus vähentää tilastollista voimaa! Osborne and Waters 2002 23 Testien oletukset Homoskedastisuus Eli varianssin tulisi olla sama muuttujan eri tasoilla Oletus regressioanalyysissa Korkea heteroskedastisuus vähentää tilastollista voimaa! Osborne and Waters 2002 24 Testien oletukset Ei-lineariset yhteydet vähentävät voimaa normaalissa regressioanalyysissa Osborne and Waters 2002 25 Monitestaus 26 Monitestaus Hypoteesin asettaminen on tärkeää! Data louhinta tai kalastelu (data fishing, data mining) Monitestaus korjaukset esim. Bonferroni korjaus yksinkertainen, mutta konservatiivinen Bootstrap- menetelmä Post-Hoc testaus varianssianalyysissa 27 Tulkinta Tilastollinen merkitsevyys vs. vaikutus (effect) ? “The difference between ‘significant’ and ‘not significant’ is not itself statistically significant” ”Absence of evidence is not evidence of absence” 28 Voima 29 Voima-analyysit Tarvittavat tiedot Tutkittavien määrä Tärkeimmän vasteen esiintyvyys (odotettu vastetapahtumien määrä) Tehtävät oletukset Vaikutuksen koko Tilastollisen merkitsevyyden raja (α) Tilastollinen voima (1-β) 30 Alfa eli merkitsevyystaso (esim. 0.05 tai 5%) Beta eli voima (esim 0.8 tai 80%) Todennäköisyys että ero löytyy vaikka sitä ei ole olemassa (väärä positiivinen löydös) Todennäköisyys että löydetty ero on todellinen Välianalyysit (interim analyses) ovat etukäteen (a priori) suunniteltuja analyyseja meneillään olevaan kliiniseen kokeeseen Syyt eettisiä tai taloudellisia α – virhe kasvaa Voima voi jäädä riittämättömäksi? Suresh KP & Chandrashekara S. J Hum Reprod Sci 2012; 5: 7–13. 31 Erilaisia asetelmia Keskiarvojen erot Osuuksien erot Monimuuttujamallit Erilaisia ohjelmia Nettilaskurit Spesifit ohjelmat SPSS sample power, … http://homepage.stat.uiowa.edu/~rlenth/Power/index.html 32 Tutkimusasetelma Kliinisissä kokeissa pienempi otoskoko on riittävä Varianssi Suurempi varianssi vaatii isompaa aineistoa ryhmäerojen löytämiseksi Seurantatutkimukset Huomioi kato (muutot, kuolemat, kieltäytymiset) Suresh KP & Chandrashekara S. J Hum Reprod Sci 2012; 5: 7–13. 33 Miten ei tule raportoida eimerkitseviä tuloksia! • • • • • • • • • • • • • • a clear, strong trend (p=0.09) an encouraging trend (p<0.1) an important trend (p=0.066) approached conventional levels of significance (p<0.10) below (but verging on) the statistical significant level (p>0.05) difference was apparent (p=0.07) essentially significant (p=0.10) failed to reach significance on this occasion (p=0.09) flirting with conventional levels of significance (p>0.1) leaning towards significance (p=0.15) narrowly escaped significance (p=0.08) not conventionally significant (p=0.089), but.. not significant in the narrow sense of the word (p=0.29) on the very fringes of significance (p=0.099) http://mchankins.wordpress.com/2013/04/21/still-not-significant-2/ 34 35 Muita menetelmiä Faktorianalyysi Latent Class analyysi, klusterianalyysi Multiple Imputation, painotus Rakenneyhtälömallitus, SEM 36 Kirjallisuutta Altman DG. Statistics and ethics in medical research. Misuse of statistics is unethical. Br Med J 1980; 281: 1182–4. Blackford JU. Leveraging statistical methods to improve validity and reproducibility of research findings. JAMA Psychiatry. 2017 Feb 1;74(2):119-120. Easterbrook PJ, et al. Publication bias in clinical research. Lancet 1991; 337:867–72. Gardenier J & Resnik D. The misuse of statistics: concepts, tools, and a research agenda. Accountability in Research: Policies and Quality Assurance 2002; 9:65-74. Greenland S, et al. Statistical tests, p-values, confidence intervals, and power: a guide to misinterpretations. Draft 1 Mar 2016. Ioannidis JPA. Why most published research findings are false. PLOS Medicine 2005;2:e124. Lang T. Twenty statistical errors even you can find in biomedical research articles. Croatian Med J 2004; 45:361-70. 37 Kirjallisuutta Mark DB, et al. Understanding the role of p values and hypothesis tests in clinical research. JAMA Cardiol. 2016; 1(9):1048-1054. Moher D, et al. CONSORT 2010 explanation and elaboration: updated guidelines for reporting parallel group randomised trials. BMJ 2010; 340:c869. Osborne JW & Waters E. Four assumptions of multiple regression that researchers should always test. Practical Assessment, Research, and Evaluation 2002: 8 (available online). Suresh KP & Chandrashekara S. Sample size estimation and power analysis for clinical research studies. J Hum Reprod Sci 2012; 5: 7–13. Uhari M & Nieminen P. Epidemiologia ja Biostatistiikka. 2. painos. Duodecim, 2012. [email protected] 38
© Copyright 2025 Paperzz