Tietoa painokertoimista ja niiden käytöstä

Painokertoimien avulla korjataan kadon vaikutusta ja niitä on syytä käyttää kaikissa analyyseissa. Jokaiselle FinTerveys 2017-tutkimuksen 18 + vuotiaiden perusotokseen kuuluville on muodostettu oma painokerroin.

Näitä painokertoimia ei ole laskettu Itä-Suomen Rikastukseen kuuluville tutkittaville. Rikastus on poimittu lähinnä Pohjois-Karjalasta ja pieneltä osin Pohjois-Savosta, joiden osuus koko maan väestöstä on vain n. 8 prosenttia, joten näiden alueiden osalta tarkemmat estimaatit lisäisivät koko maan estimaattien tarkkuutta vain vähän. Lisäksi tutkimussisältö on rikastuksessa suppeampi, joten rikastusotoksen lisääminen tutkimusaineistoon  on hyödyllinen vain verrattaessa vuoden 2017 tilannetta aiempiin Finriski-tutkimuksiin, jotka olivat alueellisesti rajattuja.

Painokerroin huomioi eri ikäryhmien erilaiset otantatodennäköisyydet. Painokerroin kuvaa kuinka monta samankaltaista ihmistä yksi osallistunut keskimäärin edustaa. Painotetaan osallistuneita niin, että jokainen tutkimukseen osallistunut edustaa vastaavan tyyppisiä katoon jääneitä henkilöitä.

Finterveys-tutkimuksen otanta-asetelma perustui Terveys 2000 -tutkimukseen. Finterveys-aineiston analysoinnissa käytetään vastaavia tilastollisia menetelmiä ja ohjelmistoja kuin mitä on käytetty Terveys2000 ja Terveys2011 tutkimuksissa.

Terveys 2011 -sivulta löytyy kattavat esimerkit sekä taustoittavaa materiaalia tilastollisten analyysien suorittamista varten. Esimerkkiohjelmia löytyy Terveys2011-sivun kohdasta Aineiston analysointi (pdf dokumentti). Sivulta löytyy myös viite Terveys 2011 -tutkimuksen otanta-asetelmaan ja painokertoimet kuvaavaan artikkeliin (Härkänen et al. 2016)

Esimerkit sekä taustoittavaa materiaalia tilastollisten analyysien suorittamiseen
Systematic handling of missing data in complex study designs : experiences from the Health 2000 and 2011 Surveys

SPSS -ohjelmistoon tarvitaan Complex samples lisäpaketti., jotta painokertoimet saadaan oikein mukaan analyysiin.

Analyysien suorittamisessa erona on se, että osite-, ryväs- ja painokerroinmuuttujien nimet eroavat Terveys 2000 ja 2011 -aineistojen vastaavista:

Terveys 2011-tutkimuksessa muuttujat ovat: 

  • Osite: OSITE
  • Ryväs: RYVAS
  • Analyysipaino: ALL_ANALYSIS_W
  • Korottava paino: ALL_EXPANSION_W

FinTerveys-tutkimuksessa muuttujat ovat:

  • Osite: FT17_OTOS_OSITE
  • Ryväs: FT17_OTOS_RYVAS
  • Analyysipaino: W_PERUS_KYS1_ANA
  • Korottava paino: W_PERUS_KYS1_EXP

Analyysipainoja ('analysis' ja 'ana') käytetään lähes kaikissa analyyseissä., esim. prevalensseja xx % väestöstä. Ainoastaan, jos halutaan estimoida lukumääriä väestössä, käytetään korottavia painoja ('expansion' ja 'exp'), esimerkiksi jos halutaan arvioida väestömääriä kuten kuinka monella ihmisellä Suomessa on kohonnut verenpaine. Jos analysoitavassa muuttujassa on enemmän puuttuvia arvoja (item nonresponse) kuin käytettävän painokertoimen määrittelemiseen käytetyssä osallistumiskriteerissä, niin korottavilla painoilla saadaan aliarvio lukumäärästä väestössä. Tällöin kannattaa paikata dataa moni-imputoinnilla ennen painokertoimien käyttämistä.

Kuten Terveys 2000 ja 2011 -tutkimuksissa, myös Finterveys-tutkimuksessa on muodostettu useita painokertoimia eri tutkimusosioita varten, mm. terveystarkastus-, 70 vuotta täyttäneiden ja ravinto-osiot. Jos tutkimuksessa käytetään esimerkiksi vain terveystarkastusmuuttujia, on suositeltavaa käyttää terveystarkastuspainokertoimia. Jos analyysissä on mukana tietoja useammasta lähteestä käytetään pienimmän n-määrän omaavan lähteen painokertoimia. Esimerkiksi jos mukana on muuttujia kysely1:stä, kysely2:sta, terveystarkastuksesta ja labrasta, painokertoimena kannattaa käytää kyselyyn 2 kalibroitua painokerrointa (w_perus_kys2_ana), johon osallistuminen oli pienintä.

Analyysipainokertoimet ovat:

  • w_perus_tervtark_ana (käytetään kun analysoidaan terveystarkastusmuuttujia)
  • w_perus_kys1_ana (käytetään kun analysoidaan kysely1-lomakkeen muuttujia)
  • w_perus_kys2_ana (käytetään kun analysoidaan kysely2-lomakkeen muuttujia )
  • w_70v_kys70_ana (käytetään kun analysoidaan kysely70-lomakkeen muuttujia )
  • w_perus_lpuh_ana (käytetään kun analysoidaan lyhyt puhelin haastattelu -lomakkeen muuttujia )
  • w_ravinto_ravinto_ana (käytetään kun analysoidaan vähintään toista ravintohaastattelua)
  • w_ravinto_rav_hyv_mol_ana (käytetään kun analysoidaan molempia ravintohaastatteluja )
  • w_ravinto_hyv_toinen_ana (käytetään kun analysoidaan vain toista ravintohaastattelua )
  • w_virtsa_vrk_ana (käytetään kun analysoidaan vuorokausivirtsan muuttujia)
  • w_virtsa_spotti_ana (käytetään kun analysoidaan spottivirtsan muuttujia)
  • w_liikunta_ana (käytetään kun analysoidaan liikuntamittarin muuttujia)
  • w_nivel_ana (käytetään kun analysoidaan nivel-alaotoksen muuttujia terveystarkastuslomake kolmosesta)

Väestöpainokertoimet ovat:

  • w_perus_tervtark_exp
  • w_perus_kys1_exp
  • w_perus_kys2_exp
  • w_70v_kys70_exp
  • w_perus_lpuh_exp
  • w_ravinto_ravinto_exp
  • w_ravinto_rav_hyv_mol_exp
  • w_ravinto_hyv_toinen_exp
  • w_virtsa_vrk_exp
  • w_virtsa_spotti_exp