Tutkimuksen taustaa
Sairauksien synnyssä on yksilöllisiä piirteitä jokaiselle meistä. Siksi myös niiden hoito ja ennaltaehkäisy ovat yleensä tehokkaimpia silloin, kun ne räätälöidään jokaiselle erikseen. Useat sairaudet voidaan estää tai niiden puhkeamista viivyttää elämäntapavalinnoilla tai ennaltaehkäisevällä hoidolla, jos yksilölliset riskit sairaudelle tunnistetaan hyvissä ajoin.
FinRekisterit-tutkimusprojektissa pyrimme rekisteritietojen avulla ymmärtämään paremmin monimutkaisia tekijöitä tautien synnyssä ja kehittämään tautiriskin arviointia.
Tutkimuksen tulokset voivat olla hyvä lähtökohta kohdennetuille tutkimuksille, joita tarvitaan ennaltaehkäisevän ja henkilökohtaisen terveydenhuollon toimintaan ja kliinisten käytäntöjen kehittämiseen.
Monimutkaisten suhteiden paljastamiseksi ja sairauksien ennakoimiseksi rakennamme tilastollisia ja koneoppimismalleja, jotka hyödyntävät yksilön elämän eri osa-alueiden tietoja. Koneoppiminen on tekoälyn sovellus, jossa tietokone-ohjelmat oppivat suorittamaan tehtäviä suuresta määrästä tutkimuskysymykseen soveltuvaa tietoa ilman tarkkoja ennalta määritettyjä ohjeita.
Ennakointi on yksi esimerkki tehtävistä, joihin koneoppimismenetelmiä voidaan käyttää. Koneoppimismenetelmät pystyvät käsittelemään paljon erilaisia tietoja samanaikaisesti. Siten voidaan tehdä uusia havaintoja, jotka eivät olisi mahdollisia perinteisillä tutkimusmenetelmillä.
Tästä syystä FinRekisterit-tutkimuksen käyttämät tiedot sisältävät suuren määrän terveystietoja ja muuta sitä tukevaa tietoa yksilöiden lääkkeistä, sukulaisista, syntymästä ja kuolemasta, elinhistoriasta, koulutuksesta, ammatista sekä tulotuesta.
Jotta koneoppimismallit toimisivat, tarvitsemme miljoonien ihmisten tietoja, jotka kattavat lähes koko Suomen väestön. Tämä on mahdollista käyttämällä valtakunnallisia suomalaisia rekistereitä, joita on käytetty tutkimuksiin jo vuosikymmenien ajan.