THL tutkii Potilastiedon arkiston tekstimuotoisten aineistojen hyödyntämistä tilastoinnissa, tutkimuksessa ja tiedolla johtamisessa

Julkaisuajankohta 18.3.2024 10.25
Uutinen

Terveyden ja hyvinvoinnin laitos (THL) pilotoi koneoppimis- ja tekoälymenetelmiä, joilla Kelan Kanta-palveluiden Potilastiedon arkiston vapaatekstimuotoista tietoa muutetaan rakenteiseen muotoon. Yhtenäinen, rakenteinen muoto helpottaa ja laajentaa tietojen käyttöä eri tarkoituksiin.  

Hankkeen tavoitteena ei ole vaikuttaa potilastiedon arkiston nykyisten tietojen sisältöön, vaan edesauttaa valmiuksia hyödyntää aineistoa toisiokäytössä, kuten tilastoinnissa, tutkimuksessa ja tiedolla johtamisessa.

Pilottihankkeessa diabetesrekisterin potilaskertomuksista tunnistetaan vapaatekstimuodossa olevia tietoja potilaiden pituudesta, painosta ja verenpaineesta sekä tupakoinnista. Vertailuaineistona hyödynnetään myös rakenteisia kirjauksia.  

Jatkossa mahdollista saada rakenteista tietoa toisiokäyttöön myös suoraan hoitoon liittyvästä tekstimuotoisesta tiedosta

Potilaiden hoitotilanteissa kerättyjä tietoja hyödynnetään tutkimustyössä, kun tutkitaan mm. sairauksien esiintymistä diagnoosimerkintöjen perusteella tai lääkkeiden käyttöä lääkerekisterien avulla. Hyödynnetyt tiedot ovat yleensä olleet helposti käytettävissä olevassa rakenteisessa muodossa. Potilaiden hoitoon liittyy terveydenhuollossa myös paljon sellaisia tärkeitä tietoja, joita ei kirjata rakenteisesti tai joissa rakenteiset tiedot ovat puutteellisia.   

”Tutkimuksemme parantaa valmiuksiamme hyödyntää sellaisia tietoja, joita kirjataan lähes pelkästään tekstinä, kuten vaikkapa potilaan kertomat oireet. Lisäksi pystymme kenties jatkossa täydentämään puutteellisia rakenteisia kirjauksia”, kertoo THL:n tutkimuspäällikkö Petteri Hovi.

Tutkimuksessa arvioidaan, kuinka luotettavasti tekstimuotoisen tiedon koneellinen tulkinta onnistuu sekä miten tekstimuotoisen tiedon hyödyntäminen parantaa saatavilla olevien tietojen kattavuutta. Samalla arvioidaan myös kirjaamisen yhdenmukaisuutta eri potilastietojärjestelmissä.

”Myös tekstimuotoisen tiedon hyödyntämisessä tulee huomioida, että kirjaaminen tai kirjaamisen puuttuminen riippuvat kirjattavasta aiheesta. Paino tai murrosiän vaihe on tavallisempaa kirjoittaa tekstiin silloin, jos niissä havaitaan poikkeavuutta ja kun niillä on jokin vaikutus päätöksiin. Mielenkiintoista onkin selvittää esimerkiksi sitä, onko myös diabetespotilaiden normaalipainon kirjaaminen tavallista”, Hovi toteaa.  

”Ensisijaisena tietolähteenä tilastoinnissa ja tutkimuksessa ovat jatkossakin sellaisenaan käytettävissä olevat rakenteiset kirjaukset, mutta on tärkeää tutkia teknologian tuomia uusia mahdollisuuksia puutteiden täydentämiseksi ja laajemman tietovarannon kartuttamiseksi. Terveydenhuollossa syntyy paljon tekstiaineistoja, ja niitä kannattaa pyrkiä hyödyntämään monipuolisesti väestön terveyden edistämiseksi”, korostaa THL:n tilastotutkija Tuomo Nieminen.

Tietoja käsitellään tietoturvallisessa ympäristössä. Tietoja raportoitaessa huolehditaan siitä, ettei henkilöitä voida tunnistaa.

Hankkeesta lisää 

Potilastiedon arkiston näyttömuotoisen aineiston hyödyntäminen tilastoinnissa ja tutkimuksessa: tietojen rakenteellistaminen koneoppimismenetelmin (Aioli) 

Lisätietoja 

Petteri Hovi 
tutkimuspäällikkö 
puh. 029 524 8941 
[email protected] 

Tuomo Nieminen 
tilastotutkija 
puh. 029 524 7534 
[email protected] 

Jokke Häsä 
tilastotutkija 
puh. 029 524 8187 
[email protected] 

Mika Pihlajamäki  
kehittämispäällikkö 
puh. 029 524 7733 
[email protected] 

Sote-palvelujen johtaminen Tiedonhallinta sosiaali- ja terveysalalla Tiedonhallinta sosiaali- ja terveysalalla tilastouutinen - Tiedonhallinta sosiaali- ja terveysalalla