Varmistetut koronatapaukset Suomessa (COVID-19)

Tässä kuvataan THL:n avoin aineisto, joka kuvaa Suomen COVID-19 -tapauksia, testaavien laboratorioiden ilmoittamia testausmääriä ja COVID-19-tartuntaan liittyviä kuolemantapauksia. 

Aineisto julkaistaan THL:n avoimen datan rajapinnan kautta.

Tietoja voi tarkastella myös suoraan tilastotaulukoista.  Taulukot julkaistaan tilastokuutiona, joka mahdollistaa käyttäjän omat valinnan aineistosta. 

Rajapinnan osoite: https://sampo.thl.fi/pivot/prod/api/epirapo/covid19case.json

Aineiston aihealue: epirapo

Aineiston nimi: covid19case

THL:n avoimen datan rajapinnan kuvaus

THL:n avoimen datan lisenssi

Aineiston kuvaus

Aineisto sisältää tartuntatautirekisteriin ilmoitettujen COVID-19 -tapausten ja tapauksiin liittyvien kuolemien lukumääriä ja laboratorioiden ilmoittamia testausmääriä. Tietoja päivitetään päivittäin. Tartuntatautirekisteriin ilmoitetuissa tapahtumissa saattaa olla 2–4 päivän viive. Kuntatasolla tietoja ei näytetä, jos tapauksia on alle 5.
Tietoa tartuntatautirekisteristä

Muutoshistoria

Alkaen 15.6.2023

Uutta tietoa testimääristä ei enää kerry. Tiedot analysoiduista koronanäytemääristä ovat perustuneet laboratorioiden toimittamiin tietoihin. Tämä erillistiedonkeruu on päättynyt kesäkuussa 2023.

Mittarit

Mittari Mittarin tunniste Kuvaus Lähde
COVID-19 -tapausten lukumäärä n_covid_ttr Tapaukseksi lasketaan tartuntatautirekisteriin ilmoitettu COVID-19 tauti. Yhdellä henkilöllä voi olla maksimissaan yksi tautitapaus 12 kuukauden sisällä. Ajallisesti tapaukset asetetaan tartuntatautirekisterin tilastointipäivälle. Tartuntatautirekisteri.
COVID-19 testausmäärät n_labtest

Laboratoriot ilmoittavat päivittäin, kuinka monta COVID-19 liittyvää testiä kyseisessä laboratoriossa tehdään kyseisenä päivänä. Ajallisesti testit asetetaan testin tekopäivälle.

 

Laboratorioilmoitus kyselylomakkeella
Koronaan ajallisesti liittyvät kuolemat (30 vrk), Tartuntatautirekisteri

n_deaths_ttr

 

1. Väestötietojärjestelmän kuolintieto, jonka päivämäärä on 30 päivän sisällä COVID-19 -tapauksen tilastointipäivämäärästä.

2. Tartuntatautirekisterin kuolintieto, kun lääkäri on ilmoittanut tartuntatautirekisteriin COVID-19 hoidon lopputulokseksi kuoleman. Ajallisesti kuolemat asetetaan tartuntatautirekisterin tilastointipäivälle.

Väestötietojärjestelmä ja tartuntatautirekisteri.
Asukaslukumäärä sum_pop_week Viikoittain päivittyvä asukasmäärä. Väestötietojärjestelmä.
Koronasta johtuvat kuolemat, kuolintodistus (alustava tieto) n_deaths_covid_due_kt Kuolemat, joissa koronavirus on kirjattu kuolemansyyksi, eli kuoleman katsotaan aiheutuneen koronasta. Ajallisesti kuolemat asetetaan kuolinpäivälle. Kuolintodistukset, alustava THL:n kokoama tieto. Tilastokeskus vastaa virallisesta tilastoinnista.
Kuolemat joissa korona myötävaikuttavana tekijänä, kuolintodistus (alustava tieto) n_deaths_covid_ctb_kt Kuolemat, joihin koronaviruksen katsotaan olleen kuolemaan myötävaikuttavana tekijänä, mutta kuolemansyy on jokin muu. Ajallisesti kuolemat asetetaan kuolinpäivälle. Kuolintodistukset, alustava THL:n kokoama tieto. Tilastokeskus vastaa virallisesta tilastoinnista.

 

Dimensiot ja mittarit

Dimensiot kuvaavat ulottuvuuksia, joissa aineistoa voidaan esittää. Kukin dimensio jakaantuu yhteen tai useampaan tasoon, joiden avulla tarkasteltavista tiedoista voidaan taulukoida haluttuja näkymiä.  Dimensioiden tulkinta riippuu tarkasteltavasta mittarista. Taulukossa kuvataan dimension tulkinta kunkin mittarin suhteen.

Dimensio Taso Yleinen kuvaus tasosta Kuvaus, kun mittarina COVID-19 -tapausten lukumäärä Kuvaus, kun mittarina COVID-19 testausmäärät Kuvaus, kun mittarina Koronaan ajallisesti liittyvät kuolemat (30 vrk), tartuntatautirekisteri Kuvaus, kun mittarina asukaslukumäärä Kuvaus, kun mittarina Koronasta johtuvat kuolemat, kuolintodistus (alustava tieto) Kuvaus, kun mittarina Kuolemat joissa korona myötävaikuttavana tekijänä, kuolintodistus (alustava tieto)
Aika päivä Päivämäärä jota tieto koskee. Mittareilla on erilaisia määritelmiä ajallisen tilastoinnin suhteen. Tartuntatautirekisterin tilastointipäivä. Tilastointipäiväksi lasketaan tautitapaukseen liittyvistä ilmoituksista varhaisimman ilmoituksen tilastointipäivä, joka on seuraavassa järjestyksessä ensimmäinen ei-tyhjä arvo:
1) näytteenottopäivä (lääkärin ja laboratorion ilmoitukset).
2) diagnoosipäivä (lääkärinilmoitus).
3) ilmoituspäivä (lääkärin ja laboratorion ilmoitukset).
Kyselylomakkeen päivämäärä, jolla laboratorio ilmoittaa kyseisen päivän aikana tutkitut näytteet. Potilaan covid-19-tartunnan mukainen tilastointipäivä. Tietoa ei eritelty päivän tarkkuudella. Kuolinpäivä. Kuolinpäivä.
  viikko ISO-standardin mukainen viikko. Johdetaan päivästä. Yhteenlaskettu määrä viikon ajalta. Yhteenlaskettu määrä viikon ajalta. Yhteenlaskettu määrä viikon ajalta. Viikko, jonka aikana väestön lukumäärä on laskettu Väestötietorekisteristä. Yhteenlaskettu määrä viikon ajalta. Yhteenlaskettu määrä viikon ajalta.
  kaikki ajat Kaikki päivät yhteensä tai tuorein kokonaistieto. Yhteenlaskettu määrä koko seuranta-ajalta. Yhteenlaskettu määrä koko seuranta-ajalta. Yhteenlaskettu määrä koko seuranta-ajalta. Tuorein väestötieto. Yhteenlaskettu määrä koko seuranta-ajalta. Yhteenlaskettu määrä koko seuranta-ajalta.

Alue
kunta Suomen kunnat vuoden 2020 Tilastokeskuksen aluejaon mukaan. Tautitapauksen tilastointikunta. Ensisijaisesti koti-/asuinkunta, toissijaisesti hoitopaikan kunta ja viimeiseksi näytteen ottaneen laboratorion sijaintikunta. Tietoa ei ole eritelty kunnittain. Tietoa ei ole eritelty kunnittain. Koti-/asuinkunta. Tietoa ei ole eritelty kunnittain. Tietoa ei ole eritelty kunnittain.
  sairaanhoitopiiri Johdetaan kunnasta Tilastokeskuksen aluejaon mukaisesti. Yhteenlaskettu määrä sairaanhoitopiirin kunnista. Laboratorion ilmoittama tutkittujen näytteiden määrä sairaanhoitopiiristä. Tietoa ei eritelty sairaanhoitopiireittäin. Yhteenlaskettu määrä sairaanhoitopiirin kunnista. Tietoa ei eritelty sairaanhoitopiireittäin. Tietoa ei eritelty sairaanhoitopiireittäin.
  kaikki alueet Alueet yhteensä. Yhteenlaskettu määrä kaikista kunnista. Yhteenlaskettu määrä sairaanhoitopiireistä. Yhteenlaskettu määrä kaikista kunnista. Yhteenlaskettu määrä kaikista kunnista. Yhteenlaskettu määrä Suomesta. Yhteenlaskettu määrä Suomesta.
Ikäryhmä ikäryhmä 10-vuotisikäryhmät 0-80+. Ikä tilastointipäivänä. Tietoa ei ole eritelty ikäryhmittäin. Ikä kuolinpäivänä. Tietoa ei ole eritelty ikäryhmittäin. Ikä kuolinpäivänä. Ikä kuolinpäivänä.
  kaikki ikäryhmät Ikäryhmät yhteensä. Yhteenlaskettu määrä ikäryhmistä. Tieto on ikäryhmät yhteensä. Yhteenlaskettu määrä ikäryhmistä. Tuorein väestötieto. Yhteenlaskettu määrä ikäryhmistä. Yhteenlaskettu määrä ikäryhmistä.
Sukupuoli sukupuoli Sukupuolet mies ja nainen. Tartuntatautirekisteriin ilmoitettu potilaan sukupuoli. Tietoa ei ole eritelty sukupuolittain. Tartuntatautirekisteriin ilmoitettu potilaan sukupuoli. Tietoa ei ole eritelty sukupuolen mukaan. Potilaan sukupuoli. Potilaan sukupuoli.
  kaikki sukupuolet Sukupuolet yhteensä. Yhteenlaskettu määrä sukupuolista. Tieto on ikäryhmät yhteensä. Yhteenlaskettu määrä sukupuolista. Tuorein väestötieto. Yhteenlaskettu määrä sukupuolista.

Yhteenlaskettu määrä sukupuolista.

 

Dimensioiden tasot

Kuutiokäyttöliittymästä ja rajapinnasta löytyvät dimensiot ja tasot on kuvattu alla olevassa taulukossa.

Dimensio Taso Tason tunniste Solmun tunniste (SID)
Aika päivä date  
  viikko week  
  kaikki ajat root 509030
Alue kunta municipality  
  sairaanhoitopiiri hcd  
  kaikki alueet root 445222
Ikäryhmä 10-vuotisikäryhmät 0-80+ ttr10yage  
  kaikki iät root 444309
Sukupuoli sukupuoli sexgroup  
  kaikki sukupuolet root 444328

 

Tarkasteltavat yhdistelmät mittareittain

Taulukot alla ilmoittavat aineistoon lasketut yhdistelmät, jotka ovat haettavissa avoimen datan rajapinnasta ja tarkasteltavissa tilastokuutiokäyttöliittymästä. Lasketut yhdistelmät ilmoitetaan mittarikohtaisesti. Taulukon jokainen rivi ilmoittaa yhden saatavilla olevan yhdistelmän, jossa “root” tarkoittaa kokonaismäärää dimension kaikkien arvojen yli.

Vain taulukoissa kuvatut yhdistelmät ovat saatavilla avoimena aineistona. Jos haetaan sellaista yhdistelmää, jota ei ole kuvattu alla, haku palautuu rajapinnasta tyhjänä.

Haettavia yhdistelmiä voi helpoiten tarkastella tilastokuution käyttöliittymän kautta.
Siirry tilastokuutioon

Ohje kuutiokäyttöliittymän käyttöön

Tarkasteltavat yhdistelmät

Tietosuojasyistä kuutioon ei ole laskettu kaikkia mahdollisia yhdistelmiä. Alla olevassa taulukossa on kuvattu ne yhdistelmät, joiden mittarit ovat saatavissa.

Yhdistelmät mittarille COVID-19 -tapausten lukumäärä

Aika Alue Ikä Sukupuoli
Kaikki ajat / Viikko / Päivä Kaikki alueet / Sairaanhoitopiirit Kaikki iät   Kaikki sukupuolet
Kaikki ajat / Viikko Kunnat Kaikki iät Kaikki sukupuolet
Kaikki ajat Kaikki alueet Kaikki iät / Ikäryhmät Kaikki sukupuolet / Sukupuolet

 

Yhdistelmät mittarille COVID-19 testausmäärä

Aika Alue Ikä Sukupuoli
Kaikki ajat / Viikko / Päivä Kaikki alueet Kaikki iät Kaikki sukupuolet
Kaikki ajat / Viikko Sairaanhoitopiirit Kaikki iät Kaikki sukupuolet

 

Yhdistelmät mittarille Koronaan ajallisesti liittyvät kuolemat (30 vrk), tartuntatautirekisteri

Aika Alue Ikä Sukupuoli
Kaikki ajat / Viikko / Päivä Kaikki alueet Kaikki iät Kaikki sukupuolet
Kaikki ajat Kaikki alueet Kaikki iät / Ikäryhmät Kaikki sukupuolet / Sukupuolet

 

Yhdistelmät mittarille Koronasta johtuvat kuolemat, kuolintodistus (alustava tieto)

Aika Alue Ikä Sukupuoli
Kaikki ajat / Viikko / Päivä Kaikki alueet Kaikki iät Kaikki sukupuolet
Kaikki ajat Kaikki alueet Kaikki iät / Ikäryhmät Kaikki sukupuolet / Sukupuolet

 

Yhdistelmät mittarille Kuolemat joissa korona myötävaikuttavana tekijänä, kuolintodistus (alustava tieto)

Aika Alue Ikä Sukupuoli
Kaikki ajat / Viikko / Päivä Kaikki alueet Kaikki iät Kaikki sukupuolet
Kaikki ajat Kaikki alueet Kaikki iät / Ikäryhmät Kaikki sukupuolet / Sukupuolet

 

Yhdistelmät mittarille Väestö

Aika Alue Ikä Sukupuoli
Kaikki ajat / Viikko Kaikki alueet / Sairaanhoitopiirit / Kunnat Kaikki iät Kaikki sukupuolet

 

Rajapinnan logiikka

Rajapinnan kautta voi hakea tiedot joko CSV- tai JSON-stat -muodossa.

Rajapinta pohjautuu dimensioihin, jotka jakaantuvat <dimensiotunniste> - <solmutunniste> (ID-SID) -pareihin. Näistä ID on tekstiä ja SID numerosarja. Erottimena käytetään väliviivaa (-). Valitsemalla yksi tai useampi ID-SID-pari, valitaan se näkökulma, josta dataa halutaan tarkastella.

JSON-muodossa listaus kaikista käytettävissä olevista ID-SID-pareista löytyy osoitteesta https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.dimensions.json

Varsinainen data löytyy osoitteesta: https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json?row=<id1>-<sid1>&column=<id2>-<sid2>&filter=measure-<mittarin id>.

Siihen voi lisätä tarvittavan määrän ID-SID-pareja rivi- ja sarakemuuttujille sekä valitun mittarin kohtaan filter.

Oletusarvoisesti rajapinta palauttaa ID-SID-paria vastaavan dimension tason arvot ja kaikkien tason lehtien arvot.

Esimerkiksi: 
https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json?row=hcdmunicipality2020-445222&column=dateweek20200101-509030&filter=measure-444833 palauttaa:

  • Aluedimension (ID = hcdmunicipality2020) tason "Kaikki alueet" (SID = 445222) arvo ja kaikki tasoon kuuluvien lehtien arvot (sairaanhoitopiirit)
  • Aikadimension (ID = dateweek20200101) tason "Kaikki ajat" (SID= 509030) arvo ja kaikki tasoon kuuluvien lehtien arvot (viikot)
  • Mittarilta COVID-19 -tapausten lukumäärä (mittarin ID = 444833)

Haku voidaan rajoittaa kunkin dimension osalta vain valitun tason arvoihin lisäämällä sid-numeron perään piste (.).

Esimerkiksi:
https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json?row=hcdmunicipality2020-445193&column=dateweek20200101-509030&filter=measure-444833 palauttaa:

  • Aluedimension (ID = hcdmunicipality2020) tason "Helsingin ja Uudenmaan SHP" (SID = 445193) arvot ja kaikki tasoon kuuluvien lehtien arvot (kunnat)
  • Aikadimension (ID = dateweek20200101) tason "Kaikki ajat" (SID = 509030) arvot ja kaikki tasoon kuuluvien lehtien arvot (viikot)
  • Mittarilta COVID-19 -tapausten lukumäärä (mittarin ID = 444833)

Lisäämällä piste SID-numeron perään:
https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json?row=hcdmunicipality2020-445193.&column=dateweek20200101-509030&filter=measure-444833 palauttaa:

  • Vain aluedimension (ID = hcdmunicipality2020) tason "Helsingin ja Uudenmaan SHP" (SID = 445193) arvot
  • Aikadimension (ID = dateweek20200101) tason "Kaikki ajat" (SID = 509030) arvot ja kaikki tasoon kuuluvien lehtien arvot (viikot)
  • Mittarilta COVID-19 -tapausten lukumäärä (mittarin ID = 444833)

JSON-stat-muodon lisäksi rajapinnan kautta on mahdollista hakea data myös CSV-muodossa. Tämä tapahtuu yksinkertaisesti korvaamalla osoitteesta "json" "csv":llä. Edellinen esimerkki CSV-muodossa olisi siis:
https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.csv?row=hcdmunicipality2020-445193.&column=dateweek20200101-509030&filter=measure-444833

Lisätietoa

Esimerkkejä tyypillisistä aineistohauista

Helsingin COVID-19 -tapaukset viikoittain, mukaan lukien kokonaismäärä

  • Vain aluedimension (ID = hcdmunicipality2020) tason "Helsinki" (SID = 445171) arvot
  • Aikadimension (ID = dateweek20200101) tason "Kaikki ajat" (SID = 509030) arvot ja kaikki tasoon kuuluvien lehtien arvot (viikot)
  • Mittarilta COVID-19 -tapausten lukumäärä (mittarin ID = 444833)

Tilastokuutio: COVID-19-tapaukset

Kuutiorajapinnan osoite:
https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json?row=hcdmunicipality2020-445171.&column=dateweek20200101-509030&filter=measure-444833

Kaikki COVID-19 -kuolemantapaukset ikäryhmittäin

  • Ikäryhmädimension (ID = ttr10yage) tason "Kaikki ikäryhmät" (SID = 444309) arvot ja kaikki tasoon kuuluvien lehtien arvot (ikäryhmät)
  • Vain aikadimension (ID = dateweek20200101) tason "Kaikki ajat" (SID = 509030) arvot
  • Mittarilta COVID-19 -kuolemantapausten lukumäärä (mittarin ID = 492118)

Tilastokuutio: COVID-19-tapaukset

Kuutiorajapinnan osoite:
https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json?row=ttr10yage-444309&column=dateweek20200101-509030.&filter=measure-492118

Huom. Kuutiokäyttöliittymän ja -rajapinnan osoitteet ovat identtisiä, poislukien kuutiorajapinnan osoitteen .json pääte ennen ?-merkkiä. Käyttöliittymä on siten hyvä apuväline hakujen muodostamiseen.

Kuutiokäyttöliittymän käytöstä voit lukea lisää yleisestä ohjeesta.
Kuutiokäyttöliittymän ohjeet 

Rajapinnan lukeminen R-ohjelmistolla

Useat tilasto- ja tieteelliseen laskentaan suunnitellut ohjelmistot sisältävät valmiita ratkaisuja JSON-stat-muotoisen aineiston lukemiseen.

Tässä esimerkissä haetaan THL:n avoimesta rajapinnasta COVID-19-tapaukset viikoittain ja kunnittain. Aineiston lukemisessa hyödynnetään rjstat-pakettia, joka on saatavilla R-ohjelmiston virallisesta pakettijakelusta (CRAN).

# Paketti JSON-stat tiedon lukemista varten
library(rjstat)
  
# Osoitteen perusosa
url_base <- "https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json"
  
# Osoitteen perään lisättävä pyyntöosa (Tapaukset viikoittain ja kunnittain)
request <- "?row=hcdmunicipality2020-445268L&column=dateweek20200101-509030"
 
# Yhdistetään URL:t yhdeksi merkkijonoksi
url <- paste0(url_base, request)
 
# Haetaan näkymä kuutiosta (palautuu listana, jossa alkiona taulukko data.framena)
cube <- fromJSONstat(url, naming = "label", use_factors = F, silent = T)
 
# Tallennetaan kuution näkymä talteen omaksi objektikseen ja tarkastellaan muutamaa ensimmäistä riviä
res <- cube[[1]]
head(res, 20)

Yhteystiedot

Yhteydenotot ja kyselyt koskien avointa COVID-19 -aineistoa:
epidemia.avoindata(at)thl.fi

Palaute THL:n kuutiokäyttöliittymästä ja avoimen datan rajapinnasta:
tietojarjestelmat(at)thl.fi

Muiden THL:n avoimien aineistojen yhteystiedot