Varmistetut koronatapaukset Suomessa (COVID-19)
Tässä kuvataan THL:n avoin aineisto, joka kuvaa Suomen COVID-19 -tapauksia, testaavien laboratorioiden ilmoittamia testausmääriä ja COVID-19-tartuntaan liittyviä kuolemantapauksia.
Aineisto julkaistaan THL:n avoimen datan rajapinnan kautta.
Tietoja voi tarkastella myös suoraan tilastotaulukoista. Taulukot julkaistaan tilastokuutiona, joka mahdollistaa käyttäjän omat valinnan aineistosta.
Rajapinnan osoite: https://sampo.thl.fi/pivot/prod/api/epirapo/covid19case.json
Aineiston aihealue: epirapo
Aineiston nimi: covid19case
THL:n avoimen datan rajapinnan kuvaus
Aineiston kuvaus
Aineisto sisältää tartuntatautirekisteriin ilmoitettujen COVID-19 -tapausten ja tapauksiin liittyvien kuolemien lukumääriä ja laboratorioiden ilmoittamia testausmääriä. Tietoja päivitetään päivittäin. Tartuntatautirekisteriin ilmoitetuissa tapahtumissa saattaa olla 2–4 päivän viive. Kuntatasolla tietoja ei näytetä, jos tapauksia on alle 5.
Tietoa tartuntatautirekisteristä
Muutoshistoria
Alkaen 15.6.2023
Uutta tietoa testimääristä ei enää kerry. Tiedot analysoiduista koronanäytemääristä ovat perustuneet laboratorioiden toimittamiin tietoihin. Tämä erillistiedonkeruu on päättynyt kesäkuussa 2023.
Mittarit
Mittari | Mittarin tunniste | Kuvaus | Lähde |
---|---|---|---|
COVID-19 -tapausten lukumäärä | n_covid_ttr | Tapaukseksi lasketaan tartuntatautirekisteriin ilmoitettu COVID-19 tauti. Yhdellä henkilöllä voi olla maksimissaan yksi tautitapaus 12 kuukauden sisällä. Ajallisesti tapaukset asetetaan tartuntatautirekisterin tilastointipäivälle. | Tartuntatautirekisteri. |
COVID-19 testausmäärät | n_labtest | Laboratoriot ilmoittavat päivittäin, kuinka monta COVID-19 liittyvää testiä kyseisessä laboratoriossa tehdään kyseisenä päivänä. Ajallisesti testit asetetaan testin tekopäivälle.
|
Laboratorioilmoitus kyselylomakkeella |
Koronaan ajallisesti liittyvät kuolemat (30 vrk), Tartuntatautirekisteri | n_deaths_ttr
|
1. Väestötietojärjestelmän kuolintieto, jonka päivämäärä on 30 päivän sisällä COVID-19 -tapauksen tilastointipäivämäärästä. 2. Tartuntatautirekisterin kuolintieto, kun lääkäri on ilmoittanut tartuntatautirekisteriin COVID-19 hoidon lopputulokseksi kuoleman. Ajallisesti kuolemat asetetaan tartuntatautirekisterin tilastointipäivälle. |
Väestötietojärjestelmä ja tartuntatautirekisteri. |
Asukaslukumäärä | sum_pop_week | Viikoittain päivittyvä asukasmäärä. | Väestötietojärjestelmä. |
Koronasta johtuvat kuolemat, kuolintodistus (alustava tieto) | n_deaths_covid_due_kt | Kuolemat, joissa koronavirus on kirjattu kuolemansyyksi, eli kuoleman katsotaan aiheutuneen koronasta. Ajallisesti kuolemat asetetaan kuolinpäivälle. | Kuolintodistukset, alustava THL:n kokoama tieto. Tilastokeskus vastaa virallisesta tilastoinnista. |
Kuolemat joissa korona myötävaikuttavana tekijänä, kuolintodistus (alustava tieto) | n_deaths_covid_ctb_kt | Kuolemat, joihin koronaviruksen katsotaan olleen kuolemaan myötävaikuttavana tekijänä, mutta kuolemansyy on jokin muu. Ajallisesti kuolemat asetetaan kuolinpäivälle. | Kuolintodistukset, alustava THL:n kokoama tieto. Tilastokeskus vastaa virallisesta tilastoinnista. |
Dimensiot ja mittarit
Dimensiot kuvaavat ulottuvuuksia, joissa aineistoa voidaan esittää. Kukin dimensio jakaantuu yhteen tai useampaan tasoon, joiden avulla tarkasteltavista tiedoista voidaan taulukoida haluttuja näkymiä. Dimensioiden tulkinta riippuu tarkasteltavasta mittarista. Taulukossa kuvataan dimension tulkinta kunkin mittarin suhteen.
Dimensio | Taso | Yleinen kuvaus tasosta | Kuvaus, kun mittarina COVID-19 -tapausten lukumäärä | Kuvaus, kun mittarina COVID-19 testausmäärät | Kuvaus, kun mittarina Koronaan ajallisesti liittyvät kuolemat (30 vrk), tartuntatautirekisteri | Kuvaus, kun mittarina asukaslukumäärä | Kuvaus, kun mittarina Koronasta johtuvat kuolemat, kuolintodistus (alustava tieto) | Kuvaus, kun mittarina Kuolemat joissa korona myötävaikuttavana tekijänä, kuolintodistus (alustava tieto) |
---|---|---|---|---|---|---|---|---|
Aika | päivä | Päivämäärä jota tieto koskee. Mittareilla on erilaisia määritelmiä ajallisen tilastoinnin suhteen. | Tartuntatautirekisterin tilastointipäivä. Tilastointipäiväksi lasketaan tautitapaukseen liittyvistä ilmoituksista varhaisimman ilmoituksen tilastointipäivä, joka on seuraavassa järjestyksessä ensimmäinen ei-tyhjä arvo: 1) näytteenottopäivä (lääkärin ja laboratorion ilmoitukset). 2) diagnoosipäivä (lääkärinilmoitus). 3) ilmoituspäivä (lääkärin ja laboratorion ilmoitukset). |
Kyselylomakkeen päivämäärä, jolla laboratorio ilmoittaa kyseisen päivän aikana tutkitut näytteet. | Potilaan covid-19-tartunnan mukainen tilastointipäivä. | Tietoa ei eritelty päivän tarkkuudella. | Kuolinpäivä. | Kuolinpäivä. |
viikko | ISO-standardin mukainen viikko. Johdetaan päivästä. | Yhteenlaskettu määrä viikon ajalta. | Yhteenlaskettu määrä viikon ajalta. | Yhteenlaskettu määrä viikon ajalta. | Viikko, jonka aikana väestön lukumäärä on laskettu Väestötietorekisteristä. | Yhteenlaskettu määrä viikon ajalta. | Yhteenlaskettu määrä viikon ajalta. | |
kaikki ajat | Kaikki päivät yhteensä tai tuorein kokonaistieto. | Yhteenlaskettu määrä koko seuranta-ajalta. | Yhteenlaskettu määrä koko seuranta-ajalta. | Yhteenlaskettu määrä koko seuranta-ajalta. | Tuorein väestötieto. | Yhteenlaskettu määrä koko seuranta-ajalta. | Yhteenlaskettu määrä koko seuranta-ajalta. | |
Alue |
kunta | Suomen kunnat vuoden 2020 Tilastokeskuksen aluejaon mukaan. | Tautitapauksen tilastointikunta. Ensisijaisesti koti-/asuinkunta, toissijaisesti hoitopaikan kunta ja viimeiseksi näytteen ottaneen laboratorion sijaintikunta. | Tietoa ei ole eritelty kunnittain. | Tietoa ei ole eritelty kunnittain. | Koti-/asuinkunta. | Tietoa ei ole eritelty kunnittain. | Tietoa ei ole eritelty kunnittain. |
sairaanhoitopiiri | Johdetaan kunnasta Tilastokeskuksen aluejaon mukaisesti. | Yhteenlaskettu määrä sairaanhoitopiirin kunnista. | Laboratorion ilmoittama tutkittujen näytteiden määrä sairaanhoitopiiristä. | Tietoa ei eritelty sairaanhoitopiireittäin. | Yhteenlaskettu määrä sairaanhoitopiirin kunnista. | Tietoa ei eritelty sairaanhoitopiireittäin. | Tietoa ei eritelty sairaanhoitopiireittäin. | |
kaikki alueet | Alueet yhteensä. | Yhteenlaskettu määrä kaikista kunnista. | Yhteenlaskettu määrä sairaanhoitopiireistä. | Yhteenlaskettu määrä kaikista kunnista. | Yhteenlaskettu määrä kaikista kunnista. | Yhteenlaskettu määrä Suomesta. | Yhteenlaskettu määrä Suomesta. | |
Ikäryhmä | ikäryhmä | 10-vuotisikäryhmät 0-80+. | Ikä tilastointipäivänä. | Tietoa ei ole eritelty ikäryhmittäin. | Ikä kuolinpäivänä. | Tietoa ei ole eritelty ikäryhmittäin. | Ikä kuolinpäivänä. | Ikä kuolinpäivänä. |
kaikki ikäryhmät | Ikäryhmät yhteensä. | Yhteenlaskettu määrä ikäryhmistä. | Tieto on ikäryhmät yhteensä. | Yhteenlaskettu määrä ikäryhmistä. | Tuorein väestötieto. | Yhteenlaskettu määrä ikäryhmistä. | Yhteenlaskettu määrä ikäryhmistä. | |
Sukupuoli | sukupuoli | Sukupuolet mies ja nainen. | Tartuntatautirekisteriin ilmoitettu potilaan sukupuoli. | Tietoa ei ole eritelty sukupuolittain. | Tartuntatautirekisteriin ilmoitettu potilaan sukupuoli. | Tietoa ei ole eritelty sukupuolen mukaan. | Potilaan sukupuoli. | Potilaan sukupuoli. |
kaikki sukupuolet | Sukupuolet yhteensä. | Yhteenlaskettu määrä sukupuolista. | Tieto on ikäryhmät yhteensä. | Yhteenlaskettu määrä sukupuolista. | Tuorein väestötieto. | Yhteenlaskettu määrä sukupuolista. | Yhteenlaskettu määrä sukupuolista. |
Dimensioiden tasot
Kuutiokäyttöliittymästä ja rajapinnasta löytyvät dimensiot ja tasot on kuvattu alla olevassa taulukossa.
Dimensio | Taso | Tason tunniste | Solmun tunniste (SID) |
---|---|---|---|
Aika | päivä | date | |
viikko | week | ||
kaikki ajat | root | 509030 | |
Alue | kunta | municipality | |
sairaanhoitopiiri | hcd | ||
kaikki alueet | root | 445222 | |
Ikäryhmä | 10-vuotisikäryhmät 0-80+ | ttr10yage | |
kaikki iät | root | 444309 | |
Sukupuoli | sukupuoli | sexgroup | |
kaikki sukupuolet | root | 444328 |
Tarkasteltavat yhdistelmät mittareittain
Taulukot alla ilmoittavat aineistoon lasketut yhdistelmät, jotka ovat haettavissa avoimen datan rajapinnasta ja tarkasteltavissa tilastokuutiokäyttöliittymästä. Lasketut yhdistelmät ilmoitetaan mittarikohtaisesti. Taulukon jokainen rivi ilmoittaa yhden saatavilla olevan yhdistelmän, jossa “root” tarkoittaa kokonaismäärää dimension kaikkien arvojen yli.
Vain taulukoissa kuvatut yhdistelmät ovat saatavilla avoimena aineistona. Jos haetaan sellaista yhdistelmää, jota ei ole kuvattu alla, haku palautuu rajapinnasta tyhjänä.
Haettavia yhdistelmiä voi helpoiten tarkastella tilastokuution käyttöliittymän kautta.
Siirry tilastokuutioon
Ohje kuutiokäyttöliittymän käyttöön
Tarkasteltavat yhdistelmät
Tietosuojasyistä kuutioon ei ole laskettu kaikkia mahdollisia yhdistelmiä. Alla olevassa taulukossa on kuvattu ne yhdistelmät, joiden mittarit ovat saatavissa.
Yhdistelmät mittarille COVID-19 -tapausten lukumäärä
Aika | Alue | Ikä | Sukupuoli |
---|---|---|---|
Kaikki ajat / Viikko / Päivä | Kaikki alueet / Sairaanhoitopiirit | Kaikki iät | Kaikki sukupuolet |
Kaikki ajat / Viikko | Kunnat | Kaikki iät | Kaikki sukupuolet |
Kaikki ajat | Kaikki alueet | Kaikki iät / Ikäryhmät | Kaikki sukupuolet / Sukupuolet |
Yhdistelmät mittarille COVID-19 testausmäärä
Aika | Alue | Ikä | Sukupuoli |
---|---|---|---|
Kaikki ajat / Viikko / Päivä | Kaikki alueet | Kaikki iät | Kaikki sukupuolet |
Kaikki ajat / Viikko | Sairaanhoitopiirit | Kaikki iät | Kaikki sukupuolet |
Yhdistelmät mittarille Koronaan ajallisesti liittyvät kuolemat (30 vrk), tartuntatautirekisteri
Aika | Alue | Ikä | Sukupuoli |
---|---|---|---|
Kaikki ajat / Viikko / Päivä | Kaikki alueet | Kaikki iät | Kaikki sukupuolet |
Kaikki ajat | Kaikki alueet | Kaikki iät / Ikäryhmät | Kaikki sukupuolet / Sukupuolet |
Yhdistelmät mittarille Koronasta johtuvat kuolemat, kuolintodistus (alustava tieto)
Aika | Alue | Ikä | Sukupuoli |
---|---|---|---|
Kaikki ajat / Viikko / Päivä | Kaikki alueet | Kaikki iät | Kaikki sukupuolet |
Kaikki ajat | Kaikki alueet | Kaikki iät / Ikäryhmät | Kaikki sukupuolet / Sukupuolet |
Yhdistelmät mittarille Kuolemat joissa korona myötävaikuttavana tekijänä, kuolintodistus (alustava tieto)
Aika | Alue | Ikä | Sukupuoli |
---|---|---|---|
Kaikki ajat / Viikko / Päivä | Kaikki alueet | Kaikki iät | Kaikki sukupuolet |
Kaikki ajat | Kaikki alueet | Kaikki iät / Ikäryhmät | Kaikki sukupuolet / Sukupuolet |
Yhdistelmät mittarille Väestö
Aika | Alue | Ikä | Sukupuoli |
---|---|---|---|
Kaikki ajat / Viikko | Kaikki alueet / Sairaanhoitopiirit / Kunnat | Kaikki iät | Kaikki sukupuolet |
Rajapinnan logiikka
Rajapinnan kautta voi hakea tiedot joko CSV- tai JSON-stat -muodossa.
Rajapinta pohjautuu dimensioihin, jotka jakaantuvat <dimensiotunniste> - <solmutunniste> (ID-SID) -pareihin. Näistä ID on tekstiä ja SID numerosarja. Erottimena käytetään väliviivaa (-). Valitsemalla yksi tai useampi ID-SID-pari, valitaan se näkökulma, josta dataa halutaan tarkastella.
JSON-muodossa listaus kaikista käytettävissä olevista ID-SID-pareista löytyy osoitteesta https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.dimensions.json
Varsinainen data löytyy osoitteesta: https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json?row=<id1>-<sid1>&column=<id2>-<sid2>&filter=measure-<mittarin id>.
Siihen voi lisätä tarvittavan määrän ID-SID-pareja rivi- ja sarakemuuttujille sekä valitun mittarin kohtaan filter.
Oletusarvoisesti rajapinta palauttaa ID-SID-paria vastaavan dimension tason arvot ja kaikkien tason lehtien arvot.
Esimerkiksi:
https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json?row=hcdmunicipality2020-445222&column=dateweek20200101-509030&filter=measure-444833 palauttaa:
- Aluedimension (ID = hcdmunicipality2020) tason "Kaikki alueet" (SID = 445222) arvo ja kaikki tasoon kuuluvien lehtien arvot (sairaanhoitopiirit)
- Aikadimension (ID = dateweek20200101) tason "Kaikki ajat" (SID= 509030) arvo ja kaikki tasoon kuuluvien lehtien arvot (viikot)
- Mittarilta COVID-19 -tapausten lukumäärä (mittarin ID = 444833)
Haku voidaan rajoittaa kunkin dimension osalta vain valitun tason arvoihin lisäämällä sid-numeron perään piste (.).
Esimerkiksi:
https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json?row=hcdmunicipality2020-445193&column=dateweek20200101-509030&filter=measure-444833 palauttaa:
- Aluedimension (ID = hcdmunicipality2020) tason "Helsingin ja Uudenmaan SHP" (SID = 445193) arvot ja kaikki tasoon kuuluvien lehtien arvot (kunnat)
- Aikadimension (ID = dateweek20200101) tason "Kaikki ajat" (SID = 509030) arvot ja kaikki tasoon kuuluvien lehtien arvot (viikot)
- Mittarilta COVID-19 -tapausten lukumäärä (mittarin ID = 444833)
Lisäämällä piste SID-numeron perään:
https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json?row=hcdmunicipality2020-445193.&column=dateweek20200101-509030&filter=measure-444833 palauttaa:
- Vain aluedimension (ID = hcdmunicipality2020) tason "Helsingin ja Uudenmaan SHP" (SID = 445193) arvot
- Aikadimension (ID = dateweek20200101) tason "Kaikki ajat" (SID = 509030) arvot ja kaikki tasoon kuuluvien lehtien arvot (viikot)
- Mittarilta COVID-19 -tapausten lukumäärä (mittarin ID = 444833)
JSON-stat-muodon lisäksi rajapinnan kautta on mahdollista hakea data myös CSV-muodossa. Tämä tapahtuu yksinkertaisesti korvaamalla osoitteesta "json" "csv":llä. Edellinen esimerkki CSV-muodossa olisi siis:
https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.csv?row=hcdmunicipality2020-445193.&column=dateweek20200101-509030&filter=measure-444833
Lisätietoa
- JSON-stat -muoto (englanniksi)
- JSON-stat -muodon käsittelyyn tarkoitettu ohjelmistokirjasto (englanniksi)
Esimerkkejä tyypillisistä aineistohauista
Helsingin COVID-19 -tapaukset viikoittain, mukaan lukien kokonaismäärä
- Vain aluedimension (ID = hcdmunicipality2020) tason "Helsinki" (SID = 445171) arvot
- Aikadimension (ID = dateweek20200101) tason "Kaikki ajat" (SID = 509030) arvot ja kaikki tasoon kuuluvien lehtien arvot (viikot)
- Mittarilta COVID-19 -tapausten lukumäärä (mittarin ID = 444833)
Tilastokuutio: COVID-19-tapaukset
Kuutiorajapinnan osoite:
https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json?row=hcdmunicipality2020-445171.&column=dateweek20200101-509030&filter=measure-444833
Kaikki COVID-19 -kuolemantapaukset ikäryhmittäin
- Ikäryhmädimension (ID = ttr10yage) tason "Kaikki ikäryhmät" (SID = 444309) arvot ja kaikki tasoon kuuluvien lehtien arvot (ikäryhmät)
- Vain aikadimension (ID = dateweek20200101) tason "Kaikki ajat" (SID = 509030) arvot
- Mittarilta COVID-19 -kuolemantapausten lukumäärä (mittarin ID = 492118)
Tilastokuutio: COVID-19-tapaukset
Kuutiorajapinnan osoite:
https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json?row=ttr10yage-444309&column=dateweek20200101-509030.&filter=measure-492118
Huom. Kuutiokäyttöliittymän ja -rajapinnan osoitteet ovat identtisiä, poislukien kuutiorajapinnan osoitteen .json pääte ennen ?-merkkiä. Käyttöliittymä on siten hyvä apuväline hakujen muodostamiseen.
Kuutiokäyttöliittymän käytöstä voit lukea lisää yleisestä ohjeesta.
Kuutiokäyttöliittymän ohjeet
Rajapinnan lukeminen R-ohjelmistolla
Useat tilasto- ja tieteelliseen laskentaan suunnitellut ohjelmistot sisältävät valmiita ratkaisuja JSON-stat-muotoisen aineiston lukemiseen.
Tässä esimerkissä haetaan THL:n avoimesta rajapinnasta COVID-19-tapaukset viikoittain ja kunnittain. Aineiston lukemisessa hyödynnetään rjstat-pakettia, joka on saatavilla R-ohjelmiston virallisesta pakettijakelusta (CRAN).
# Paketti JSON-stat tiedon lukemista varten
library(rjstat)
# Osoitteen perusosa
url_base <- "https://sampo.thl.fi/pivot/prod/fi/epirapo/covid19case/fact_epirapo_covid19case.json"
# Osoitteen perään lisättävä pyyntöosa (Tapaukset viikoittain ja kunnittain)
request <- "?row=hcdmunicipality2020-445268L&column=dateweek20200101-509030"
# Yhdistetään URL:t yhdeksi merkkijonoksi
url <- paste0(url_base, request)
# Haetaan näkymä kuutiosta (palautuu listana, jossa alkiona taulukko data.framena)
cube <- fromJSONstat(url, naming = "label", use_factors = F, silent = T)
# Tallennetaan kuution näkymä talteen omaksi objektikseen ja tarkastellaan muutamaa ensimmäistä riviä
res <- cube[[1]]
head(res, 20)
Yhteystiedot
Yhteydenotot ja kyselyt koskien avointa COVID-19 -aineistoa:
epidemia.avoindata(at)thl.fi
Palaute THL:n kuutiokäyttöliittymästä ja avoimen datan rajapinnasta:
tietojarjestelmat(at)thl.fi