Påverkan uppstår i interaktion – varför ser inte en randomiserad studie den?
Den randomiserade kontrollerade studien, RCT (randomized controlled trial), lyfts gång på gång fram inom social- och hälsovården när man efterfrågar säkerhet och trovärdighet som stöd för beslutsfattandet. När offentliga medel används för nya lösningar – särskilt artificiell intelligens – ökar trycket att visa påverkan med ”hård evidens”. RCT erbjuder ett tydligt och erkänt svar på detta behov. Det är en metodologisk trygg hamn, vars språk både finansiärer, beslutsfattare och forskare förstår.
Därför lutar man sig mot den även i situationer där det fenomen som utvärderas inte passar dess antaganden. RCT är inte bara en metod, utan en del av ett synsätt där påverkan ses som en isolerbar, mätbar och generaliserbar egenskap.
Detta synsätt kan utmanas genom att använda artificiell intelligens inom social- och hälsovården som exempel. AI:s effekter uppstår först när tekniken, människorna och organisationens praxis möts i vardagen. Ändå återvänder vi lätt till RCT-upplägget, eftersom det erbjuder en tydlig struktur mitt i komplexiteten.
Problem 1: Vi föreställer oss en intervention som i själva verket är en hel verksamhetsmiljö
AI-lösningar är inte standardiserade interventioner som kan lyftas ur sitt sammanhang. De formas i samspelet mellan data, professionellas tolkningar, ledarskap, resurser och klienternas reaktioner. Effekten är inte statisk, utan byggs upp kontinuerligt. Detta utmanar RCT‑tänkandet, som förutsätter att interventionen kan isoleras och mätas kontrollerat.
En RCT kan ge ett exakt tal, men den säger inte hur och varför effekten uppstår. Den centrala frågan – hur AI fungerar i vardagens praktik – förblir obesvarad.
Införandet av AI förändrar arbetsfördelning, prioriteringar och ansvar. Samtidigt formar organisationens praxis själva systemet.
Det som utvärderas är alltså inte en enskild ”AI‑intervention”, utan ett nätverk av relationer som byggs upp i praktiken. RCT strävar efter att isolera effekten, trots att effekten uppstår just genom denna sammanflätning.
Problem 2: Vi mäter resultaten, inte hur de uppstår
AI:s påverkan uppstår inte enbart genom träffsäkerheten i prognoser eller analyser. Dessa är bara information. Påverkan uppstår först när informationen tas i bruk: den tolkas, man har tillit till den (eller inte), och på basis av den förändras verksamheten.
Samma prognos kan leda till helt olika beslut i olika organisationer – eller bli helt oanvänd.
När vi endast mäter slutresultat, såsom besöksantal eller kostnader, försvinner denna mellanliggande process ur sikte. RCT antar att påverkan löper linjärt från intervention till utfall, trots att den i verkligheten byggs upp genom flerstegad interaktion.
Problem 3: Utvärderingssättet formar verkligheten
En utvärderingsram är inte neutral. Den definierar vad som uppfattas som meningsfullt. När vi främst mäter individuella utfall riskerar vi att förbise hur tekniken förändrar organisatoriska relationer, beslutshierarkier eller ansvarsfördelning.
Samtidigt förstärker vi föreställningen att problem kan lösas genom teknisk optimering, även när de är kopplade till strukturer och arbetsorganisering. Utvärderingssättet börjar styra utvecklingen: det som mäts är det som utvecklas.
Vi behöver utvärdering som följer verksamheten – inte bara indikatorer
Vid utvärdering av AI bör implementeringen granskas som en del av en bredare verksamhetshelhet. I stället för att endast fråga om systemet minskade ett enskilt nyckeltal bör vi undersöka hur det förändrade verksamheten, vilka beroenden det skapade och vilka tolkningspraktiker som byggdes upp kring det.
Detta kräver att kvantitativ information kompletteras med kvalitativ analys: observationer, dokumentgranskning och samtal med yrkesverksamma. Först då kan vi förstå varför tekniken ger upphov till vissa typer av konsekvenser i en viss organisation. Utvärderingen måste följa vardagsarbetet, inte enbart granska det i efterhand.
Påverkan är inte en universell egenskap
Teknik är inte ett färdigt paket som kan överföras oförändrat från en kontext till en annan. Varje implementering är en förhandling där systemet anpassar sig till lokala praxis och praxiserna till systemet. Påverkan är ett situationsbundet fenomen, inte en permanent egenskap som kan bevisas en gång och antas vara universell.
Om vi håller fast vid en enda utvärderingsmodell i situationer där objektet är en föränderlig verksamhetshelhet, riskerar vi att få exakta svar på fel frågor.
Låt oss bredda evidensen, inte snäva in den
Det handlar inte om att RCT skulle vara en felaktig metod. Den lämpar sig väl för frågor där interventionen är tydligt definierad och kan standardiseras, såsom läkemedel och enkla medicinska åtgärder. Problem uppstår när den tillämpas i situationer där det som utvärderas formas genom mer komplex interaktion.
AI‑lösningar inom social- och hälsovården hör till denna kategori. Deras effekter uppstår i samspelet mellan människor, processer och miljöer och formas av lokala praxis.
Därför behöver vi utvärdering som erkänner denna komplexitet. Evidensen bör inte begränsas till en modell, utan breddas så att den också synliggör hur påverkan faktiskt byggs upp i praktiken.