torsdag 27. august 2020

Tolke medisinske tester

Dette er andre innlegg i en miniserie om betinget sannsynlighet og Bayes teorem.  Det første innlegget er Betinget sannsynlighet – Bayes teorem og det tredje innlegget er Klima ─ Bayesiansk vs frekventistisk tankegang.

Nå i august 2020 er mye oppmerksomhet rettet mot covid-19 pandemien. Jeg vil derfor se nærmere på sannsynlighetene rundt testene som gjøres for å avdekke om personer er smittet av SARS-CoV-2 viruset som forårsaker covid-19. Positiv test betyr at testen tyder på at personen er smittet av viruset. Smittet betyr at personen virkelig er smittet av viruset. Sann positiv betyr at en smittet person tester positivt. Sann negativ betyr at en person som ikke er smittet, tester negativt.

Jeg tar utgangspunkt i to rapporter som opererer med litt forskjellige sannsynligheter for testenes sensitivitet og spesifisitet. Sensitivitet, spesifisitet og prevalens er forklart i det forrige innlegget. Kort sagt er sensitiviteten sannsynligheten for positiv test når personen er smittet, spesifisiteten er sannsynligheten for negativ test når personen ikke er smittet, og prevalensen er prosent smittede i en gruppe.

Folkehelseinstituttet (FHI) publiserte nettsiden Testkriterier for koronavirus allerede 8. februar 2020 og har holdt den oppdatert siden da. I den siste oppdateringen 26. august 2020 skriver de at PCR testen som de bruker, har sensitivitet 80 prosent og spesifisitet 99,9 prosent. De skriver videre at prevalensen i Norge er 0,01 prosent. 

Rapporten Covid Reference Edition 4 ble sist oppdatert 11. august 2020. Den publiseres på nettsiden covidreference.com. Der står det at gjennomsnittet av anti-body testene godkjent av FDA har sensitivitet 84,9 prosent og spesifisitet er 98,6 prosent. Jeg vet ikke hvorfor det er såpass stor forskjell mellom disse verdiene og verdiene som FHI opererer med.

Sann positiv som en funksjon av prevalens

Det er viktig å vite sannsynligheten for at en som tester positivt virkelig er smittet. Figur 1 viser sannsynligheten for det. Den er beregnet som en funksjon av prevalens og for fem forskjellige spesifisiteter. Kurvene er beregnet vha. ligning 3 i det forrige innlegget.


Figur 1: Sannsynligheten for at en tilfeldig person som tester positiv, virkelig er smittet av SARS-CoV-2 viruset. Den vises som en funksjon av prevalens for fem forskjellige spesifisiteter.

Figur 1 er beregnet med en sensitivitet på 80 prosent. Samme figur beregnet med en sensitivitet på 84,6 prosent er så lik  at det ikke er mulig å se forskjell på dem. Det er nok overraskende for mange. Forklaringen er at det er falske positive prøveresultater som senker sannsynligheten i Figur 1, og sannsynligheten for det er (1-spesifisiteten). Vi ser derfor at sannsynligheten i figuren er mye bedre når spesifisiteten er høy enn når den er litt lavere. 

Sannsynligheten for at en person med positivt prøvesvar virkelig er smittet, stiger når prevalensen øker. Det er forståelig. Når det er veldig lite smitte, er det veldig høy sannsynlighet for at et positivt prøvesvar er falskt. Tilsvarende, når det er veldig mye smitte, er det veldig liten sannsynlighet for at et positivt prøvesvar er falskt. 

For å forstå hvorfor sannsynligheten i Figur 1 stiger når prevalensen øker kan vi gjøre et tankeeksperiment med ytterpunktene for prevalensen. Med null prevalens er det ingen smitte blant de som testes. Da må en positiv prøve være en falsk negativ, dvs. at sannsynligheten for at en som tester positivt virkelig er smittet må være null. Med 100 prosent prevalens er alle smittet. Da må en positiv prøve være sann, for alle er jo smittet.

Sann negativ som en funksjon av prevalens

Det er også viktig å vite sannsynligheten for at en som tester negativt ikke er smittet. Også det er en funksjon av prevalensen, som vist i Figur 2.  Kurvene er beregnet vha. ligning 6 i det forrige innlegget.


Figur 2: Sannsynligheten for at en tilfeldig person som tester negativt, ikke er smittet av SARS-CoV-2 viruset. Den vises som en funksjon av prevalens for fem forskjellige sensitiviteter.

Figur 2 viser sannsynligheten for at en tilfeldig person som tester negativt på sars-CoV-2 viruset ikke er smittet. Den er beregnet som en funksjon av prevalens for fem forskjellige sensitiviteter. 

Figuren er beregnet med en spesifisitet på 99.9 prosent. Samme figur beregnet med en spesifisitet på 98,6 prosent gir så likt resultat at det ikke er mulig å se forskjell på figurene. Det er nok overraskende for mange. Forklaringen er at det er falske negative prøveresultater som senker denne sannsynligheten. Sannsynligheten for falske negative er (1-sensitiviteten). Vi ser derfor at sannsynligheten i Figur 2 er mye bedre når sensitiviteten er høy en når den er lav. 

Flere tester på samme person


Prevalensen er sannsynligheten for at en tilfeldig person i en gruppe, virkelig er smittet. Når gruppen er hele Norges befolkning, er prevalensen i august 2020 i følge FHI 0,01 prosent. Med FHI sine verdier for sensitivitet og spesifisitet viser ligningene bak Figur 1 at sannsynligheten for at en tilfeldig person som tester positivt virkelig er smittet, er så lav som 7,4 prosent. For å oppnå større sikkerhet må personen testes en gang til. Da tilhører personen en gruppe med prevalens 7,4 prosent. Hvis personen tester positivt også andre gangen, viser de samme ligningene at sannsynligheten for at hen virkelig er smittet har steget til 98,5 prosent. Hvis hen derimot tester negativt andre gangen, viser ligningene bak Figur 2 at det er 98,4 prosent sannsynlighet for at hen ikke er smittet. Dvs. at en tilfeldig person i en gruppe med lav prevalens som tester positivt ved første gangs prøve, må testes en gang til for å oppnå akseptabel sikkerhet mht. om hen virkelig er smittet.

Talleksempel fra FHI


I det forrige innlegget skrev jeg at det er et par kalkulatorer på nettet som gir andre sannsynligheter for sann positiv og sann negativ enn ligningene bak Figur 1 og 2 gjør. Jeg fant imidlertid en god kalkulator som ga samme resultat som de nevnte ligningene. 

I figuren nederst på nettsiden til FHI som jeg nettopp refererte til, er det et talleksempel med prevalens 3 prosent. Som en siste sjekk går jeg gjennom det eksempelet nå. De som ikke er interessert i detaljene bør la være å lese de neste avsnittene. Konklusjonen er at ligningene bak Figur 1 og 2 gir samme resultat som eksempelet til FHI.

FHI eksempelet: I en gruppe på 100 000 personer er 3000 syke og 97 000 er friske. Med spesifisitet 99,9 prosent vil 96 903 av de friske teste negativt (sanne negative) og 97 vil teste positivt (falske positive). Med sensitivitet 80 prosent vil 2400 av de syke teste positivt (sanne positive) og 600 vil teste negativt (falske negative). 

Sannsynligheten for sann positivt er antall sanne positive dividert på totalt antall positive. Dvs. 2400 dividert på summen av 2400 og 97, som er 0,9612. Det er 96,12 prosent, som også mine ligninger gir.

Sannsynligheten for sann negativ er antall sanne negative dividert på totalt antall negative. Dvs. 96 903 dividert på summen av 96903 og 600, som er 0,9938. Det er 99,38 prosent, som også mine ligninger gir.

Ingen kommentarer:

Legg inn en kommentar