torsdag 27. august 2020

Tolke medisinske tester

Dette er andre innlegg i en miniserie om betinget sannsynlighet og Bayes teorem.  Det første innlegget er Betinget sannsynlighet – Bayes teorem og det tredje innlegget er Klima ─ Bayesiansk vs frekventistisk tankegang.

Nå i august 2020 er mye oppmerksomhet rettet mot covid-19 pandemien. Jeg vil derfor se nærmere på sannsynlighetene rundt testene som gjøres for å avdekke om personer er smittet av SARS-CoV-2 viruset som forårsaker covid-19. Positiv test betyr at testen tyder på at personen er smittet av viruset. Smittet betyr at personen virkelig er smittet av viruset. Sann positiv betyr at en smittet person tester positivt. Sann negativ betyr at en person som ikke er smittet, tester negativt.

Jeg tar utgangspunkt i to rapporter som opererer med litt forskjellige sannsynligheter for testenes sensitivitet og spesifisitet. Sensitivitet, spesifisitet og prevalens er forklart i det forrige innlegget. Kort sagt er sensitiviteten sannsynligheten for positiv test når personen er smittet, spesifisiteten er sannsynligheten for negativ test når personen ikke er smittet, og prevalensen er prosent smittede i en gruppe.

Folkehelseinstituttet (FHI) publiserte nettsiden Testkriterier for koronavirus allerede 8. februar 2020 og har holdt den oppdatert siden da. I den siste oppdateringen 26. august 2020 skriver de at PCR testen som de bruker, har sensitivitet 80 prosent og spesifisitet 99,9 prosent. De skriver videre at prevalensen i Norge er 0,01 prosent. 

Rapporten Covid Reference Edition 4 ble sist oppdatert 11. august 2020. Den publiseres på nettsiden covidreference.com. Der står det at gjennomsnittet av anti-body testene godkjent av FDA har sensitivitet 84,9 prosent og spesifisitet er 98,6 prosent. Jeg vet ikke hvorfor det er såpass stor forskjell mellom disse verdiene og verdiene som FHI opererer med.

Sann positiv som en funksjon av prevalens

Det er viktig å vite sannsynligheten for at en som tester positivt virkelig er smittet. Figur 1 viser sannsynligheten for det. Den er beregnet som en funksjon av prevalens og for fem forskjellige spesifisiteter. Kurvene er beregnet vha. ligning 3 i det forrige innlegget.


Figur 1: Sannsynligheten for at en tilfeldig person som tester positiv, virkelig er smittet av SARS-CoV-2 viruset. Den vises som en funksjon av prevalens for fem forskjellige spesifisiteter.

tirsdag 25. august 2020

Betinget sannsynlighet – Bayes teorem

Dette er det første av tre innlegg i en miniserie om betinget sannsynlighet og Bayes teorem. Det andre innlegget er Tolke medisinske tester og det tredje innlegget er Klima ─ Bayesiansk vs frekventistisk tankegang. Innleggene er samlet i denne pdf-filen.

Statistikk og sannsynlighetsregning er sentralt i klimavitenskapen når trender og sammenhenger skal beregnes og analyseres. Denne klimabloggen har derfor mange innlegg om matematisk statistikk og mange innlegg som bruker statistikk. Men ingen av innleggene så langt er om betinget sannsynlighet der vi basert på eksisterende og ny kunnskap skal ta stilling til en ja-nei problemstilling. Det vil de neste innleggene handle om.

Vi ønsker alle visshet når vi forholder oss til en problemstilling. Men ofte er ikke det mulig fordi selv de beste ekspertene på problemstillingen bare kan angi sannsynlighetene som de forskjellige mulighetene har. Mange synes at det er vanskelig å forholde seg til slik usikkerhet. De ønsker klare svar, dvs. enten eller. De ønsker ikke, kanskje klarer ikke, å forholde seg til sannsynligheter angitt i prosenter.

Ved å innføre betinget sannsynlighet blir det enda vanskeligere. I tillegg til å forholde oss til sannsynligheter må vi tolke dem i ly av allerede kjent kunnskap. Et ofte brukt eksempel på betinget sannsynlighet er mammografi-undersøkelser av alle kvinner ved en bestemt alder. En mammografi-undersøkelse vil med stor sannsynlighet gi et positivt resultat hvis kvinnen virkelig har brystkreft. Men det motsatte er ikke tilfelle. Selv om et prøvesvar er positivt, er det liten sannsynlighet for at kvinnen har brystkreft. For de fleste av oss føles dette intuitivt galt. Også de av oss som har satt seg godt inn i temaet, må ofte tenke seg om flere ganger for å forstå at det vanligvis er slikt. Hensikten med dette og de neste to innleggene er å forklare betinget sannsynlighet, både med matematikk og med eksempler, som forteller at det ofte er slik som nettopp beskrevet med mammografi. Matematikken forklares i dette innlegget. Hvordan den kan anvendes på henholdsvis medisinske tester og på observasjoner innen klimavitenskapen forklares i de påfølgende to innleggene.

Bayes teorem

Bayes teorem, som vist i ligning (1), er sentralt innen betinget sannsynlighet.