lørdag 17. oktober 2020

Global warming is accelerating

Figure 1 shows how the global surface temperature has increased since pre-industrial time.

The blue dots are the monthly temperature anomalies, the blue curve is the five years moving average, and the red line is the trend calculated over the last 30 years. The reference period is from January 1880 till December 1909. The temperature in that period is often considered as the temperature in pre-industrial time, mainly because we do not have reliable global temperature measurements before that. Consequently, the figure shows the warming since pre-industrial time. 

The trend line ends at 1.19°C in August 2020. It is reasonable to say that the global surface temperature has increased by that value since pre-industrial time.

Figure 1: The average of four global surface temperature series. The reference period is from January 1880 till December 1909.

The temperatures in Figure 1 are the average of the four series NASA GISTEMP, NOAA Global, Berkeley BEST and HadCRUT4 kriging. These series all have global coverage. They were downloaded from their sources in the beginning of October 2020.

onsdag 9. september 2020

Klima ─ Bayesiansk vs frekventistisk tankegang

Dette er tredje og siste innlegg i en miniserie om betinget sannsynlighet og Bayes teorem. Det første innlegget, Betinget sannsynlighet – Bayes teorem, går lett gjennom matematikken. Det andre innlegget, Tolke medisinske tester, bruker Bayes teorem for å tolke medisinske tester statistisk. De to innleggene bruker bayesiansk tankegang.

Tidligere innlegg, dvs. før de to nettopp nevnte, handler mye om statistisk behandling og tolkning av målinger i klimasammenheng. Det er gjort bl.a. i en serie på fem innlegg om Linear regression analysis og i en serie på seks innlegg om Statistical analysis of data with outliers. Disse to seriene, og innlegg som anvender statistikken som de beskriver, bruker en såkalt frekventistisk tankegang.

Bayesiansk og frekventistisk tankegang er på mange måter forskjellige. Statistikere har tildels delt seg i to leirer, slik Ivar Heuch beskriver i artikkelen Striden mellom bayesianere og frekventister om idégrunnlaget for statistiske slutninger. Artikkelen er fra 2008, og i avslutningen skriver Heuch at han tror at det i fremtiden vil etableres en bedre balanse mellom bayesianske og frekventistiske angrepsmåter, og at begge retningene vil finne sin plass i idégrunnlaget for statistikkfaget. 

Jeg synes at forskjellen mellom bayesiansk og frekventistisk tankegang formuleres fint i en forelesning fra UIO, Bayesian modelling of time series. Utgangspunktet er en hypotese og en måleserie. Med frekventistisk tankegang spør vi Hva er sannsynligheten for å få en slik måleserie gitt at hypotesen er riktig ? Med bayesiansk tankegang spør vi Hva er sannsynligheten for at hypotesen er riktig gitt måleserien ? I resten av innlegget vil jeg konkretisere denne forskjellen med et eksempel der måleserien er global temperatur gjennom ti år og hypotesen er at global gjennomsnittstemperatur stiger.

torsdag 27. august 2020

Tolke medisinske tester

Dette er andre innlegg i en miniserie om betinget sannsynlighet og Bayes teorem.  Det første innlegget er Betinget sannsynlighet – Bayes teorem og det tredje innlegget er Klima ─ Bayesiansk vs frekventistisk tankegang.

Nå i august 2020 er mye oppmerksomhet rettet mot covid-19 pandemien. Jeg vil derfor se nærmere på sannsynlighetene rundt testene som gjøres for å avdekke om personer er smittet av SARS-CoV-2 viruset som forårsaker covid-19. Positiv test betyr at testen tyder på at personen er smittet av viruset. Smittet betyr at personen virkelig er smittet av viruset. Sann positiv betyr at en smittet person tester positivt. Sann negativ betyr at en person som ikke er smittet, tester negativt.

Jeg tar utgangspunkt i to rapporter som opererer med litt forskjellige sannsynligheter for testenes sensitivitet og spesifisitet. Sensitivitet, spesifisitet og prevalens er forklart i det forrige innlegget. Kort sagt er sensitiviteten sannsynligheten for positiv test når personen er smittet, spesifisiteten er sannsynligheten for negativ test når personen ikke er smittet, og prevalensen er prosent smittede i en gruppe.

Folkehelseinstituttet (FHI) publiserte nettsiden Testkriterier for koronavirus allerede 8. februar 2020 og har holdt den oppdatert siden da. I den siste oppdateringen 26. august 2020 skriver de at PCR testen som de bruker, har sensitivitet 80 prosent og spesifisitet 99,9 prosent. De skriver videre at prevalensen i Norge er 0,01 prosent. 

Rapporten Covid Reference Edition 4 ble sist oppdatert 11. august 2020. Den publiseres på nettsiden covidreference.com. Der står det at gjennomsnittet av anti-body testene godkjent av FDA har sensitivitet 84,9 prosent og spesifisitet er 98,6 prosent. Jeg vet ikke hvorfor det er såpass stor forskjell mellom disse verdiene og verdiene som FHI opererer med.

Sann positiv som en funksjon av prevalens

Det er viktig å vite sannsynligheten for at en som tester positivt virkelig er smittet. Figur 1 viser sannsynligheten for det. Den er beregnet som en funksjon av prevalens og for fem forskjellige spesifisiteter. Kurvene er beregnet vha. ligning 3 i det forrige innlegget.


Figur 1: Sannsynligheten for at en tilfeldig person som tester positiv, virkelig er smittet av SARS-CoV-2 viruset. Den vises som en funksjon av prevalens for fem forskjellige spesifisiteter.

tirsdag 25. august 2020

Betinget sannsynlighet – Bayes teorem

Dette er det første av tre innlegg i en miniserie om betinget sannsynlighet og Bayes teorem. Det andre innlegget er Tolke medisinske tester og det tredje innlegget er Klima ─ Bayesiansk vs frekventistisk tankegang. Innleggene er samlet i denne pdf-filen.

Statistikk og sannsynlighetsregning er sentralt i klimavitenskapen når trender og sammenhenger skal beregnes og analyseres. Denne klimabloggen har derfor mange innlegg om matematisk statistikk og mange innlegg som bruker statistikk. Men ingen av innleggene så langt er om betinget sannsynlighet der vi basert på eksisterende og ny kunnskap skal ta stilling til en ja-nei problemstilling. Det vil de neste innleggene handle om.

Vi ønsker alle visshet når vi forholder oss til en problemstilling. Men ofte er ikke det mulig fordi selv de beste ekspertene på problemstillingen bare kan angi sannsynlighetene som de forskjellige mulighetene har. Mange synes at det er vanskelig å forholde seg til slik usikkerhet. De ønsker klare svar, dvs. enten eller. De ønsker ikke, kanskje klarer ikke, å forholde seg til sannsynligheter angitt i prosenter.

Ved å innføre betinget sannsynlighet blir det enda vanskeligere. I tillegg til å forholde oss til sannsynligheter må vi tolke dem i ly av allerede kjent kunnskap. Et ofte brukt eksempel på betinget sannsynlighet er mammografi-undersøkelser av alle kvinner ved en bestemt alder. En mammografi-undersøkelse vil med stor sannsynlighet gi et positivt resultat hvis kvinnen virkelig har brystkreft. Men det motsatte er ikke tilfelle. Selv om et prøvesvar er positivt, er det liten sannsynlighet for at kvinnen har brystkreft. For de fleste av oss føles dette intuitivt galt. Også de av oss som har satt seg godt inn i temaet, må ofte tenke seg om flere ganger for å forstå at det vanligvis er slikt. Hensikten med dette og de neste to innleggene er å forklare betinget sannsynlighet, både med matematikk og med eksempler, som forteller at det ofte er slik som nettopp beskrevet med mammografi. Matematikken forklares i dette innlegget. Hvordan den kan anvendes på henholdsvis medisinske tester og på observasjoner innen klimavitenskapen forklares i de påfølgende to innleggene.

Bayes teorem

Bayes teorem, som vist i ligning (1), er sentralt innen betinget sannsynlighet. 

lørdag 27. juni 2020

Skidager i Nordmarka

Dette er fjerde og siste av fire innlegg om snø, temperatur, nedbør og skidager i Nordmarka. De er samlet i denne pdf-filen.

En tommelfingerregel sier at vi kan gå på ski i terrenget når snødybden er 25 cm eller mer. Slike dager kalles skidager. Figur 1 viser antall skidager i Nordmarka utenfor Oslo fra 1900 til 2020. Målingene er hovedsaklig fra målestasjonen på Bjørnholt 360 m.o.h. Der er snødybden målt siden 1897, men med et opphold mellom 1937 og 1954. Meteorologer har brukt målinger fra nærliggende målestasjoner for å lage en sammenhengende måleserie. Et tidligere innlegg, Snødybde og temperatur i Nordmarka, forklarer hvor data om snødybde og skidager er hentet fra og hvordan de er bearbeidet.

Figur 1: Antall skidager per skisesong på Bjørnholt i Nordmarka

fredag 26. juni 2020

Snødybde og nedbør i Nordmarka

Dette er tredje av fire innlegg om snø, temperatur, nedbør og skidager i Nordmarka. De er samlet i denne pdf-filen. Innlegget som du leser nå, analyserer sammenhengen mellom snødybde og nedbør på Bjørnholt i Nordmarka.  Det er en oppdatering av et innlegg med samme tittel fra juni 2018. Nå med målinger også for vintersesongene 2019 og 2020.

Meteorologisk institutt sin eKlima portal har fullstendige målinger av nedbør i vintermånedene. Jeg brukte disse til å utvide datagrunnlaget jeg hadde i 2018.

Figur 1 viser 30 års glidende middelverdi av nedbøren på Bjørnholt i månedene november til mai. Hvert punkt på kurvene viser middelverdien av nedbøren i aktuelle måned beregnet over tidsrommet 15 år før og 15 år etter.

Figur 1: 30 års glidende middelverdi av nedbør på Bjørnholt i månedene november til mai. De siste punktene på kurvene er mellom 2005 og 2006, og de dekker tidsrommet 1991 til 2020.

torsdag 25. juni 2020

Snødybde og temperatur i Nordmarka

Dette er andre av fire innlegg om snø, temperatur, nedbør og skidager i Nordmarka. De er samlet i denne pdf-filen. Innlegget som du leser nå, analyserer sammenhengen mellom snødybde og temperatur på Bjørnholt i Nordmarka. Det er en oppdatering av innlegget Snødybde og temperatur i Nordmarka fra august 2018. Nå med målinger også for vintersesongene 2019 og 2020.

Fra eKlima portalen hentet jeg døgnverdier og månedlige gjennomsnittsverdier for snødybde på Bjørnholt for sesongene 2019 og 2020. Jobben ble mer omfattende enn det, noe jeg forklarer ganske detaljert i Appendiks A. Gjennom denne jobben fikk jeg et litt mer fullstendig datagrunnlag enn jeg hadde i 2018.

På Bjørnholt begynte målingene av snødybde i januar 1897 og av temperatur i oktober 2007. Det er viktig å vite hvordan temperaturen har utviklet seg på det samme stedet som snømålingene er gjort. Derfor lagde jeg i august 2018 en homogenisert temperaturserie for Bjørnholt for perioden fra januar 1897 til juni 2018. Jeg brukte Bjørnholtmålingene når de var tilgjengelige. For temperaturer før det baserte jeg meg på en homogenisert temperaturserie for Oslo (Blindern, 94 m.o.h., målestasjon 18700). For perioden der begge stasjonene hadde målinger var Oslotemperaturene i vinter- og vårmånedene gjennomsnittlig 2,79 °C varmere enn Bjørnholttemperaturene. Det var liten år til år variasjon i denne differansen. Jeg gjorde tilsvarende sammenligning mellom temperaturene målt på Bjørnholt og på Tryvasshøgda  (514 m.o.h, målestasjon 18950). Her varierte differansen mye mer fra år til år, så jeg konkluderte med bare å bruke Oslotemperaturene. Når det ikke var temperaturmålinger fra Bjørnholt brukte jeg Oslotemperaturene minus 2,79 °C. Det nevnte innlegget fra august 2018 har mer detaljer om dette. Nå i 2020 utvidet jeg denne homogeniserte temperaturserien med temperaturmålinger gjort på Bjørnholt i de siste to årene.

Figur 1 viser 30 års glidende middelverdi av snødybdene på Bjørnholt for månedene november til april og for gjennomsnittet i desember til mars. Middelverdiene er beregnet over 30 år. De siste punktene i kurvene er mellom 2005 og 2006, og de er middelverdiene for tidsrommet 1991 til 2020.

Figur 1: 30 års glidende middelverdi av snødybdene på Bjørnholt for månedene november til april og for gjennomsnittet i desember til mars.