fredag 1. januar 2021

Solar Cycle Model failed totally when predicting colder temperatures

To download the blog post as a pdf file, click here.

Abstract

Jan-Erik Solheim, Kjell Stordahl and Ole Humlum (hereafter SSH) published two articles in 2011 and 2012 about the relationship between the mean temperature in a solar cycle and the length of the previous solar cycle [1, 2]. For the northern hemisphere, they found a negative correlation between those two variables. A long solar cycle is followed by one with a low temperature, and a short solar cycle is followed by one with a high temperature. SSH named this the Previous Solar Cycle Length Model. For simplicity, in this note I refer to it as the Solar Cycle Model or just the model. For the same reason, I usually omit the word mean when referring to the mean temperature in a solar cycle.

SSH claim that their model describes a cause-effect relationship, i.e. that it has predictive power. Solar cycle 24 had just started when they wrote their articles. SSH predicted a significant temperature decrease in solar cycle 24. That solar cycle has just ended, and now it is possible to check if their prediction came true. It did not.

The temperatures fitted well with the Solar Cycle Model until the mid-1970s, but not later. The mean temperatures during the last solar cycles have been much higher than predicted by the model. 

tirsdag 22. desember 2020

Local and regional temperature series

The previous blog post, Global warming is accelerating, applied four temperature series with global coverage. They were NASA GISTEMP, NOAA Global, Berkeley BEST and HadCRUT4 kriging.

The next blog post will examine a solar cycle model which, according to the authors of two articles published eight years ago, claims that the temperatures in some northern regions are dependent on the length of the previous solar cycle. The model predicted cold temperatures in solar cycle 24, which ended in November 2019 after having lasted for 11 years. It is time to check if the prediction came true. 

The  blog post that you are reading now, examines the local and regional temperature series that will be applied in the next blog post. It shows graphically the temperature series read from these sources, and it compares them against each other. 

The average length of a solar cycle is 11 years. The temperatures are therefore averaged over 11 years in this blog post before plotting and comparison. The average is shown as a moving average, in which each point on the temperature curve shows the average of the monthly temperatures five and a half years before and after that point.

lørdag 17. oktober 2020

Global warming is accelerating

Figure 1 shows how the global surface temperature has increased since pre-industrial time.

The blue dots are the monthly temperature anomalies, the blue curve is the five years moving average, and the red line is the trend calculated over the last 30 years. The reference period is from January 1880 till December 1909. The temperature in that period is often considered as the temperature in pre-industrial time, mainly because we do not have reliable global temperature measurements before that. Consequently, the figure shows the warming since pre-industrial time. 

The trend line ends at 1.19°C in August 2020. It is reasonable to say that the global surface temperature has increased by that value since pre-industrial time.

Figure 1: The average of four global surface temperature series. The reference period is from January 1880 till December 1909.

The temperatures in Figure 1 are the average of the four series NASA GISTEMP, NOAA Global, Berkeley BEST and HadCRUT4 kriging. These series all have global coverage. They were downloaded from their sources in the beginning of October 2020.

onsdag 9. september 2020

Klima ─ Bayesiansk vs frekventistisk tankegang

Dette er tredje og siste innlegg i en miniserie om betinget sannsynlighet og Bayes teorem. Det første innlegget, Betinget sannsynlighet – Bayes teorem, går lett gjennom matematikken. Det andre innlegget, Tolke medisinske tester, bruker Bayes teorem for å tolke medisinske tester statistisk. De to innleggene bruker bayesiansk tankegang.

Tidligere innlegg, dvs. før de to nettopp nevnte, handler mye om statistisk behandling og tolkning av målinger i klimasammenheng. Det er gjort bl.a. i en serie på fem innlegg om Linear regression analysis og i en serie på seks innlegg om Statistical analysis of data with outliers. Disse to seriene, og innlegg som anvender statistikken som de beskriver, bruker en såkalt frekventistisk tankegang.

Bayesiansk og frekventistisk tankegang er på mange måter forskjellige. Statistikere har tildels delt seg i to leirer, slik Ivar Heuch beskriver i artikkelen Striden mellom bayesianere og frekventister om idégrunnlaget for statistiske slutninger. Artikkelen er fra 2008, og i avslutningen skriver Heuch at han tror at det i fremtiden vil etableres en bedre balanse mellom bayesianske og frekventistiske angrepsmåter, og at begge retningene vil finne sin plass i idégrunnlaget for statistikkfaget. 

Jeg synes at forskjellen mellom bayesiansk og frekventistisk tankegang formuleres fint i en forelesning fra UIO, Bayesian modelling of time series. Utgangspunktet er en hypotese og en måleserie. Med frekventistisk tankegang spør vi Hva er sannsynligheten for å få en slik måleserie gitt at hypotesen er riktig ? Med bayesiansk tankegang spør vi Hva er sannsynligheten for at hypotesen er riktig gitt måleserien ? I resten av innlegget vil jeg konkretisere denne forskjellen med et eksempel der måleserien er global temperatur gjennom ti år og hypotesen er at global gjennomsnittstemperatur stiger.

torsdag 27. august 2020

Tolke medisinske tester

Dette er andre innlegg i en miniserie om betinget sannsynlighet og Bayes teorem.  Det første innlegget er Betinget sannsynlighet – Bayes teorem og det tredje innlegget er Klima ─ Bayesiansk vs frekventistisk tankegang.

Nå i august 2020 er mye oppmerksomhet rettet mot covid-19 pandemien. Jeg vil derfor se nærmere på sannsynlighetene rundt testene som gjøres for å avdekke om personer er smittet av SARS-CoV-2 viruset som forårsaker covid-19. Positiv test betyr at testen tyder på at personen er smittet av viruset. Smittet betyr at personen virkelig er smittet av viruset. Sann positiv betyr at en smittet person tester positivt. Sann negativ betyr at en person som ikke er smittet, tester negativt.

Jeg tar utgangspunkt i to rapporter som opererer med litt forskjellige sannsynligheter for testenes sensitivitet og spesifisitet. Sensitivitet, spesifisitet og prevalens er forklart i det forrige innlegget. Kort sagt er sensitiviteten sannsynligheten for positiv test når personen er smittet, spesifisiteten er sannsynligheten for negativ test når personen ikke er smittet, og prevalensen er prosent smittede i en gruppe.

Folkehelseinstituttet (FHI) publiserte nettsiden Testkriterier for koronavirus allerede 8. februar 2020 og har holdt den oppdatert siden da. I den siste oppdateringen 26. august 2020 skriver de at PCR testen som de bruker, har sensitivitet 80 prosent og spesifisitet 99,9 prosent. De skriver videre at prevalensen i Norge er 0,01 prosent. 

Rapporten Covid Reference Edition 4 ble sist oppdatert 11. august 2020. Den publiseres på nettsiden covidreference.com. Der står det at gjennomsnittet av anti-body testene godkjent av FDA har sensitivitet 84,9 prosent og spesifisitet er 98,6 prosent. Jeg vet ikke hvorfor det er såpass stor forskjell mellom disse verdiene og verdiene som FHI opererer med.

Sann positiv som en funksjon av prevalens

Det er viktig å vite sannsynligheten for at en som tester positivt virkelig er smittet. Figur 1 viser sannsynligheten for det. Den er beregnet som en funksjon av prevalens og for fem forskjellige spesifisiteter. Kurvene er beregnet vha. ligning 3 i det forrige innlegget.


Figur 1: Sannsynligheten for at en tilfeldig person som tester positiv, virkelig er smittet av SARS-CoV-2 viruset. Den vises som en funksjon av prevalens for fem forskjellige spesifisiteter.

tirsdag 25. august 2020

Betinget sannsynlighet – Bayes teorem

Dette er det første av tre innlegg i en miniserie om betinget sannsynlighet og Bayes teorem. Det andre innlegget er Tolke medisinske tester og det tredje innlegget er Klima ─ Bayesiansk vs frekventistisk tankegang. Innleggene er samlet i denne pdf-filen.

Statistikk og sannsynlighetsregning er sentralt i klimavitenskapen når trender og sammenhenger skal beregnes og analyseres. Denne klimabloggen har derfor mange innlegg om matematisk statistikk og mange innlegg som bruker statistikk. Men ingen av innleggene så langt er om betinget sannsynlighet der vi basert på eksisterende og ny kunnskap skal ta stilling til en ja-nei problemstilling. Det vil de neste innleggene handle om.

Vi ønsker alle visshet når vi forholder oss til en problemstilling. Men ofte er ikke det mulig fordi selv de beste ekspertene på problemstillingen bare kan angi sannsynlighetene som de forskjellige mulighetene har. Mange synes at det er vanskelig å forholde seg til slik usikkerhet. De ønsker klare svar, dvs. enten eller. De ønsker ikke, kanskje klarer ikke, å forholde seg til sannsynligheter angitt i prosenter.

Ved å innføre betinget sannsynlighet blir det enda vanskeligere. I tillegg til å forholde oss til sannsynligheter må vi tolke dem i ly av allerede kjent kunnskap. Et ofte brukt eksempel på betinget sannsynlighet er mammografi-undersøkelser av alle kvinner ved en bestemt alder. En mammografi-undersøkelse vil med stor sannsynlighet gi et positivt resultat hvis kvinnen virkelig har brystkreft. Men det motsatte er ikke tilfelle. Selv om et prøvesvar er positivt, er det liten sannsynlighet for at kvinnen har brystkreft. For de fleste av oss føles dette intuitivt galt. Også de av oss som har satt seg godt inn i temaet, må ofte tenke seg om flere ganger for å forstå at det vanligvis er slikt. Hensikten med dette og de neste to innleggene er å forklare betinget sannsynlighet, både med matematikk og med eksempler, som forteller at det ofte er slik som nettopp beskrevet med mammografi. Matematikken forklares i dette innlegget. Hvordan den kan anvendes på henholdsvis medisinske tester og på observasjoner innen klimavitenskapen forklares i de påfølgende to innleggene.

Bayes teorem

Bayes teorem, som vist i ligning (1), er sentralt innen betinget sannsynlighet. 

lørdag 27. juni 2020

Skidager i Nordmarka

Dette er fjerde og siste av fire innlegg om snø, temperatur, nedbør og skidager i Nordmarka. De er samlet i denne pdf-filen.

En tommelfingerregel sier at vi kan gå på ski i terrenget når snødybden er 25 cm eller mer. Slike dager kalles skidager. Figur 1 viser antall skidager i Nordmarka utenfor Oslo fra 1900 til 2020. Målingene er hovedsaklig fra målestasjonen på Bjørnholt 360 m.o.h. Der er snødybden målt siden 1897, men med et opphold mellom 1937 og 1954. Meteorologer har brukt målinger fra nærliggende målestasjoner for å lage en sammenhengende måleserie. Et tidligere innlegg, Snødybde og temperatur i Nordmarka, forklarer hvor data om snødybde og skidager er hentet fra og hvordan de er bearbeidet.

Figur 1: Antall skidager per skisesong på Bjørnholt i Nordmarka