torsdag 9. oktober 2014

Konfidensintervall og test av solsyklusmodellen

Jan-Erik Solheim skrev i diskusjonen på Dagsavisen Nye Meninger (DNM) at han og medforfatterne Ole Humlum og Kjell Stordahl testet solsyklusmodellen ved å sammenligne målte middeltemperaturer i solsyklus 23 med modellens prediksjoner og 95% konfidensintervall. De har ikke, hverken i diskusjonen på DNM eller i sin opprinnelige artikkel, gitt detaljer rundt denne testen som gjør leseren i stand til å vurdere resultatet. Som et svar på dette hevdet jeg at solsyklusmodellen feilet i den testen, og at den ligger an til å feile enda mer i inneværende solsyklus 24. Jeg har tidligere underbygget dette med numeriske detaljer i tabell 3 og 4 i innlegget Solar Cycle Model fails after mid-1970s. Nå i ettertid har jeg arbeidet med å fremstille dette grafisk. Jeg kan ikke inkludere grafikk i diskusjonen på DNM, og jeg legger den derfor inn i dette innlegget på egen blogg.

Innlegget starter med en generell forklaring av konfidensintervall og hvordan de kan brukes for å teste solsyklusmodellens prediksjoner. Deretter følger tre figurer med grafisk fremstilling av konfidensintervall som viser at solsyklusmodellen fungerte OK frem til midten av 1970-tallet, men at den overhodet ikke kan forklare de høye temperaturene som er målt i de siste tiårene. Modellen er derfor uegnet til å prediktere fremtidige temperaturer.

Det er vanlig å angi usikkerheten som et 95% konfidensintervall rundt beregnet verdi. Både konfidensintervall og beregnet verdi er basert på et sett med målinger og en hypotese (eller teori). Hvis hypotesen er riktig, er det 95% sannsynlighet for at konfidensintervallet omfavner korrekt verdi; dvs. at det er 2,5% sannsynlighet for at hele konfidensintervallet ligger over korrekt verdi og 2,5% sannsynlighet for at det ligger under korrekt verdi.

Hypotesen i solsyklusmodellen er at temperaturen i en solsyklus er bestemt av lengden på den foregående solsyklusen, og at vi kan prediktere temperaturen vha. lineær regresjonsanalyse. Usikkerheten i prediksjonen beregnes først som et konfidensintervall som med 95% sannsynlighet omfavner forventet middeltemperatur i den neste solsyklusen. Men for å teste prediksjonen må vi sammenligne den med målt middeltemperatur. Den vil normalt avvike fra forventet middeltemperatur pga. støy fra vær og/eller naturlige variasjoner. Konfidensintervallet for forventet middeltemperatur må derfor utvides slik at det tar hensyn til støyen som vi har erfart at målinger av slike middeltemperaturer har. Etter utvidelsen er det 95% sannsynlighet for at konfidensintervallet omfavner målt middeltemperatur i den neste solsyklusen. Alle konfidensintervall som presenteres i dette innlegget, er utvidet på denne måten. Et tidligere innlegg, med bl.a. detaljert referanse til Storchs bok Statistical Analysis in Climate Research, forklarer dette nærmere.

Med solsyklusmodellen kan vi prediktere middeltemperaturen i hver solsyklus for hver temperaturserie. Temperaturseriene kan være lokale eller globale. Hver prediksjon har sitt tilhørende konfidensintervall. Figur 1 viser, for femten temperaturserier, hvordan prediksjonene med tilhørende konfidensintervall ligger i forhold til målt middeltemperatur i solsyklus 20. For alle temperaturseriene er observert middeltemperatur lagt i nullpunktet på horisontal x-akse.

Figur 1: Solsyklusmodellens prediksjoner og 95% konfidensintervall for solsyklus 20 for femten temperaturserier. Prediksjonene og konfidensintervallene er tegnet relativt middeltemperaturene som ble målt i solsyklus 20. Målte middeltemperaturer er lagt i nullpunktet på horisontal x-akse.

Prediksjonene og konfidensintervallene i Figur 1 er beregnet med temperaturene målt t.o.m. solsyklus 19. Disse prediksjonene kunne ha blitt gjort da solsyklus 20 startet. De målte middeltemperaturene ble klare da solsyklus 20 sluttet, og vha. disse kan vi teste prediksjonene som ble gjort da solsyklusen startet. Vi gjør det tilsvarende når vi senere tester prediksjonene for solsyklusene 23 og 24. Temperaturene i solsyklusen som vi tester prediksjonene for, inngår aldri i beregningene av prediksjonen. Det gjør selvfølgelig heller ikke temperaturene i de etterfølgende solsyklusene.

Solsyklus 20 varte frem til 1976. Figur 1 bekrefter at solsyklusmodellen fungerte bra frem til midten av 1970-tallet. Konfidensintervallene ligger ganske jevnt spredt rundt de målte middeltemperaturene. Bare ett av femten konfidensintervall feiler mht. å omfavne den målte middeltemperaturen. Dette er statistisk sett som forventet.

Den forrige solsyklusen, nummer 23, sluttet i 2008. Figur 2 viser solsyklusmodellens prediksjoner og 95% konfidensintervall relativt målte middeltemperaturer i solsyklus 23. Hele ti av de femten målte middeltemperaturene er varmere enn øvre grense i konfidensintervallene til sine prediksjoner. Vi kan trygt si at solsyklusmodellen feilet i sine prediksjoner for solsyklus 23.

Figur 2: Solsyklusmodellens prediksjoner og 95% konfidensintervall for solsyklus 23. Forøvrig samme forklaring som til Figur 1.

Vi er nå ca halvveis i solsyklus 24. Figur 3 viser solsyklusmodellens prediksjoner og 95% konfidensintervall relativt de målte middeltemperaturene så langt i solsyklus 24. Hele fjorten av de femten målte middeltemperaturene er varmere enn øvre grense i konfidensintervallene til sine prediksjoner. 

Jeg har tidligere vist at de siste halvpartene av solsyklusene i snitt har vært varmere enn de første halvpartene. Alt tyder derfor på at solsyklusmodellen vil feile enda mer i solsyklus 24 enn den gjorde i solsyklus 23. 

Figur 3: Solsyklusmodellens prediksjoner og 95% konfidensintervall for solsyklus 24. Vi er ca halvveis i solsyklus 24, og nullpunktet på horisontal x-akse er middeltemperaturene målt så langt. Forøvrig samme forklaring som til Figur 1.

Figur 2 og Figur 3 viser at solsyklusmodellen ikke kan forklare de høye temperaturene som er målt i de siste tiårene. Modellen er derfor uegnet til å prediktere fremtidige temperaturer.

Etterord om temperaturseriene

Temperaturene som danner grunnlaget for Figur 1 og Figur 2 ble lastet ned i 2012. Vardø temperaturene ble lastet ned fra eKlima portalen til Meteorologisk institutt, og de andre lokale temperaturene ble lastet ned fra rimfrost.no. Beregningene ble gjort i 2012 i forbindelse med at innlegget Solar Cycle Model fails after mid-1970s ble skrevet.

Temperaturene som danner grunnlaget for Figur 3 ble lastet ned i månedskiftet september/oktober i 2014. De lokale temperaturene ble lastet ned fra rimfrost.no. Armagh i Nord-Irland er ikke lenger med i  Rimfrost listen, så jeg brukte Belfast temperaturene i stedet for. Britiske Met Office har ikke oppdatert HadCRUT3 temperaturene siden mai 2014 på siden som jeg pleier å hente de fra. Jeg valgte derfor å bruke HadCRUT4 temperaturene i stedet for; de er oppdatert t.o.m. august 2014.

Ingen kommentarer:

Legg inn en kommentar