Innlegget bruker temperaturdata for tidsrommet 1998 til 2010 som et eksempel. 1998 var et varmt år. Det er med hensikt valgt som start i eksempelet, fordi mange påstår at den globale oppvarmingen stoppet i 1998, og noen hevder at det har har vært en kjølende trend siden 1998. Bl.a. hevder Ivar Giæver, nobelprisvinner i fysikk, i en kronikk i Aftenposten 26. juni 2011 at "Men klimaforkjemperne snakker ikke lenger om global oppvarming, temperaturen har jo gått ned siden 1998!" Giæver underbygger ikke påstanden sin, hverken i kronikken eller som svar på de kritiske kommentarene som kom i Aftenposten. Blogginnlegget som du leser nå, viser at Giæver's påstand er feil.
NASA GISS Temperaturkurve
Figurer med global temperatur langs den vertikale y-aksen og tiden langs den horisontale x-aksen er velkjente. Temperaturen er avviket fra en middeltemperatur, og den er beregnet på grunnlag av målinger fra bl.a. termometere og satellitter. Den angir et middlet middelavvik for landområder og for havoverflaten. Den betegnes ofte bare som temperaturen. Dette er nærmere forklart i et tidligere innlegg. Nå konsentrerer vi oss om å beregne trender i temperaturutviklingen, og å undersøke om trendene angir statistisk signifikant oppvarming eller nedkjøling.
Figur 1 viser NASA GISS temperaturen i perioden 1998 til 2010.
Figur 1. NASA GISS årlige temperaturavvik 1998 - 2010 |
De blå punktene forbundet med stiplet linje er temperaturen. Den varierer fra år til år pga. naturlige variasjoner. Det kan derfor være vanskelig å se om det er en underliggende trend i temperaturutviklingen. Den røde linjen er trenden beregnet vha. lineær regresjonsanslyse.
Beregne trend
Med lineær regresjonsanalyse er det enkelt å beregne en rett linje som best mulig passer en måleserie. Programmene Excell (med funksjonene INTERCEPT og SLOPE), MatLab (med funksjonen polyfit) og Scilab (med funksjonen reglin) regner ut både helningen til den rette linjen og skjæringspunktet med den vertikale y-aksen. De nevnte funksjonene i disse 3 programmene gir samme resultat. Når vi bruker slike standardfunksjoner, får vi eksakte svar uten selv å synse eller vurdere. Synsing og vurdering i slike spørsmål er uheldig, fordi det ofte fører til at vi konkluderer med det vi på forhånd mente. Figuren over er beregnet og plottet med Scilab, og trenden beregnet vha. lineær regresjonsanalyse er tegnet med rød strek. Den har en helning på 0.014 °C/år, dvs. den viser global oppvarming også etter 1998.
Trenden 0.014 °C/år er beregnet uten synsing eller vurdering. Det neste naturlige spørsmålet er om denne trenden er noe å legge vekt på, eller om variasjonene i målingene er så store at den har liten verdi. Her er det rom for synsing, men heldigvis finnes statistiske metoder som kan gi eksakt svar også på dette spørsmålet. Vi vil nå gå gjennom dette med referanse til figuren.
Beregne statistisk signifikans
Hypotesen vår er at temperaturen endrer seg med tiden, dvs. at det er enten global oppvarming eller global nedkjøling. Nullhypotesen er at endringene i temperaturen fra år til år er tilfeldige, dvs. at det hverken er global oppvarming eller nedkjøling. Vår hypotese kalles den alternative hypotesen, fordi den er alternativet til nullhypotesen.
Utgangspunktet er at vi, basert på et sett med temperaturmålinger, har regnet ut en trend. Trenden indikerer global oppvarming eller nedkjøling, avhengig av fortegnet. Men vi vet ikke om oppvarmingen / nedkjølingen er statistisk signifikant. Nullhypotesen er sentral for å bestemme det. Vi vil regne ut sannsynligheten for å måle disse temperaturene, eller noen som avviker enda mere fra nullhypotesen, gitt at nullhypotesen er riktig. Denne sannsynligheten kalles p-verdien. Det er vanlig å forkaste nullhypotesen hvis p-verdien er mindre enn 0.05. Da sier vi at den alternative hypotesen er statistisk signifikant på 95% konfidensnivået, eller bare at den er statistisk signifikant.
For hvert blått målepunkt er det en avstand opp eller ned til den røde regresjonslinjen. Avstanden kalles målingens feil eller residual. Vi beregner summen av kvadratene av feilene til alle målepunktene. Fortegnet til feilene varierer, men kvadratet av feilene er altid positivt, så summen øker etter hver addisjon. Summen av kvadratene dividerer vi så på antall målepunkter minus 2, og så trekker vi kvadratroten av kvotienten. Denne verdien har samme benevning som målingene, i vårt tilfelle °C, og vi kaller den standardfeilen til regreasjonsanalysen. Dette er vist i ligningen (1). Ligningene er av praktiske årsaker gruppert sammen litt lenger ned i innlegget.
Det neste steget er å beregne standardfeilen til trenden, som vist i ligning (2). Standardfeilen til trenden har samme benevning som trenden, i vårt tilfelle °C/år. Jo større standardfeilen til regresjonsanalysen er, jo større er standardfeilen til trenden. Og jo større avstand mellom målepunktene på x aksen er, jo mindre er standardfeilen til trenden. I vårt tilfelle med temperaturer mellom 1998 og 2010 er standardfeilen til temperaturtrenden 0.0066 °C/år.
Intuitivt skjønner vi at en beregnet trend som er mye mindre enn dens standardfeil, indikerer at nullhypotesen er riktig og bør aksepteres. Det betyr i vårt tilfelle at det ikke er en statistisk signifikant oppvarming eller nedkjøling. Tilsvarende skjønner vi at en beregnet trend som er mye større enn dens standardfeil, indikerer at nullhypotesen er gal og bør forkastes. Det betyr i vårt tilfelle at det er en statistisk signifikant oppvarming eller nedkjøling. Dvs. at det er forholdstallet mellom trenden og dens standardfeil som betyr noe mht. om vi skal forkaste nullhypotesen. Forholdstallet kalles t-score, og regnes ut som vist i ligning (3).
Ligninger med symbolforklaring |
I vårt tilfelle med temperaturer mellom 1998 og 2010 er t-score 2.085.
Antall målinger påvirker også avgjørelsen om hvorvidt nullhypotesen skal forkastes eller ikke. Med en gitt t-score verdi kan nullhypotesen aksepteres hvis antall målinger er lite, men forkastes hvis antall målinger er stort. Dette oppfattes også intuitivt som riktig. En beregnet trend basert på mange målinger er mere troverdig enn en trend basert på få målinger.
t-score har en velkjent sannsynlighetsfordeling (Student T ) under forutsetning av at støyen på målingene er tilfeldig, som jo er forutsetningen til nullhypotesen. Vi bruker kunnskapen om denne sannsynlighetsfordelingen til å regne ut p-verdien gitt en t-score verdi og antall målinger. Scilab og andre program har støtte for å regne ut dette. Vi forkaster nullhypotesen hvis p-verdien er mindre enn en grenseverdi. Det er vanlig å bruke 5%, dvs 0.05, som grenseverdi, noe vi også gjør. Når p-verdien er mindre enn grensen, forkaster vi nullhypotesen og sier at det er en statistisk signifikant oppvarming eller nedkjøling, avhengig av fortegnet til den beregnete trenden. I motsatt fall sier vi at det ikke er en statistisk signifikant oppvarming eller nedkjøling. Student T sannsynlighetsfordelingen og dens bruk i hypotesetesting forklares nærmere i et senere innlegg.
Antall målinger påvirker også avgjørelsen om hvorvidt nullhypotesen skal forkastes eller ikke. Med en gitt t-score verdi kan nullhypotesen aksepteres hvis antall målinger er lite, men forkastes hvis antall målinger er stort. Dette oppfattes også intuitivt som riktig. En beregnet trend basert på mange målinger er mere troverdig enn en trend basert på få målinger.
t-score har en velkjent sannsynlighetsfordeling (Student T ) under forutsetning av at støyen på målingene er tilfeldig, som jo er forutsetningen til nullhypotesen. Vi bruker kunnskapen om denne sannsynlighetsfordelingen til å regne ut p-verdien gitt en t-score verdi og antall målinger. Scilab og andre program har støtte for å regne ut dette. Vi forkaster nullhypotesen hvis p-verdien er mindre enn en grenseverdi. Det er vanlig å bruke 5%, dvs 0.05, som grenseverdi, noe vi også gjør. Når p-verdien er mindre enn grensen, forkaster vi nullhypotesen og sier at det er en statistisk signifikant oppvarming eller nedkjøling, avhengig av fortegnet til den beregnete trenden. I motsatt fall sier vi at det ikke er en statistisk signifikant oppvarming eller nedkjøling. Student T sannsynlighetsfordelingen og dens bruk i hypotesetesting forklares nærmere i et senere innlegg.
I vårt tilfelle er p-verdien 0.06. Det er bare litt større enn grensen 0.05, men den gjør at vi må konkludere med at den beregnete trenden + 0.014 °C/år ikke viser en statistisk signifikant oppvarming. Et mere folkelig utsagn er at vi kan ikke med god sikkerhet si at temperaturmålingene mellom 1998 og 2010 viser at det er en underliggende trend med global oppvarming. Men det betyr ikke at vi kan si at global oppvarming stoppet i 1998. Målingene med påfølgende beregninger viser økende temperatur i perioden, og økningen er veldig nær grensen for å være statistisk signifikant.
HadCRUT3 og NCDC temperaturdata
Vi har brukt NASA GISS temperaturene som eksempel så langt i dette innlegget. De neste figurene viser tilsvarende plot basert på HadCRUT3 og NCDC temperaturene. Begge disse temperaturseriene viser global oppvarming, men som vi skal se er den ikke statistisk signifikant.
Figur 2. HadCRUT3 årlige temperaturavvik 1998 - 2010 |
Figur 3. NCDC årlige temperaturavvik 1998 - 2010 |
Resultatene summeres opp i Tabell 1 litt lenger ned på siden, der også resultatene fra beregningene med de månedlige temperaturene er med.
Som vi ser er det stor forskjell mellom trenden beregnet basert på disse 3 temperaturseriene. I et senere innlegg vil vi vise at de samsvarer bra når vi beregner trenden over 20 år og lengere.
Månedlige temperaturdata
Så langt i innlegget har vi brukt de årlige temperaturdataene i plot og analyser. NASA GISS, HadCRUT3 og NCDC temperaturene er også tilgjengelige som månedlige temperturavvik. Når vi gjør den lineære regresjonsanalysen med de månedlige temperaturene, blir beregnet p-verdi forskjellig fra når vi bruker de årlige temperaturene, av 2 årsaker. Det er12 ganger så mange målinger, som bidrar til at det er lettere å få lav p-verdi, dvs. statistisk signifikans. Men det er større feil (residualer) for månedstemperaturene relativt den rette regresjonslinjen, noe som bidrar den andre veien.
Vi gjentar den lineære regreasjonsanalysen med de månedlige temperaturavvikene f.o.m. januar 1998 t.o.m. desember 2010. Vi tar ikke med månedene i 2011 for å få bedre kompatibilitet med resultatene fra regresjonsanalysen basert på de årlige dataene.
Figur 4. NASA GISS månedlige temperaturavvik 1998 - 2010 |
Beregnet trend er praktisk talt den samme som når vi bruker de årlige temperaturene. Med NASA GISS temperaturene har standardfeilen til regresjonsanalysen økt til 0.137 °C, sammenlignet med 0.089 °C når de årlige temperaturene blir brukt. Men antall målesett har økt til 13*12, dvs til 156, og det betyr mere.
Oppsummering av resultater
Tabell 1 oppsummerer resultatene, både når beregningene er basert på de årlige og de månedlige temperaturavvikene.
Oppsummering av resultater
Tabell 1 oppsummerer resultatene, både når beregningene er basert på de årlige og de månedlige temperaturavvikene.
Temperaturserie | Trend [ °C/år] | t-score | p-verdi | |
NASA GISS | Årlig | 0.0137 | 2.085 | 0.06 |
Månedlig | 0.0133 | 4.529 | 0.00001 | |
HadCRUT3 | Årlig | 0.0024 | 0.394 | 0.70 |
Månedlig | 0.0020 | 0.836 | 0.40451 | |
NCDC | Årlig | 0.0072 | 1.391 | 0.19 |
Månedlig | 0.0068 | 2.805 | 0.00568 |
Tabell 1. Temperaturtrend 1998 - 2010 med tilhørende p-verdi.
Beregnet trend er praktisk talt den samme for de årlige og månedlige temperaturene. Men p-verdien er mye mindre for de månedlige temperaturene, med statistisk signifikant oppvarming både for NASA GISS og NCDC temperaturene.
De fleste analyserer av signifikans tar utgangspunkt i de årlige temperaturene. Noen tar imidlertid utgangspunkt i de månedlige temperaturene for lettere å få statistisk signifikans. Månedlige temperaturer gjør det lettere å forkaste nullhypotesen. Men samtidig blir det mere uklart om hypotesen om en langsiktig global oppvarming er det dominerende alternativet til nullhypotesen. Vi velger derfor å bruke de årlige temperaturene i diskusjoner om statistisk signifikans.
Avslutning
Resultatene i dette innlegget er beregnet vha. anerkjente metoder uten synsing. Men fremdeles er det rom for synsing og kirsebærplukking ved at en kan velge tidsserien som skal analyseres, og om NASA GISS, HadCRUT3 eller NCDC temperaturene skal brukes. Dette belyser vi mere i senere innlegg.
Ingen kommentarer:
Legg inn en kommentar