mandag 30. januar 2012

Autokorrelasjon i temperaturserier

I innlegget Når er global oppvarming statistisk signifikant ? gikk jeg gjennom ligningene som avgjør om en beregnet temperaturtrend er statistisk signifikant. I tabell 1 i det nevnte innlegget regnet jeg ut p-verdien for trenden fra 1998 til 2010 beregnet både på grunnlag av de årlige og de månedlige temperaturene. Det var mye lettere å få statistisk signifikans med de månedlige temperaturene enn med de årlige temperaturene. Jeg konkluderte med å bruke p-verdien regnet ut basert på de årlige temperaturene, både fordi jeg så at andre gjør det og fordi p-verdien basert på de årlige temperaturene var mest troverdig.

Beregningen av p-verdi i det nevnte innlegget forutsetter at temperaturene er statistisk uavhengige av hverandre. Dvs. at den vertikale avstanden fra en temperaturmåling til trendlinjen er statistisk uavhengig av de tilsvarende avstandene for temperaturmålingene før og etter i tid. For de årlige temperaturene stemmer det ganske bra. Men for de månedlige temperaturmålingene stemmer det ikke. Hvis f.eks. temperaturen i februar ligger over trendlinjen, ligger vanligvis også temperaturene for både januar og mars også over. Vi ser det klart i figur 1.
Figur 1.  NASA GISS månedlige temperaturavvik 1998 - 2010
I resten av innlegget går jeg gjennom hvordan vi kan kompensere for mangelen på statistisk uavhengighet.