Klimablogg: Snødybde og skidager i Enebakk

De tre forrige innleggene på denne bloggen viser et plot med antall skidager og mange plot med snødybder på Bjørnholt 360 moh. Dager med snødybde 25 cm eller mer regnes som en skidag. Både antall skidager og snødybde har en synkende trend.

Statsmeteorolog Gustav Bjørbæk viser i boken Marka på sitt beste plot med antall skidager per sesong for mange steder i Oslo-marka. I hvert plot har han tegnet inn trendlinjen. Enebakk skiller seg ut ved at trendlinjen for antall skidager per sesong er svakt stigende. For alle andre steder er trenden synkende. Bjørbæk har ingen god forklaring på den stigende trenden i Enebakk. Dagbladets omtale av boken har et eget avsnitt om Mysteriet Enebakk.

Dette gjorde meg nysgjerrig på snøforholdene i Enebakk, og jeg lastet ned snødybdene der og analyserte dem. Enebakk ligger syd i Østmarka 163 moh.

Figur 1: Gjennomsnittlig snødybde i Enebakk i vintersesongen. De sorte punktene er sesongverdiene. Den røde linjen er trenden. Den blå kurven er glidende 30-års gjennomsnitt av sesongverdiene.

Månedlige gjennomsnittsverdier fra eKlima-portalen til Meteorologisk institutt er basis for Figur 1.

Jeg definerer de fem månedene desember til april som vintersesongen i Enebakk. Vintersesongen i et år består av desember i det foregående året og januar til april i det aktuelle året. Figur 1 viser gjennomsnittlig snødybde i vintersesongen i Enebakk. Trendlinjen gir en pekepinn om hva vi kan forvente av gjennomsnittlig snødybde. Trendlinjen faller med 1,7 cm per tiår. Det er bare 1,7 mm per år, noe som kan høres ubetydelig ut. Men resultatet over 61 år er nesten en halvering av snødybden, fra 23 cm i 1958 til 13 cm i 2018-sesongen. Det er en dramatisk reduksjon.

Klima defineres som gjennomsnittlig vær gjennom mange år, og det er vanlig å bruke 30 år som 'mange år'. Den tykke blå kurven i figuren er glidende 30-års gjennomsnitt av sesongverdiene. Hvert punkt på kurven er gjennomsnittet av de 15 foregående og de 15 etterfølgende årene. Kurvens siste punkt er mellom 2003 og 2004, og det viser gjennomsnittet av antall skidager per år i perioden 1989 til 2018.

De månedlige gjennomsnittsverdiene fra eKlima for Enebakk mangler data for noen måneder. Det er for 1998 da de flyttet stasjonen i Enebakk, og for fem januarmåneder etter det. For disse månedene har jeg beregnet snødybden i Enebakk basert på målinger fra to andre målestasjoner. Snødybden i Figur 1 er derfor omtalt som Homogenisert. Appendix A forklarer dette. Der viser jeg også en figur, tilsvarende Figur 1, uten de beregnede månedsverdiene. Da er den synkende trenden 2 cm per tiår, dvs. litt kraftigere enn i Figur 1.

Jeg har også beregnet trenden for snødybden i Enebakk enkeltvis for de seks månedene november, desember, januar, februar, mars og april. Den er synkende i alle månedene.

Figur 2 er en oppsummering som viser glidende 30-års gjennomsnitt av snødybden i de nevnte månedene og i vintersesongen.

Figur 2: Glidende 30-års gjennomsnitt av snødybden i enkeltmåneder og i vintersesongen.

Figur 1 og 2 viser stort sett det samme som figurene for Bjørnholt i de tre foregående innleggene på bloggen. Trenden i snødybde er fallende i alle månedene.

Hvorfor øker antall skidager i Bjørbæks plot når snødybden synker i mine plot ?

Som registrert bruker på eKlima-portalen til Meteorologisk institutt har jeg tilgang til månedsvis midlere snødybde i Enebakk fra januar 1957. Jeg har ikke funnet daglige snømålinger for Enebakk på eKlima. Bjørbæk skriver i boken at han har hentet data fra både instituttets datamaskin og fra Riksarkivet. Selv har jeg bare hentet fra den nevnte eKlima-portalen. Dvs. at Bjørbæk har et mer omfattende datagrunnlag enn jeg har. Men jeg tviler på at det er årsaken til forskjellen i trendlinjer.

Antall skidager er ikke nødvendigvis et godt mål på hvordan snøforholdene utvikler seg. På steder med mye snø, som på Bjørnholt, skiller ikke antall skidager mellom 25 cm snø og veldig mye snø. De tre tidligere innleggene på bloggen viser at trenden for snødybde på Bjørnholt begynte å synke før trenden i antall skidager for alvor begynte å synke. På steder med lite snø, som i Enebakk, skiller ikke antall skidager mellom lite snø, nesten ikke snø og ingen snø. På Enebakk skifter forholdene mellom disse tre tilstandene i lange perioder om vinteren.

Det neste kapitlet viser at trendberegning for antall skidager i Enebakk er problematisk rent matematisk. Derfor synes jeg ikke at vi skal legge for stor vekt på at trenden for antall skidager der øker.

Litt om trendberegning

Når ikke annet er oppgitt er vanligvis en trend er beregnet med Ordinary Least Square, heretter omtalt som OLS. Det gjelder for trendlinjen i Figur 1 i dette innlegget, og jeg antar at det gjelder for trendlinjene i boken til Bjørbæk.

Antall skidager i hver sesong i Enebakk er langt fra normalfordelte. I dataene ligger implisitt en brutal avskjæring ved null. En ikke-skidag kan være alt fra 24 cm snø til grønne plener. Negative antall skidager eksisterer ikke. Et histogram over skidagene vil vise en klump omkring null, og en lang 'hale' med noen få snørike år. Dvs. at histogrammet overhodet ikke vil se ut som Bell-kurven til normalfordelte data. Den vanlige trendberegningen OLS forutsetter at dataene er så noenlunde normalfordelte. OLS fungerer dårlig når de ikke er det. Dette beskrives mange steder, bl.a. i den korte artikkelen Dealing With Non-normal Data. Vi kan derfor ikke legge stor vekt på at OLS-trenden for antall skidager i Enebakk er stigende.

Jeg har ikke datagrunnlaget som Bjørbæk benytter for Enebakk, og jeg har derfor ikke beregnet trenden for antall skidager og sett om den er statistisk signifikant. Men når jeg ser på plottet til Bjørbæk tror jeg at den beregnede trenden er langt fra statistisk signifikant. Det er også en god grunn til ikke å legge for stor vekt på den.

Artikkelen som jeg refererte til i det forrige avsnittet, sier at for data som er langt fra normalfordelte bør vi bruke statistiske metoder som ikke forutsetter normalitet i dataene. Kendal-Theil robust line (KT) er en slik metode for å beregne en lineær trend. KT beregner trenden mellom alle årsverdiene og velger så medianen av disse som trend for hele målesettet. Denne metoden er lite følsom for både slengere (outliere) og skjevfordeling i dataene fordi den velger medianen. Trend beregnet med OLS er veldig følsom for slengere i dataene fordi den minimerer summen av kvadratene av forskjellene mellom trendlinjen og målingene. Fordi jeg ikke har datagrunnlaget for å beregne trenden vet jeg ikke om KT trendlinjen for skidager i Enebakk er stigende eller fallende.

Figur 3 viser KT trenden for de homogeniserte snødybdene i Enebakk. Den er synkende, men ikke så mye som når trenden beregnes med OLS. Jeg antar at slengeren i 1966 med 73 cm bidrar mye til at OLS trenden er mer synkende enn KT trenden.

Figur 3: Samme data som i Figur 1, bortsett fra at den røde trendlinjen er beregnet med Kendall-Theil robust line metoden.

På tross av mangel på normalitet i dataene synes jeg at OLS trenden beskriver utviklingen bedre enn KT trenden. Det kan skyldes at slengerene i dataene, som snøvinteren 1966, er reelle og ikke feilmålinger. Men jeg synes at det glidende 30-års gjennomsnittet i Figur 2 beskriver utviklingen bedre enn trendlinjene.

Appendiks A: Homogenisert snødybde i Enebakk

Fra eKlima har jeg lastet ned gjennomsnittlig månedlig snødybde for Enebakk, Flateby og Bjørnholt. Måleserien for Enebakk har månedlig snødybder fra januar 1957, men den mangler verdier for noen måneder etter det. Det største hullet er ved overgangen fra målestasjon Enebakk 4050 til Enebakk-Barbøl 4040 i 1998; da mangler data for hele vintersesongen. Etter 1998 mangler det fem månedsverdier for januar.

Jeg ønsker å lage en homogenisert måleserie for Enebakk der de manglende målingene erstattes med modifiserte målinger fra Flateby, som ligger i nærheten og på omtrent samme høyde som Enebakk, og fra Bjørnholt. Basisen for å modifisere disse målingene er differansen mellom Enebakk og disse to andre stedene når både Enebakk og de andre stedene har målinger.

Figur 4: Snødybdemålinger i Enebakk, Flateby og Bjørnholt. Dybdene er gjennomsnitt i vintersesongen. Pga. fem manglende januarmålinger etter 2005 mangler Enebakk gjennomsnittlig snødybde for de fem vintersesongene der disse januarmålingene inngår. De tykke kurvene er 8-års glidende gjennomsnitt av snødybden.

Tabell 1 viser middelverdi og standardavvik av differansene.

Tabell 1: Gjennomsnitt (Middel) og standardavvik (StdAvvik) av differansene mellom månedlig snødybde i Enebakk og henholdsvis Flateby og Bjørnholt. Benevningen er cm. Differansene er beregnet for månedene det foreligger målinger for Enebakk og henholdsvis Flateby og Bjørnholt..

Både tabellen og figuren viser at det er litt mer snø i Enebakk enn i Flateby. Videre at det er mye mer snø på Bjørnholt enn i Enebakk. Differansene mellom Enebakk og de to andre stasjonene har stort standardavvik, som betyr at det er stor usikkerhet knyttet til de homogeniserte månedsverdiene som vi får ved å kompensere månedsverdier fra Flateby og Bjørnholt med middelverdi av differansene. Men det er ikke så mange måneder vi behøver å gjøre det for. Når vi får en homogenisert januarmåned kan vi bruke den og de virkelige målingene for desember og februar til april for å lage en gjennomsnittlig snødybde i vintersesongen.

Jeg velger å bruke Flateby-målingene når de er tilgjengelige og Bjørnholt-målingene når det heller ikke er målinger for Flateby. Det vil si at jeg bruker Flateby for stasjonskiftet på Enebakk i 1998 og Bjørnholt for de fem januarverdiene etter det når Enebakk mangler verdier. Alle andre månedsverdier er slik de er hentet ned fra eKlima for Enebakk.

Trenden for gjennomsnittlig snødybde i Enebakk i vintersesongen synker med 1,7 cm per tiår når jeg bruker de homogeniserte snødybdene. Figur 5 viser at trenden faller med 2 cm per tiår når trendberegningen bare bruker vintersesongene der Enebakk selv har målinger. Vi ser at figuren mangler verdi for 1998 da stasjonen i Enebakk ble flyttet. Den mangler også verdier for 2006, 2007, 2008, 2009 og 2011 fordi januarmålingene mangler i de årene. Men på tross av seks manglende sesongverdier i Figur 5 er totalbildet der omtrent det samme som i Figur 1.