onsdag 9. september 2020

Klima ─ Bayesiansk vs frekventistisk tankegang

Dette er tredje og siste innlegg i en miniserie om betinget sannsynlighet og Bayes teorem. Det første innlegget, Betinget sannsynlighet – Bayes teorem, går lett gjennom matematikken. Det andre innlegget, Tolke medisinske tester, bruker Bayes teorem for å tolke medisinske tester statistisk. De to innleggene bruker bayesiansk tankegang.

Tidligere innlegg, dvs. før de to nettopp nevnte, handler mye om statistisk behandling og tolkning av målinger i klimasammenheng. Det er gjort bl.a. i en serie på fem innlegg om Linear regression analysis og i en serie på seks innlegg om Statistical analysis of data with outliers. Disse to seriene, og innlegg som anvender statistikken som de beskriver, bruker en såkalt frekventistisk tankegang.

Bayesiansk og frekventistisk tankegang er på mange måter forskjellige. Statistikere har tildels delt seg i to leirer, slik Ivar Heuch beskriver i artikkelen Striden mellom bayesianere og frekventister om idégrunnlaget for statistiske slutninger. Artikkelen er fra 2008, og i avslutningen skriver Heuch at han tror at det i fremtiden vil etableres en bedre balanse mellom bayesianske og frekventistiske angrepsmåter, og at begge retningene vil finne sin plass i idégrunnlaget for statistikkfaget. 

Jeg synes at forskjellen mellom bayesiansk og frekventistisk tankegang formuleres fint i en forelesning fra UIO, Bayesian modelling of time series. Utgangspunktet er en hypotese og en måleserie. Med frekventistisk tankegang spør vi Hva er sannsynligheten for å få en slik måleserie gitt at hypotesen er riktig ? Med bayesiansk tankegang spør vi Hva er sannsynligheten for at hypotesen er riktig gitt måleserien ? I resten av innlegget vil jeg konkretisere denne forskjellen med et eksempel der måleserien er global temperatur gjennom ti år og hypotesen er at global gjennomsnittstemperatur stiger.

torsdag 27. august 2020

Tolke medisinske tester

Dette er andre innlegg i en miniserie om betinget sannsynlighet og Bayes teorem.  Det første innlegget er Betinget sannsynlighet – Bayes teorem og det tredje innlegget er Klima ─ Bayesiansk vs frekventistisk tankegang.

Nå i august 2020 er mye oppmerksomhet rettet mot covid-19 pandemien. Jeg vil derfor se nærmere på sannsynlighetene rundt testene som gjøres for å avdekke om personer er smittet av SARS-CoV-2 viruset som forårsaker covid-19. Positiv test betyr at testen tyder på at personen er smittet av viruset. Smittet betyr at personen virkelig er smittet av viruset. Sann positiv betyr at en smittet person tester positivt. Sann negativ betyr at en person som ikke er smittet, tester negativt.

Jeg tar utgangspunkt i to rapporter som opererer med litt forskjellige sannsynligheter for testenes sensitivitet og spesifisitet. Sensitivitet, spesifisitet og prevalens er forklart i det forrige innlegget. Kort sagt er sensitiviteten sannsynligheten for positiv test når personen er smittet, spesifisiteten er sannsynligheten for negativ test når personen ikke er smittet, og prevalensen er prosent smittede i en gruppe.

Folkehelseinstituttet (FHI) publiserte nettsiden Testkriterier for koronavirus allerede 8. februar 2020 og har holdt den oppdatert siden da. I den siste oppdateringen 26. august 2020 skriver de at PCR testen som de bruker, har sensitivitet 80 prosent og spesifisitet 99,9 prosent. De skriver videre at prevalensen i Norge er 0,01 prosent. 

Rapporten Covid Reference Edition 4 ble sist oppdatert 11. august 2020. Den publiseres på nettsiden covidreference.com. Der står det at gjennomsnittet av anti-body testene godkjent av FDA har sensitivitet 84,9 prosent og spesifisitet er 98,6 prosent. Jeg vet ikke hvorfor det er såpass stor forskjell mellom disse verdiene og verdiene som FHI opererer med.

Sann positiv som en funksjon av prevalens

Det er viktig å vite sannsynligheten for at en som tester positivt virkelig er smittet. Figur 1 viser sannsynligheten for det. Den er beregnet som en funksjon av prevalens og for fem forskjellige spesifisiteter. Kurvene er beregnet vha. ligning 3 i det forrige innlegget.


Figur 1: Sannsynligheten for at en tilfeldig person som tester positiv, virkelig er smittet av SARS-CoV-2 viruset. Den vises som en funksjon av prevalens for fem forskjellige spesifisiteter.

tirsdag 25. august 2020

Betinget sannsynlighet – Bayes teorem

Dette er det første av tre innlegg i en miniserie om betinget sannsynlighet og Bayes teorem. Det andre innlegget er Tolke medisinske tester og det tredje innlegget er Klima ─ Bayesiansk vs frekventistisk tankegang. Innleggene er samlet i denne pdf-filen.

Statistikk og sannsynlighetsregning er sentralt i klimavitenskapen når trender og sammenhenger skal beregnes og analyseres. Denne klimabloggen har derfor mange innlegg om matematisk statistikk og mange innlegg som bruker statistikk. Men ingen av innleggene så langt er om betinget sannsynlighet der vi basert på eksisterende og ny kunnskap skal ta stilling til en ja-nei problemstilling. Det vil de neste innleggene handle om.

Vi ønsker alle visshet når vi forholder oss til en problemstilling. Men ofte er ikke det mulig fordi selv de beste ekspertene på problemstillingen bare kan angi sannsynlighetene som de forskjellige mulighetene har. Mange synes at det er vanskelig å forholde seg til slik usikkerhet. De ønsker klare svar, dvs. enten eller. De ønsker ikke, kanskje klarer ikke, å forholde seg til sannsynligheter angitt i prosenter.

Ved å innføre betinget sannsynlighet blir det enda vanskeligere. I tillegg til å forholde oss til sannsynligheter må vi tolke dem i ly av allerede kjent kunnskap. Et ofte brukt eksempel på betinget sannsynlighet er mammografi-undersøkelser av alle kvinner ved en bestemt alder. En mammografi-undersøkelse vil med stor sannsynlighet gi et positivt resultat hvis kvinnen virkelig har brystkreft. Men det motsatte er ikke tilfelle. Selv om et prøvesvar er positivt, er det liten sannsynlighet for at kvinnen har brystkreft. For de fleste av oss føles dette intuitivt galt. Også de av oss som har satt seg godt inn i temaet, må ofte tenke seg om flere ganger for å forstå at det vanligvis er slikt. Hensikten med dette og de neste to innleggene er å forklare betinget sannsynlighet, både med matematikk og med eksempler, som forteller at det ofte er slik som nettopp beskrevet med mammografi. Matematikken forklares i dette innlegget. Hvordan den kan anvendes på henholdsvis medisinske tester og på observasjoner innen klimavitenskapen forklares i de påfølgende to innleggene.

Bayes teorem

Bayes teorem, som vist i ligning (1), er sentralt innen betinget sannsynlighet. 

lørdag 27. juni 2020

Skidager i Nordmarka

Dette er fjerde og siste av fire innlegg om snø, temperatur, nedbør og skidager i Nordmarka. De er samlet i denne pdf-filen.

En tommelfingerregel sier at vi kan gå på ski i terrenget når snødybden er 25 cm eller mer. Slike dager kalles skidager. Figur 1 viser antall skidager i Nordmarka utenfor Oslo fra 1900 til 2020. Målingene er hovedsaklig fra målestasjonen på Bjørnholt 360 m.o.h. Der er snødybden målt siden 1897, men med et opphold mellom 1937 og 1954. Meteorologer har brukt målinger fra nærliggende målestasjoner for å lage en sammenhengende måleserie. Et tidligere innlegg, Snødybde og temperatur i Nordmarka, forklarer hvor data om snødybde og skidager er hentet fra og hvordan de er bearbeidet.

Figur 1: Antall skidager per skisesong på Bjørnholt i Nordmarka

fredag 26. juni 2020

Snødybde og nedbør i Nordmarka

Dette er tredje av fire innlegg om snø, temperatur, nedbør og skidager i Nordmarka. De er samlet i denne pdf-filen. Innlegget som du leser nå, analyserer sammenhengen mellom snødybde og nedbør på Bjørnholt i Nordmarka.  Det er en oppdatering av et innlegg med samme tittel fra juni 2018. Nå med målinger også for vintersesongene 2019 og 2020.

Meteorologisk institutt sin eKlima portal har fullstendige målinger av nedbør i vintermånedene. Jeg brukte disse til å utvide datagrunnlaget jeg hadde i 2018.

Figur 1 viser 30 års glidende middelverdi av nedbøren på Bjørnholt i månedene november til mai. Hvert punkt på kurvene viser middelverdien av nedbøren i aktuelle måned beregnet over tidsrommet 15 år før og 15 år etter.

Figur 1: 30 års glidende middelverdi av nedbør på Bjørnholt i månedene november til mai. De siste punktene på kurvene er mellom 2005 og 2006, og de dekker tidsrommet 1991 til 2020.

torsdag 25. juni 2020

Snødybde og temperatur i Nordmarka

Dette er andre av fire innlegg om snø, temperatur, nedbør og skidager i Nordmarka. De er samlet i denne pdf-filen. Innlegget som du leser nå, analyserer sammenhengen mellom snødybde og temperatur på Bjørnholt i Nordmarka. Det er en oppdatering av innlegget Snødybde og temperatur i Nordmarka fra august 2018. Nå med målinger også for vintersesongene 2019 og 2020.

Fra eKlima portalen hentet jeg døgnverdier og månedlige gjennomsnittsverdier for snødybde på Bjørnholt for sesongene 2019 og 2020. Jobben ble mer omfattende enn det, noe jeg forklarer ganske detaljert i Appendiks A. Gjennom denne jobben fikk jeg et litt mer fullstendig datagrunnlag enn jeg hadde i 2018.

På Bjørnholt begynte målingene av snødybde i januar 1897 og av temperatur i oktober 2007. Det er viktig å vite hvordan temperaturen har utviklet seg på det samme stedet som snømålingene er gjort. Derfor lagde jeg i august 2018 en homogenisert temperaturserie for Bjørnholt for perioden fra januar 1897 til juni 2018. Jeg brukte Bjørnholtmålingene når de var tilgjengelige. For temperaturer før det baserte jeg meg på en homogenisert temperaturserie for Oslo (Blindern, 94 m.o.h., målestasjon 18700). For perioden der begge stasjonene hadde målinger var Oslotemperaturene i vinter- og vårmånedene gjennomsnittlig 2,79 °C varmere enn Bjørnholttemperaturene. Det var liten år til år variasjon i denne differansen. Jeg gjorde tilsvarende sammenligning mellom temperaturene målt på Bjørnholt og på Tryvasshøgda  (514 m.o.h, målestasjon 18950). Her varierte differansen mye mer fra år til år, så jeg konkluderte med bare å bruke Oslotemperaturene. Når det ikke var temperaturmålinger fra Bjørnholt brukte jeg Oslotemperaturene minus 2,79 °C. Det nevnte innlegget fra august 2018 har mer detaljer om dette. Nå i 2020 utvidet jeg denne homogeniserte temperaturserien med temperaturmålinger gjort på Bjørnholt i de siste to årene.

Figur 1 viser 30 års glidende middelverdi av snødybdene på Bjørnholt for månedene november til april og for gjennomsnittet i desember til mars. Middelverdiene er beregnet over 30 år. De siste punktene i kurvene er mellom 2005 og 2006, og de er middelverdiene for tidsrommet 1991 til 2020.

Figur 1: 30 års glidende middelverdi av snødybdene på Bjørnholt for månedene november til april og for gjennomsnittet i desember til mars.

onsdag 24. juni 2020

Vintertemperatur i Nordmarka når det faller nedbør

Dette er første av fire innlegg om snø, temperatur, nedbør og skidager i Nordmarka. De er samlet i denne pdf-filen. Innleggene er oppdateringer av tilsvarende innlegg for to år siden. Det er ikke nødvendig å lese de gamle innleggene først.

Nordmarka ligger nord for Oslo. De fleste dataene i innleggene er hentet fra Meteorologisk institutt sine målinger på  Bjørnholt 360 meter over havet. De er tilgjengelige på deres eKlima portal.

Om vinteren har det en tendens til å være mildere på dager med nedbør enn på dager uten nedbør. Gustav Bjørbæk skriver i boken Marka på sitt beste at ved 1 °C (grader Celsius) faller cirka halvparten av nedbøren som sludd eller regn, noe som reduserer snødybden. Når middeltemperaturen om vinteren nærmer seg null grader, vil temperaturen i lange perioder, spesielt når det faller nedbør, være over 1 °C. Det er derfor viktig å se på middeltemperaturen i døgn med nedbør.

Figur 1: Middeltemperatur på Bjørnholt i månedene november til februar i døgn med og uten nedbør. Disse temperaturene avhenger av hvor vi setter nedbørsgrensen. Den angis langs x-aksen. Vi ser at for døgn med 10 mm eller mer nedbør er middeltemperaturen litt over 0 °C.

onsdag 27. mai 2020

Covid-19 simuleringer rundt flokkimmunitet

Innlegget som du leser nå, bygger på det tidligere innlegget Matematisk beskrivelse av en SEIR epidemimodell. Det beskriver en enkel modell som jeg programmerte både for selv bedre å forstå hvordan epidemier brer seg og fordi jeg er interessert i matematiske modeller.

13. mars valgte myndighetene å 'stengte ned' Norge for å slå ned viruset. Helt frem til da var det flere som mente at det ikke var mulig å 'slå ned' viruset, og at en i stedet skulle satse på å begrense smittespredningen og på litt sikt satse på flokkimmunitet. Sistnevnte strategi ble ikke valgt, og jeg tror at de aller fleste nå er enige om at eneste farbare vei er å 'slå ned' viruset. Det er imidlertid uenighet om hvilke tiltak som er de mest effektive for å 'slå ned' viruset, men det er en annen diskusjon.

I en artikkel på Science Media Centre, Expert comments about herd immunity, forklarer mange eksperter hva flokkimmunitet er og hvordan det kan oppnås. Flere av disse bruker en enkel epidemimodell basert på generasjoner av smitte for å forklare hva flokkimmunitet er. De forklarer det med eksempler som tar utgangspunkt i det basale reproduksjonstallet R0. Jeg gjengir kort denne forklaringen med R0 lik 3 som eksempel: En smittet person kommer inn i flokken, og han smitter 3 andre. Disse er generasjon 1 av smittede/syke. Hver av disse tre smitter tre andre, og i generasjon 2 er det derfor 9 smittede/syke. I generasjon 3 blir det 27, osv. Dette er en meget enkel modell som jeg kaller generasjonsmodellen.

lørdag 16. mai 2020

Covid-19 simulering med sene smitteverntilltak

Det forrige innlegget brukte den enkle modellen beskrevet i det tidligere innlegget Matematisk beskrivelse av en SEIR epidemimodell til å simulere forløpet av Covid-19 epidemien i Norge. Resultatene stemte brukbart med virkeligheten slik den var i slutten av april. Innlegget som du leser nå, bruker modellen for å simulere hvordan epidemien kunne ha utviklet seg hvis Norge hadde utsatt å iverksette smitteverntiltakene. Disse tiltakene ble bestemt 12. mars, og Folkehelseinstituttet FHI regner med at de ble effektive fra 15. mars. Bortsett fra forsinket oppstart av smitteverntiltakene bruker modellen de samme parametrene som beskrevet i de to nettopp nevnte innleggene.

Figur 1 viser hvordan en forsinket iverksettelse av smittevernstiltakene ville ha påvirket det maksimale antallet samtidige sykehusinnleggelser og det totale antallet døde. En ukes utsettelse ville ha økt antall maksimale samtidige sykehusinnleggelser opp til sykehusenes kapasitet. Ytterligere utsettelse ville ha sprengt sykehuskapasiteten. Det ville ha fått dobbel negativ effekt på antall døde, både ved at antallet syke ville ha økt, og ved at dødeligheten per pasient ville ha økt fordi sykehusene ikke ville ha maktet å gi alle adekvat behandling. Figur 1 viser dette ved at antall døde stiger raskere enn sykehusinnleggelsene når utsettelsen overskrider 7 dager.

Figur 1: Konsekvenser for maks antall samtidige sykehusinnleggelser og for antall døde av å utsette smitteverntiltak. Dagene på horisontal akse er utsettelse i forhold til 15. mars.

mandag 11. mai 2020

Covid-19 simulering med norske smitteverntilltak

Innlegget som du leser nå, bygger på det forrige innlegget Matematisk beskrivelse av en SEIR epidemimodell. Det beskriver en enkel modell som jeg programmerte både for selv bedre å forstå hvordan epidemier brer seg og fordi jeg er interessert i matematiske modeller. I resten av innlegget kaller jeg denne enkle SEIR modellen 'min modell' for ikke å blande den sammen med mere avanserte modeller.

Resultater og parametere i innlegget gjelder Covid-19 pandemien forårsaket av SARS-CoV-2 viruset. En pandemi er i følge SNL en epidemi som omfatter store deler av verden.

Folkehelseinstituttet FHI jobber med en avansert SEIR epidemimodell, se Koronavirus-modellering ved FHI. De har kalibrert parametrene i sin modell mot faktiske sykehusinnleggelser i Norge. Jeg har hentet parametrene til min modell fra nettsidene til FHI slik de var 21. april. En tabell i avslutningen av det forrige innlegget viser disse parametrene. Jeg forventer derfor at simuleringen med min modell vil gi sammenlignbare, men ikke identiske, resultater som FHI publiserer for Norge i slutten av april 2020. Det gjør den.

tirsdag 28. april 2020

Matematisk beskrivelse av en SEIR epidemimodell

Dette er andre innlegg i en miniserie om koronapandemien og klima. Det første innlegget sier at matematiske modeller er sentrale både i forskning på klima og på epidemier. Innlegget som du leser nå, beskriver en enkel epidemimodell.

Det blir ofte henvist til simuleringer med epidemimodeller for å illustrere hvordan koronapandemien kan utvikle seg avhengig av tiltakene som iverksettes. Hallvard Sandberg viste bilder fra en slik modell for noen uker siden på NRK. Bildet var antagelig fra Epidemic Calculator, som jeg fant på nettet og prøvde selv. Den bruker en SEIR modell som beskriver hvordan en epidemi brer seg i en befolkning. Jeg programmerte en variant av den med Scilab på egen PC. Jeg gjorde dette primært for selv å få bedre forståelse av hvordan slike modeller fungerer.

søndag 26. april 2020

Klima og Pandemi

Innleggene på HPklima er om klima og om emner som er nært knyttet til klima. I den siste kategorien er energibruken vår, både mengde og type.

Nå rammes verden av koronapandemien, og som alle andre er jeg opptatt av den. Det er likhetstrekk mellom hvordan vi på flere nivåer har sviktet i våre forberedelser for å kunne håndtere epidemiutbrudd og hvordan vi har sviktet i vår håndtering av utslipp og andre handlinger som ødelegger natur og endrer klima. Innlegget som du leser nå, handler om disse likhetene og/eller sammenhengende mellom klima og koronapandemien.

Matematiske modeller er sentrale både for å studere hvordan våre handlinger påvirker fremtidige endringer i klima og for å studere hvordan våre handlinger på andre områder påvirker fremtidig utvikling av pandemien som vi nå er i. Det neste innlegget vil handle om matematikken i en enkel epidemimodell som jeg har skrevet. Det påfølgende innlegget vil vise simuleringer med denne modellen.

mandag 16. mars 2020

CO2 utslipp fra bilferger og cruise - En oppsummering

De to forrige innleggene handlet om CO2 utslippene som hver passasjer er ansvarlig for når de reiser med de store bilfergene og når de reiser cruise med Hurtigrutens skip. For bilfergene tok jeg med utslipp fra 700 kg last, som er halve vekten av en mellomklassebil (to passasjerer i hver bil). For cruise tok jeg med utslipp fra nødvendige flyreiser til avgang- og/eller ankomsthavn. Utslippene fra flyreisene dividerte jeg på seilt distanse med skipet for å få gram CO2 ekvivalenter (CO2e) per kilometer (km). Figur 1 viser resultatene grafisk. Se de to foregående innleggene for detaljer.

Figur 1: Utslipp per passasjer-km slik det ble regnet ut i de to forrige innleggene

tirsdag 10. mars 2020

CO2 utslipp fra cruise med Hurtigrutens skip

Det forrige innlegget handlet om CO2 utslipp fra de store bilfergene. Der refererte jeg til denne nettsiden med EU MRV data og forklarte litt av bakgrunnen for den. Jeg hentet data fra denne nettsiden både for 14 store bilferger som seiler mellom de nordiske landene og mellom disse og Tyskland og for 11 av Hurtigrutens skip. Disse dataene la jeg på denne filen. Side 1 er for bilfergene og side 2 er for Hurtigrutens skip. I det forrige innlegget konkluderte jeg at en bilpassasjer på en av de store bilfergene er ansvarlig for cirka 400 gram CO2 per passasjerkilometer, og at det er cirka seks ganger mer enn når bilen kjører på landeveien.

Innlegget som du leser nå, ser på tilsvarende utslipp fra Hurtigrutens skip når de seiler cruise langs norskekysten, ved Svalbard og i Antarktis. Cruisepassasjerer har ikke med bil på skipet, og de er derfor ikke ansvarlige for utslipp pga last. Men de må fly til start- og/eller ankomsthavn for cruiset, og utslippene fra disse flyreisen(e) legger jeg til utslippene fra skipet. Per passasjerkilometer cruise blir da utslippene langs norskekysten cirka 500 gram CO2e, ved Svalbard cirka 1300 gram CO2e og i Antarktis cirka 3000 gram CO2e. Resten av innlegget utdyper dette og linker til kilder.

onsdag 4. mars 2020

CO2 utslipp fra store bilferger

Jeg har tidligere skrevet flere innlegg om utslipp fra flyreiser. Det første av disse er fra oktober 2017 og gir en oversikt over hvordan forskjellige kalkulatorer beregner utslippene. Kalkulatorene fra luftfartens egne aktører er 'snille', bl.a. ved at de ikke tar hensyn til at utslipp fra jetmotorene i stor høyde er mye mer skadelige enn tilsvarende utslipp i lav høyde. Det er nærliggende å tro at de bevisst grønnvasker egen virksomhet. Jeg stoler mest på Atmosfair kalkulatoren. Basert på den kom jeg frem til at utslippene for innenriks luftreiser er snaue 150 gram CO2 ekvivalenter (CO2e) per passasjerkilometer og for internasjonale luftreiser snaue 200 g CO2e per passasjerkilometer.

Innlegget som du leser nå, ser på utslipp fra de store bilfergene. Basert på mange sprikende kilder kommer jeg frem til at utslippene fra de store bilfergene som seiler mellom de nordiske landene og mellom disse og Tyskland, er cirka 400 g CO2e per kilometer for en bilpassasjer når to reiser sammen i en middels stor bil. De innenlandske fergene har betydelig større utslipp, cirka 1000 g CO2e per bilpassasjerkilometer.

Utslippene fra ferger er høye sammenlignet med utslippene når bilpassasjerene kjører den samme bilen på landeveien; da er utslippene cirka 70 g CO2 per bilpassasjerkilometer.

onsdag 15. januar 2020

Greta Thunberg and the carbon budget

Joeri Rogelj and Piers Forster wrote on CarbonBrief that the concept of a “carbon budget” has proved to be both elegantly simple and stubbornly complicated. I start with the elegantly simple.

The theory behind the concept says that the maximum global warming is determined by the sum of the CO2 emissions that we have emitted so far and will emit in the future, ie by the cumulative CO2 emissions. The climate panel's fifth assessment report AR5 from 2013 states that there is a linear relationship between the cumulative emissions and the rise in temperature. The AR5 estimated the carbon budgets for both 1.5˚C and 2˚C of warming. These estimates were updated in 2018 in the Climate Panel's special report on 1.5˚C warming SR15.

In her speeches, Greta Thunberg uses a carbon budget calculated in SR15 to explain why it is urgent to reduce the emissions. She does this in an elegant and simple way. On December 11, 2019, at COP25 in Madrid, she said:

  • In chapter two, on page 108 in the SR 1.5 IPCC report that came out last year, it says that if we are to have a 67 percent chance of limiting the global temperature rise to below 1.5˚C, we had on January 1, 2018, 420 gigatons of CO2 left to emit in that budget. And of course, that number is much lower today as we emit about 42 gigatons of CO2 every year including land use. With today’s emission levels, that remaining budget will be gone within about eight years. These numbers aren’t anyone’s opinions or political views. This is the current best available science.

A gigaton is one billion tons. Later in the same speech she said:

  • Most models assume, however, that future generations will somehow be able to suck hundreds of billions of tons of CO2 out of the air with technologies that do not exist in the scale required and maybe never will. The approximate 67 percent chance budget is the one with the highest odds given by the IPCC. And now we have less than 340 gigatons of CO2 left to emit in that budget to share fairly.

The message is clear and simple. We must reduce emissions so that the sum of all future emissions remains within what is left of the carbon budget. Furthermore, we cannot trust that future generations will be able to clean up after us.

She correctly retrieves and interprets the information in the Climate Panel's Special Report SR15. The presentation of the speech indicates that she understands the topic well.

The Global Carbon Project (GCP) publishes emissions data every year. On December 5, 2019, they published data up to and including 2018. Global emissions in 2018 were 42.1 billion tonnes of CO2. It includes land use change. This is in line with what Greta Thunberg said in her speech.

Emissions in 2018 were 2.2 percent higher than they were the year before. Greta Thunberg has evidence to say that politicians do not take climate problems seriously.

Figure 1: Cumulative CO2 emissions. The three horizontal lines show three different carbon budgets for 1.5˚C global warming. Greta Thunberg applies the smallest one in her speech.

I downloaded the GCP emission data and plotted the cumulative emissions through 2018. They are shown with the blue curve in Figure 1. The dotted blue line shows future cumulative emissions if the emissions continue as they were in 2018. The horizontal solid black line shows the carbon budget that Greta Thunberg talked about in her speech. It hits the dotted blue line in December 2027. This graphically illustrates what Greta Thunberg said in her speech. With today's emissions, this carbon budget will be gone in about eight years.