lördag 11 augusti 2018

SD:s väljare kommer och går

Valet närmar sig och med det mängder av statistik på längden och tvären. Dags att damma av bloggen igen och dyka ner i siffrorna.
Den enskilt största förändringen i det politiska landskapet är så klart Sverigedemokraternas tillväxt i opinionen. Vi står inför ett helt nytt parlamentariskt läge, med tre snarare än två politiska block. För att kunna gå från ingenting till ett tjugoprocentsparti, så måste så klart väljarna komma någonstans ifrån. Därför tänkte jag titta lite närmare på hur väljarströmmarna har gått mellan partierna, med fokus på just Sverigedemokraterna. Inga politiska synpunkter i övrigt.
Det bästa och mest lättillgängliga dataunderlaget är SCB:s Partisympatiundersökning (PSU). Här finns skattningar dels – så klart – av opinionsläget (partival om det varit val idag) för maj och november varje år, dels vilket parti respondenten uppgav i förra PSU:n. Det ger alltså en bra möjlighet till att följa hur väljare byter mellan olika partier och därigenom att se varifrån väljare hos växande partier kommer.

Tittar vi på opinionsläget för Sverigedemokraterna från 2011 till senaste PSU maj 2018, har de gått från drygt fem procent av opinionen till nästan tjugo, med en topp i novembermätningen 2015. Utvecklingen illustreras så klart bäst med ett vanligt linjediagram, eftersom fokus är förändringen över tid.


Andel som väljer Sverigedemokraterna om det var val idag enligt PSU, 2011-2018. Källa: SCB




Omkring femton procent av väljaropinionen har alltså kommit från andra partier under en period av sju år. Som situationen är, så handlar det i allt väsentligt om Moderaterna och Socialdemokraterna. Sett ur det här perspektivet är de övriga partierna att betrakta som brus. Inledningsvis tittar vi därför på hur nettoflödet mellan S och SD respektive M och SD ser ut för varje halvårsperiod som PSU mäter. S och M kan alltså antingen växa eller krympa på SD:s bekostnad under respektive period.
Här är det snarare nivåskattningarna som är det viktiga, så stapeldiagram blir mer relevanta än linjediagram. En annan viktig aspekt är också ifall det är fråga om en nettoökning eller en nettominskning. Det framgår visserligen av huruvida stapeln är över eller under skalans nollnivå, men det finns anledning att underlätta tolkningen av visualiseringen genom att variera färgerna med en justering av färgintensitet. Diagram med fokus på politiska partier har fördelen av att det redan finns etablerade färger som sällan kräver ytterligare förklaring. Här väljer jag att helt enkelt ha en något ljusare färgton för nettominskningar.
Att försöka lägga in staplarna i samma diagram som linjediagrammet över SD:s utveckling är inte en aktuellt. Det är generellt sett alltid sämre att lägga in två olika skalor i samma diagram, eller att blanda diagramtyper. Nej, vi håller nettoflödena separat från nivåskattningen. Dessutom väljer jag att separera S och M i olika diagram. Det hade varit möjligt att lägga in dem i samma, eftersom vi ändå skiljer dem åt med färger, men min bedömning är att det skulle bli rörigare och svårare att särskilja de olika partierna åt. Försök undvika att belamra diagrammen om möjligt. Jag har dock gjort ett tillägg, med hjälptexter för att förtydliga tolkningen av vad som är nettoökning och vad som är nettominskning gentemot SD.


Nettoförändring (procentenheter av opinionsstödet) för Moderaterna gentemot Sverigedemokraterna, enligt PSU 2011-2018 (Källa: SCB)



Nettoförändring (procentenheter av opinionsstödet) för Socialdemokraterna gentemot Sverigedemokraterna, enligt PSU 2011-2018 (Källa: SCB)


Själva innehållet då? SD:s tillväxt tog fart ordentligt från 2014. Innan dess är det svårt att se några tydliga trender. Rörelserna till och från Moderaterna var små men mestadels till M:s nackdel, medan det växlade kraftigt fram och tillbaka mellan S och SD. En ökning av S på SD:s bekostnad ena perioden tog tillbaka igen perioden efter. Från 2014 blir trenden däremot mer uppenbar – i allt större utsträckning är det moderata väljare som går till SD, medan tappet från S ligger på en ganska konstant nivå. Under 2016 och senare delen av 2017, när SD börjar backa i opinionen, tar M ganska snabbt tillbaka en stor andel av väljarna. Återgången till S är däremot klart begränsad. Men det är tydligt att vi har att göra med en väljargrupp som är snabb att gå fram och tillbaka mellan M och SD, medan rörligheten till och från S över tid har avtagit.
Tilläggas ska också att motsvarande diagram hade kunnat göras för övriga partier, men rörelserna är så små att de mestadels faller inom felmarginalen. Summeras nettoförändringen gentemot SD för alla partier förutom S och M, uppgår de ändå bara till en fjärdedel av den totala rörligheten.
Men det finns (minst) en ytterligare aspekt av det här. Bakom varje nettoförändring ligger bruttoförändringar. Även om ett parti krymper på SD:s bekostnad totalt sett, så är det flöden både till och från partiet under samma period, vars slutsumma utgör nettoresultatet. Det blir snabbt mycket data, så skulle man försöka visa samtliga flöden till och från SD för alla mätperioder skulle det bli svåröverskådligt, även om det så klart finns tekniker för även det. Istället väljer jag att plocka ut två separata perioder; en där SD vuxit och en där de backat, för att se skillnaderna mellan väljarflödena.
Som oftast är det egentligen stapeldiagram som passar bäst för nivåjämförelser, men här stöter vi på något som inte är helt ovanligt – det s.k. ”mountains and molehills”-problemet, dvs. att det är stora skillnader i skala mellan olika kategorier som jämförs. Man tvingas anpassa diagrammets skala efter det största värdet, och är det andra kategorier med jämförelsevis små värden, så krymper de så att man har svårt att urskilja skillnaderna mellan dem. I det här fallet handlar det om att illustrera att SD:s väljare i absolut störst utsträckning även valde SD förra perioden, men att det även finns väljare från andra partier föregående period, men i betydlig mindre utsträckning. Du skulle få ett diagram med en hög stapel och ett antal svårurskiljbart små.
Det finns egentligen inga bra lösningar på det här problemet, bara mer eller mindre dåliga. Jag har här valt ett alternativ med bubbeldiagram. Här är det ytan som visual cue, vilket (i enlighet med tidigare blogginlägg) egentligen är ett klart sämre alternativ än staplar. Men det är tillåtet att bryta mot reglerna om man vet vad man gör och varför – vilket jag gör. Här är det inte de exakta nivåerna som det relevanta. Vi har redan tagit höjd för utgångspunkten i de föregående diagrammen. Istället handlar det om att rangordna övriga partier och ge en ungefärlig uppfattning av storleksnivåerna. Till det duger bubbeldiagrammen gott.
Mer specifikt tittar vi på SD:s uppgång mellan maj och november 2015 och deras tillbakagång mellan maj och november 2017, för att se både hur väljarflödena går till och från övriga partier i båda fallen.

Andel som väljer Sverigedemokraterna om det var val idag enligt PSU, 2011-2018. Källa: SCB


Själva flödena visualiseras med bubbeldiagram för start- och sluttidpunkt, med pilar för att underlätta tolkningen av flödet.



Bruttoförändring av opinionsstöd enligt PSU för Sverigedemokraterna till och från övriga partier maj-november 2015




Bruttoförändring av opinionsstöd enligt PSU för Sverigedemokraterna till och från övriga partier maj-november 2017



Det viktigaste budskapet i diagrammet är förstås att visa att det ligger bruttoflöden bakom alla nettoflöden. Dvs. även när ett parti växer så är det samtidigt väljare som går ifrån det till andra partier. På samma sätt som är det väljare som går över till SD även om det totalt sett backar i opinionen.
Vi ser här också några intressanta skillnader mellan SD:s tillväxt och tillbakagång. Totalt sett så är det fler väljare som går från partiet trots att det växer totalt sett vid uppgång, än vad det är som går till det från andra partier vid tillbakagången. KD:s roll är också intressant; under 2017, när SD backar, är det fler som går till SD från KD än vad det går från S till SD. Det är även markant att inga tidigare SD-väljare går till C vid partiets nedgång. Perioden sammanfaller med Centerpartiets tillbakagång.
Samma typ av analys kan så klart göras för alla andra partier, men i dagens opinionsläge känns det ändå mest intressant att titta närmare på SD. PSU är en guldgruva för att göra analyser av det politiska läget, och jag återkommer till andra aspekter av det i kommande blogginlägg.





måndag 23 januari 2017

”Jag tyar nog lite mer, Karl-Oskar”

En fråga som jag stötte på i facebookflödet i samband med att Sveriges befolkning är på väg att passera tio miljoner, gällde vad som hade hänt om den stora emigrationen till Amerika aldrig hade ägt rum. Nästan 1,2 miljoner svenskar flyttade till Amerika mellan 1850 och 1940. Vissa av dem flyttade så småningom hem igen, men de flesta blev kvar, vilket innebar ett permanent bortfall i Sveriges befolkning. I och med senaste presidentvalet kanske det även finns skäl att anta att så många svenskar inte heller är så intresserade av att emigrera idag.
 
Kan man räkna på vad som skulle ha hänt om emigrationen aldrig inträffat?  Det skulle bli ett slags kontrafaktiskt scenario, eller alternativ historieskrivning. Med hjälp av SCB:s föredömligt långa tidsserier för befolkningsutveckling är det lätt att ta fram utvecklingen över total in- och utvandring år för år. En ganska lätthanterlig sammanställning över vilka länder det rör sig om går också att plocka ut.
 
Jag gör antagandet att inga svenskar flyttade till Nordamerika (USA och Kanada) under perioden 1850 till 1940 och tar helt enkelt bort dem ur från antalet utflyttade. Dock var det även en del som flyttade tillbaka, så jag antar också att all invandring från USA och Kanada denna period var återvändare, och plockar bort dem också. Vi får alltså ett nytt och större (eller mindre negativt) flyttnetto för dessa år. Men vi måste även räkna om födelsenettot – större befolkning ger upphov till fler barn. Jag gör här en förenkling och räknar på födelsenetto som andel av total befolkning per år under hela perioden, och använder den kvoten på den större befolkningen (genom minskad utflyttning) för att få ett nytt födelsenetto respektive år ända fram till idag.
 
Vad får vi då för resultat? Ett enkelt linjediagram passar bäst för en så här lång tidsserie. Inga konstigheter – tydligt avskilda linjer gör att de inte behöver särskiljas med färg och etiketterna sätts lämpligast vid linjernas slut. Eftersom det också kan vara viktigt att läsa av linjernas slutpunkter, är det också lämpligt att ha stödlinjer.

Befolkning i Sverige 1850-2015 med och utan Amerikaemigration

 
Enligt mina grova beräkningar tycks det som att befolkningen skulle varit drygt 11,6 miljoner år 2015, istället för 9,8 miljoner. En skillnad på nära 1,8 miljoner invånare. I vårt kontrafaktiska scenario skulle vi passerat tiomiljonerstrecket redan 1981, istället för 2017 som det blev i verkligheten. Vi hade varit fler – men hade vi haft det bättre ställt? Sannolikt inte. Det fanns goda skäl till att så många sökte lyckan på andra sidan Atlanten. Skulle man på något sätt tvingat emigranterna att stanna hade kanske fattigdom, svält och armod varit mycket mera utbredd, under mycket längre tid.

torsdag 31 mars 2016

"När jag var liten var det alltid snö på vintern"

SMHI:s öppna data är faktiskt en fantastisk guldgruva för den inbitna statistiknörden. Inte minst ger den möjlighet att besvara den kanske viktigaste frågan av alla: var det verkligen mer snö när jag var liten? I följande Tableau-diagram har jag tagit fram snödjupsdata per vintermånad från ett antal mätstationer runt om i landet, ända från 1950 (!). Det finns en hel del luckor i materialet, så det krävdes lite pusslande för att få ihop någorlunda heltäckande tidsserier för varje landsända. Genom att utgå från användarens födelseår, kan man lätt omvandla data till att visualiseras för varje vinter från den första till elvaårsåldern. Upp till bevis! Var din barndoms vintrar ständigt fyllda av gnistrande snötäcken eller var det kanske ändå så att det förekom en och annan grönslaskig halvårslång höst även då?
 

onsdag 9 september 2015

Den syriska diasporan

I dessa dagar finns det knappast något mer angeläget ämne att ta upp än den syriska flyktingkrisen. Antalet människor på flykt är ofattbart stort. Många har gjort försök att begripliggöra omfattningen, Hans Rosling inte minst. Utan jämförelser i övrigt drar jag mitt strå till stacken genom att göra ett eget försök.

Utifrån UNHCR:s data framträder en bild av ett land med över hälften av befolkningen på flykt. Ytdiagram är sällan den mest lyckade lösningen för att jämföra kategorier över tid. Eftersom nivån för varje kategori är beroende av nivån på kategorierna nedanför, blir det svårt att avläsa vad förändringar beror på. Men som alltid vid diagramkonstruktion finns det inga absoluta rätt eller fel.

Med två tydliga huvudkategorier - syrier på flykt eller fortfarande kvar hemma - fungerar det speglade ytdiagrammet bra. Över tid framträder förskjutningen från den arabiska vårens inledning 2011 fram till dagens situation (statistiken sträcker sig till år 2014), där en allt större del av Syriens befolkning tvingats på flykt.

Var befann sig Syriens befolkning år 2011-2014?



Av en befolkning på drygt 20 miljoner människor hade år 2014 mer än hälften - över 11,5 miljoner - drivits bort från sina hem. Att kalla det en flyktingkatastrof är knappast överord, men det är inte en flyktingkatastrof som drabbar Europa i första hand. Den allra största andelen är flyktingar i sitt eget land. 7,6 miljoner av dem befinner sig i ett Syrien sönderslitet av krig, med sämsta tänkbara förutsättningar för att ta hand om dem. Resten - i stort sett - har flytt till grannländerna. Turkiet, Libanon, Jordanien, Irak, Egypten, Libyen och Armenien har tagit emot 3,7 miljoner flyktingar.

Den blåa ytan i diagrammet visar antalet flyktingar till EU-länderna. Den är så liten att den knappt syns. I slutet av 2014 utgjorde de omkring 123 000 personer, mindre än en procent de totala flyktingströmmarna. Sverige och Tyskland tar visserligen hand om merparten av dessa, men jämfört med Syriens grannländer är det en marginell belastning.

Ser man till hur många flyktingarna är i förhållande till ländernas storlek, är det frågan om rejäla skillnader. Antalet flyktingar per tusen invånare i mottagarländerna - och här fungerar ett vanligt stapeldiagram bäst - visar att i Tyskland har man tagit emot en halv flykting per tusen invånare. I Sverige, som tagit emot något färre flyktingar än Tyskland totalt, men som är ett mycket mindre land, är motsvarande antal 3,5 flyktingar per tusen invånare.

Antal syriska flyktingar per tusen invånare i de största mottagarländerna

Siffrorna bleknar dock i jämförelse med Syriens grannländer. Turkiet är ett stort land och trots stora flyktingvolymer landar antalet på tjugo flyktingar per tusen invånare. Men Libanon, med en befolkning mindre än Sveriges, har tagit emot 1,1 miljoner syrier, vilket innebär hela 200 flyktingar på tusen invånare - en syrisk flykting per fem libaneser. Detta i ett land med en bruttonationalprodukt per capita som bara är en sjättedel av Sveriges.
 
Det är alltså ingen tvekan om att det rör sig om enorma mängder människor på flykt. Ett helt land håller på att tömmas på invånare. Och det är grannländerna som får ta nästan hela ansvaret för flyktingströmmarna, inte Europa. Är lösningen då verkligen - som föreslås från brunfärgat håll - att lägga ytterligare bördor på dem genom "hjälp på plats" och helt eliminera den i sammanhanget marginella flyktingströmmen till EU? Eller finns det utrymme att ta ytterligare lite ansvar för katastrofen bland Europas länder? Vi har trots allt långt, långt kvar innan vi ens kommer i närheten av grannländernas nivåer.
 


måndag 29 juni 2015

Tips - Sherlock Holmes i diagramform

The Guardian presenterar Sherlock Holmes i form av en serie diagram. Metodologiskt kan man ha vissa invändningar mot en del av presentationsformerna, men överlag är det en hysteriskt underhållande bildserie, så jag överser glatt med sånt jag normalt skulle ha gnällt över.

tisdag 2 juni 2015

Tips - Andra världskrigets dödsoffer

Ett snabbt tips om en mycket välgjord visualisering av hur fruktansvärt många dödsoffer andra världskriget krävde. Rent tekniskt är presentationen enkel, i stort sett bara animerade stapel- och ytdiagram, men den levererar en mycket tydlig och gripande berättelse. Ett ypperligt exempel på statistical storytelling när den är som bäst.

onsdag 27 maj 2015

Stora och små flygplan

Som bekant har i dagarna den stora flygövningen ACE (Arctic Challenge Exercise) dragit igång i norra Skandinavien, med 3 600 personer och 115 flygplan från nio länder. En "gigantisk" flygövning enligt media. Strax efter att den dragit igång svarade Ryssland med en egen beredskapsövning, omfattande 12 000 personer och 250 flygplan. Alltså ännu mer gigantisk än ACE.

SVT gör ett tappert försök att illustrera storleksförhållandena, men snubblar redan i startgroparna. Att 250 är mer än dubbelt så mycket som 115 tror jag de flesta känner till, men det blir inte tydligare av att göra flygplanssymbolerna dubbelt så stora.


Ser man till ytan som de båda grupperna tar upp, verkar antalet ryska plan vara snarare fjorton gånger fler. Att man vill göra en poäng av att den ryska flygövningen är större än den västeuropeiska må vara hänt, men om informationsgrafiken ska vara korrekt, skulle den snarare se ut så här:




Fortfarande fler ryska plan, men nu med en riktig storleksjämförelse. Gissningsvis antog SVT:s grafiker att det var antalet ikoner som var det viktiga och att skalan inte spelar någon roll. Men visual cue i det här fallet är lika mycket den faktiska ytan som antalet symboler, kanske till och med ännu mer. Hjärnans system ett går direkt på ytjämförelsen, snarare än att via system två räkna flygplanen och jämföra antalet.