måndag 4 maj 2015

Två snabba från SCB

Jag hade egentligen inte tänkt klanka ner på just SCB så mycket, men nyligen damp två nya framställningar ner i mitt facebook-flöde, som jag inte kan låta bli att kommentera. Igen handlar det om att Sveriges officiella statistikmyndighet inte kan hålla sig till best practice för diagramframställning.

Det första kanske möjligen kan ursäktas med att det mer är en infographic än ett diagram, men samma principer för att undvika förvirring gäller ändå. Det visar på antalet sysselsatta inom industrin år 1980 och 2014, följaktligen med budskapet "allt färre jobbar inom industrin". Diagrammet innehåller alltså exakt två datapunkter.

 
För att skoja till det lite har man gjort de två staplarna i form av skorstenar till en fabriksbyggnad. Här ligger också problemet. Vid stapeldiagram är det staplarnas längd som är visual cue och som ska jämföras mot varandra. Därför är det exempelvis extra viktigt att man aldrig kapar y-axeln. Längden på staplarna utgår från baslinjen vid y=0. Men här har man alltså lagt in en stiliserad fabriksbyggnad för att lätta upp framställningen, med följden att staplarna (dvs. skorstenarna) istället ser ut att börja vid y=300 (jag utgår från att man avser 300 000, även om man inte skriver ut att det är tusental någonstans i diagrammet). Staplarnas höjd ser därmed ut att vara 631 respektive 261. Detta innebär att den visuella tolkningen blir att minskningen av industrisysselsättningen ser ut att vara närmare 60 procent, istället för det korrekta 40 procent.
 
Det andra exemplet handlar om nyregistreringar av fordon, där Trafikanalys är statistikansvarig myndighet och (tror jag) SCB producerar statistiken på uppdrag. Här jämförs direktimporten och nyregistreringarna mellan åren 2014 och 2015 i en blandning av ett stapel- och ytdiagram.
 
 
Och redan där ligger det första felet. Det är en - tyvärr - inte helt ovanlig metod när man vill särskilja två olika serier. Men som jag visat i tidigare bloggposter finns det alltid skäl till varför man väljer den ena eller den andra diagramtypen. Vissa är bättre än andra, beroende på sammanhang. Generellt är linjer att föredra när det är tidsserier som ska jämföras, medan staplar passa bäst för att jämföra kategorier. Ytdiagram är sällan lyckade över huvudtaget, eftersom det snabbt blir svårt att jämföra storleken på de staplade ytorna när det är många kategorier med.
 
Här har man krånglat till det för sig genom att mixa båda typerna, i ett försök att särskilja de båda åren. Det blir inte bra. Välj en diagramtyp och håll dig till den. På det här sättet försvåras bara jämförelserna mellan de båda åren. Valet av diagramtyp styrs av andra saker än att skilja olika serier åt. Där är färger eller olika etiketter bättre.
 
Färger har dessutom redan använts här, så det finns inget behov av ytterligare åtskiljande. Möjligen kan man ha synpunkter på valet av färger, vilket inte direkt underlättar för läsare (särskilt inte för någon med viss färgblindhet, som jag).
 
Slutligen är också etiketterna på x-axeln märkliga. Varje månad har märkts med år 2015, även om det helt uppenbart är både år 2014 och 2015 som jämförs. Månadsnummer istället för månadens namn i klartext är dessutom bara en extra förvirring som ytterst lätt kan åtgärdas och underlätta betydligt vid tolkningen.

Inga kommentarer:

Skicka en kommentar