torsdag 11 oktober 2018

Grundläggande visualiseringsteori, del 3: Cirkeldiagrammet - älskat och hatat

En av de saker som kanske mest förvånar en vanlig användare när man kommer mer i kontakt med visualiseringsvärlden, är det kompakta motståndet mot cirkeldiagram. Cirkeldiagrammet (eller, om man så vill, tårtdiagram alternativt pajdiagram) är ju en vanlig form av framställning, som dyker upp dagligen i tidningar, på nätet, i rapporter - överallt där siffror ska redovisas. Vad kan vara så fel med det?


Att cirkeldiagrammet avskys av så många som jobbar professionellt med visualisering (Stephen Few: Save the pies for dessert, Cole Nussbaumer: Death to pie charts, Edward Tufte: The only thing worse than a pie chart is several of them) är inte en fråga om tycke och smak, utan helt och hållet baserat på hur effektivt det är på att förmedla data.

Huvudpoängen är följande: visual cue i ett cirkeldiagram är vinkeln på tårtbitarna och storleken på deras ytor. Går vi tillbaka till det mest basala i visualiseringsdiagram, Cleveland & McGill's visuella hierarki, hamnar såväl vinkel som yta långt ner i listan. De är helt enkelt dåliga metoder att förmedla data. I princip är andra former av diagram alltid bättre än cirkeldiagram.

Men, invänder vän av ordning, cirkeldiagram är ju perfekta för att visa andelar. Man ser tydligt hur stor del av helheten varje sektion representerar. Ja och nej (mest nej). Vi tar ett exempel för att illustrera. Här är ett exempel på ett vanligt cirkeldiagram, med sex olika kategorier. Kategori C kan lätt utläsas till 25 procent, en fjärdedel av diagrammets yta.

Det här är cirkeldiagrammets egentliga styrka; att visa en andel av helheten. 25 procent av 100 procent framstår tydligt. Men om vi bara stuvar om kategorierna lite, till att exempelvis sortera dem efter storlek?

Plötsligt är det inte så självklart att kategori C är exakt 25 procent längre. När start- och slutpositionerna var lodräta eller vågräta kunde ögat enkelt uppfatta andelen. Nu är vinkeln fortfarande 90 grader, men det är nästan omöjligt att exakt bedöma storleken på tårtbiten.

Vad gör man då istället? En vanlig lösning är att ange de exakta andelarna som etiketter, kanske till och med kategorinamnen som etiketter.




Men vad har vi fått nu? Vad är visual cue? Det är inte längre vinkeln på tårtbiten eller ytan, utan bara det angivna siffervärdet på etiketten. Och då kan vi lika gärna ha en vanlig tabell. Eller, för den delen, ett stapeldiagram, som är den form som bäst förmedlar kategoridata.



Är cirkeldiagram då alltid fel? Nej, inte helt och hållet. Forskningen visar att det finns en specifik tillämpning där de är det bättre alternativet. I artikeln  “Displaying Proportions and Percentages” visar Ian Spence och Stephan Lewandwsky - något förenklat - att cirkeldiagram kan fungera bra när summan av två kategorier ska jämföras med summan av två andra kategorier, som i detta exempel:



Vad är störst - A+B eller C+D? I just det här fallet visar det sig att cirkeldiagram faktiskt är bättre än staplar. Nu är det här ett ganska smalt tillämpningsområde, och möjligen kan det finnas fler exempel som ännu inte har beforskats. Men på det stora hela är pajdiagram alltid sämre än andra alternativ.

Jag gillar pajer. Här är en som jag och min dotter bakade här om dagen. Men spara pajerna till fika. Håll dem borta från siffertrillandet om du inte vet exakt vad du håller på med!