torsdag 19 december 2013

Grundläggande visualiseringsteori, del 1: Visuell hierarki

Det här är den första av (förhoppningsvis) flera bloggposter som går in lite mer på djupet kring de teoretiska grunderna för informationsvisualisering. Jag inleder med en av de viktigaste forskningsinsatserna på området – Clevelands hierarki över grafiska element.

William S. Cleveland skrev 1985 tillsammans med Robert McGill uppsatsen Graphical Perception and Graphical Methods for Analyzing Scientific Data , där han för första gången fastslår en rangordning över vilka typer av grafiska metoder för att visualisera data som är effektivast.

När man konstruerar diagram, kodas numerisk information genom storlek, position, form och färg. När man tittar på diagrammet, avkodas informationen visuellt av synsystemet. Den grafiska framställningen är bara lyckad om den avkodningen är effektiv. Den visuella avkodningen handlar om det som på engelska benämns "preattentive vision", dvs det omedvetna, omedelbara mottagandet av information som görs utan någon uppenbar mental ansträngning. Den som är bekant med Daniel Kahneman känner igen det som system 1. Man genomför visserligen också medveten avkodning, genom att t.ex. läsa av skalor och etiketter (Kahnemans system 2), men diagrammens styrka jämfört med tabeller kommer från vår system 1-förmåga att utläsa mönster och jämföra storlekar.

Cleveland och McGill kategoriserade tio olika sätt att visuellt koda information; vinkel, yta, färgskala, färgintensitet, färgtäthet (andel svart), längd, lägen på samma skala, lägen på flera identiska skalor, lutning och volym. Dessa kategorier utgör grunden för i stort sett alla typer av diagram som kan konstrueras.

Kontrollerade experiment genomfördes sen för att studera hur effektiva respektive grafisk typ var för att avkoda information. Försökspersonerna fick försöka utläsa hur stora de procentuella skillnaderna var mellan olika värden kodade med samma grafiska element. Exempelvis fick de se fyra olika vinklar (A-D) och skulle sedan avgöra hur stor andel av vinkel A som vinkel B, C respektive D utgjorde. Försöken upprepades för alla tio olika typer av grafiska element. Genom att jämföra det uppskattade värdet mot det sanna, kunde absolutskillnaden summeras till bedömningsfelet för varje grafisk typ.

Ju större bedömningsfel, desto sämre blir alltså det grafiska elementet på att förmedla information på ett korrekt sätt. Genom att rangordna elementen efter hur mycket (eller lite) fel försökspersonerna gjorde vid försöken, fick man fram en hierarki över olika metoder, graderade från bästa informationsöverföring till sämsta.


Mest effektivt som informationsöverföring är diagram som utnyttjar lägen på en gemensam skala, t.ex. stapeldiagram, linjediagram och punktdiagram. Minst effektiv informationsöverföring får man vid användning av olika färger, t.ex. heatmaps eller tematiska kartor.

Vad betyder då det här för tillämpningen vid diagramkonstruktion? Jo, Clevelands och McGills resonemang är som följer - vid visuell kodning av information har man ofta flera olika valmöjligheter. Man bör då välja den grafiska metod som ligger så högt upp i hierarkin som möjligt. Det ökar exaktheten i avläsningen av mönster i informationen. Det innebär inte en exakt instruktion för hur man konstruerar diagram, men ger ett viktigt stöd i olika valsituationer.

Rent praktiskt innebär det till exempel att tårtdiagram (vinkel) i princip alltid är sämre än stapeldiagram (lägen på samma skala). Att delade stapeldiagram (längd) är sämre än grupperade stapeldiagram (lägen på samma skala). Att olika färger på en karta (färgskala) är sämre än nyanser av samma färg (färgintensitet). Att bubblor (yta) är sämre än staplar (lägen på samma skala). Och så vidare.