Den goda (men svåra) framställningen av statistik

Jag hoppas att du nu håller med om att statistik är väldigt svårt, om det ska bli bra.

  • Det är egentligen inte svårt att räkna och samla ihop statistik, även om det finns åtskilliga problem med det också, till exempel representativitet.
  • Det är inte svårt att göra visualiseringar – det finns program som till exempel Powerpoint och Excel som hjälper dig med det.
  • Det är inte svårt att tydligt lyfta fram vad du vill ha sagt med din visualisering.

Men det är svårt att göra det på ett schysst sätt. Det beror på att två principer krockar:

  • Att ge neutral statistik som inte är påverkad av någon (som kanske har skäl för att manipulera den). Då bör man nämligen ge så mycket information som möjligt, så att läsaren själv kan få göra sin bedömning vad som är rimligt att ha med för att göra en god tolkning. Men det kan då bli dels för mycket information, så att läsaren inte ser skogen för alla träd, dels för svår information, om läsaren inte känner till vad till exempel medianen är för något.

Lita inte på statistik från den här killen! Jag brukar i och för sig säga att man inte ska ska döma en bok efter omslaget. Men i det här fallet tror jag att jag ändå skulle göra det 🙂

  • Att vara tydlig och begriplig, till exempel genom att bara visa en variabel. Det är ju lösningen på problemet med för mycket information. Men risken är då att läsaren är utlämnad till din tolkning av statistiken. Det är bra för manipulatörer, men inte för den som vill ge människor en möjlighet att själv skapa sig en uppfattning.
Embed from Getty Images

Det finns några olika sätt som kan hjälpa dig att balansera dina visualiseringar:

  • Fundera på skalan på Y- och X-axlarna! Vilken är rimlig?

Problemet är att det inte finns en skala som funkar i alla situationer, till exempel att låta Y-axeln börja vid 0.

En variant är att visa visualiseringen på två sätt, med olika skalor. Till exempel en som går 0-100 och en som går 50-100. Men det tar mer plats och det är jobbigare att läsa.

  • Fundera över vilket genomsnitt som är mest rimligt!

Inte heller här är det självklart vilket centralmått som är det bästa.

Du kan ge flera olika så att läsaren får både medelvärdet, medianen och typvärdet. Men det tar mer plats och det är jobbigare att läsa. Dessutom kanske det blir för svårt för läsaren, så att det snarare stjälper än hjälper.

Embed from Getty Images

Försök att vara en ängel när du ska presentera din statistik, men kanske inte av den här sorten …

  • Var försiktig med 2D och 3D!

Om värdena är dubbelt så höga så ska figurerna vara dubbelt så höga, inte till exempel tre gånger så höga.

  • Visa “motsatsen” också!

Om du vill visa hur många människor som begår brott, så kan du också visa hur många som är laglydiga. Men det blir dubbelt så mycket information för läsaren …

  • Använd bara siffror i tabeller! Inte diagram!

Tabeller är mer neutrala än visualiseringar. Men det blir ofta mycket svårare och jobbigare för din läsare. Och även tabeller kan enkelt manipuleras.

I slutändan är det en avvägning där du måste väga enkelhet mot neutralitet – om du vill vara en snäll statistiker.

Karta över Tolka statistik