Olika typer av visualiseringar

Tabell

En tabell samlar och sammanfattar data – vanligen siffror – i rader och kolumner, för att du ska kunna få en översikt av alla data:

Korstabell

Korstabellen kallas också för fyrfältare (om du får 4 fält!). Den är till för att jämföra och analysera olika variabler, men behöver inte vara siffror.

I denna korstabell (eller åttafältare) ser du vilka individer som var myndiga under medeltiden. Som du ser hade det inte varit möjligt att bara ha med variabeln kön, civilstånd eller ålder, eftersom myndigheten påverkas av alla tre.

Idag hade samma framställning sett ut på följande sätt:

Eller med andra ord: Idag är det bara åldern som avgör om du är myndig eller inte – kön eller civilstånd spelar ingen roll.

Diagram

Diagram är mycket effektiva för att förmedla information på. De är lätta att läsa och förstå – även om det finns många svårigheter och möjligheter till manipulation med dem. De innehåller vanligen mindre information och färre detaljer än tabeller. Men det är just därför som de blir lättare att tolka, samtidigt som de blir mindre nyanserade.

Ett diagram är en visualisering som visar på samband, särskilt sådana som kan kvantifieras, det vill säga göras om till siffror.

Fördelen med att visualisera data på det här sättet är att du snabbt får en bra överblick.

Det jag ser i detta diagram är att något ökar med tiden. Och om jag tittar närmare ser jag att Y-axeln går från “sucking” till “not sucking”, vilket jag tolkar som att någon blir mindre dålig över tid (det vill säga bättre), till exempel någon som går en utbildning.

Du kan ha stor nytta av visualiseringarna. De hjälper dig med att:

  • Beskriva data, det vill säga vad de innehåller och innebär.
  • Analysera data, vilket innebär att du delar upp data i mindre delar för att se hur de hänger ihop.
  • Jämföra data, under förutsättning att du har något att jämföra med, vilket kan hjälpa dig i dina försök att analysera.
  • Förklara data, till exempel mönster som avviker från det förväntade.
  • Hitta samband mellan data, det vill säga hitta korrelationer och orsakssamband.

Om du använder exempelvis ett linjediagram så kan du med hjälp av linjer beskriva dina data, till exempel förändring över tid:

  • Du kan beskriva data: Över tid ökar invånarna.
  • Du kan analysera data: Det går att utmönstra 5 olika perioder i materialet:

I ord skulle analysen kanske kunna se ut på följande sätt: Under 1700-talet (period 1) ökade befolkningen i staden knappt överhuvudtaget. Men under 1800 inleds (period 2) en måttlig befolkningsökning, som stegras avsevärt i början av 1900-talet (period 3), men som efter ett tag följs av en nedgång, för att under resten av 1900-talet (period 4) öka kraftigt. Befolkningsökningen ser ut att avta i början av 2000-talet (period 5).

  • Du kan jämföra data: Röd stad har en högre befolkningsökning än grön stad.

Nu framstår ökningen i början av 1900-talet som ännu märkligare. Varför sker den starka befolkningsökningen med den efterföljande nedgången bara i röd stad?

  • Du kan hitta samband med andra data: Befolkningsutvecklingen sammanfaller (korrelerar) med några förändringar i samhället:

Du kan se att dina perioder korrelerar med de tre förändringarna i samhället. 1700-talet (period 1) sammanfaller med de otaliga krigen, svälterna och sjukdomarna i det äldre samhället. Period 2 (1800-talet) tycks korrelera med den minskade barnadödligheten. Och urbaniseringen sammanfaller med period 3 och 4, det vill säga hela 1900-talet.

  • Du kan förklara förändringarna av data med hjälp av sambanden: Befolkningen ökar först på grund av den minskade dödligheten och senare på grund av urbaniseringen.

Men observera att en korrelation inte är samma sak som en orsak: bara för att något sammanfaller i tid behöver de inte orsaka varandra.

I det här fallet känns sambanden som rimliga förklaringar till den ökade befolkningen. Dock kan de inte förklara nedgången i början av 1900-talet.

Då måste du leta efter andra anledningar:

Det skulle dock kunna förklaras med att den stora inflyttningen till staden inte kunde matchas av bostäder, vilket ledde till en så stor trångboddhet att folk valde att flytta ut, tills bostadsbyggandet kom igång, då befolkningen ökade igen. Om det dessutom samtidigt hade varit krig, så hade ju även det kunnat förklara befolkningsnedgången.

Linjediagram

Med hjälp av ett linjediagram kan du med hjälp av linjer visa hur något till exempel utvecklas över tid:

Stolpdiagram

Stolpdiagram (eller stapeldiagram) visar med hjälp av stolpar till exempel mängden av något:

Sektordiagram

Sektordiagrammet kallas också cirkeldiagram eller tårtdiagram. Det är till för att visa andelar eller procent av något. Observera att det inte är tänkt att visa antal – då är vanligen stolpdiagrammet bättre.

Men var försiktig med dessa diagram eftersom de är lätta att manipulera (medvetet) eller trassla till det (omedvetet) – särskilt om de är i 3D!

Kanske kan följande Tiktok få illustrera de potentiella problemen med att sektordiagram bara visar andelar, inte hur absoluta stora de olika andelarna är:

Vad ska vara med i en visualisering?

En visualisering ska vara självförklarande. All nödvändig information ska finnas tillgänglig för läsaren. Problemet med detta är förstås att alla kanske inte förstår all denna information, till exempel vad kumulativa tal är, men det är ett annat problem. Är det absoluta tal ska det stå (om det finns både absoluta och relativa tal). Handlar det om procent ska det stå. Och så vidare.

En visualisering måste kommenteras i text, till exempel efter visualiseringen. Där ska du förklara hur och varför du tolkar statistiken på det sätt du gör.

I en akademisk eller vetenskaplig text ska visualiseringar numreras, ha en rubrik (som berättar vad visualiseringen beskriver) och en källhänvisning.

Men de kan förstås vara mycket mer komplicerade än så. Här följer en visualisering från min egen avhandling:

Öva på visualiseringar

Pröva själv – Tolka statistik – Övning 14

Karta över Tolka statistik