De puntjes op de i: 7 redenen waarom u puntgrafieken zou moeten maken

Punten gaan verder waar lijnen en staven stoppen. Dat klink misschien raar, zeker voor wie nog uit de les wiskunde onthield dat een lijn een oneindige verzameling punten is. Toch kunnen punten zoveel meer dan lijnen in visualisatie. Enkele voordelen en -beelden van puntengrafieken.

1. Punten zijn efficiënt

Al in 1984 bewezen onderzoekers Cleveland en Mcgill dat op een gezamenlijke as gerangschikte punten een van de meest efficiënte manieren zijn om hoeveelheden en verhoudingen te communiceren.

cleveland_mcgill_cairo

Visualisatievormen die vergelijken van cijfers makkelijk maken (bovenaan) en vormen die minder efficiënt zijn (onderaan) © Alberto Cairo, naar Cleveland en McGill.

Het mag dan ook verbazen dat puntgrafieken zo zeldzaam zijn. Dit in tegenstelling tot staafgrafieken en de op het vlak van efficiëntie minderwaardige taartdiagrammen.

2. Punten geven meer detail

Beyond Bar and Line Graphs, Time for a New Data Presentation Paradigm, een recent en heel interessant artikel in PLOS Biology, pleit voor het vervangen van staafgrafieken die gemiddeldes en standaardafwijkingen weergeven door ‘1-dimensionele puntenwolken’ in wetenschappelijke studies. De voornaamste rede hiervoor is dat puntenwolken ook spreiding, outliers en dichtheid van datapunten weergeven.

journal.pbio.1002128.g001

Een zeer terecht punt. Vergelijk bijvoorbeeld de volgende 2 grafieken over werkloosheid in Europese landen, allebei gemaakt door Eurostat.

Unemployment_rates,_seasonally_adjusted,_February_2015

 

dotplot_eurostat

 

De tweede grafiek geeft ook de spreiding van de werkloosheid binnen elk land weer, waardoor een veel completer verhaal kan verteld worden.

3.  Twee verbonden punten zijn… een helling

Het artikel in PLOS geeft ook aan hoe je door het verbinden van twee 1-dimensionale puntenwolken ook groepen en trends in data kan ontdekken.

journal.pbio.1002128.g002

Zo krijg je hellingsgrafieken, een van mijn favoriete visualisatievormen. Maar van twee 1-dimensionele puntenwolken kan je natuurlijk ook gewoon een traditionele 2-dimensionele puntenwolk maken.

4. Punten besparen plaats

Punten nemen veel minder inkt op papier en pixels op een scherm in dan andere visualisatievormen. Je kan er dus visualisaties met een veel hogere datadensiteit (of een hogere data to ink ratio) mee bereiken. Vergelijk maar eens.

Origineel:

belastingen_belastingsdruk_oeso_landen_oecd_MFNgraph_TIJD_15042015_F_ipadgraph

En mijn schets van een puntenvariant:

België blijft loonlastenkampioen

5. Punten geven ruimte voor meer dimensies

Het is vrij eenvoudig om met kleuren en afmetingen grafieken zelfs nog datadenser te maken. Punten kunnen ingekleurd worden (kwalitatief of kwantitatief) en de grootte kan gecodeerd worden. Voeg dan nog tijd/animatie toe, en je krijgt de beroemde Rosling-grafieken (aka bubble charts).

Je grafiek moet natuurlijk wel leesbaar blijven. Niet altijd vanzelfsprekend, met 5 dimensies (x, y, kleur, grootte, tijd) op 1 grafiek.

6. Punten helpen verhalen vertellen

Met een doordacht gebruik van kleuren kan in een grote wolk van punten de meest interessante punten uitgelicht worden om een verhaal te vertellen.

7. Punten kunnen duizenden aan

Door slim gebruik te maken van transparantie kunnen punten gebruikt worden voor het weergeven van letterlijk duizenden datapunten. Er zijn uiteraard limieten, maar zoals Tim Brock hier uitlegt zijn er wat truukjes om het optimum aan transparantie te vinden.

Er gebeurt ook onderzoek naar hoe de optimale transparantie van punten in een wolk automatisch gevonden kan worden. Hier hebben we wellicht het laatste dus nog niet van gezien.

De familie der puntgrafieken

Omwille van de hierboven opgesomde voordelen, pleit ik voor meer gebruik van punten voor het visualiseren van cijfers. Wanneer gebruik je dan welke puntgrafiek?

  • Voor het vergelijken van een enkele dimensie voor verschillende categoriën: 1-dimensionele scatterplot.
  • Voor het detecteren van scheve en bimodale distributies van 2 variabelen: verbonden 1-dimensionele scatterplot (of hellingsgrafiek).
  • Voor het detecteren van verbanden tussen 2 variabelen: 2-dimensionele scatterplot.
  • Voor het weergeven van 4-dimensionele data (3 cijfervariabelen, 1 categorische): bellengrafiek. Kan ook voor 3-dimensionele data (3 cijfervariabelen of 2 cijfervariabelen en 1 categorische).
  • Voor het weergeven van 4-dimensionele data + tijd: geanimeerde bellengrafiek (aka Rosling-grafiek).

Add Comment

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *