Punten gaan verder waar lijnen en staven stoppen. Dat klink misschien raar, zeker voor wie nog uit de les wiskunde onthield dat een lijn een oneindige verzameling punten is. Toch kunnen punten zoveel meer dan lijnen in visualisatie. Enkele voordelen en -beelden van puntengrafieken.
1. Punten zijn efficiënt
Al in 1984 bewezen onderzoekers Cleveland en Mcgill dat op een gezamenlijke as gerangschikte punten een van de meest efficiënte manieren zijn om hoeveelheden en verhoudingen te communiceren.

Visualisatievormen die vergelijken van cijfers makkelijk maken (bovenaan) en vormen die minder efficiënt zijn (onderaan) © Alberto Cairo, naar Cleveland en McGill.
Het mag dan ook verbazen dat puntgrafieken zo zeldzaam zijn. Dit in tegenstelling tot staafgrafieken en de op het vlak van efficiëntie minderwaardige taartdiagrammen.
2. Punten geven meer detail
Beyond Bar and Line Graphs, Time for a New Data Presentation Paradigm, een recent en heel interessant artikel in PLOS Biology, pleit voor het vervangen van staafgrafieken die gemiddeldes en standaardafwijkingen weergeven door ‘1-dimensionele puntenwolken’ in wetenschappelijke studies. De voornaamste rede hiervoor is dat puntenwolken ook spreiding, outliers en dichtheid van datapunten weergeven.
Een zeer terecht punt. Vergelijk bijvoorbeeld de volgende 2 grafieken over werkloosheid in Europese landen, allebei gemaakt door Eurostat.
De tweede grafiek geeft ook de spreiding van de werkloosheid binnen elk land weer, waardoor een veel completer verhaal kan verteld worden.
3. Twee verbonden punten zijn… een helling
Het artikel in PLOS geeft ook aan hoe je door het verbinden van twee 1-dimensionale puntenwolken ook groepen en trends in data kan ontdekken.
Zo krijg je hellingsgrafieken, een van mijn favoriete visualisatievormen. Maar van twee 1-dimensionele puntenwolken kan je natuurlijk ook gewoon een traditionele 2-dimensionele puntenwolk maken.
4. Punten besparen plaats
Punten nemen veel minder inkt op papier en pixels op een scherm in dan andere visualisatievormen. Je kan er dus visualisaties met een veel hogere datadensiteit (of een hogere data to ink ratio) mee bereiken. Vergelijk maar eens.
Origineel:
En mijn schets van een puntenvariant:
5. Punten geven ruimte voor meer dimensies
Het is vrij eenvoudig om met kleuren en afmetingen grafieken zelfs nog datadenser te maken. Punten kunnen ingekleurd worden (kwalitatief of kwantitatief) en de grootte kan gecodeerd worden. Voeg dan nog tijd/animatie toe, en je krijgt de beroemde Rosling-grafieken (aka bubble charts).
Je grafiek moet natuurlijk wel leesbaar blijven. Niet altijd vanzelfsprekend, met 5 dimensies (x, y, kleur, grootte, tijd) op 1 grafiek.
6. Punten helpen verhalen vertellen
Met een doordacht gebruik van kleuren kan in een grote wolk van punten de meest interessante punten uitgelicht worden om een verhaal te vertellen.

Bron: How Baltimore’s Young Black Men Are Boxed In, fivethirthyeight.com
7. Punten kunnen duizenden aan
Door slim gebruik te maken van transparantie kunnen punten gebruikt worden voor het weergeven van letterlijk duizenden datapunten. Er zijn uiteraard limieten, maar zoals Tim Brock hier uitlegt zijn er wat truukjes om het optimum aan transparantie te vinden.

Bron: Too big data: coping with overplotting, infragistics.com
Er gebeurt ook onderzoek naar hoe de optimale transparantie van punten in een wolk automatisch gevonden kan worden. Hier hebben we wellicht het laatste dus nog niet van gezien.
De familie der puntgrafieken
Omwille van de hierboven opgesomde voordelen, pleit ik voor meer gebruik van punten voor het visualiseren van cijfers. Wanneer gebruik je dan welke puntgrafiek?
- Voor het vergelijken van een enkele dimensie voor verschillende categoriën: 1-dimensionele scatterplot.
- Voor het detecteren van scheve en bimodale distributies van 2 variabelen: verbonden 1-dimensionele scatterplot (of hellingsgrafiek).
- Voor het detecteren van verbanden tussen 2 variabelen: 2-dimensionele scatterplot.
- Voor het weergeven van 4-dimensionele data (3 cijfervariabelen, 1 categorische): bellengrafiek. Kan ook voor 3-dimensionele data (3 cijfervariabelen of 2 cijfervariabelen en 1 categorische).
- Voor het weergeven van 4-dimensionele data + tijd: geanimeerde bellengrafiek (aka Rosling-grafiek).