Rentestaven en inflatielijnen

Naast Lou Reed prijkte vandaag op de voorpagina van De Morgen een grafiek. Uiteraard juich ik grafieken op voorpagina’s toe, net als op cijfers gebaseerde artikels, zoals Eindelijk weer geld verdienen met spaarboekje er een is.

Maar de grafiek, en u hoort mij al komen, kon wel wat beter. Dit is het origineel:

rente-inflatie_demorgen_org

Staafgrafieken zijn meestal beter, luidt een van de regels van de datavisualisatie. Maar niet als het gaat om gegevens die variëren in de tijd. Dan is een lijngrafiek meestal meer aangewezen. De grafiek zou er dan zo uit kunnen zien:

rente-inflatie

Voordelen van deze grafiek:

  • De evoluties van zowel de inflatie als de rente zijn veel beter afleesbaar.
  • Ook de evolutie van het verschil tussen beide percentages, waar het uiteindelijk om draait, is veel duidelijker.
  • Er ontstaan betekenisvolle ‘gebieden’ (de ruimte tussen de twee lijnen), die met een beetje tekst geduid kunnen worden.

Interessant zou zijn om met maandelijkse gemiddelden te werken. Dit zou meer de werkelijkheid benaderen dan het gebruik van  jaarlijkse gemiddelden.

Hoe een grafiek op zijn kop beter kan zijn

Waar grafiekmakers vaak mee worstelen, is het voorstellen van kleine schommelingen van grote waardes. Een manier om die wat uit te vergroten is het ‘breken’ van de Y-as of de X-as niet op 0 te leggen.

beurskoers

In sommige gevallen, zoals voorbeeld hierboven uit De Standaard, is het breken van Y-as te verantwoorden. Soms kunnen kleine verschillen toch betekenisvol zijn, zoals het geval is met aandelenkoersen. Meestal dienen dat soort grafieken ook meer om een trend weer te geven en zijn de absolute waarden niet zo belangrijk.

Maar Y-assen worden in de meeste gevallen gebroken om verschillen groter te laten lijken dan ze in werkelijkheid zijn. Een andere rede om de as te breken is het vermijden van grote vlakken zonder data. Deze grafiek van De Correspondent, uit het artikel Democratie? Leuk, maar niet hoe het nu gaat is zo’n geval.

opkomstverkiezingen_correspondent

Een geluk bij een ongeluk is dat duidelijk wordt aangegeven dat de Y-as gebroken wordt. Vaak wordt gewoon de X-as niet op 0 gelegd, wat een nog grotere fout is. Met een Y-as die niet wordt gebroken, ziet de grafiek er zo uit:

opkomstverkiezingen_correspondent_correct

Inderdaad veel ongebruikte ruimte op de grafiek. Maar de daling van de verkiezingsopkomst wordt door deze weergave ook gerelativeerd, zeker voor de Europese verkiezingen. De daling is niet zo spectaculair.

Oplossing

Met een eenvoudig omdraaien van de grafiek, worden bovenstaande problemen in een keer opgelost. Dit komt neer op het weergeven van het stijgdende verkiezingsverzuim in plaats van de dalende verkiezingsopkomst, wat eigenlijk logischer is.

opkomstverkiezingen_correspondent_gespiegeld

De oorspronkelijke grafiek bevat geen labels, waardoor het onmogelijk is om de waardes af te lezen (wat een min is voor elke visualisatie). Gelukkig leerde ik vandaag de sublieme WebPlotDigitizer kennen. Daarmee haal je gemakkelijk data uit grafieken op afbeeldingen.

Meer uitgewerkt ziet de grafiek er zo uit:

opkomstverkiezingen_remake

Toegegeven, het trucje van de omgekeerde grafiek kan alleen in specifieke gevallen worden toegepast (met name hoge percentages). Maar assen breken is bijna nooit een goed idee en valt met wat creativiteit, zowel in de keuze van de weergegeven data als in het design van de grafiek, meestal gemakkelijk vermeden worden.

Nieuwe peiling, nog meer staafjes

Old habits die hard. Dat bewezen de grafiekjes die eind vorige week de resultaten van een nieuwe peiling moesten visualiseren.

Bij de vorige peiling in mei van dit jaar maakte ik een eigen voorstel om de peilingresulaten weer te geven. Mijn aanbevelingen waren toen:

  1. de tijd weergeven van links naar rechts.
  2. de tijd tussen de verkiezingen en peilingen waarvan de resultaten worden voorgesteld proportioneel weergeven op de x-as.
  3. balkjes per partij naast elkaar vervangen door lijngrafieken.
  4. data direct labelen op de grafiek, zodat een legende overbodig wordt.

De meeste visualisaties respecteerden deze aanbevelingen niet en ze doen dat ook nu niet. De grafici verantwoordelijk voor het maken van de grafieken van de peilingresultaten hebben duidelijk sjablonen waar ze niet graag van af stappen.

De Standaard

ds2

De Standaard blijft hardnekkig de tijd weergeven van rechts naar links. Verder ook veel overbodige elementen op de grafiek, zoals de grijze banden, die niet nodig zijn aangezien alle datapunten worden gelabeld.

De Morgen

demorgen2

De grafiek van de morgen is wat beter: geen overbodige elementen, tijd van links naar rechts en meer verticale ruimte, waardoor de scores van de verschillende partijen wat beter met elkaar kunnen vergeleken worden. Wel wordt verwezen naar de peiling van mei 2012, terwijl het een peiling betreft van dit jaar.

deredactie.be

deredactie22

Deredactie.be blijft zijn onleesbare formaat, met veel data maar zonder goed afleesbare of vergelijkbare waarden, trouw.

De Tijd

De Tijd kwam als enige mijn wens naar lijn- in plaats van staafgrafieken tegemoet. Maar tegen regels 2 en 4 wordt nog steeds gezondigd: geen proportionele weergave van de tijdsintervallen en geen directe labeling.

tijd2

Goed aan de grafiek is dat het de peiling in perspectief zet over een langere periode. Ze lijkt zo de rise and fall van de N-VA weer te geven. Met wat minder nadrukkelijke bollen en fijnere lijnen zou de grafiek wat leesbaarder zijn, denk ik. Wat mij betreft hebben we hier een winnaar. (Of misschien beter: de eenoog in het land der blinden?)

Mijn voorstel

Ik heb de nieuwe data verwerkt in mijn sjabloontje (ja, uiteraard doe ik dat ook zo :-)). Hier het resultaat met de nieuwe data:

peilingokt13

Betrouwbaarheidsintervallen

Voor deze peiling werden 1041 Vlamingen gevraagd naar hun politieke voorkeur van de dag. Waar het nog altijd op wachten is de eerste peilingresultaten die gewag maken van betrouwbaarheidsintervallen. Misschien dat ik volgende keer mijn cursus statistiek eens van onder het stof haal om deze ook eens grafisch voor te kunnen stellen.

Visualisaties De Correspondent: mooi maar onbruikbaar en misleidend

Iedereen in het Nederlandstalige online medialandschap keek er reikhalzend naar uit: vandaag werd De Correspondent gelanceerd. Ik keek er ook naar uit. De tagline ‘Een dagelijks medicijn tegen de waan van de dag’ klinkt me als muziek in de oren.

Het eerste en voor iedereen toegankelijke artikel draagt als titel De terugkeer van de Muur en gaat over grensmuren wereldwijd. Een interessant onderwerp wat mij betreft, en het wordt ook goed uitgespit.

Waar het artikel wel minpunten mee haalt, zijn de visuele elementen. Toegegeven: ze ogen mooi, de kaartjes en de grafiek, met kleuren helemaal afgestemd op de layout van de site. Maar er wordt wel gezondigd tegen enkele regels van de datavisualisatie, soms zelfs op een problematische manier.

De grafiek

Door standaardinstellingen in Microsoft Excel en Powerpoint hebben taartdiagrammen al snel de neiging om te lijden aan de 3D-ziekte. Maar een lijngrafiek in 3D? Nog niet veel gezien, en gelukkig maar. Toch gaat de correspondent ervoor:

groeivangrensmurenwereldwijd

Grootste probleem is de leesbaarheid van de grafiek. Hoeveel muren waren er bijvoorbeeld in 1975? Heel moeilijk te zeggen. De muur staat letterlijk in de weg. Door het gebruik van 3D en door de lijn van de lijngrafiek ook volume te geven (de dikte van de muur) heeft elke datapunt eigenlijk 3 mogelijk af te lezen waarden: de voet van de muur, de bovenste rand aan de voorkant en deze aan de achterkant. Goed dat enkele waarden als annotatie worden meegegeven, anders was de grafiek totaal onbruikbaar geweest.

Wat van een online only medium vandaag toch ook mag verwacht worden, is wat interactiviteit. Ik verwachtte wat extra uitleg te krijgen bij het klikken op de rode bollen met cijfers (een lijstje met landen die muren hebben gebouwd, bijvoorbeeld), maar de grafiek is een statische afbeelding. Wat teleurstellend.

De kaartjes

Dan de kaartjes. Even oogstrelend voor het oog, maar deze keer echt misleidend.

kaartjegrensmuren

Een eerste suggestie voor verbetering: het zou goed zijn aan te geven welk van twee grenslanden een muur bouwde (bouwde Paraguay of Brazilië nu die muur?).

Maar grootste probleem is het misleidende van de kaart. De grens tussen de VS en Mexico is bijlange niet helemaal afgesloten door een muur, wat de kaart wel lijkt aan te geven. Het zijn niet de muren die op de kaart in het rood zijn getekend, het zijn de grenzen waarlangs ergens een muur staat. Een enorm verschil. Het gebruik van dezelfde kleur voor de titel ‘Grensmuren in…’ als voor het kaartsymbool voor de grenzen met muren, is misleidend.

En wat te denken van de ondertitel ‘Impressie situatie 1945 tot nu’? Geeft het woord ‘impressie’ aan dat het niet gaat om de exacte weergave van de realiteit, maar eerder de realiteit zoals die door de kaartenmaker wordt gepercipieerd, naar analogie met een impressionistisch schilderij? En wat staat de ‘1945’ daar te doen? Het gaat toch om de situatie vandaag?

En net als bij de grafiek probeerde ik vruchteloos op de rode lijntjes te klikken om meer te weten te komen.

Mooi maar onbruikbaar en misleidend

Ongetwijfeld zullen er veel lezers zijn die tevreden zijn met een mooi kaartje en een mooie grafiek. Niet iedereen wil weten hoeveel muren er nu stonden in 1975 of hoe sterk de stijging naar 2010 nu precies was. Het misleidende en onleesbare van de grafiek wordt voor sommigen zeker gecompenseerd door het esthetische.

Maar de kaartjes, met hun misleidende titels en mistige ondertitels, zijn een groter probleem. Ik vraag me af hoeveel procent van de lezers doorhebben dat de rode lijn grenzen zijn met ergens een muur en niet om de muren zelf. Zo ontstaan misverstanden en de kaartjes zijn in mijn ogen het equivalent van redeneringsfouten of foute beweringen in de tekst. In de journalistiek eigenlijk ontoelaatbaar.

De Vlaming en zijn woning, gesorteerd en uitgelijnd

Ik ben wel fan van de grafieken in De Tijd. Ze hebben een consistente en heldere huisstijl, zonder neiging naar chart junk, die andere kranten wel hebben. De Tijd bevat ook aanzienlijk meer grafieken dan de andere kranten, wat ik uiteraard een goede zaak vind.

Maar niet voor niets luidt een van mijn deviezen in de datavisualisatie ‘Alles kan beter’. Hier toon ik aan dat door grafische elementen simpelweg te sorteren en uit te lijnen, cijfers veel leesbaarder worden.

Laten we starten met het origineel, uit het artikel Vlaming wil zich niet meer uitsloven voor zijn woning. Een enquête onder 750 Vlamingen peilde naar de houding van de Vlaming ten opzichte van het aankopen van een woning. Het artikel bevat heel wat percentages, waarvan enkele ook grafisch werden voorgesteld:

vlamingenenhunhuizen

Een correcte voorstelling van de resultaten. Maar door het gewoon sorteren van de staven wordt veel sneller duidelijk wat de meeste mensen eigenlijk wensen voor hun potentiële nieuwe woning:

huisvlaming_gesorteerd

Misschien had De Tijd een goede rede om de staven te sorteren zoals ze deden, maar ik vind de sortering zeker een verbetering. Meteen wordt ook duidelijk dat de onderste twee staven eigenlijk gespiegeld zouden moeten worden en hoger op de grafiek zouden gesorteerd moeten worden.

Nog een verbetering is het uitlijnen van de staven rond de gezamenlijke ‘0-as’. Dat geeft volgend resultaat:

huisvlaming_gesorteerdverschoven

Als laatste verbetering zou ik nog het gebruik van twee even ‘zware’ kleuren adviseren. Nu trekt het donkere blauw onevenredig veel aandacht van het oog.

Grafieken zijn een hulpmiddel voor de lezer om zaken te kunnen vergelijken. Gesorteerde en juist uitgelijnde grafische elementen maken dit vergelijken veel minder inspannend voor de lezer.

Alles kan beter: het klassement van de Tour de France

Het valt moeilijk te verklaren, maar het is zo: de sportbladzijden, dé datapagina’s bij uitstek in de krant, blijven vooralsnog verstoken van enige datavisualisatie. Uitslagen, rangschikkingen en tijden worden nog steeds klassiek in een tabelletje gestoken.

Nu heb ik niks tegen tabellen. Voor het droog geordend weergeven van gegevens en voor het makkelijk opzoekbaar maken van data zijn ze moeilijk te kloppen. Maar er wordt heel wat potentieel onbenut gelaten.

Neem nu de Ronde van Frankrijk. Het klassement voor de gele trui ziet er in De Morgen en De Standaard zo uit:

wielerklassement_ds

wielerklassement_dm

Oerdegelijk en klassiek, maar weinig geïnspireerd. Online is de situatie niet beter. Meestal wordt enkel de nationaliteit van de renners weergegeven met een vlagje, zoals Sporza hieronder doet, maar verder weinig nieuws onder de zon. De Belgen worden wel nog met een zwaarder lettertype uitgelicht.

wielerklassement_sporza

Dat er mogelijkheden zijn om de rangschikking en de tijdsverschillen meer visueel en inzichtelijker weer te geven, mag duidelijk zijn. Ik geef hieronder mijn (snel uitgewerkt) voorstel, dat zelf ook zeker nog ruimte laat voor verbetering:

wielerklassement4

De tabel is blijven staan en werd uitgebreid met een bolletjesgrafiek die de achterstand op de gele trui weergeeft.

Omdat er vandaag wel wat veranderde aan de top van het klassement, kreeg ik het idee om naast de tijdsverschillen ook de verschuivingen te tonen. Dit deed ik door de tijdsverschillen na de vorige rit ook weer te geven. Zo zie je meteen wie tijd heeft goedgemaakt en wie tijd verloor ten opzichte van de leider in het klassement.

Wat ik zelf wel geslaagd vind, is dat de 0-lijn een soort eindmeet vormt, het eerst bereikt door de gele trui. En natuurlijk is er de voor de hand liggende knipoog naar de bolletjestrui.

Opiniepeiling: datavisualisatie beneden alle peil

Vorige vrijdag maakten VRT en De Standaard de resultaten bekend van hun politieke opiniepeiling. Nu ben ik geen fan van opiniepeilingen (wat is uiteindelijk het nut?) en gaat er met de statistische interpretatie heel wat mis (Betrouwbaarheidsintervallen, iemand?).

Los van dit voorbehoud, wil ik het hier eens hebben over de voorstelling van de resultaten, zoals de verschillende media ze afgelopen weekend publiceerden. Hoe brengen de Vlaamse media het er van af op het vlak van basic datavisualisatie? Niet zo goed, zo blijkt.

De Standaard

De Standaard kon, als opdrachtgever van de opiniepeiling, de resultaten in primeur brengen. Vermoedelijk hadden ze dus een beetje tijd om de resultaten te verwerken en na te denken over hoe ze deze visueel konden voorstellen.

Dit is waar ze voor gingen:

ds

Een standaard staafgrafiekje, waar bij verkiezingsresultaten en peilingen telkens naar wordt gegrepen. Maar er loopt wel een en ander fout. Zo moet je de tijd aflezen van rechts naar links, in plaats van het meer intuïtieve links naar rechts. Ook worden de resultaten voorgesteld alsof de vorige peiling, van september 2012, precies midden tussen deze peiling en de verkiezingen van 2010 viel. Een fout die alle andere media ook maken, zoals hieronder te zien is.

DS online

Online gaat De Standaard voor een wat cleanere en dus betere versie (geen dubbele afscheidingslijn, een wat zachtere achtergrond). Maar waar is de PVDA+ plots gebleven?

dsonline

VRT

Dan de VRT, de andere organisator van de peiling.

vrtjournaal

Deze grafiek is een still uit het VRTjournaal. Daar gelden natuurlijk andere regels voor dan voor grafieken in gedrukte of online media. Er van uitgaande dat de presentatrice aan de kijker uitlegt ten opzichte van welke waarden de huidige peiling wordt vergeleken op de grafiek, wordt hier ook weer de tijd voorgesteld van rechts naar links. Geen idee waarom. Verder: laat de strepen in de achtergrond gewoon achterwege en de grafiek wordt al veel leesbaarder. En de achtergrondfoto mag nog meer naar de achtergrond (of beter nog: ook gewoon weg).

deredactie.be

De VRT beschikt over een databank van een hele reeks opiniepeilingen. Sinds de verkiezingen van 2010 lieten ze al er al zeven uitvoeren. En daar willen ze graag mee uitpakken.

deredactie1

Inderdaad veel peilingen. Maar zeg mij eens: hoeveel procent haalde het Vlaams Belang bij de peiling van maart 2011? Om deze vraag te beantwoorden moeten je ogen op verschillende plaatsen op de grafiek info ophalen. En dan nog blijf je het exacte antwoord schuldig. En behaalde Groen! nu meer of minder dan Open VLD in de meest recente peiling? Vergelijken is moeilijk met deze grafiek.

Toegegeven, op dezelfde pagina publiceert deredactie.be nog een andere grafiek waar alle cijfers wel op worden weergegeven. Maar vergelijken blijft nog steeds moeilijk en in een browser moet je al beginnen scrollen om de hele grafiek te zien.

deredactie2

De Morgen

De Morgen houdt het in zijn zaterdagkrant heel basic. De tijd loopt wel al van links naar rechts en ook vermeldt De Morgen de categorie ‘Andere’, wat deredactie.be ook al deed, maar wat De Standaard achterwege liet. Deze categorie is niet onaanzienlijk, want ze haalt zelfs meer dan de PVDA+ (waarvan het staafje eigenlijk een plaats naar rechts had gemoeten).

demorgen

demorgen.be

In mijn ogen toont De Morgen op zijn website met het artikel N-VA moet vier procent inleveren, maar blijft grootste zijn misprijzen voor het digitale medium. Het web en het internet worden meer en meer visueel, maar toch slaagt demorgen.be het volgende bij het artikel te produceren:

dmonline

Ik begrijp dat het snel moet gaan als de concurrentie het allemaal al online heeft staan, maar gooi het allemaal even in Datawrapper en je Belga-bericht ziet er op slag 10 keer meer aantrekkelijk uit. En je visualisatie is zonder twijfel beter dan die van de concurrentie.

De Tijd

De Tijd heeft een nieuwe iPad-app. Voorlopig nog gratis, dus gedownload.

+ : ik krijg plots de papieren zaterdagkrant in de bus

– : de grafieken uit de krant duiken niet op in de app. Voor de grafiek over de peiling heb ik dus mij scanner moeten bovenhalen:

tijd

Inderdaad, zeer minimalistisch. Daar hou ik op zich wel van, maar een visuele vergelijking met de vorige peiling of, beter nog, met de vorige verkiezingen, ware beter geweest.

Maar eigenlijk loopt het helemaal mis. CD&V haalt 17,4 procent en N-VA 32,1 procent. Maar het staafje van CD&V komt in de verste niet in de buurt van de helf van dit van de N-VA. Zeer misleidend. Ik vermoed dat het staafje waar de cijfers in vermeld worden ook in rekening moet worden gebracht. Maar qua datavisualisatie wordt hier een grove fout begaan.

knack.be

Hier kunnen we kort over zijn: knack.be nam het Belgabericht over, zonder de cijfers te visualiseren. Ook niet in tabelvorm, zoals de demorgen.be deed.

Mijn voorstel

Hier mijn voorstel voor het visualiseren van de peilingresultaten:

peiling_def

Waarom is deze beter dan alle hierboven besproken varianten?

  • de tijd wordt voorgesteld van links naar rechts
  • de intervallen tussen de verschillende verkiezingen en peilingen zijn waarheidsgetrouw (meer afstand tussen de verkiezingen uit 2010 en de peiling in 2012 dan tussen de peiling van 2012 en deze van 2013)
  • alle waarden zijn veel duidelijker te vergelijken: hellingen van de lijnen geven dalingen of stijgingen weer en voor elke verkiezing of peiling is de rangschikking zo af te lezen
  • het visuele afval is tot een minimum beperkt: door het gebruik van labels is de verticale as overbodig geworden en is deze weg gelaten.

Conclusie

Door even de tijd te nemen om de voornaamste Vlaamse media onder de loep te nemen, kan ik concluderen dat er op het vlak van datavisualisatie nog veel werk aan de winkel is. Of misschien stel ik beter dat er nog heel wat onontgonnen terrein ligt te wachten?

Ik hoop alvast binnenkort een eerste hellingsgrafiek of lijngrafiek te zien te krijgen als het gaat over verkiezings- of peilingsresultaten. Fingers crossed.