Laat de politieke stromen stromen

Hoe stromen kiezers tussen de verkiezingen van de ene naar de andere partij? Een studie, resultaat van een samenwerking van meerdere universiteiten, wijst het uit. Kiezers zijn niet echt honkvast en wisselden tussen de verkiezingen van 2010 en 2014 flink van voorkeur.

Om de resultaten van het onderzoek te visualiseren, koos De Standaard voor donutjes:

kiezersstromen_standaard

 

De Morgen kiest voor gestapelde staven:

politiekestromen_DM

Beide grafieken geven mooi weer hoe de kiezers bewogen per partij. Maar wat ontbreekt is het algemene overzicht. En je hebt ook geen idee van de onderlinge verhoudingen tussen de partijen, aangezien alle partijen als 100 % worden voorgesteld. Dit vertekent het beeld: kleine partijen krijgen veel meer visuele ruimte dan ze eigenlijk verdienen.

Sankey

Het kostte me wat moeite, maar uiteindelijk vond ik toch het brondocument van de cijfers. Door de cijfers van de verkiezingsresultaten te combineren met de cijfers van de in- en uitstroom van elke partij, kon ik een stroomdiagram (of Sankey-diagram) maken:

PolitiekeVerschuivingen

Met deze visualisatie krijg je wel een algemeen beeld van het hele plaatje (misschien wat te druk, ik geef het toe) en worden de verhoudingen tussen de partijen wel gerespecteerd.

Binnenkort

Met wat meer tijd zou ik nog wat datalabels en wat interactiviteit toevoegen (voor het uitlichten van partijen, bijvoorbeeld, en voor het raadpleegbaar maken van de cijfers), maar voor nu blijft het bij deze schets.

Vanaf volgende week, echter, zal ik dergelijke grafieken maken voor De Tijd en L’Echo. Het bekritiseren van visualisaties uit andere media zal vanaf dan op deze blog op een lager pitje gezet worden (tenzij er bepaalde grenzen overschreden worden, natuurlijk). Ik zal me in de toekomst vooral concentreren op mijn eigen werk.

De odyssee van Louis Cruls

Ik wou al langer eens experimenteren met Odyssey.js, een tooltje om gemakkelijk tekst en interactieve kaarten te integreren. Het levensverhaal van illuster stadsgenoot Louis Cruls bleek een perfect onderwerp voor mijn eerste Odyssey.

luiz_cruls

Louis Cruls werd in 1848 in Diest geboren. De ingenieur en astronoom emigreerde naar Brazilië en leidde er 2 expedities die aan de basis lagen voor de keuze van de locatie van de nieuwe hoofdstad Brazilië. Een krater op Mars draagt zijn naam, net als een straat in Rio de Janeiro en een eilandengroep in Antarctica.

Maar leest u vooral zelf het verhaal van het boeiende leven van deze avontuurlijke landgenoot.

cruls_screenshot

Weather Browser wint!

Afgelopen juli nam ik deel aan de Climate Crush, een wedstrijd voor het visualiseren van klimaatgegevens. Ik maakte de Weather Browser, een interactieve tool die met drie circulaire diagrammen voor ieder uur van de dag de temperatuur, neerslag, windsnelheid, windrichting en bewolking weergeeft (lees hier de making of).

weatherbrowser_overview

Het Amerikaanse zakenblad Fast Company schreef op zijn website in het artikel How to re-imagine the climate : designers and coders hack weather data over de wedstrijd en pikte er enkele van de meer interessante inzendingen uit. Dit schreven ze over mijn inzending:

This interactive tool by Maarten Lambrechts visualizes detailed daily and hourly weather data in a way that makes it easy to compare the climates of two cities (in the example case, Cairo and Singapore) by temperature, wind speed and direction, precipitation, and cloud cover. It’s a neat way to get a quick, intuitive sense of hundreds of thousands of data points. I could see this being useful if, say, a person were moving and were deciding between two cities. A morning jog-type person might quickly browse the data to get a sense of seasonal, hourly, and daily variation between different places.

Zelf vind ik de Weather Browser vooral geschikt om snel een beeld te krijgen van het weer op een bepaalde dag in het verleden (bijvoorbeeld op de dag van je geboorte).

In de prijzen

Eind  vorige week werden eindelijk de prijzen bekendgemaakt. Mijn visualisatie werd tweede!

Uiteraard ben ik heel gelukkig met deze prijs, zeker gezien de andere inzendingen. Winnaar werd Rainscapes van Density Design, het onderzoekslab van het departement Design van de Universiteit van Milaan.

rainscapes

Ik vroeg Paolo Ciucarelli, hoofd van Density Design, hoeveel mensen er aan Rainscapes hebben gewerkt. Onder coördinatie van een designer en een computer scientist werd Rainscapes uitgewerkt door hun team van stagiairs.

Geen schande dus om het daar tegen te moeten afleggen 🙂

Heel veel dank aan Weather Analytics voor deze mooie wedstrijd en de jury voor hun goede keuze 🙂

Belgische Weather Browser?

Ik zou heel graag een Belgische versie van de Weather Browser maken. Ik ga hiervoor mijn licht eens opsteken bij het KMI. Veel verwacht ik daar niet van, maar ik ben in elk geval benieuwd naar hun reactie…

Data, visualisatie en storytelling: 10 conferenties om te volgen dit najaar

De vakantie loopt ten einde, maar op het vlak van datavisualisatie en datajournalistiek kondigt zich een druk conferentienajaar aan. Ik weet nog niet precies welke conferenties ik zelf zal kunnen meepikken, maar hieronder vind je een overzicht van de events die ik in mijn agenda aanstipte.

Sommige conferenties in de lijst zijn moeilijk bij te wonen (enkel op uitnodiging, gesitueerd in het verre buitenland, …). Omdat deze conferenties dikwijls ook vanop afstand te volgen zijn (vaak stellen ze video’s en ander materiaal ter beschikking), nam ik ze toch op in de lijst.

The Graphical Web

27-30 augustus, Winchester (Engeland)

The Graphical Web is an annual, global conference to showcase the many new open source technologies that have become available for presenting visual information on the web. The conference showcases best practice, new opportunities and future directions in the fast-changing world of web graphics and will be of direct appeal to a wide range of professionals throughout the technology, data visualization and graphics industries.

Visualize it

4-5 september, Hogeschool Utrecht

Tijdens Visualise it! gaan we op zoek naar (nieuwe) visuele oplossingen om informatie helder te maken. Diverse nationale en internationale experts laten u op 4 en 5 september kennismaken met hun werk en de visuele keuzes die zij hebben gemaakt.

Tableau Conference

8-12 september, Seattle

The Tableau Conference is a fun four days of learning how to better see and understand your data. With hundreds of learning opportunities, 5 stellar keynote addresses, and numerous networking opportunities, this is place to come and find out where your data will take you next.

Online News Association Conference

25-27 september, Chicago

The Online News Association’s 2014 Conference & Awards Banquet is the premier gathering of highly engaged digital journalists who are shaping the future of media. Record-breaking numbers of journalists travel to ONA’s conference each year to learn about new tools, techniques and technologies, to discuss advancements and challenges in the industry, take advantage of the rare opportunity to network face-to-face, and share best practices with peers from all over the map.

Future of Storytelling

1-2 oktober, New York

The Future of StoryTelling is an invitation-only, two-day gathering of technology, media, and communications visionaries from around the world. The summit is designed to put participants in direct contact with the most vital ideas, people, and technologies that are shaping the way we tell stories.

Open Data Dag Vlaanderen

3 oktober, Brussel

Benieuwd naar wat er aan diensten gerealiseerd wordt met Open Data? Kom dan naar de derde editie van de Open Data Dag Vlaanderen op vrijdag 3 oktober 2014 in het Boudewijngebouw in Brussel. Dit jaar is de gebruiker van Open Data aan het woord; bedrijven, organisaties, ontwikkelaars en individuen die met Open Data aan de slag gaan. Entrepreneurs en anderen die met deze data en informatie applicaties en web toepassingen bouwen die op hun beurt economische en sociale meerwaarde creëren.

European week of Regions and Cities

6-9 oktober, Brussel

The European Week of Regions and Cities will again bring together some 6000 regional representatives and experts in Brussels from 6-9 October. We’ll be hosting a couple of hundred journalists from across the EU at the event, which includes a specially designed media programme. Given the strong focus on the use of statistics to report about European regions and EU Cohesion Policy, we will be extending a special invitation this year to a limited number of data journalists.

VVOJ conferentie

7-8 november, Kortrijk

Op 7 en 8 november 2014 vindt de jaarlijkse conferentie van de Vereniging van Onderzoeksjournalisten VVOJ plaats. Het VVOJ congres is de grootste bijeenkomst van onderzoeksjournalisten in Vlaanderen in Nederland. Naast (uiteraard) de nieuwste technieken, mooiste verhalen en meest interessante trends zal het congres dit jaar ook speciale aandacht besteden aan onderzoek doen naar oorlog en vredesvraagstukken.

IEEEVIS

9-14 november, Parijs

IEEE VIS 2014 is the premier forum for advances in visualization. The event-packed week brings together researchers and practitioners from academia, government, and industry to explore their shared interests in tools, techniques, and technology. To celebrate its 25th anniversary in 2014, IEEE VIS comes for the first time in its history to Europe and the city of Paris, acknowledging the growing role of European research on visualization.

Visualized.io London

22 november, Londen

It’s time again for a VISUALIZED experience in Europe! Inspired by the success of our first independently organized event in Berlin, we are now moving to the next city. Join us this time in London for the second one-day conference where we will once again bring together passionate speakers who have visions and ideas to move the scene forward, who will talk about their projects, and who will inspire you.

7 gratis tools voor de datajournalist

Ik schafte me zopas een nieuw digitaal werkpaard aan en een van de eerste dingen dan is natuurlijk het installeren van nieuwe apps. Mijn favoriete tools voor het werken met data waren de eerste die ik downloadde. Alle 7 zijn het gratis programma’s en, op Tableau na, ook allemaal open source. Dit zijn ze:

refineOpen Refine

Open Refine (voorheen Google Refine) is een handig programma voor het opkuisen van data. Niet helemaal voor beginners (af en toe een lijntje code kan heel handig zijn), maar zeker de moeite om even de leercurve te beklimmen. Deze reeks videootjes is daar uitermate geschikt voor.

RStudioR en RStudio

R is een programma uit de statistiek. Het is heel krachtig, maar niet zo gebruiksvriendelijk. RStudio doet een goede poging om dit wat te verhelpen, door onder andere ook het maken van grafiekjes wat makkelijker te maken.

tableauTableau

Sinds kort is Tableau Public, de gratis versie van het visualisatieprogramma Tableau, ook beschikbaar voor Mac. Ik ben geen expert in Tableau, maar heb er al wel wat mee geëxperimenteerd. Veelzijdig en gebruiksvriendelijk, je maakt er mooie grafieken mee.

tilemillTilemill

Voor het maken van interactieve kaartjes die wat verder gaan dan de standaard Google Maps, 1 adres: Tilemill. Afkomstig uit dezelfde stal als het fantastische Mapbox.

qgisQGIS

Voor het werken met geodata is er het geografisch informatiesysteem (GIS) QGIS. Je maakt er ook statische kaartjes mee.

bracketsBrackets

Brackets is eigenlijk niet echt een tool voor het werken met data. Het is een teksteditor voor het schrijven van code, gemaakt voor html, css en javascript. Het beste van Brackets is de Live Preview: zonder je files op te hoeven slaan en je browser te refreshen zie je je aanpassingen direct in de browser (werkt wel enkel met Chrome).

De Morgen vergeet inspiratiebronvermelding

Vandaag pakt De Morgen op de voorpagina uit met een visualisatie van 179 kinderen uit Gaza die omkwamen onder Israëlisch vuur.

DM_voorpagina_20140728_Gaza

Voorpgagina_DM_20140728_Gaza_detail

Er ging een belletje rinkelen. Een paar dagen geleden had ik iets gelijkaardig gezien: Revealed: the Palestian children killed by Israeli forces, op telegraph.co.uk.

gaza_telegraph

De kleine lettertjes onderaan de voorpagina van De Morgen:

Grafiek De Morgen
Bron Al Mezan Center for Human Rights

Zou het niet eerlijker en correcter zijn om naast de databron ook de inspiratiebron te vermelden?

Postcodekribbels: per postcode door het ganse land

Een van de klassieke visualisaties, die onder andere ook mijn interesse in dit vakgebied aangewakkerd heeft, is ZIPScribble.

ZIPScribbleMap-color-names-borders-thumb

 

ZIPScribble verbindt de ZIPcodes, de Amerikaanse postcodes, met lijnen in oplopende volgorde. Al sinds ik ZIPScribble ken, wou ik er een Belgische versie van maken.

Nooit vond ik de tijd, maar toen ik met wat met de kaartfuncties van Tableau aan het experimenteren was, realiseerde ik met dat het relatief eenvoudig zou zijn om een interactieve ZIPScribble voor België te maken.

De data haalde ik bij Thomas Hambach (waarvoor hartelijk dank). Ingekleurd per provincie, ziet ZIPScribble België er zo uit:

Toegegeven, veel valt er uit deze visualisatie niet te halen. Maar eindelijk heb ik ZIPScribble België van mijn lijstje kunnen afvinken.

De Morgen slordig met cijfers

Grafieken en cijfers bij artikels in de krant: het hoeft hier geen betoog dat ik daar een absolute voorstander van ben. Helaas wordt daar vaak slordig mee omgesprongen. Een voorbeeld is De Morgen van vandaag.

Chinese zelfmoorden

Op pagina 7 worden 2 tot de verbeelding sprekende cijfers over zelfmoorden onder Chinese vrouwen getoond.

DM_zelfdodingchina

Straffe cijfers. Maar zijn die cijfers voor de tweede helft van de jaren negentig voor de hele periode? Of gaat het om jaarlijkse cijfers? Zeer waarschijnlijk gaat het om jaarlijkse cijfers, maar dat valt uit de illustratie noch uit de tekst op te maken.

Moest het toch gaan over de hele periode, dan is de daling veel minder spectaculair: van gemiddeld 7,6 zelfdodingen per 100.000 vrouwen per jaar naar 3.

 Migranten in België

Op pagina’s 11 tot 13 wordt het voorpagina-artikel Migrant blijft te arm en te laag geschoold uitgediept met heel wat grafieken. In deze grafieken slopen echter een paar foutjes en onzorgvuldigheden.

Een van de grafieken zou moeten aantonen dat de migrantenbevolking jonger is dan de autochtone bevolking.

DM_migrantenleeftijd

Als er een les 1 in datavisualisatie zou bestaan, zou het voor mij deze zijn: eenheden, eenheden en eenheden. Zonder vermelding van de eenheden is een grafiek betekenisloos. Het correct inschatten van het verschil tussen de autochtone en de migrantenbevolking tussen 25 en 45 jaar (de rode ‘berg’ boven de zwarte lijn) is onmogelijk zonder de juiste eenheden.

Waarschijnlijk gaat het om percentages binnen de relatieve bevolkingsgroepen. Maar zeker weten we dat dus niet. Voor het weergeven van dit verschijnsel zou ik opteren voor een bevolkingspiramide, die tegelijk ook aantoont hoe de absolute cijfers zich verhouden (helaas vond ik de cijfers niet dadelijk terug en kon ik deze piramide niet maken).

Foutje

De laatste grafiek uit het artikel illustreert de onderwijsgraad van migranten en autochtonen. Hier loopt het ook fout.

DM_migrantenopleidingsprofiel

Volgens de grafiek is het percentage migranten zonder diploma lager dan het percentage autochtonen zonder diploma, wat in werkelijkheid omgekeerd is. De lijnen op de linkse grafiek hebben dus de foute kleur gekregen.

Maar er is nog iets aan de hand. De som van de percentages voor autochtonen bedraagt telkens 100 %, zoals mag verwacht worden (tenminste als je er van uitgaat dat het gaat om het hoogst behaalde diploma, wat niet expliciet wordt vermeld). Maar de percentages voor migranten komen opgeteld telkens uit op meer dan 103 procent. Met deze cijfers is dus ook iets niet in de haak.

Zorgvuldigheid en geloofwaardigheid

Spelfouten (en zelfs tikfouten) in nieuwsmedia tasten de geloofwaardigheid van een medium aan. Niet echt rationeel, want iedereen maakt wel eens dergelijke foutjes, maar het is wel de realiteit.

Fouten en onzorgvuldigheden in grafieken en cijfers hebben hetzelfde effect: hoe kan je vertrouwen hebben in een artikel als de grafieken erbij heel wat fouten vertonen? Een journalist die de feiten in zijn artikel dubbelcheckt en in zijn tekst alle dubbelzinnigheden en onzorgvuldigheden vermijdt, ziet zijn inspanningen als een kind met het badwater weggegooid worden door fouten in de cijfers en grafieken.

Wat meer aandacht en zorgvuldigheid bij het maken van grafieken zou De Morgen niet misstaan. Het is immers niet de eerste keer dat het misgaat bij de grafieken in deze krant.

Grafiek redesign in Excel: de rode kaarten van Sporza

Redesigns zijn een van mijn favoriete disciplines in datavisualisatie. Een grafiek opnieuw (en beter) ontwerpen is enorm lerrijk. In mijn presentatie over datavisualisatie die ik mocht geven voor de Dag van de Boekhouder enkele maanden geleden stopte ik ook een redesign. Omdat het materiaal toch maar mos lag te kweken op mijn harde schijf, geef ik deze hier nu in uitgeschreven vorm. De redesign werd volledig gemaakt in Excel.

Origineel

Dit is het origineel, eind oktober 2013 geplukt van sporza.be.

rodekaartensporza_org

Er loopt heel wat mis met deze grafiek, zoals verderop duidelijk zal worden. Om dit te illustreren zou je eens kunnen timen hoeveel tijd je nodig hebt voor het beantwoorden van volgende eenvoudige vraag: wie incasseerde tot op dat moment in de competitie de meeste rode kaarten, Anderlecht of Cercle Brugge? Uw tijd gaat nu in.

Default Excel

Zoals bij iedere redesign was het eerst zaak om eerst de data in handen te krijgen. Aflezen en in Excel gooien was de boodschap. Een staafgrafiek met de Excel standaardinstellingen ziet er zo uit:

rodekaartensporza1

De standaardinstellingen van Excel zijn berucht voor het overtreden van de basisregels van goede datavisualisatie, maar toch slaagt Excel er in om 1 van de grootste problemen van de originele grafiek op te lossen: de legende is verdwenen en de namen van de ploegen staan direct onder de staven.

De legende die Excel er nog bij plaatste, met slechts 1 item, is nu overbodig en laten we weg:

rodekaartensporza2

Alle ruimte gebruiken

Wat Excel niet goed deed is de grafiek alle ruimte geven: de grootste waarde in de data is 5 terwijl de grafiek tot 6 gaat. Dit herstellen we:

rodekaartensporza3

Sorteren

Om de grafiek beter leesbaar te maken, veranderen we de sortering van de staven. In het origineel staan de clubs gesorteerd volgens de ranking in de competitiestand op dat moment, maar mij lijkt een rangschikking naar het aantal ontvangen rode kaarten meer zinvol:

rodekaartensporza4

Stijve-nekgrafiek

Stijve-nekgrafieken zijn een ware plaag. Ook het origineel van Sporza is een stijve-nekgrafiek: een grafiek waarbij je als lezer je hoofd (of de krant/tablet/scherm) moet draaien om de labels goed te kunnen lezen. Met een simpele truc is dat zo opgelost: zet de staven horizontaal, zodat ook de tekst horizontaal kan.

Naast het voorkomen van een stijve nek, heeft dit (mits een goede sortering) nog een bijkomend voordeel: de data worden nu weergegeven als een echte rangschikking, met de clubs met de meeste rode kaarten bovenaan en die met de minste onderaan.

rodekaartensporza5

Kleur

In het origineel krijgen de staven de dominante kleur van de uitrusting van de clubs. Niet zo’n goed idee, aangezien dit aanleiding geeft tot drie tinten groen, drie tinten blauw en vier tinten rood. Zelfs niet-kleurenblinden lopen hierin verloren.

Standaard gebruikt Excel een blauw met een kleurverloop voor de staven, met wat schaduw als extra. Dit verving ik door een plat grijs, zodat later met kleur meer accent kan gegeven worden. Ook maakte ik de staven wat dikker.

rodekaartensporza6

Directe labeling

Hoewel het in dit geval, met behoorlijk wat clubs met hetzelfde aantal rode kaarten, niet echt nodig is, is het wel een goede praktijk om staven direct te labelen met hun datawaarde.

rodekaartensporza7

Dan worden de verticale hulplijnen overbodig:

rodekaartensporza8

En de X-as in zijn geheel eigenlijk ook:

rodekaartensporza9

Y-as

De Y-as heeft ook geen functie en kan ook zonder probleem verwijderd worden:

rodekaartensporza10

Anderlecht

Stel nu dat de grafiek bedoeld is voor het supportersblad van Anderlecht. Dan is het uiteraard een goed idee om de supporters/lezers visueel direct naar de staaf van hun geliefde club te leiden (en ja, dat doen we hier met de clubkleuren:-)

rodekaartensporza11

The proof is in the viewing

Ziezo, een heel pak beter. Of kan u misschien nog eens timen hoe lang het duurt om na te gaan of het nu Cercle of Anderlecht was dat de meeste rode kaarten slikte?

Om de grafiek echt publiceerbaar te maken, komen er best nog een titel en lead bij. Voor publicatie op een nieuwssite zou ik ten slotte het kleurtje van Anderlecht achterwege laten en simpelweg de clubs met het hoogste en laagte aantal rode kaarten benadrukken:

rodekaartensporza13

 

Wat Google denkt over uw gemeente: de quiz

Bij het zoeken op Google geeft de zoekmachine u nog tijdens het typen suggesties voor aanvullingen. De app Wat Google denkt over uw gemeente geeft voor elke Vlaamse gemeente de top 10 van door Google gesuggereerde aanvulling.

Hieronder vindt u 22 door Google gesuggereerde aanvullingen bij een Vlaamse gemeente. Weet u over welke gemeente het gaat? Blijf even met de muis op een afbeelding staan om het antwoord te laten verschijnen of klik op een afbeelding om de zoekopdracht in kwestie uit te voeren.

chemie

kettingbotsing

Ga zelf op zoek naar interessante Googlesuggesties of zoek op wat Google suggereert voor jouw gemeente.