Op zoek naar een rijke vrijgezelle? Verhuis naar Linkebeek!

Een paar weken geleden gingen de resultaten van de Census 2011 online, de eerste volkstelling in België die volledig werd uitgevoerd op basis van databanken in plaats van een deur-tot-deur bevraging. Hier en daar kon je er in de pers wel over lezen, maar de echte rijkdom van deze dataset kwam nergens echt aan bod. Met deze demo wil ik hier graag verandering in brengen.

Stel: je bent al enige tijd vrijgezel en al even op zoek naar de vrouw van je leven. Je eisen zijn niet echt hoog: je hoopt enkel dat ze wat brood op de plank kan brengen. Maar toch is het vinden van de vrouw van je leven al een moeilijke zoektocht gebleken. Veel vrouwen loop je niet echt tegen het lijf en als dat toch eens gebeurt, blijken ze niet zelden al getrouwd te zijn.

Ondertussen word je stilaan lichtjes wanhopig en je neemt een drastisch besluit: je gaat verhuizen naar de plaats in Vlaanderen waar je het meeste kans hebt om de vrouw van je leven tegen te komen.

Gelukkig kan je wat met data overweg. De gegevens van de Census 2011, aangevuld met wat data over inkomens, en Tableau zijn alles wat je nodig hebt.

Daar ga je.

Tableau maakt het gemakkelijk om verschillende datasets aan elkaar te hangen.

Om tabellen met gemeentedata aan elkaar te plakken (join is de officiële term) gebruik je best NIS-codes

Eenmaal de data in Tableau, is het een kwestie van velden slepen en filters instellen. Je wil graag veel vrouwen kunnen ontmoeten en liefst zijn deze vrouwen niet getrouwd. Census 2011 heeft de ideale data voor jou: voor iedere gemeente wordt de verhouding tussen mannen en vrouwen gegeven en wordt ook weergegeven wat het aandeel getrouwde personen is. Dit zetten we in een puntenwolk, waarop we met kleur de gemeenten van elke provincie groeperen.

linkebeek1

Voor meer detail, zoomen we even in.

linkebeek2

Dat ziet er al heel goed uit. Gemeenten met relatief weinig gehuwde mensen vind je links, gemeenten met relatief veel vrouwen vind je bovenaan. Linksboven in de grafiek, daar moet je dus zijn.

Maar je Frans is niet geweldig, en dus besluit je franstalige gemeenten uit te sluiten met een filter.

linkebeek3

Mooi. Maar omdat je liefst zou willen dat je toekomstige niet onbemiddeld is, besluit je enkel de gemeenten met de hoogste gemiddelde inkomens in aanmerking te laten komen. Met de natte vinger leg je de grens op een gemiddeld inkomen op 16.000 euro per inwoner per jaar.

linkebeek4

Je nieuwe jachtterrein springt er links bovenaan meteen uit: Linkebeek, waar voor iedere 10 mannen 11 vrouwen wonen, waar maar 46 % van de inwoners getrouwd is en waar het gemiddelde inkomen per inwoner net geen 20.000 euro per jaar bedraagt, wordt je nieuwe thuis!

Mocht Linkebeek je toch niet zo liggen, verleg je territorium dan naar de andere gemeenten uit het kwadrant linksboven. Gent, Mortsel en kustgemeenten Oostende, Blankenberge en De Panne komen in aanmerking (maar voor deze laatste 3 zou ik toch ook even de gemiddelde leeftijd uit de Census 2011 nakijken).

Check hieronder zelf waar je best gaat wonen.

7 gratis tools voor de datajournalist

Ik schafte me zopas een nieuw digitaal werkpaard aan en een van de eerste dingen dan is natuurlijk het installeren van nieuwe apps. Mijn favoriete tools voor het werken met data waren de eerste die ik downloadde. Alle 7 zijn het gratis programma’s en, op Tableau na, ook allemaal open source. Dit zijn ze:

refineOpen Refine

Open Refine (voorheen Google Refine) is een handig programma voor het opkuisen van data. Niet helemaal voor beginners (af en toe een lijntje code kan heel handig zijn), maar zeker de moeite om even de leercurve te beklimmen. Deze reeks videootjes is daar uitermate geschikt voor.

RStudioR en RStudio

R is een programma uit de statistiek. Het is heel krachtig, maar niet zo gebruiksvriendelijk. RStudio doet een goede poging om dit wat te verhelpen, door onder andere ook het maken van grafiekjes wat makkelijker te maken.

tableauTableau

Sinds kort is Tableau Public, de gratis versie van het visualisatieprogramma Tableau, ook beschikbaar voor Mac. Ik ben geen expert in Tableau, maar heb er al wel wat mee geëxperimenteerd. Veelzijdig en gebruiksvriendelijk, je maakt er mooie grafieken mee.

tilemillTilemill

Voor het maken van interactieve kaartjes die wat verder gaan dan de standaard Google Maps, 1 adres: Tilemill. Afkomstig uit dezelfde stal als het fantastische Mapbox.

qgisQGIS

Voor het werken met geodata is er het geografisch informatiesysteem (GIS) QGIS. Je maakt er ook statische kaartjes mee.

bracketsBrackets

Brackets is eigenlijk niet echt een tool voor het werken met data. Het is een teksteditor voor het schrijven van code, gemaakt voor html, css en javascript. Het beste van Brackets is de Live Preview: zonder je files op te hoeven slaan en je browser te refreshen zie je je aanpassingen direct in de browser (werkt wel enkel met Chrome).

Postcodekribbels: per postcode door het ganse land

Een van de klassieke visualisaties, die onder andere ook mijn interesse in dit vakgebied aangewakkerd heeft, is ZIPScribble.

ZIPScribbleMap-color-names-borders-thumb

 

ZIPScribble verbindt de ZIPcodes, de Amerikaanse postcodes, met lijnen in oplopende volgorde. Al sinds ik ZIPScribble ken, wou ik er een Belgische versie van maken.

Nooit vond ik de tijd, maar toen ik met wat met de kaartfuncties van Tableau aan het experimenteren was, realiseerde ik met dat het relatief eenvoudig zou zijn om een interactieve ZIPScribble voor België te maken.

De data haalde ik bij Thomas Hambach (waarvoor hartelijk dank). Ingekleurd per provincie, ziet ZIPScribble België er zo uit:

Toegegeven, veel valt er uit deze visualisatie niet te halen. Maar eindelijk heb ik ZIPScribble België van mijn lijstje kunnen afvinken.