Knack pikt datavisualisatie bij Buzzfeed

Gemengde gevoelens bij een visualisatie in de Knack van deze week.

Eerst was ik enthousiast. Want er stond een scatterplot in Knack! Scatterplots, of puntenwolken, zijn een effectieve visualisatievorm om 2 variabelen en hun onderling verband weer te geven. Ze worden volgens mij nog onderbenut in de media. Goed dus dat Knack er eentje publiceerde.

knack_copy

Als lezer bleef ik wel wat op mijn honger zitten. Wat moest ik nu concluderen uit deze scatterplot? Dat er geen enkele relatie is tussen schoolresultaten en gelukkige leerlingen? Daar lijkt het wel op, aangezien de vier kwadranten ongeveer even gevuld zijn.

Ook lijken er geografische patronen in te zitten (de landen met de beste schoolresultaten liggen allemaal in Azië, minder gelukkige leerlingen vinden we vooral in Oost- en Zuid-Europa), maar hier wordt in de grafiek noch in de begeleidende tekst op ingegaan.

En aangezien er geen eenheden worden weergeven, kan je als lezer ook niet uitmaken hoe groot de verschillen echt zijn (verder meer hierover).

Plagiaat

Maar er zijn meer problemen met deze visualisatie. Zoals ik wel vaker doe, probeerde ik na te gaan waar het idee voor de visualisatie vandaan kwam. De tekst bij de grafiek zegt:

Een goed onderwijssysteem betekent nog niet dat er gelukkige kindjes op de banken zitten. Bij de OESO, een internationale overheidsorganisatie die sociaal-economisch beleidsonderzoek verricht, vroegen ze zich af welke landen beide voor elkaar krijgen. De organisatie combineerde de resultaten van kennistests over wiskunde, lezen en wetenschap bij 15-jarigen met een onderzoek rond de vraag ‘ben je gelukkig op school?’.

Het zou dus de OESO zelf zijn geweest die de scatterplot initieel bedacht en maakte. Maar daar vond ik nergens een spoor van terug, ook niet in het OESO-rapport met de resultaten van het onderzoek.

Wat ik wel vond: een grafiek op Buzzfeed, die wel heel erg lijkt op die van Knack:

buzzfeed_org

Net een paar dagen geleden mengde ik me in een Twitterdebat over datavisualisaties en plagiaat, naar aanleiding van een copycat met berouw over zijn kopieerwerk. Zelf vroeg ik me ook af of ik met mijn Hoe de wereld ontwikkelde over een rode lijn was gegaan door mij te inspireren op Life Expectancy Changes.

Het antwoord van professor Alberto Cairo, authoriteit op het vlak van datavisualisatie, was gelukkig duidelijk:

tweet_cairo

Goed: mijn geweten gesust en weer iets bijgeleerd. Maar hoe zit dat bij Knack?

  1. Structuur: is dezelfde als bij het origineel. Zelfs de kleuren, de achtergrond en de assen (plus de arm/hand van de leerkracht!) zijn nagenoeg identiek.
  2. Data: de grafiek is gewoon overgetekend, de data zijn identiek.
  3. Begeleidende tekst: is uiteraard niet dezelfde, aangezien het origineel in het Engels was. Zowel titel als tekst pikken België er uit, wat natuurlijk niet bij het origineel gebeurde.

Op 2 van deze 3 criteria luidt het oordeel dus: kopieerwerk. Mits een goede bronvermelding (enkel de OESO wordt als bron geciteerd) en met toestemming van de auteur kon het misschien nog door de beugel, maar voor mij is dit gewoon plagiaat.

Maar het wordt nog erger.

Ranking in plaats van scores

Bij het origineel vinden we de volgende beschrijving (mijn markering):

Happiness was ranked based on the percentage of students who agreed or disagreed with the statement “I feel happy at school.” Test scores were ranked based on the combined individual rankings of the students’ math, reading, and science scores.

Er werd dus geen gebruik gemaakt van de echte scores en percentages van ieder land, wel van de plaats op de ranglijst van ieder land. Dat is ook goed te zien op de grafiek: geen enkel land situeert zich op dezelfde hoogte of dezelfde horizontale positie als een ander land. Kijk bijvoorbeeld naar Oostenrijk-Australië en Estland-Finland (beiden in het kwadrant linksboven): zij volgen elkaar netjes op op beide rankings, waardoor hun symbooltjes netjes naast elkaar staan.

Geen enkel ander land staat op dezelfde lijn als een ander. De 4 landen in de rechtopstaande rechthoek hebben in realiteit hetzelfde aandeel gelukkige leerlingen.

Geen enkel ander land staat op dezelfde lijn als een ander. De 4 landen in de rechtopstaande rechthoek hebben in realiteit hetzelfde aandeel gelukkige leerlingen.

Volgens de originele data zegt 80 procent van de ondervraagde 15-jarigen in zowel Hongarije, Oostenrijk, Luxemberg als Australia akkoord te gaan met de stelling dat ze gelukkig zijn op school. Deze landen zouden dus op dezelfde verticale lijn moeten gepositioneerd staan. Door de ranking te gebruiken in plaats van de echte score, gebeurt dit niet (hoewel op een ranking een gelijke score eigenlijk een ex aequo zou moeten zijn).

Bijkomend probleem: het minimumpercentage gelukkige leerlingen bedraagt nog steeds 60 procent in Zuid-Korea. Zoals de grafiek nu is getekend, lijkt het alsof de leerlingen in dat land doodongelukkig op de schoolbanken zitten. Iets wat op zijn minst te nuanceren valt.

Slechte beurt

Door een gekopieerde grafiek te publiceren zonder bronvermelding, wat neerkomt op plagiaat, en met overname van de fouten uit het origineel, maakt Knack voor mij hier toch een heel slechte beurt. Knack maakt van datavisualisatie een vast item op zijn pagina’s, maar zou toch echt wat origineler en correcter uit de hoek moeten komen.

Add Comment

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *