Wanneer je beter geen grafiek publiceert

Vandaag in De Standaard, het artikel Cameron roert anti-Europese trom (bis) (paywall), vergezeld van volgende grafiek:

IMG_0650

Daar word ik dus echt moe van. Iedereen met een notie van statistiek hoort bij een verschil van 1 procent in de peilingen meteen al alle alarmbellen afgaan. Een dergelijk verschil kan in een volgende peiling helemaal omgedraaid zijn zonder dat de mening van de populatie veranderd is. Maar zelfs The Guardian valt er voor.

Sampling error

Daarom dacht ik: even die betrouwbaarheidsintervallen checken (het artikel van The Guardian meldt dat er 2.133 Britse volwassenen werden bevraagd). Maar dat bleek zelfs niet nodig. Op de site van het peilingenbureau Yougov vond ik de volgende passage over dit peilingresultaat (de nadruk is van mij):

On its own, a single poll should be regarded with some care. A one-point lead is well within sampling error; and YouGov has frequently reported very small Labour leads in recent weeks. Our latest figures are not so very different from those. Or, the poll may be a blip, reflecting a real but short-lived boost for the Tories following their party’s annual conference and David Cameron’s well-received speech. The days ahead will tell us whether there has been a lasting shift in perceptions of the parties seven months ahead of next year’s election.

Vrij vertaald: deze peiling bewijst niets, hopelijk zijn de verschillen bij de polls van de volgende dagen groter, zodat we wel iets te vertellen zullen hebben. Niet echt materiaal om een artikel of een grafiek in de krant aan te wijden, dus.

Terzijde: volgens mijn berekeningen is het betrouwbaarheidsinterval (95 %) gelijk aan ongeveer +/- 2 %.

Fout overgetekend

De grafiek bij het artikel van Yougov leek me meteen wel heel vertrouwd:

YGVI

Er is echter een verschil tussen beide grafieken: die van Yougov geeft aan dat de grafiek over de lange termijn een Rolling average (voortschrijdend gemiddelde) betreft. De kleine grafiek geeft een Daily % weer. Dat is ook de rede waarom de blauwe en en rode lijn op de grote grafiek op het einde elkaar niet kruisen en deze op de kleine grafiek wel.

Dit onderscheid wordt in De Standaard niet gemaakt. De grote grafiek wordt simpelweg overgetekend, met uitzondering van het rechtereinde: daar wordt deze gewoon aangepast om in overeenstemming te zijn met de dagelijkse gegevens. Nergens wordt melding gemaakt van een voortschrijdend gemiddelde of van dagelijkse percentages.

In mijn ogen dus een overbodige grafiek, die dan nog eens fout wordt overgetekend omdat de oorspronkelijke grafiek niet goed werd begrepen. Behoorlijk fout, als je het mij vraagt.

Add Comment

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *