Waarom nieuwsmedia data moeten publiceren

Een paar goede en een paar slechte voorbeelden zetten me de voorbije dagen aan het denken over het publiceren van data bij artikels.

Slecht voorbeeld

Eerst het slechte voorbeeld. Ik was van plan deze grafiek uit Knack eens onder handen te nemen:

regenbooggrafiek

Mijn grootste kritieken op de grafiek: veel data maar weinig verhaal en veel kleur maar weinig houvast voor de lezer. Om een poging te ondernemen om de grafiek te verbeteren, ging ik op zoek naar de oorspronkelijke data. Knack vermeldt gelukkig wel de bron van de data: het World Hapiness report. (De doorklikkende lezer merkt dat de link leidt naar de downloadpagina van het rapport, niet naar de pdf van het rapport zelf. Niemand houdt van een pdf van tientallen megabyte in de browser, zonder eerst te kunnen nagaan of het de moeite is om het rapport te downloaden.)

Zo leerde ik  dat het ging om een gemiddelde van de jaren 2010-2012, wat in het artikel nergens ter sprake komt:

geluksgrafiek_origineel

Helaas geen annex met de data in het rapport. Wel in de FAQ op de website, het volgende antwoord:

Q: Where are the data in the World Happiness Report from?
A: All data are from the Gallup World Poll, not from surveys conducted by the authors directly.

Q: Can I have the data in excel format?
A: Unfortunately we are not able to provide that. Please look at the online appendix to chapter 2, which contains all of the information we are able to provide.

De gebruikte data zijn zeer waarschijnlijk dus in licentie gegeven, met een grote beperking op het publiceren van de brondata (die Gallup graag ook nog ergens anders hoopt te slijten). Helaas geen mogelijkheid dus om de grafiek van Knack eens onder handen te nemen.

Goed voorbeeld

Hoewel Knack de data zelf niet kon geven, was Knack was dus wel zo goed om de naam van het bronrapport te geven, wat bijlange niet altijd wordt gedaan. Online is het natuurlijk nog beter om een link te leggen naar het rapport zelf, wat al helemaal zeldzaam is.

Het goede voorbeeld wordt hier wat mij betreft gegeven door De Correspondent. Met hun duidelijke links naar meer achtergrondinfo in de marge, doen ze aan goede bronvermelding en bieden ze iets extra voor de geïnteresseerde lezer.

correspondent_link

Het nog betere voorbeeld

De Correspondent gaat zelfs nog een paar stappen verder: ze verzamelen zelf data en publiceren die volledig. En ze doen zelfs een oproep aan de lezer om zelf aan de slag te gaan met de data.

In het artikel Door wie worden we online gevolgd, presenteert De Correspondent (weliswaar in ruwe en nog onafgewerkte vorm) de resultaten van hun onderzoek naar tracking. De methode van dataverzameling wordt ook beschreven en onderaan volgt dan de oproep, met een link naar de data:

Ik ben benieuwd of een van jullie hiermee uit de voeten kan en laat het me vooral weten als je op- of aanmerkingen hebt over onze methode, dan wel over de data.

Ik weet niet of de oproep veel succes zal hebben, maar het volledig ter beschikking stellen van de (zelf verzamelde!) data is voor mij voorbeeldstellend.

Waarom?

Maar waarom voorbeeldstellend? Waarom zouden nieuwsmedia zich in hemelsnaam bezig moeten houden met het publiceren van data? Wel, omwille van de volgende redenen:

  • het is een extra service voor de geïnteresseerde lezer. Een deel van het lezerspubliek zal omwille hiervan sneller naar je website terugkeren. Misschien trek je wel een extra nieuw publiek aan.
  • het verhoogd de betrouwbaarheid en transparantie van je medium. Hoe kunnen we weten of de grafiek uit Knack geen fouten bevat als we geen enkele manier hebben om aan de brondata te komen?
  • het kost meestal weinig extra moeite om de data te publiceren. In het geval van De Correspondent was het gewoon zaak de data op te laden naar Google Drive en een linkje te leggen.
  • je kan aan crowdsourcing doen, zoals De Correspondent eigenlijk impliciet doet via zijn oproep. Laat je publiek de data doorzoeken en tips voor nader onderzoek aanreiken.

Add Comment

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *