Waarom je grafieken niet zomaar moet vertrouwen

Grafieken kunnen gemakkelijk gemanipuleerd worden om een bepaalde boodschap over te brengen. Laat jij jezelf ook voor de gek houden?
Leestijd 4 minuten — Wo 25 juli 2018

Dit twitterde het conservatieve Amerikaanse tijdschrift National Review in 2015:

De boodschap is duidelijk: met de opwarming van de aarde valt het wel mee. Global warming is onzin.

Wat is hier aan de hand? De grafiek vertelt niet het eerlijke verhaal. Hoewel de data wel kloppen, is de schaal op de y-as zo gekozen dat verschillen niet meer te zien zijn.

Met dezelfde data had je ook deze grafiek kunnen maken. Daar ontstaat een heel ander beeld.

Wereldwijde temperatuurverandering ten opzichte van het gemiddelde van 1951-1980 (NASA-data).

Oneerlijke grafieken

Visualisatietrucs kunnen een grafiek een oneerlijk verhaal laten vertellen. Iets waar we als kijker gemakkelijk in trappen, want mensen zijn visueel ingesteld. Ga maar na: we zien een stuk sneller wat een grafiek vertelt dan als we hetzelfde verhaal uit een tabel getallen zouden moeten halen.

Manipulatie met grafieken komt in allerlei vormen. Wat er aan de hand was met de misleidende klimaatgrafiek van National Reviewhierboven, had je misschien zelf ook al door. Maar soms gebeurt de beïnvloeding subtieler.

Een voorbeeld dichter bij huis: naar aanleiding van CBS-cijfers maakte de NOS onderstaande visualisatie, die laat zien dat oudere mensen hun gezondheid als slechter ervaren dan jongeren.

Oudere mensen ervaren hun gezondheid als slechter. Bron: NOS.nl, op basis van CBS-cijfers.

Wat valt op bij deze grafiek? Allereerst het gebruik van kleur. De ondergemiddelde balkjes (ouderen) zijn rood gekleurd en de bovengemiddelde balkjes (jongeren) juist blauw. Op deze manier word je onmiddellijk gewezen op een verschil tussen jongeren en ouderen.

Verder kloppen de lengtes van de balkjes niet met de percentages. Tussen 73.7% en 83.2% zit geen groot verschil, maar het balkje voor 83% is anderhalf keer zo lang als dat voor 73.7%. Zo worden de verschillen overdreven.

Twee trucjes om het verhaal in deze grafiek duidelijker naar voren te laten komen. De verbeterde grafiek ziet er zo uit:

'Eerlijkere' grafiek op basis van dezelfde CBS-cijfers.

Waaróm de NOS dit doet is onduidelijk. Er is geen politiek motief zoals bij het eerste voorbeeld. Waarschijnlijk speelde het visueel aantrekkelijk maken van de grafiek ook een rol. De verbeterde grafiek is correcter, maar ook een stuk saaier.

Gezichtsbedrog

Makers van grafieken houden ons dus voor de gek. Maar het wordt nog erger. Zelfs bij een 'eerlijke' grafiek (wat dat dan ook precies is), niet gemaakt om een bepaalde boodschap over te brengen, maken we fouten bij de interpretatie ervan. Onze waarneming laat ons in de steek.

In welk van onderstaande twee puntenwolken is de samenhang tussen beide variabelen bijvoorbeeld het grootst?

In welke puntenwolk is de samenhang het grootst?

De correlatie lijkt rechts groter omdat de punten dichter op elkaar staan. Maar het was – uiteraard – een strikvraag; er staat twee keer dezelfde data weergegeven.

De wetenschappelijke literatuur bevat meer voorbeelden. Als je mensen een verdeling laat zien en later vraagt om die te beschrijven, blijkt dat mensen de verdeling als meer symmetrisch onthouden dan ze daadwerkelijk was. Als referentiepunt hebben we een (symmetrische) normale verdeling in ons hoofd. In dit artikel vat Washington Post-journalist Kennedy Elliott 39 van dit soort studies samen.

Verkeerde interpretaties voorkomen

Als je zelf een datavisualisatie maakt, wil je graag voorkomen dat die verkeerd geïnterpreteerd wordt. Maar dat is niet het enige. Je wil ook dat de grafiek er aantrekkelijk uit ziet. En je wil niet dat lezers minutenlang moeten staren voordat ze door hebben wat de grafiek nu eigenlijk zegt. Deze drie eisen (niet misleidend, visueel aantrekkelijk, snel interpreteerbaar) zitten elkaar nogal eens in de weg. Want als je een grafiek aantrekkelijk of interpreteerbaar maakt, duw je de lezer ook de kant op van jouw interpretatie.

Hopelijk helpen de voorbeelden hierboven om te voorkomen dat je als lezer van een grafiek gefopt wordt. Het is in elk geval nuttig om te letten op de assen, het kleurgebruik en of de getallen kloppen. Het 'checken' van een grafiek duurt even, maar voor het lezen van een grafiek mag je best de tijd nemen. Zeker als je in één keer overtuigd bent van het verhaal dat een grafiek vertelt, is het de moeite waard na te gaan of dat echt door de data komt, of vooral door hoe die data zijn weergegeven.

Data in beeld

Dit blog is onderdeel van de serie "Data in beeld" waarin stagiair Merlijn Staps gebruik maakt van data om populaire ideeën tegen het licht te houden. Wat kunnen we leren van statistieken? En bevestigen de cijfers onze intuïtie of juist niet? Lees ook de andere blogs.