Pas op… kwantipulatie

Het blijft me opvallen dat we met enige regelmaat bezoekers aan deze blog ontvangen die de website gevonden hebben dankzij het combineren van zoektermen als misleiden, bedriegen en grafiek. Ik moet toegeven dat ook ik regelmatig op zoek ben naar foute voorbeelden. Ze werken namelijk goed om uit te leggen wat er allemaal fout kan gaan bij incorrect gebruik van grafieken.

Wekelijks scan ik een grote hoeveelheid artikelen om te zien of er iets tussen zit wat ik kan gebruiken. Zo kwam ik laatst een artikel tegen op snarketing 2.0: “How to Quantipulate using graphics”. Het voorbeeld op zich (verkeerd gebruiken van een staafdiagram) is niet spectaculair, maar de gebruikte term quantipulate of kwantipulatie sprak mij direct aan. Eindelijk een term om foute grafieken mee aan te duiden. Vrij vertaald betekent kwantipulatie:

De kunst van het toepassen van oncontroleerbare statistieken om mensen te overtuigen van je gelijk

Direct heb ik verder gezocht op de term Quantipulate, maar zonder veel resultaat. Blijkbaar wordt de term (nog) niet veel gebruikt. Toch kwam ik via een andere weg wel een recent artikel tegen op de website van Business Insider welke goed past bij de term kwantipulatie.

De titel van het artikel is: “Waarom alcohol schadelijker kan zijn dan heroïne”. Deze stelling wordt ondersteund met de onderstaande grafiek.

Het is wel duidelijk dat alcohol het hoogste scoort op de “schadelijk”-schaal (Overall harm score). Alleen is er ook een grote hoeveelheid informatie verstopt in deze gestapelde staafgrafiek.

Zo zijn 16 verschillende categorieën in één gestapelde staafgrafiek wat te veel van het goede. Ook de kleuren van verschillende categorieën lijken te veel op elkaar. Zeker als in een staaf een bepaalde categorie (bijna) niet voorkomt kost het veel moeite om de exacte categorie te herkennen. Wat is bijvoorbeeld de drug met de hoogste “drug-specific impairment of mental functioning (CW 5-7)“?

Ook lijken de drugs gesorteerd van hoog naar laag op basis van de Overall harm score. Alleen waarom staat Khat dan voor Anabolic steroids? Er valt dus genoeg aan te merken op deze visualisatie. Maar het is nog erger: we zien namelijk alleen maar gegevens die de suggestieve titel van het artikel ondersteunen.

In zijn blog Junk Charts geeft Kaiser Fung aan dat er blijkbaar een hiërarchie zit in de getoonde categorieën. De bron voor het artikel was een paper van David Nutt. Deze had niet alleen de bovenstaande grafiek gemaakt, want zijn paper bevat ook de onderstaande grafiek:

Deze grafiek laat een genuanceerder beeld zien: alcohol is wel schadelijker dan heroïne als je de schade van de gebruiker en de omgeving optelt. Echter, als je deze los van elkaar ziet blijkt dat voor de gebruiker heroïne veel schadelijker is. Daarnaast kunnen deze gegevens ook beter gevisualiseerd worden. Vandaar dat ik in de volgende grafiek een eerste aanzet geef om het eenvoudiger te maken om de schade per drug goed met elkaar te kunnen vergelijken (opgesplitst naar schade aan de omgeving en aan de gebruiker). Met beter kleurgebruik en een andere sortering zou deze nog duidelijker worden, maar deze heb ik gelijk gehouden aan het origineel zodat de verbinding tussen alle grafieken blijft bestaan.

Duidelijk een geval van kwantipulatie. Niet zozeer door David Nutt, maar wel door Business Insider. Deze heeft alleen de gegevens gebruikt die een sensationele kop ondersteunen, waardoor je bijna gelooft dat alcohol schadelijker dan heroïne is.