Berichten

Wedstrijd: verbeter de grafiek

In de huidige druk van het boek Information Dashboard Design van Stephen Few staan vele voorbeelden van dashboards. De meeste dashboards in zijn boek zijn vooral voorbeelden van hoe het vooral niet moet. Stephen geeft aan dat het boek zo weinig goede voorbeelden bevat omdat hij deze tijdens het schrijven van het boek (2005) niet kon vinden. Tijdens zijn training in Mei gaf hij al aan dat hij voor de volgende uitgave meer goede voorbeelden wil gebruiken. Een direct gevolg hiervan is de Dashboard Design Competition welke hij begin augustus uitschreef.

Helaas kon ik zelf niet deelnemen vanwege tijdgebrek, maar gelukkig is het 91 anderen wel gelukt. Tussen deze inzendingen zitten een groot aantal geweldige dashboards die het bestuderen meer dan waard zijn. Een geweldige bron van inspiratie.

Ik was dan ook blij verrast toen ik zojuist het laatste blog artikel van Naomi Robbins las op Forbes. Hierin schrijft ook zij een wedstrijd uit, maar deze keer op een veel kleinere schaal. Zij geeft een bestaande grafiek als startpunt en vraagt iedereen om alternatieven aan te dragen. Met andere woorden: verbeter de grafiek.

Aangezien het een zeer beperkte set aan gegevens is besloot ik direct aan de slag te gaan. De originele visualisatie is een tweetal donut grafieken (soort taartgrafiek) en kun je vinden in bovenstaande afbeelding.

Mijn eerste ingeving bij het zien van (meerdere) taartgrafieken is om ze te vertalen naar een staafgrafiek. Dit omdat wij mensen niet alleen heel slecht zijn in het vergelijken van taartpunten binnen een taartgrafiek, maar nog slechter taartpunten kunnen vergelijken tussen twee taartgrafieken. Om zeker te stellen dat per bron (Facebook, Twitter en LinkedIn) B2B en B2C goed te vergelijken zijn heeft iedere bron een eigen y-as. Het resultaat zie je in de onderstaande afbeelding.

Vaak wordt als alternatief van een taartgrafiek gekozen voor een gestapelde staafgrafiek. In veel gevallen werkt dit niet goed, omdat alleen de eerste categorie (hier Facebook) goed te vergelijken is. De overige categorieën zijn veel lastiger te vergelijken omdat deze op verschillende punten starten (daar waar de vorige is geëindigd). Alleen in dit geval hebben we maar 3 categorieën, waardoor het effect van de verschillende startpunten niet zo storend is. Vandaar dat ik ook een gestapelde staafgrafiek heb gemaakt (zie onder). Wat wel direct opvalt is dat het LinkedIn aandeel in B2C zo klein is dat het niet meer lukt het percentage in het gebied te plaatsen. Vandaar dat ik deze er onder geplaatst heb.

Tenslotte heb ik nog een derde alternatief gemaakt: zogenaamde Parallel Coordinates. Meestal wordt dit grafiektype gebruikt bij meer dan twee gezichtspunten, maar ook met deze bescheiden hoeveelheid gegevens vallen een aantal zaken direct op . Zo valt het snijden van de LinkedIn en de Twitter lijn direct op. Ook is direct te zien dat vooral Facebook profiteert van de daling van LinkedIn in het B2C segment tov B2B.

Welke van deze vier (origineel en 3 alternatieven) heeft jullie voorkeur en waarom? Laat het me weten op onze LinkedIn pagina.

Er zijn vast nog veel meer varianten mogelijk, dus aarzel niet om deze voor te stellen aan Naomi Robbins. Je hebt nog tot zondag 9 December om je verbeteringen aan haar te sturen.

 

Onze innovatie is top, nu de datavisualisatie nog

Afgelopen zaterdag is het me eindelijk gelukt: na 3 jaar blessureleed eindelijk weer 10km kunnen hardlopen. Het heeft de nodige moeite gekost, maar zoals ik in mei al schreef is een combinatie van structureel meten en goede ondersteuning net als in het bedrijfsleven een randvoorwaarde voor succes.

Het gevolg was natuurlijk wel dat ik zondag rustig aan gedaan heb. En een rustige zondag begint bij mij meestal met het doornemen van de verschillende tijdschriften die gedurende de week op de mat zijn gevallen. Natuurlijk kan ik het dan ook niet nalaten om te letten op de gebruikte datavisualisaties.

Deze week trok een artikel uit het blad Management Team mijn aandacht. De titel was Onze innovatie is top en beschrijft het goede innovatieklimaat in Nederland. Onderdeel van dit artikel zijn twee korte achtergrondverhalen, welke alleen voorkomen in de gedrukte versie.

Het eerste achtergrondverhaal, Alle 9 top, gaat over de negen topsectoren en de financiering van dit initiatief. Blijkbaar zal het bedrijfsleven 1,8 miljard voor zijn rekening nemen en de overheid 1 miljard. Vervolgens staan onder aan het verhaal de grafieken uit afbeelding 1.

We zien hierin de verdeling van de financiering naar topsector. Niet alleen de keuze voor een zogenaamde donut-chart is ongelukkig (taartgrafiek met een gat), maar ook de kleuren van verschillende sectoren lijken te veel op elkaar (bijv. tuinbouw, life sciences & health en high tech systemen en materialen). Door het gebruik van sterk gelijkende kleuren moet je soms meerdere keren heen en weer gaan tussen de grafiek en de legenda om zeker te stellen welke sector het betreft. Verder valt op dat de grafiek van het bedrijfsleven veel groter is afgebeeld dan die van de overheid. Nameten leert dat de diameter van de linker grafiek (bedrijfsleven) 2 keer zo groot is als die van de rechter (overheid). Blijkbaar hebben de makers hiermee de verhouding tussen 1,8 miljard en 1 miljard willen illustreren. Jammer genoeg voegt het weinig toe. Sterker nog, het maakt het alleen maar lastiger om de overheidsinvesteringen per sector te vergelijken.

Op de eerste plaats ben ik op zoek gegaan naar de bron van deze gegevens, want deze staat helaas niet vermeld in het artikel. Na wat zoeken in Google kwam ik de gegevens tegen op een pagina van de rijksoverheid. Op basis hiervan heb ik het alternatief gemaakt zoals te zien in afbeelding 2.

Wat direct opvalt is de post overig bij de overheid. Deze was niet aanwezig in donut-chart. Ook zul je merken dat je met deze datavisualisatie veel minder tijd nodig hebt om de informatie te verwerken.

Op de volgende pagina in het tijdschrift staat het tweede achtergrondverhaal met als titel Hotspot Eindhoven. De relatie tussen de tekst en de grafiek lijkt me niet erg sterk: de tekst gaat exclusief over Eindhoven, waar de grafiek over de vijf grootste r&d investeerders van Nederland gaat. Wellicht dat het hebben van twee bedrijven uit Eindhoven in de top 5 van Nederland de relatie is, maar erg sterk is het niet.

Het positieve van deze grafiek is dat er een bronvermelding bij staat. Helaas kan ik verder geen enkel positief punt noemen van deze grafiek. Het 3D effect maakt het zeer moeilijk om de getallen te lezen. Dus ook in dit geval ben ik aan de slag gegaan om een alternatief te maken, waarvan je hieronder het resultaat kunt vinden.

Zien jullie het enorme inhoudelijke verschil? Volgens de gegevens uit het Technisch Weekblad daalt de investering van Philips in r&d vanaf 2008, maar in de grafiek van het MT stijgt hij. Ook bij ASML zou volgens deze gegevens de investering vanaf 2008 blijven dalen, waar de grafiek in het MT vanaf 2009 een stijging “suggereert”.

Het is bekend dat het 3D effect de leesbaarheid negatief beïnvloed, maar dat de trend zo ernstig vervormt wordt kan ik me niet voorstellen. Wellicht dat ik de verkeerde brongegevens heb gebruikt, of zijn de getallen in het MT door elkaar gehaald?

Gebruik dus een effectieve datavisualisatie, maar belangrijker nog: gebruik de juiste gegevens.

 

In lijn met kwantipulatie

Vaak zien we bij kwantipulatie voornamelijk voorbeelden van het incorrect toepassen van taart- en staafgrafieken. Waarschijnlijk komt dit ook doordat de valkuilen bij deze grafiektypen eenvoudig te herkennen zijn. Echter, ook de oude vertrouwde lijngrafiek wordt misbruikt in kwantipulatie.

Een belangrijke valkuil bij het gebruik van lijngrafieken is de toepassing van meerdere (verschillende) schaalverdelingen. Zo lijkt het in de onderstaande lijngrafiek dat de blauwe lijn een vrij rustig verloop te kennen (lijn loopt redelijk vlak), waar de rode lijn een veel grilliger patroon laat zien. Ook zien we dat de lijnen in de maand Juli elkaar kruisen. Vaak heeft het kruisen van twee lijnen een speciale betekenis, dus letten we hier ook direct op.

Echter, zoals te zien is in afbeelding 2 vertonen de resultaten van zowel rood als blauw precies hetzelfde patroon. Sterker nog: de lijnen kruisen elkaar nergens.

Nu ben ik begonnen met te vertellen over het toepassen van meerdere schaalverdelingen, waardoor u deze direct ziet. Echter, in de praktijk zien de meeste lezers deze tweede as in eerste instantie niet en concentreren de meesten van ons zich op de vorm van de lijnen. Probeer dus meerdere schaalverdelingen in één grafiek te vermijden. Mochten hierdoor verschillende gegevensverzamelingen niet goed leesbaar worden, maak er dan ook twee verschillende grafieken van.

Niet alleen met het variëren van de schaalverdeling kan de boodschap van een grafiek sterk veranderen. Een andere kwantipulatie methode die veel toegepast wordt is het aanpassen van de aspect ratio of beeldverhouding. Naomi Robbins schreef hier recent over in haar blog voor Forbes. Zij gebruikt daarin een voorbeeld van 2 grafieken met gelijke gegevens en schaalverdelingen die ieder een net iets andere verhaal vertellen. Bij de linkse grafiek (aspect ratio van 0,15) lijkt de stijging veel minder spectaculair dan bij de rechtse (aspect ratio van 2,5). Helaas zijn er (nog?) geen eenduidige regels voor het toepassen van de aspect ratio, dus wees op je hoede.

aspect ratio van 0,15

aspect ratio van 2,5

Dag vakantie, hallo verkiezingen!

Welkom terug! Net als de meeste van jullie hebben ook wij in de maand augustus van onze vakantie genoten.

Na de vakantie weer in het ritme komen valt mij altijd zwaar, vooral als ‘s-morgens vroeg de wekker om aandacht schreeuwt. Als de wekker de enige was die om aandacht verlegen zat…

Na een paar weken doorgebracht te hebben in Spanje was ik helemaal vergeten dat we weer snel naar de stembus mogen. Maar “gelukkig” hoef je de TV maar aan te zetten of een krant open te slaan: je ontkomt er niet aan. Ook een rustige wandeling door de stad is niet meer mogelijk, want op iedere hoek staat wel iemand die zijn of haar politieke voorkeur aan je uitdeelt.

En natuurlijk horen bij verkiezingen ook de peilingen. Iedere grote naam in onderzoeksland doet verplicht mee. Gevolg: een lawine aan getallen en bijbehorende analyses, die als het een beetje mee zit elkaar natuurlijk tegen spreken.

Zo zag ik gisteren op www.telegraaf.nl de onderstaande grafiek verschijnen. Natuurlijk niet handig dat er gekozen is voor een 3D staafgrafiek, maar hoe ondersteunt deze grafiek het bijbehorende artikel?

In het artikel staat geschreven dat de PvdA (volgens de peilingen) de laatste weken steeds dichter bij het zetelaantal van de SP komt. Hoe zie ik dat in deze grafiek? Buiten de typische moeilijkheden met een 3D staafgrafiek (zie Trellis chart: klein maar fijn) is er nog iets anders wat vragen bij mij oproept: waar kan ik zien dat het verschil kleiner is geworden in de loop van de tijd?

Bij de vier onderzoeken staat in de legenda gelukkig wel vermeld wanneer deze zijn uitgevoerd. Alleen staan ze zowel in de grafiek als legenda niet in chronologische volgorde. In de volgende grafiek heb ik de gegevens daarin geplaatst.

Nu is te zien dat het verschil kleiner lijkt te zijn geworden, sterker nog: de PvdA lijkt de SP te hebben ingehaald. Echter, niet alleen het tijdstip verschilt per grafiek. Iedere grafiek is ook nog eens gebaseerd op een ander onderzoek. Nu weet ik niet veel van dit soort onderzoek, maar ik ben er vrij zeker van dat deze vier onderzoekers allen hun eigen specifieke aanpak hebben. Dus wat vergelijken we eigenlijk? Op de website www.peilloos.nl heb ik ook de eerdere resultaten van de gebruikte onderzoekers gevonden. Hieronder per onderzoeker de peilingen vanaf 1 juli 2012 van de PvdA en de SP.

Het blijven natuurlijk peilingen met alle beperkingen van dien, maar door zoveel mogelijk zaken gelijk te houden (ceteris paribus) zijn we op zijn minst in staat om de ontwikkeling in de tijd te zien. Deze laatste grafieken ondersteunen de strekking van het artikel in ieder geval een stuk beter dan het 3D origineel. Met deze laatste grafieken is het direct duidelijk dat het verschil in aantal zetels tussen de PvdA en de SP de laatste weken kleiner is geworden.

 

Pas op… kwantipulatie

Het blijft me opvallen dat we met enige regelmaat bezoekers aan deze blog ontvangen die de website gevonden hebben dankzij het combineren van zoektermen als misleiden, bedriegen en grafiek. Ik moet toegeven dat ook ik regelmatig op zoek ben naar foute voorbeelden. Ze werken namelijk goed om uit te leggen wat er allemaal fout kan gaan bij incorrect gebruik van grafieken.

Wekelijks scan ik een grote hoeveelheid artikelen om te zien of er iets tussen zit wat ik kan gebruiken. Zo kwam ik laatst een artikel tegen op snarketing 2.0: “How to Quantipulate using graphics”. Het voorbeeld op zich (verkeerd gebruiken van een staafdiagram) is niet spectaculair, maar de gebruikte term quantipulate of kwantipulatie sprak mij direct aan. Eindelijk een term om foute grafieken mee aan te duiden. Vrij vertaald betekent kwantipulatie:

De kunst van het toepassen van oncontroleerbare statistieken om mensen te overtuigen van je gelijk

Direct heb ik verder gezocht op de term Quantipulate, maar zonder veel resultaat. Blijkbaar wordt de term (nog) niet veel gebruikt. Toch kwam ik via een andere weg wel een recent artikel tegen op de website van Business Insider welke goed past bij de term kwantipulatie.

De titel van het artikel is: “Waarom alcohol schadelijker kan zijn dan heroïne”. Deze stelling wordt ondersteund met de onderstaande grafiek.

Het is wel duidelijk dat alcohol het hoogste scoort op de “schadelijk”-schaal (Overall harm score). Alleen is er ook een grote hoeveelheid informatie verstopt in deze gestapelde staafgrafiek.

Zo zijn 16 verschillende categorieën in één gestapelde staafgrafiek wat te veel van het goede. Ook de kleuren van verschillende categorieën lijken te veel op elkaar. Zeker als in een staaf een bepaalde categorie (bijna) niet voorkomt kost het veel moeite om de exacte categorie te herkennen. Wat is bijvoorbeeld de drug met de hoogste “drug-specific impairment of mental functioning (CW 5-7)“?

Ook lijken de drugs gesorteerd van hoog naar laag op basis van de Overall harm score. Alleen waarom staat Khat dan voor Anabolic steroids? Er valt dus genoeg aan te merken op deze visualisatie. Maar het is nog erger: we zien namelijk alleen maar gegevens die de suggestieve titel van het artikel ondersteunen.

In zijn blog Junk Charts geeft Kaiser Fung aan dat er blijkbaar een hiërarchie zit in de getoonde categorieën. De bron voor het artikel was een paper van David Nutt. Deze had niet alleen de bovenstaande grafiek gemaakt, want zijn paper bevat ook de onderstaande grafiek:

Deze grafiek laat een genuanceerder beeld zien: alcohol is wel schadelijker dan heroïne als je de schade van de gebruiker en de omgeving optelt. Echter, als je deze los van elkaar ziet blijkt dat voor de gebruiker heroïne veel schadelijker is. Daarnaast kunnen deze gegevens ook beter gevisualiseerd worden. Vandaar dat ik in de volgende grafiek een eerste aanzet geef om het eenvoudiger te maken om de schade per drug goed met elkaar te kunnen vergelijken (opgesplitst naar schade aan de omgeving en aan de gebruiker). Met beter kleurgebruik en een andere sortering zou deze nog duidelijker worden, maar deze heb ik gelijk gehouden aan het origineel zodat de verbinding tussen alle grafieken blijft bestaan.

Duidelijk een geval van kwantipulatie. Niet zozeer door David Nutt, maar wel door Business Insider. Deze heeft alleen de gegevens gebruikt die een sensationele kop ondersteunen, waardoor je bijna gelooft dat alcohol schadelijker dan heroïne is.