Berichten

Wedstrijd: verbeter de grafiek

In de huidige druk van het boek Information Dashboard Design van Stephen Few staan vele voorbeelden van dashboards. De meeste dashboards in zijn boek zijn vooral voorbeelden van hoe het vooral niet moet. Stephen geeft aan dat het boek zo weinig goede voorbeelden bevat omdat hij deze tijdens het schrijven van het boek (2005) niet kon vinden. Tijdens zijn training in Mei gaf hij al aan dat hij voor de volgende uitgave meer goede voorbeelden wil gebruiken. Een direct gevolg hiervan is de Dashboard Design Competition welke hij begin augustus uitschreef.

Helaas kon ik zelf niet deelnemen vanwege tijdgebrek, maar gelukkig is het 91 anderen wel gelukt. Tussen deze inzendingen zitten een groot aantal geweldige dashboards die het bestuderen meer dan waard zijn. Een geweldige bron van inspiratie.

Ik was dan ook blij verrast toen ik zojuist het laatste blog artikel van Naomi Robbins las op Forbes. Hierin schrijft ook zij een wedstrijd uit, maar deze keer op een veel kleinere schaal. Zij geeft een bestaande grafiek als startpunt en vraagt iedereen om alternatieven aan te dragen. Met andere woorden: verbeter de grafiek.

Aangezien het een zeer beperkte set aan gegevens is besloot ik direct aan de slag te gaan. De originele visualisatie is een tweetal donut grafieken (soort taartgrafiek) en kun je vinden in bovenstaande afbeelding.

Mijn eerste ingeving bij het zien van (meerdere) taartgrafieken is om ze te vertalen naar een staafgrafiek. Dit omdat wij mensen niet alleen heel slecht zijn in het vergelijken van taartpunten binnen een taartgrafiek, maar nog slechter taartpunten kunnen vergelijken tussen twee taartgrafieken. Om zeker te stellen dat per bron (Facebook, Twitter en LinkedIn) B2B en B2C goed te vergelijken zijn heeft iedere bron een eigen y-as. Het resultaat zie je in de onderstaande afbeelding.

Vaak wordt als alternatief van een taartgrafiek gekozen voor een gestapelde staafgrafiek. In veel gevallen werkt dit niet goed, omdat alleen de eerste categorie (hier Facebook) goed te vergelijken is. De overige categorieën zijn veel lastiger te vergelijken omdat deze op verschillende punten starten (daar waar de vorige is geëindigd). Alleen in dit geval hebben we maar 3 categorieën, waardoor het effect van de verschillende startpunten niet zo storend is. Vandaar dat ik ook een gestapelde staafgrafiek heb gemaakt (zie onder). Wat wel direct opvalt is dat het LinkedIn aandeel in B2C zo klein is dat het niet meer lukt het percentage in het gebied te plaatsen. Vandaar dat ik deze er onder geplaatst heb.

Tenslotte heb ik nog een derde alternatief gemaakt: zogenaamde Parallel Coordinates. Meestal wordt dit grafiektype gebruikt bij meer dan twee gezichtspunten, maar ook met deze bescheiden hoeveelheid gegevens vallen een aantal zaken direct op . Zo valt het snijden van de LinkedIn en de Twitter lijn direct op. Ook is direct te zien dat vooral Facebook profiteert van de daling van LinkedIn in het B2C segment tov B2B.

Welke van deze vier (origineel en 3 alternatieven) heeft jullie voorkeur en waarom? Laat het me weten op onze LinkedIn pagina.

Er zijn vast nog veel meer varianten mogelijk, dus aarzel niet om deze voor te stellen aan Naomi Robbins. Je hebt nog tot zondag 9 December om je verbeteringen aan haar te sturen.

 

In lijn met kwantipulatie

Vaak zien we bij kwantipulatie voornamelijk voorbeelden van het incorrect toepassen van taart- en staafgrafieken. Waarschijnlijk komt dit ook doordat de valkuilen bij deze grafiektypen eenvoudig te herkennen zijn. Echter, ook de oude vertrouwde lijngrafiek wordt misbruikt in kwantipulatie.

Een belangrijke valkuil bij het gebruik van lijngrafieken is de toepassing van meerdere (verschillende) schaalverdelingen. Zo lijkt het in de onderstaande lijngrafiek dat de blauwe lijn een vrij rustig verloop te kennen (lijn loopt redelijk vlak), waar de rode lijn een veel grilliger patroon laat zien. Ook zien we dat de lijnen in de maand Juli elkaar kruisen. Vaak heeft het kruisen van twee lijnen een speciale betekenis, dus letten we hier ook direct op.

Echter, zoals te zien is in afbeelding 2 vertonen de resultaten van zowel rood als blauw precies hetzelfde patroon. Sterker nog: de lijnen kruisen elkaar nergens.

Nu ben ik begonnen met te vertellen over het toepassen van meerdere schaalverdelingen, waardoor u deze direct ziet. Echter, in de praktijk zien de meeste lezers deze tweede as in eerste instantie niet en concentreren de meesten van ons zich op de vorm van de lijnen. Probeer dus meerdere schaalverdelingen in één grafiek te vermijden. Mochten hierdoor verschillende gegevensverzamelingen niet goed leesbaar worden, maak er dan ook twee verschillende grafieken van.

Niet alleen met het variëren van de schaalverdeling kan de boodschap van een grafiek sterk veranderen. Een andere kwantipulatie methode die veel toegepast wordt is het aanpassen van de aspect ratio of beeldverhouding. Naomi Robbins schreef hier recent over in haar blog voor Forbes. Zij gebruikt daarin een voorbeeld van 2 grafieken met gelijke gegevens en schaalverdelingen die ieder een net iets andere verhaal vertellen. Bij de linkse grafiek (aspect ratio van 0,15) lijkt de stijging veel minder spectaculair dan bij de rechtse (aspect ratio van 2,5). Helaas zijn er (nog?) geen eenduidige regels voor het toepassen van de aspect ratio, dus wees op je hoede.

aspect ratio van 0,15

aspect ratio van 2,5

Trellis chart: klein maar fijn

Het gebruik van 3D effecten in grafieken is over het algemeen een slecht idee. Het “mooie” uiterlijk weegt nooit op tegen de slechte leesbaarheid van bijvoorbeeld een 3D staafgrafiek. Met andere woorden: geen 3D effecten gebruiken.

Er zijn ook staafgrafieken waarbij 3D niet alleen het uiterlijk verandert, maar waar de derde dimensie gebruikt wordt om extra gegevens te tonen in de grafiek. Een voorbeeld hiervan zijn de zogenaamde Manhattan (staaf)grafieken(zie afbeelding boven).

In de bovenstaande afbeelding zie je dat op de derde dimensie (z-as) de verschillende producten zijn geplaatst. Alleen hebben we ook hier weer te maken met slechte leesbaarheid, helemaal als staven (bijna) helemaal wegvallen (zie product B in periode 7).

Toch is het voor management dashboards van belang om meerdere gezichtspunten tegelijkertijd inzichtelijk te maken. Hierdoor ontstaat de mogelijkheid om de situatie in één overzicht te analyseren zonder te navigeren of “bladeren”.

De eerste stap om meerdere gezichtspunten tegelijkertijd inzichtelijk te kunnen maken is het kiezen voor een effectieve presentatievorm. Aangezien het hier gaat om de ontwikkeling van een meetwaarde over tijd ligt een lijngrafiek het meest voor de hand. De gegevens zijn in afbeelding 2 zonder veel moeite eenvoudig af te lezen en te analyseren.

In dit geval is de keuze van een andere presentatievorm al een enorme verbetering. Maar wat als we ook de verkoopregio als gezichtspunt willen toevoegen aan de grafiek? Bij slechts 2 verkoopregio’s (Noord en Zuid) verdubbelt het aantal lijnen in onze lijngrafiek. Dit heeft direct een negatieve invloed op de leesbaarheid en maakt analyse zeer lastig (afb. 3). Terugvallen op de Manhattan staafgrafiek is ook hier geen optie, want die was met 3 gezichtspunten al niet leesbaar.

Voor situaties waarbij meer dan 3 gezichtspunten tegelijkertijd geanalyseerd moeten worden gebruiken wij de zogenaamde Trellis Chart of Small Multiple. Beide termen worden door elkaar gebruikt en komen op hetzelfde neer: een kruistabel met in iedere cel een grafiek in plaats van alleen een getal. Iedere grafiek in een Trellis Chart gebruikt dezelfde schaalverdeling om het vergelijken en analyseren van alle gezichtspunten mogelijk te maken. In afbeelding 4 staan alle eerder genoemde gezichtspunten afgebeeld met behulp van een Trellis Chart. Zie je het verschil?

Logische schalen

In de tijd dat ik op de middelbare school zat (vanaf 1984) hadden we allemaal rekenmachines om complexe berekeningen te kunnen uitvoeren tijdens de wiskunde en natuurkunde lessen. Ergens tijdens mijn verblijf op het voortgezet onderwijs heeft mijn vader mij laten zien hoe zij dat in “hun tijd” deden. Er waren toen nog geen rekenmachines (laat staan computers), maar ook zij moesten berekeningen uitvoeren met sinus, cosinus, tangens, worteltrekken, etc.

Tot ongeveer 1980 gebruikten scholieren (maar ook technici, natuurkundigen, ingenieurs, etc) de rekenliniaal . Deze liniaal is gebaseerd op logaritmen en wordt ook wel logaritmische liniaal genoemd.

Met het verdwijnen van de rekenliniaal is ook de parate kennis van logaritmen afgenomen. Zo moest ik laatst opzoeken wat logaritmen ook alweer zijn en hoe ze te gebruiken. Toch kom ik ze nog vaak tegen, ook als schaalverdeling in grafieken.

Echter, weinig mensen begrijpen goed wat de gevolgen zijn van het gebruik van een logaritmische schaalverdeling. Daarom is het beter om deze niet te gebruiken. Toch zijn er ook voordelen aan het gebruiken van een logaritmische schaalverdeling.

Zo is een logaritmische schaalverdeling beter in staat om (percentuele) veranderingen in beeld te brengen (in tegenstelling tot een lineaire schaalverdeling). Vandaar dat de prijsontwikkeling van aandelen vaak in een grafiek met een logaritmische schaal wordt afgebeeld. Hierna volgt een voorbeeld om dat te verduidelijken.

Wat was het verschil ook alweer tussen een lineaire en een logaritmische verdeling?

Bij een lineaire verdeling is het absolute verschil tussen twee waarden altijd dezelfde afstand op een as. Dus de afstand op de as tussen de waarden 15 en 25 (verschil=10) is gelijk aan de afstand tussen de waarden 2.950 en 2.960.

Bij een logaritmische verdeling is een gelijke afstand op een as niet het absolute verschil, maar het relatieve verschil (percentuele verschil). Dus de afstand op de as tussen de waarden 20 en 23 (verschil=15%) is gelijk aan de afstand tussen de waarden 1.000 en 1.150.

De onderstaande afbeelding laat de ontwikkeling van een denkbeeldig aandeel zien dat 15% per periode stijgt (met een lineaire schaalverdeling). Het aandeel begint in periode 1 met een prijs van 10 en eindigt in periode 50 met een prijs van 9.423.

Op het eerste gezicht lijkt het er op dat de prijs steeds sneller stijgt. In absolute waarden is dit ook het geval, maar toch is de stijging constant 15%. Als we deze zelfde gegevens nu afbeelden in een grafiek met een logaritmische schaal zien we duidelijk een constante stijging.

Toch blijft het oppassen met de logaritmische schaalverdeling: alleen gebruiken voor een publiek dat logaritmen en de gevolgen goed begrijpt!