Wedstrijd: verbeter de grafiek

In de huidige druk van het boek Information Dashboard Design van Stephen Few staan vele voorbeelden van dashboards. De meeste dashboards in zijn boek zijn vooral voorbeelden van hoe het vooral niet moet. Stephen geeft aan dat het boek zo weinig goede voorbeelden bevat omdat hij deze tijdens het schrijven van het boek (2005) niet kon vinden. Tijdens zijn training in Mei gaf hij al aan dat hij voor de volgende uitgave meer goede voorbeelden wil gebruiken. Een direct gevolg hiervan is de Dashboard Design Competition welke hij begin augustus uitschreef.

Helaas kon ik zelf niet deelnemen vanwege tijdgebrek, maar gelukkig is het 91 anderen wel gelukt. Tussen deze inzendingen zitten een groot aantal geweldige dashboards die het bestuderen meer dan waard zijn. Een geweldige bron van inspiratie.

Ik was dan ook blij verrast toen ik zojuist het laatste blog artikel van Naomi Robbins las op Forbes. Hierin schrijft ook zij een wedstrijd uit, maar deze keer op een veel kleinere schaal. Zij geeft een bestaande grafiek als startpunt en vraagt iedereen om alternatieven aan te dragen. Met andere woorden: verbeter de grafiek.

Aangezien het een zeer beperkte set aan gegevens is besloot ik direct aan de slag te gaan. De originele visualisatie is een tweetal donut grafieken (soort taartgrafiek) en kun je vinden in bovenstaande afbeelding.

Mijn eerste ingeving bij het zien van (meerdere) taartgrafieken is om ze te vertalen naar een staafgrafiek. Dit omdat wij mensen niet alleen heel slecht zijn in het vergelijken van taartpunten binnen een taartgrafiek, maar nog slechter taartpunten kunnen vergelijken tussen twee taartgrafieken. Om zeker te stellen dat per bron (Facebook, Twitter en LinkedIn) B2B en B2C goed te vergelijken zijn heeft iedere bron een eigen y-as. Het resultaat zie je in de onderstaande afbeelding.

Vaak wordt als alternatief van een taartgrafiek gekozen voor een gestapelde staafgrafiek. In veel gevallen werkt dit niet goed, omdat alleen de eerste categorie (hier Facebook) goed te vergelijken is. De overige categorieën zijn veel lastiger te vergelijken omdat deze op verschillende punten starten (daar waar de vorige is geëindigd). Alleen in dit geval hebben we maar 3 categorieën, waardoor het effect van de verschillende startpunten niet zo storend is. Vandaar dat ik ook een gestapelde staafgrafiek heb gemaakt (zie onder). Wat wel direct opvalt is dat het LinkedIn aandeel in B2C zo klein is dat het niet meer lukt het percentage in het gebied te plaatsen. Vandaar dat ik deze er onder geplaatst heb.

Tenslotte heb ik nog een derde alternatief gemaakt: zogenaamde Parallel Coordinates. Meestal wordt dit grafiektype gebruikt bij meer dan twee gezichtspunten, maar ook met deze bescheiden hoeveelheid gegevens vallen een aantal zaken direct op . Zo valt het snijden van de LinkedIn en de Twitter lijn direct op. Ook is direct te zien dat vooral Facebook profiteert van de daling van LinkedIn in het B2C segment tov B2B.

Welke van deze vier (origineel en 3 alternatieven) heeft jullie voorkeur en waarom? Laat het me weten op onze LinkedIn pagina.

Er zijn vast nog veel meer varianten mogelijk, dus aarzel niet om deze voor te stellen aan Naomi Robbins. Je hebt nog tot zondag 9 December om je verbeteringen aan haar te sturen.

 

Ik zie, ik zie, wat ik niet zie…

Het verspreiden van kennis over het visualiseren van gegevens is een belangrijke doelstelling van deze wekelijkse blog. We hopen hiermee onze bijdrage te leveren aan het verbannen van slechte visualisaties, of zoals Tufte het zo mooi samenvat: Chartjunk.

Naast deze artikelen verzorg ik ook met enige regelmaat een workshop Effectief Rapporteren. Zo’n workshop wordt bijna altijd verzorgd “op locatie”. Dit heeft als grote voordeel dat we niet alleen kunnen praten over de algemene richtlijnen en aandachtspunten, maar ook over het toepassen van de kennis op de werkelijke rapporten en dashboards van de betreffende organisatie. De deelnemers kunnen het dus direct toepassen op hun eigen werk.

Een belangrijk onderdeel van de workshop is tijdens de introductie uitleggen dat we niet zien met onze ogen, maar met onze hersenen. Dit besef is de basis van het effectief visualiseren van gegevens. Nu kan ik dit wel vertellen en uitleggen, maar het zelf ervaren is veel krachtiger en duidelijker.

Gelukkig zijn er genoeg websites beschikbaar met voorbeelden van hoe onze hersenen ons op het verkeerde been (kunnen) zetten. Op Your amazing brain… staan een aantal klassiekers, maar ook op de Nederlandse site Gissen en Missen zijn er verschillende te vinden.

Iemand die nog een stapje verder gaat is Brusspup. Hij heeft op YouTube een geweldige collectie van video’s, de ene nog spectaculairder dan de ander.

Ieder van deze voorbeelden toont wel aan dat onze hersenen een grote rol spelen bij het zien, maar wat zien we nu eigenlijk met onze ogen?

In zijn boek The Functional Art heeft Alberto Cairo een aardig voorbeeld gebruikt om dit te illustreren. In de onderstaande foto’s heb ik dit geprobeerd na te bootsen.

Van de ongeveer 180 graden zicht die onze twee ogen ons geven zijn maar 2 graden scherp en gedetailleerd (zie afbeelding 3). Dus we denken wel dat we het beeld zien zoals op de eerste afbeelding, maar in werkelijkheid zien we op een bepaald moment maar een klein onderdeel (zie afbeelding 2). De rest is wazig, maar onze hersenen vullen het beeld voor ons aan. Gelukkig vallen afwijkende zaken ook op in het wazige gebied, zodat we vanzelf ons scherpe zicht daarop kunnen richten. Vandaar dat het van belang is om context informatie niet te veel te laten opvallen en de signalen juist wel. Anders weten onze hersenen niet waar we moeten kijken.

Flirten met data

Ruim een jaar geleden zijn we begonnen met het schrijven van artikelen voor deze blog. Voor ons een manier om met iedereen te delen wat ons bezig houdt en waar we tegenaan lopen. Een groot aantal artikelen in deze blog gaan dan ook over het bepalen wat nodig is om resultaat te verbeteren (resultaatgerichte bedrijfsvoering) en over het visualiseren van data (effectief rapporteren).

Een onmisbaar ingrediënt in het “bereiden” van beide aandachtsgebieden is de beschikbaarheid van data. Sterker nog: niet zomaar data, maar goede data. Maar wat is eigenlijk goede data?

Er zijn vele manieren om te kijken naar dit onderwerp. Veel voorkomende dimensies zijn:

  • Geldigheid
  • Nauwkeurigheid
  • Consistentie
  • Integriteit
  • Tijdigheid
  • Volledigheid

Het omgaan met en bewaken van deze dimensies is een omvangrijk vakgebied op zich (data kwaliteit), waar ik wellicht in toekomstige artikelen nog op terug kom.

Vandaag wil ik wat langer stil staan bij de eerste kennismaking met nieuwe data. Of je nu een data visualisatie gaat maken of op zoek bent naar mogelijke verbanden, er is altijd dat moment dat je voor de eerste keer wordt voorgesteld aan je data.

Meestal gaat zo’n eerste kennismaking gepaard met de nodige gezonde spanning. Je ziet allerlei mogelijkheden en je kunt bijna niet wachten om met de data aan de slag te gaan. Maar voordat je inhoudelijk met de data aan de slag gaat is het verstandig om deze data eerst beter te leren kennen. Als de hoeveelheid data beperkt is duurt deze kennismaking niet al te lang, maar hoe meer data hoe lastiger het wordt om deze te doorgronden.

Nu zijn er vele softwareproducten op de markt die je kunnen helpen bij deze eerste kennismaking, alleen heb je meestal een prijzige cursus nodig om ze te kunnen gebruiken. Ook de investering voor de software zelf is meestal niet rendabel als je deze niet dagelijks gebruikt.

Gelukkig zijn er ook verschillende open en gratis initiatieven op dit gebied. Een goed voorbeeld hiervan is de DataWrangler van de Stanford universiteit. Na het bekijken van de demo kun je zelf al direct aan de slag met je eigen data. Alleen lijkt het er op dat er niet heel actief meer aan deze tool wordt gewerkt. Ook is de tool alleen online te gebruiken, waardoor het voor gevoelige data niet te gebruiken is.

Er is echter ook een heel goed alternatief: Google Refine. In tegenstelling tot wat ik gewend ben van de meeste Google tools kun je Google Refine downloaden en installeren op je eigen machine. Met behulp van de Google Refine wiki kun je direct aan de slag. Google Refine omvat een groot aantal hulpmiddelen om de data te leren kennen, maar ook om deze op te schonen. Alle stappen die je zet in een data bestand kun je opslaan als een soort macro en bijvoorbeeld toepassen op een vergelijkbaar ander bestand.

Ik raad iedereen aan om Google Refine eens uit te proberen, want het maakt de kennismaking met data een stuk eenvoudiger.