9.5 Tips for Great Data Visualisation

This article was originally posted on the measure-up blog of Stacey Barr.

Enrico Bertini explains in his recipe that studying plays an important role in becoming a Data Visualization expert. However, he also emphasizes it is just the beginning. This was probably the reason why Ben de Jong approached me a year ago to help him improve data visualizations at the bank he works for.

Ben was already familiar with the works of people like Stephen Few, Alberto Cairo and Andy Kirk. He clearly wasn’t looking for additional theoretical background. He was looking for someone with hands-on experience that could help him and the bank to the next level. And so we started to work together to improve the data visualizations of “his” bank.

Part of the assignment was to share our knowledge and experience with as many people as possible within the bank. We realized it would be difficult to get a broad audience interested if it would require a lot of their time. Furthermore, we wanted the session to be practical and not just an introduction. After attending our session, everyone should be able to directly apply the basics to their own work.

This is how we came up with our one-hour session called: 9.5 tips for great data visualizations. We conducted dozens of these sessions to confront people with the most common mistakes, illustrated by their own visualizations.

A couple of weeks ago Stacey was in The Netherlands, and I mentioned our “9.5 tips” sessions to her. Before I knew it she convinced me to write this blog post to share it with an even broader audience.

Tip 1. Start with WHY

In general, a visualization is the answer to a question. But how do you formulate an answer if you don’t know the question?

Therefore, you always start designing by an answering this fundamental WHY question. Although the question is easy, the answer (almost) never is.

This also implies you know your audience and take them into account.

Tip 2. Don’t make me think

Most visualizations require a lot of thought. Not because the audience is reflecting on the actions they need to take, but because they find it hard to understand the visualization itself. To avoid this, we need to apply three basic rules:

Tip 3. Cutting corners

When we use bar charts we “ask” our audience to compare area sizes. This can only be done right if these bars start at 0. Unfortunately, it is very common to have them start at other values, because otherwise “the differences are not clear enough”. If this is the case, choose an other chart type, because a bar chart scale should ALWAYS start at 0.

by ‘cutting’ the scale the difference here looks way bigger

the actual difference is only 22%

Tip 4. Apples to Oranges

When we have two measures with completely different scales it is difficult to combine them into one single chart. A common solution is to apply a secondary y-scale, so each of the measures has its own scale. Unfortunately, this practice introduces a lot of confusion. Sometimes even to the point that the visualization suggests there is some form of correlation between the measures, without any being really there. The solution is straightforward: split the two measures into two separate charts.

by applying two (independent) y-axis the message is determined by the different scaling. All three examples here are exactly the same data

by applying two (independent) y-axis the message is determined by the different scaling. All three examples here are exactly the same data

by applying two (independent) y-axis the message is determined by the different scaling. All three examples here are exactly the same data

Tip 5. Show your true colors

Color plays an important role in our visual perception and attention, so apply it with care. A number of ground rules concerning color usage are:

  • Use a neutral color as your base color (like white);
  • Make sure objects with the same color are related or mean the same;
  • Only use limited strong colors (like saturated red) for emphasizing important data;
  • Use a neutral color (like light gray) for all contextual/context elements (scales, tick marks, reference lines, etc.)

Probably the most popular color scheme is Red, Amber & Green (RAG). This color scheme is also responsible for a lot of clutter and distraction on visualizations. Please bear in mind that some people can’t distinguish red from green (color blindness), so maybe it is better to use an other color for green (like blue). Also ask yourself the question: do we really need to show the green color? Limit yourself to coloring exceptions only.

Tip 6. Less is more

Sometimes I get the impression that visualization designers experience white space as their enemy. As long as they have space left they keep adding stuff. But if you have answered your WHY question, there is no reason to add more. It is even the other way around: the visualization is done when you are done with removing components.

Tip 7. Trending topic

It is very common (unfortunately) to simplify trends over time into one single indicator/arrow: we have gone up or down compared to the result in the previous period. These point-to-point comparisons are terrible, as Stacey explains in her workshops and book. A popular alternative to this single indicator is displaying all historic context, cluttering the visualization. A good alternative is to make use of Tufte’s sparklines: they give enough historic context without cluttering your visualization.

Tip 8. Avoid chart junk

In your data visualization it should be DATA FIRST: let the data tell its story. Everything else is considered chart junk (as introduced by Edward Tufte), and should be minimized. Making the visualization look “nice” is mostly adding more junk and compromising your goal: to inform.

Tip 9. Save the pies for dessert

In most cases when someone uses a pie chart there are (far) better alternatives at hand. This is why Stephen Few saves all pies for dessert. We have had no need for them either, but should you insist on using one, apply the rules from Donna Wong:

  • Never more than 4 slices;
  • Use one single color (hue);
  • Start at 12 o’clock and order the slices descending.

Tip 9.5 Sketch & experiment

This last tip is not concerning the visualization itself, but more on your design approach. This is why we have valued it with half a tip.
There are two important enemies to effective data visualization: software tools & actual data. When you start with software you run the risk to get distracted by the functions and features of the software. Actual data demands a lot of attention because of unclear definitions or questionable quality. Both make you loose the focus on the WHY and your visualization. This is why we use pencil and paper to start sketching the visualization. Make use of the Five Design Sheet methodology to design your visualizations.

Wat is een Management Dashboard?

Als je dagelijks bezig bent met Management Dashboards en datavisualisatie loop je een verhoogd risico op statistitis. Met andere woorden: alle activiteiten en processen proberen uit te drukken in numerieke waarden en statistieken.

Zo kijk ik met enige regelmaat naar de (Google) zoektermen waarmee bezoekers onze site ontdekken. Niet zozeer om onze marketing campagnes aan te sturen, maar meer om te zien welke onderwerpen spelen.

Zo valt mij op dat er vrij veel bezoekers onze website vinden door in google op te geven Wat is een management dashboard. Alleen ben ik bang dat zij het antwoord niet zomaar konden vinden op onze site, dus vandaar dit artikel. In onze Effectief Rapporteren workshops komt dit wel ter sprake, dus hoogste tijd om er ook hier aandacht aan te besteden.

Om te beginnen is het belangrijk om vast te stellen dat we niet allemaal het zelfde verstaan onder een Management Dashboard. Dus een duidelijke definitie van wat het voor jou of mij betekent helpt in ieder geval onduidelijkheden te voorkomen.

Kort samengevat definieer ik een management dashboard als volgt: Regelmatige en gestructureerde feedback over (de ontwikkeling van) een resultaat van een organisatie en/of proces.

Hiermee wil ik niet zeggen dat dit dé definitie is, maar wel één waarmee wij werken. Zo heeft ook Stephen Few al in 2004 een definitie gegeven in het artikel Dashboard Confusion. Deze definitie luidt (vrij vertaald): Visuele weergave van de belangrijkste informatie nodig om één of meerdere doelen te bereiken die samengevat op één enkel beeldscherm je in staat stelt om in één oogopslag de informatie te bewaken en begrijpen.

Few gaat (natuurlijk) iets meer in op de vorm, maar komt goed overeen met onze definitie.

Daarnaast is het ook nodig om de belangrijkste functies van een dashboard te benoemen. De drie hoofdfuncties van een management dashboard zijn volgens Few:

  • Overzicht
  • Inzoomen op specifieke zaken
  • Link naar details

De gebruiker van een dashboard moet op de eerste plaats snel een algeheel overzicht krijgen van de situatie en kunnen bepalen wat extra aandacht nodig heeft (Overzicht). Vervolgens moet de gebruiker de zaken die extra aandacht nodig hebben nader kunnen onderzoeken om zo te bepalen of er iets aan gedaan moet worden (Inzoomen op specifieke zaken). Tenslotte, als de gebruiker meer informatie nodig heeft om te bepalen hoe te reageren moet het dashboard dit ondersteunen (Link naar details).

Mocht je dus een Management Dashboard (pakket) willen evalueren, start dan bij het bekijken of en hoe deze drie functies ondersteund worden. Geen Management Dashboard kan zonder, dus ook bij het opzetten van onze Management Dashboard toepassing Oxygen zijn alledrie uitvoerig aanwezig.

Wedstrijd: verbeter de grafiek

In de huidige druk van het boek Information Dashboard Design van Stephen Few staan vele voorbeelden van dashboards. De meeste dashboards in zijn boek zijn vooral voorbeelden van hoe het vooral niet moet. Stephen geeft aan dat het boek zo weinig goede voorbeelden bevat omdat hij deze tijdens het schrijven van het boek (2005) niet kon vinden. Tijdens zijn training in Mei gaf hij al aan dat hij voor de volgende uitgave meer goede voorbeelden wil gebruiken. Een direct gevolg hiervan is de Dashboard Design Competition welke hij begin augustus uitschreef.

Helaas kon ik zelf niet deelnemen vanwege tijdgebrek, maar gelukkig is het 91 anderen wel gelukt. Tussen deze inzendingen zitten een groot aantal geweldige dashboards die het bestuderen meer dan waard zijn. Een geweldige bron van inspiratie.

Ik was dan ook blij verrast toen ik zojuist het laatste blog artikel van Naomi Robbins las op Forbes. Hierin schrijft ook zij een wedstrijd uit, maar deze keer op een veel kleinere schaal. Zij geeft een bestaande grafiek als startpunt en vraagt iedereen om alternatieven aan te dragen. Met andere woorden: verbeter de grafiek.

Aangezien het een zeer beperkte set aan gegevens is besloot ik direct aan de slag te gaan. De originele visualisatie is een tweetal donut grafieken (soort taartgrafiek) en kun je vinden in bovenstaande afbeelding.

Mijn eerste ingeving bij het zien van (meerdere) taartgrafieken is om ze te vertalen naar een staafgrafiek. Dit omdat wij mensen niet alleen heel slecht zijn in het vergelijken van taartpunten binnen een taartgrafiek, maar nog slechter taartpunten kunnen vergelijken tussen twee taartgrafieken. Om zeker te stellen dat per bron (Facebook, Twitter en LinkedIn) B2B en B2C goed te vergelijken zijn heeft iedere bron een eigen y-as. Het resultaat zie je in de onderstaande afbeelding.

Vaak wordt als alternatief van een taartgrafiek gekozen voor een gestapelde staafgrafiek. In veel gevallen werkt dit niet goed, omdat alleen de eerste categorie (hier Facebook) goed te vergelijken is. De overige categorieën zijn veel lastiger te vergelijken omdat deze op verschillende punten starten (daar waar de vorige is geëindigd). Alleen in dit geval hebben we maar 3 categorieën, waardoor het effect van de verschillende startpunten niet zo storend is. Vandaar dat ik ook een gestapelde staafgrafiek heb gemaakt (zie onder). Wat wel direct opvalt is dat het LinkedIn aandeel in B2C zo klein is dat het niet meer lukt het percentage in het gebied te plaatsen. Vandaar dat ik deze er onder geplaatst heb.

Tenslotte heb ik nog een derde alternatief gemaakt: zogenaamde Parallel Coordinates. Meestal wordt dit grafiektype gebruikt bij meer dan twee gezichtspunten, maar ook met deze bescheiden hoeveelheid gegevens vallen een aantal zaken direct op . Zo valt het snijden van de LinkedIn en de Twitter lijn direct op. Ook is direct te zien dat vooral Facebook profiteert van de daling van LinkedIn in het B2C segment tov B2B.

Welke van deze vier (origineel en 3 alternatieven) heeft jullie voorkeur en waarom? Laat het me weten op onze LinkedIn pagina.

Er zijn vast nog veel meer varianten mogelijk, dus aarzel niet om deze voor te stellen aan Naomi Robbins. Je hebt nog tot zondag 9 December om je verbeteringen aan haar te sturen.


Onze innovatie is top, nu de datavisualisatie nog

Afgelopen zaterdag is het me eindelijk gelukt: na 3 jaar blessureleed eindelijk weer 10km kunnen hardlopen. Het heeft de nodige moeite gekost, maar zoals ik in mei al schreef is een combinatie van structureel meten en goede ondersteuning net als in het bedrijfsleven een randvoorwaarde voor succes.

Het gevolg was natuurlijk wel dat ik zondag rustig aan gedaan heb. En een rustige zondag begint bij mij meestal met het doornemen van de verschillende tijdschriften die gedurende de week op de mat zijn gevallen. Natuurlijk kan ik het dan ook niet nalaten om te letten op de gebruikte datavisualisaties.

Deze week trok een artikel uit het blad Management Team mijn aandacht. De titel was Onze innovatie is top en beschrijft het goede innovatieklimaat in Nederland. Onderdeel van dit artikel zijn twee korte achtergrondverhalen, welke alleen voorkomen in de gedrukte versie.

Het eerste achtergrondverhaal, Alle 9 top, gaat over de negen topsectoren en de financiering van dit initiatief. Blijkbaar zal het bedrijfsleven 1,8 miljard voor zijn rekening nemen en de overheid 1 miljard. Vervolgens staan onder aan het verhaal de grafieken uit afbeelding 1.

We zien hierin de verdeling van de financiering naar topsector. Niet alleen de keuze voor een zogenaamde donut-chart is ongelukkig (taartgrafiek met een gat), maar ook de kleuren van verschillende sectoren lijken te veel op elkaar (bijv. tuinbouw, life sciences & health en high tech systemen en materialen). Door het gebruik van sterk gelijkende kleuren moet je soms meerdere keren heen en weer gaan tussen de grafiek en de legenda om zeker te stellen welke sector het betreft. Verder valt op dat de grafiek van het bedrijfsleven veel groter is afgebeeld dan die van de overheid. Nameten leert dat de diameter van de linker grafiek (bedrijfsleven) 2 keer zo groot is als die van de rechter (overheid). Blijkbaar hebben de makers hiermee de verhouding tussen 1,8 miljard en 1 miljard willen illustreren. Jammer genoeg voegt het weinig toe. Sterker nog, het maakt het alleen maar lastiger om de overheidsinvesteringen per sector te vergelijken.

Op de eerste plaats ben ik op zoek gegaan naar de bron van deze gegevens, want deze staat helaas niet vermeld in het artikel. Na wat zoeken in Google kwam ik de gegevens tegen op een pagina van de rijksoverheid. Op basis hiervan heb ik het alternatief gemaakt zoals te zien in afbeelding 2.

Wat direct opvalt is de post overig bij de overheid. Deze was niet aanwezig in donut-chart. Ook zul je merken dat je met deze datavisualisatie veel minder tijd nodig hebt om de informatie te verwerken.

Op de volgende pagina in het tijdschrift staat het tweede achtergrondverhaal met als titel Hotspot Eindhoven. De relatie tussen de tekst en de grafiek lijkt me niet erg sterk: de tekst gaat exclusief over Eindhoven, waar de grafiek over de vijf grootste r&d investeerders van Nederland gaat. Wellicht dat het hebben van twee bedrijven uit Eindhoven in de top 5 van Nederland de relatie is, maar erg sterk is het niet.

Het positieve van deze grafiek is dat er een bronvermelding bij staat. Helaas kan ik verder geen enkel positief punt noemen van deze grafiek. Het 3D effect maakt het zeer moeilijk om de getallen te lezen. Dus ook in dit geval ben ik aan de slag gegaan om een alternatief te maken, waarvan je hieronder het resultaat kunt vinden.

Zien jullie het enorme inhoudelijke verschil? Volgens de gegevens uit het Technisch Weekblad daalt de investering van Philips in r&d vanaf 2008, maar in de grafiek van het MT stijgt hij. Ook bij ASML zou volgens deze gegevens de investering vanaf 2008 blijven dalen, waar de grafiek in het MT vanaf 2009 een stijging “suggereert”.

Het is bekend dat het 3D effect de leesbaarheid negatief beïnvloed, maar dat de trend zo ernstig vervormt wordt kan ik me niet voorstellen. Wellicht dat ik de verkeerde brongegevens heb gebruikt, of zijn de getallen in het MT door elkaar gehaald?

Gebruik dus een effectieve datavisualisatie, maar belangrijker nog: gebruik de juiste gegevens.


Visualisatie voor iedereen

Voor iedereen die geïnteresseerd is in het verbeteren van data visualisaties was 2012 al een geweldig jaar. In mei was er de mogelijkheid om de driedaagse training van Stephen Few bij te wonen en in juli was Andy Kirk in Amsterdam voor een training. Voor iedereen die deze twee trainingen gemist heeft: komend jaar is er vast weer een mogelijkheid om één van deze trainingen in Nederland bij te wonen.

Vorige week schreef ik over een andere grote naam in de wereld van data visualisaties: Alberto Cairo. Ook hij geeft regelmatig data visualisatie trainingen, alleen heb ik nog niet de mogelijkheid gehad om een training van Alberto bij te wonen. Na het schrijven van mijn artikel vorige week ben ik maar op zoek gegaan naar zijn trainingsschema. Zo te zien is ook hij van plan om een training/presentatie in Nederland te verzorgen, alleen is dat pas in maart 2013.

Natuurlijk zal ik proberen er bij te zijn, maar maart is nog zo ver weg. Vandaar dat ik blij verrast was met Alberto’s blog artikel van vrijdag jl.

Hij verzorgt een 6-weekse workshop vanaf eind deze maand bij mij thuis! Niet alleen bij mij thuis, maar ook bij jou als je dat wilt. De workshop is namelijk in de vorm van een zogenaamde Massive Open Online Course of MOOC.

Het is al geweldig dat we allemaal kunnen deelnemen vanuit onze luie stoel, maar het wordt nog beter: de workshop is GRATIS!

Dit is een geweldige kans om eens en voor altijd af te rekenen met die verschrikkelijke dashboards en rapporten met slechte visualisaties die we overal maar tegen komen. Dus als je iets te maken hebt met data visualisatie: mis deze kans niet en schrijf je nu in! In de onderstaande video vertelt Alberto je meer over de workshop.

Functionele dashboard kunst

Eerder dit jaar schreef ik over het boek el arte funcional van Alberto Cairo. Op dat moment was alleen de Spaanse versie beschikbaar, maar inmiddels is ook de engelse vertaling te koop: the functional art.

Zijn benadering van infographics en informatievisualisatie is wat breder dan die van bijvoorbeeld Stephen Few. Hij gaat bijvoorbeeld ook uitvoerig in op de artistieke en emotionele kant van informatievisualisatie, welke Few al snel zal classificeren als chartjunk.

Echter, ook Stephen Few is duidelijk onder de indruk van Alberto’s boek. Hij heeft er zelfs het volgende artikel over geschreven: Here at Last, “The Functional Art”.

Wat mij direct opviel in het boek was het zogenaamde Visualisatie Wiel. Het is een handig hulpmiddel om de verschillende afwegingen in kaart te brengen die horen bij het ontwerpen van een visualisatie of dashboard.

Alberto Cairo geeft de afwegingen weer met 6 verschillende assen. Iedere as verbind twee extremen (bijvoorbeeld origineel vs. stereotiep). Vervolgens kun je per as aangeven waar je visualisatie of dashboard op de as thuishoort. Al is dit slechts een subjectief proces, het helpt goed bij het structureren van je ontwerp-overwegingen. Laten we kort de verschillende assen bekijken.

Abstract – Concreet

Bij Concreet representeer je een object zoals deze er ook in werkelijkheid uit ziet. Hoe minder de representatie lijkt op het werkelijke object, hoe meer het richting Abstract gaat. In management dashboards wordt vooral gebruik gemaakt van Abstract.

Functioneel – Decoratief

Functioneel is alleen dat tonen wat noodzakelijk is voor het communiceren van de informatie. Bij Decoratief worden ook zaken getoond die niet noodzakelijk zijn, maar slechts ter verfraaiing van het beeld dienen. Decoratief valt in de meeste gevallen onder het kopje chart junk. Informatie visualisatie binnen management dashboards zal dus vooral neigen naar Functioneel.

Dichtheid – Luchtigheid

De positie op deze as wordt bepaald door de hoeveelheid getoonde informatie ten opzichte van de gebruikte hoeveelheid ruimte. Bij complexe omgevingen zal veel informatie nodig zijn om het overzicht te verkrijgen. Dit vraagt een hoge mate van Dichtheid van het management dashboard. Echter, er zijn ook onderwerpen waarbij de hoeveelheid meevalt, waardoor Luchtigheid mogelijk is.

Multidimensioneel – Unidimensioneel

Bij deze as gaat het om twee gerelateerde variabelen: de mogelijkheden om te navigeren door de verschillende niveaus van gegevens (bijv. drillen) en de verschillende manieren (grafiek- en tabelvormen) om dezelfde informatie af te beelden. Aangezien een belangrijke functie van een management dashboard het drillen is is hier de voorkeur duidelijk voor Multidimensioneel.

Origineel – Stereotiep

Als de visualisatie gebaseerd is op een bekend grafiektype (bijv. staaf- of lijngrafiek) is er sprake van Stereotiep. Echter, als de visualisatie zelf nieuw is voor de lezer is het Origineel. Aangezien we bij een management dashboard de kortst mogelijke route naar het antwoord willen ondersteunen heeft Stereotiep hier de voorkeur.

Noviteit – Redundantie

Een visualisatie kan een gegeven slechts één keer tonen (Noviteit), of meerdere keren op verschillende manieren (Redundantie). Voor een management dashboard zijn beide goed bruikbaar.

Inmiddels heb ik het Visualisatie Wiel al een paar keer toegepast tijdens het ontwerpen van een dashboard of rapport. Het heeft mij in ieder geval geholpen de verschillende overwegingen en keuzes te structureren. Wat denken jullie hiervan? Ik kijk uit naar jullie input en reacties op onze Linkedin pagina.


Dashboard waar de vonken vanaf vliegen

Op vrijwel ieder management dashboard dat wij ontwerpen staat een grafiektype dat zo klein en subtiel is dat je het bijna over het hoofd zou zien. Echter, ondanks haar omvang is dit grafiektype van onschatbare waarde voor ieder dashboard. Het gaat hier om de zogenaamde sparkline.

De term sparkline is in 2004 door Edward Tufte geïntroduceerd. Zijn bedoeling was om de gegevensvisualisatie niet langer uitsluitend te tonen in een grafiek op een afgezonderde plaats op de pagina of het scherm. Hij wilde de gegevensvisualisatie daar plaatsen waar ook de bijbehorende woorden en getallen staan. Samengevat is een sparkline een eenvoudige en compacte visualisatie, rijk aan gegevens met de omvang van een woord.

Ook op het management dashboard vervult de sparkline een belangrijke functie. Vooral bij het afbeelden van KPI resultaten. Meestal is alleen het huidige resultaat van een KPI niet voldoende, maar is het ook nodig om eerdere resultaten inzichtelijk te maken (historie). Voordat je het weet past je management dashboard niet meer op één scherm of pagina als je voor iedere KPI een grafiek moet toevoegen, waardoor het dashboard zijn functie (overzicht) verliest. Dit is precies waar de sparkline kan helpen.

Vaak zie ik nog dashboards waarbij de historie wordt samengevat met een enkele pijl. Hierbij verliezen we echter een hoop waardevolle gegevens. Op de plaats van de pijl kunnen we ook een sparkline kwijt, waardoor de hoeveelheid informatie direct toeneemt zonder meer plaats te kosten.

Net als bij een gewone lijngrafiek is het ook bij de sparkline de vraag of een afwijking normaal is (natuurlijke variantie) of bijzonder (het echte signaal). Hier schreef ik al eerder over in het artikel Vertrouwen in uw management dashboard is goed, maar controle is beter.

Vandaar dat Stacey Barr in haar laatste artikel de sparkline en controlchart combineert tot smartlines.

Met haar smartlines weet Stacey nog meer bruikbare informatie te stoppen in een klein gebied. Ik weet alleen nog niet of de smartline op korte termijn op onze dashboards moet verschijnen. Ik ben benieuwd naar jullie mening over de smartlines van Stacey. Laat een bericht achter op onze Linkedin pagina.


In lijn met kwantipulatie

Vaak zien we bij kwantipulatie voornamelijk voorbeelden van het incorrect toepassen van taart- en staafgrafieken. Waarschijnlijk komt dit ook doordat de valkuilen bij deze grafiektypen eenvoudig te herkennen zijn. Echter, ook de oude vertrouwde lijngrafiek wordt misbruikt in kwantipulatie.

Een belangrijke valkuil bij het gebruik van lijngrafieken is de toepassing van meerdere (verschillende) schaalverdelingen. Zo lijkt het in de onderstaande lijngrafiek dat de blauwe lijn een vrij rustig verloop te kennen (lijn loopt redelijk vlak), waar de rode lijn een veel grilliger patroon laat zien. Ook zien we dat de lijnen in de maand Juli elkaar kruisen. Vaak heeft het kruisen van twee lijnen een speciale betekenis, dus letten we hier ook direct op.

Echter, zoals te zien is in afbeelding 2 vertonen de resultaten van zowel rood als blauw precies hetzelfde patroon. Sterker nog: de lijnen kruisen elkaar nergens.

Nu ben ik begonnen met te vertellen over het toepassen van meerdere schaalverdelingen, waardoor u deze direct ziet. Echter, in de praktijk zien de meeste lezers deze tweede as in eerste instantie niet en concentreren de meesten van ons zich op de vorm van de lijnen. Probeer dus meerdere schaalverdelingen in één grafiek te vermijden. Mochten hierdoor verschillende gegevensverzamelingen niet goed leesbaar worden, maak er dan ook twee verschillende grafieken van.

Niet alleen met het variëren van de schaalverdeling kan de boodschap van een grafiek sterk veranderen. Een andere kwantipulatie methode die veel toegepast wordt is het aanpassen van de aspect ratio of beeldverhouding. Naomi Robbins schreef hier recent over in haar blog voor Forbes. Zij gebruikt daarin een voorbeeld van 2 grafieken met gelijke gegevens en schaalverdelingen die ieder een net iets andere verhaal vertellen. Bij de linkse grafiek (aspect ratio van 0,15) lijkt de stijging veel minder spectaculair dan bij de rechtse (aspect ratio van 2,5). Helaas zijn er (nog?) geen eenduidige regels voor het toepassen van de aspect ratio, dus wees op je hoede.

aspect ratio van 0,15

aspect ratio van 2,5

Data visualisatie is kunst

Ontwerp is een belangrijk onderdeel van data visualisatie. Vandaar dat wij het in deze blog hier vaak over hebben. Echter, als je veel bezig bent met data visualisatie merk je snel genoeg dat het veel meer is dan alleen ontwerpen. Daarnaast gebruiken we vaak maar een deel van het data visualisatie gebied.

Afgelopen vrijdag kreeg ik de kans om deel te nemen aan Andy Kirk’s ééndaagse training “Introduction to Data Visualisation”. Hierin bespreekt Andy data visualisatie vanuit een groot aantal verschillende gezichtspunten.

Zo ging hij uitvoerig in op de doelstelling(en) van een data visualisatie. Deze kan uiteenlopen van zaken als communiceren en informeren tot vermaken en inspireren, en alles daar tussen. In grote lijnen is de doelstelling te vatten in de volgende onderdelen:

Bij Uitleggen gaat het vooral om het overbrengen van informatie aan anderen. Bij Verkennen ligt de nadruk meer op het ondersteunen en onderzoeken van een redenering. Zowel Uitleggen als Verkennen zijn belangrijke onderdelen van ons dagelijks werk: het ontwikkelen van management dashboards. Het is dan ook niet verwonderlijk dat wij zoveel gebruik maken van het werk van Stephen Few, want zijn boeken sluiten naadloos aan bij deze onderdelen: Show me the numbers (Uitleggen) en Now you SEE it (Verkennen).

Er is echter nog een derde onderdeel: Exposeren. Dit is een onderdeel waar wij vrij weinig mee te maken hebben, maar ook Exposeren is een belangrijke doelstelling van data visualisatie. Bij Exposeren zijn de gegevens meer de basis van een expressie. Exposeren kenmerkt zich door termen als: plezier, vermaken, aandacht vragen, kunst, etc. Het gaat veel meer over een beroep doen op gevoel en emotie.

Een goed voorbeeld hiervan is het werk van Chris Jordan. Hij gebruikt gegevens in zijn kunstwerken om te onderstrepen hoe ernstig het gesteld is met onze omgeving. Zo zijn veel van zijn werken gemaakt met grote aantallen plastic of blikjes. Een van zijn drijfveren om op deze manier gegevens te visualiseren is om ons gevoel te betrekken. In de onderstaande TEDtalk vertelt hij over een paar van zijn stukken:

Al is Exposeren vrijwel niet van toepassing op management dashboards, het is altijd goed om te leren van het werk van anderen. Al was het alleen maar voor inspiratie. Dat willen we toch allemaal?


De taartgrafiek: William’s laatste uitvinding

Ook ik was van de partij bij de workshop van Stephen Few in Mei. Een terugkerend fenomeen gedurende deze workshop was het bekritiseren van de taartgrafiek. We hebben hier al eerder over geschreven. Waarom is de taartgrafiek eigenlijk zo populair? Tijdens mijn zoektocht naar het antwoord kwam ik een artikel tegen van Ian Spence over de geschiedenis van de taartgrafiek.

Duidelijk is dat de Schot William Playfair in 1801 de eerste taartgrafiek gemaakt heeft. Dit heeft hij gedaan nadat hij de staafgrafiek en de lijngrafiek een aantal jaar eerder al had uitgevonden. Hij mag dan ook met recht als een van de grondleggers van modern rapporteren gezien worden. Maar was deze dag in 1801 dan een slechte dag van William? Hij kende namelijk al het alternatief voor de taartgrafiek (zijn eigen staafgrafiek), maar besloot toch de taartgrafiek toe te passen.

In zijn boek waar hij de taartgrafiek voor het eerst gebruikt geeft hij het volgende aan over het gebruik van grafieken: “making an appeal to the eye when proportion and magnitude are concerned, is the best and readiest method of conveying a distinct idea.” Vrij vertaald: Als je slechts wil vergelijken op grootte en proportie dan kun je dat het beste doen met grafieken die aantrekkelijk zijn voor het oog. Zijn invulling hiervan was:

De grafiek werkt als volgt:
Elke cirkel is een land. De grootte van de cirkel staat voor het landoppervlak, de lijn links van de cirkel de populatie, de lijn rechts de inkomsten etc. Maar waar is nu de taartgrafiek? Dat is het tweede bolletje, namelijk Turkije:

De verdeling van heel Turkije is opgedeeld in Europees, Afrikaans en Aziatisch Turkije. Het gebruik van de eerste taartgrafiek was dan ook een vernieuwing in een “grafiek” die we nu een infographic zouden noemen. En hiervoor gelden nu eenmaal andere regels, alhoewel Michel daar nog niet helemaal uit is…

William was zich heel bewust van de beperkingen van dit grafiektype, hij heeft ze namelijk later nog maar tweemaal gebruikt. Meneer Few heeft dus helemaal gelijk dat een taartgrafiek niet efficiënt is en dus niet thuis hoort in zakelijke gegevensoverdracht, maar met William ben ik het eens dat ook een aantrekkelijke vorm van groot belang is.

Tenslotte komen we dan bij de belangrijkste les van de workshop: Besef goed welk verhaal de grafiek moet vertellen… en wees voorzichtig in het gebruik van de taartgrafiek!