Berichten

9.5 Tips for Great Data Visualisation

This article was originally posted on the measure-up blog of Stacey Barr.

Enrico Bertini explains in his recipe that studying plays an important role in becoming a Data Visualization expert. However, he also emphasizes it is just the beginning. This was probably the reason why Ben de Jong approached me a year ago to help him improve data visualizations at the bank he works for.

Ben was already familiar with the works of people like Stephen Few, Alberto Cairo and Andy Kirk. He clearly wasn’t looking for additional theoretical background. He was looking for someone with hands-on experience that could help him and the bank to the next level. And so we started to work together to improve the data visualizations of “his” bank.

Part of the assignment was to share our knowledge and experience with as many people as possible within the bank. We realized it would be difficult to get a broad audience interested if it would require a lot of their time. Furthermore, we wanted the session to be practical and not just an introduction. After attending our session, everyone should be able to directly apply the basics to their own work.

This is how we came up with our one-hour session called: 9.5 tips for great data visualizations. We conducted dozens of these sessions to confront people with the most common mistakes, illustrated by their own visualizations.

A couple of weeks ago Stacey was in The Netherlands, and I mentioned our “9.5 tips” sessions to her. Before I knew it she convinced me to write this blog post to share it with an even broader audience.

Tip 1. Start with WHY

In general, a visualization is the answer to a question. But how do you formulate an answer if you don’t know the question?

Therefore, you always start designing by an answering this fundamental WHY question. Although the question is easy, the answer (almost) never is.

This also implies you know your audience and take them into account.

Tip 2. Don’t make me think

Most visualizations require a lot of thought. Not because the audience is reflecting on the actions they need to take, but because they find it hard to understand the visualization itself. To avoid this, we need to apply three basic rules:

Tip 3. Cutting corners

When we use bar charts we “ask” our audience to compare area sizes. This can only be done right if these bars start at 0. Unfortunately, it is very common to have them start at other values, because otherwise “the differences are not clear enough”. If this is the case, choose an other chart type, because a bar chart scale should ALWAYS start at 0.

by ‘cutting’ the scale the difference here looks way bigger

the actual difference is only 22%

Tip 4. Apples to Oranges

When we have two measures with completely different scales it is difficult to combine them into one single chart. A common solution is to apply a secondary y-scale, so each of the measures has its own scale. Unfortunately, this practice introduces a lot of confusion. Sometimes even to the point that the visualization suggests there is some form of correlation between the measures, without any being really there. The solution is straightforward: split the two measures into two separate charts.

by applying two (independent) y-axis the message is determined by the different scaling. All three examples here are exactly the same data

by applying two (independent) y-axis the message is determined by the different scaling. All three examples here are exactly the same data

by applying two (independent) y-axis the message is determined by the different scaling. All three examples here are exactly the same data

Tip 5. Show your true colors

Color plays an important role in our visual perception and attention, so apply it with care. A number of ground rules concerning color usage are:

  • Use a neutral color as your base color (like white);
  • Make sure objects with the same color are related or mean the same;
  • Only use limited strong colors (like saturated red) for emphasizing important data;
  • Use a neutral color (like light gray) for all contextual/context elements (scales, tick marks, reference lines, etc.)

Probably the most popular color scheme is Red, Amber & Green (RAG). This color scheme is also responsible for a lot of clutter and distraction on visualizations. Please bear in mind that some people can’t distinguish red from green (color blindness), so maybe it is better to use an other color for green (like blue). Also ask yourself the question: do we really need to show the green color? Limit yourself to coloring exceptions only.

Tip 6. Less is more

Sometimes I get the impression that visualization designers experience white space as their enemy. As long as they have space left they keep adding stuff. But if you have answered your WHY question, there is no reason to add more. It is even the other way around: the visualization is done when you are done with removing components.

Tip 7. Trending topic

It is very common (unfortunately) to simplify trends over time into one single indicator/arrow: we have gone up or down compared to the result in the previous period. These point-to-point comparisons are terrible, as Stacey explains in her workshops and book. A popular alternative to this single indicator is displaying all historic context, cluttering the visualization. A good alternative is to make use of Tufte’s sparklines: they give enough historic context without cluttering your visualization.

Tip 8. Avoid chart junk

In your data visualization it should be DATA FIRST: let the data tell its story. Everything else is considered chart junk (as introduced by Edward Tufte), and should be minimized. Making the visualization look “nice” is mostly adding more junk and compromising your goal: to inform.

Tip 9. Save the pies for dessert

In most cases when someone uses a pie chart there are (far) better alternatives at hand. This is why Stephen Few saves all pies for dessert. We have had no need for them either, but should you insist on using one, apply the rules from Donna Wong:

  • Never more than 4 slices;
  • Use one single color (hue);
  • Start at 12 o’clock and order the slices descending.

Tip 9.5 Sketch & experiment

This last tip is not concerning the visualization itself, but more on your design approach. This is why we have valued it with half a tip.
There are two important enemies to effective data visualization: software tools & actual data. When you start with software you run the risk to get distracted by the functions and features of the software. Actual data demands a lot of attention because of unclear definitions or questionable quality. Both make you loose the focus on the WHY and your visualization. This is why we use pencil and paper to start sketching the visualization. Make use of the Five Design Sheet methodology to design your visualizations.

Datavisualisaties in beweging 2013

Dat je niet altijd eerst een paar uur moet vliegen om een goed seminar over datavisualisaties bij te wonen was me vorig jaar al opgevallen. Alleen hoorde ik te laat over “Datavisualisaties in beweging” waardoor ik daar niet bij kon zijn. Gelukkig werd ik dit jaar op tijd gewaarschuwd door Yuri Engelhardt (Dank je Yuri!), waardoor ik afgelopen vrijdag wel aanwezig kon zijn bij de tweede editie.

Het was geweldig om zo veel mensen bij elkaar te zien die allemaal bezig zijn met dit onderwerp. En ook vanuit allerlei verschillende achtergronden: journalisten, studenten, wetenschappers, professionals, bedrijven, vormgevers, programmeurs, etc.

Door deze interessante mix van mensen is het onmogelijk om niet geïnspireerd te raken. En dat is bij mij ook zeker gelukt. Bedankt organisatie en deelnemers voor deze mooie, leerzame en inspirerende dag.

Het seminar begon in de ochtend met een aantal parallelle workshop sessies. Altijd weer lastig om te kiezen, want je kunt niet bij twee sessies tegelijk zijn. De twee sessies die ons (ik was samen met mijn collega Paul) het meest aanspraken waren die van het CBS (Edwin de Jonge over statistiek en de regels van goede visualisaties) en de inleiding D3 (Justus Sturkenboom, docent Hogeschool van Amsterdam). Maar dit zegt niets over de overige workshops, want daar waren we helaas niet bij.

Het middagprogramma bestond uit een aantal presentaties waarin verschillende mensen hun visualisaties deelden. Naast het delen van de mooie voorbeelden was er ook veel aandacht voor het proces om de visualisatie te maken.

Belangrijkste boodschap over het proces was: experimenteer! Dus zo snel mogelijk verschillende alternatieven uitproberen en (indien mogelijk) testen bij je publiek.

Één van de sprekers, Edwin de Jonge van het CBS, had naast de workshop ‘s-ochtends ook een presentatie in de middag. Hij vertelde daar over hun StatMine project. Al ben ik meestal niet positief over de data visualisaties van het CBS, wat ik over dit project heb gezien ziet er veel belovend uit.

Waren er dan geen punten van aandacht? Natuurlijk zijn die er ook. Een belangrijk gevolg van experimenteren is dat er ook mislukkingen zijn. Dit is geen enkel probleem, maar deze moeten dan wel als mislukking (h)erkend worden.

De techniek en onze creativiteit maken een hoop mogelijk, maar dat betekent niet dat het daardoor altijd beter wordt. Hierin had de organisatie (volgens mij) iets kritischer mogen zijn. Zo was er het verhaal over Interactieve Isotype. Het voorbeeld dat we kregen voorgeschoteld was een interactieve versie van het (gedrukte) origineel. Jammer genoeg was de interactieve versie zowel minder duidelijk als minder informatief dan het origineel.

Mag de inhoud ten kosten gaan van de vorm?Omdat het kan? Volgens mij niet, dus daar sluit ik me maar weer aan bij Alberto Cairo: vorm volgt functie!

Al met al een geweldige dag. Bedankt allemaal en tot volgend jaar.

 

Ik zie, ik zie, wat ik niet zie…

Het verspreiden van kennis over het visualiseren van gegevens is een belangrijke doelstelling van deze wekelijkse blog. We hopen hiermee onze bijdrage te leveren aan het verbannen van slechte visualisaties, of zoals Tufte het zo mooi samenvat: Chartjunk.

Naast deze artikelen verzorg ik ook met enige regelmaat een workshop Effectief Rapporteren. Zo’n workshop wordt bijna altijd verzorgd “op locatie”. Dit heeft als grote voordeel dat we niet alleen kunnen praten over de algemene richtlijnen en aandachtspunten, maar ook over het toepassen van de kennis op de werkelijke rapporten en dashboards van de betreffende organisatie. De deelnemers kunnen het dus direct toepassen op hun eigen werk.

Een belangrijk onderdeel van de workshop is tijdens de introductie uitleggen dat we niet zien met onze ogen, maar met onze hersenen. Dit besef is de basis van het effectief visualiseren van gegevens. Nu kan ik dit wel vertellen en uitleggen, maar het zelf ervaren is veel krachtiger en duidelijker.

Gelukkig zijn er genoeg websites beschikbaar met voorbeelden van hoe onze hersenen ons op het verkeerde been (kunnen) zetten. Op Your amazing brain… staan een aantal klassiekers, maar ook op de Nederlandse site Gissen en Missen zijn er verschillende te vinden.

Iemand die nog een stapje verder gaat is Brusspup. Hij heeft op YouTube een geweldige collectie van video’s, de ene nog spectaculairder dan de ander.

Ieder van deze voorbeelden toont wel aan dat onze hersenen een grote rol spelen bij het zien, maar wat zien we nu eigenlijk met onze ogen?

In zijn boek The Functional Art heeft Alberto Cairo een aardig voorbeeld gebruikt om dit te illustreren. In de onderstaande foto’s heb ik dit geprobeerd na te bootsen.

Van de ongeveer 180 graden zicht die onze twee ogen ons geven zijn maar 2 graden scherp en gedetailleerd (zie afbeelding 3). Dus we denken wel dat we het beeld zien zoals op de eerste afbeelding, maar in werkelijkheid zien we op een bepaald moment maar een klein onderdeel (zie afbeelding 2). De rest is wazig, maar onze hersenen vullen het beeld voor ons aan. Gelukkig vallen afwijkende zaken ook op in het wazige gebied, zodat we vanzelf ons scherpe zicht daarop kunnen richten. Vandaar dat het van belang is om context informatie niet te veel te laten opvallen en de signalen juist wel. Anders weten onze hersenen niet waar we moeten kijken.

Visualisatie voor iedereen

Voor iedereen die geïnteresseerd is in het verbeteren van data visualisaties was 2012 al een geweldig jaar. In mei was er de mogelijkheid om de driedaagse training van Stephen Few bij te wonen en in juli was Andy Kirk in Amsterdam voor een training. Voor iedereen die deze twee trainingen gemist heeft: komend jaar is er vast weer een mogelijkheid om één van deze trainingen in Nederland bij te wonen.

Vorige week schreef ik over een andere grote naam in de wereld van data visualisaties: Alberto Cairo. Ook hij geeft regelmatig data visualisatie trainingen, alleen heb ik nog niet de mogelijkheid gehad om een training van Alberto bij te wonen. Na het schrijven van mijn artikel vorige week ben ik maar op zoek gegaan naar zijn trainingsschema. Zo te zien is ook hij van plan om een training/presentatie in Nederland te verzorgen, alleen is dat pas in maart 2013.

Natuurlijk zal ik proberen er bij te zijn, maar maart is nog zo ver weg. Vandaar dat ik blij verrast was met Alberto’s blog artikel van vrijdag jl.

Hij verzorgt een 6-weekse workshop vanaf eind deze maand bij mij thuis! Niet alleen bij mij thuis, maar ook bij jou als je dat wilt. De workshop is namelijk in de vorm van een zogenaamde Massive Open Online Course of MOOC.

Het is al geweldig dat we allemaal kunnen deelnemen vanuit onze luie stoel, maar het wordt nog beter: de workshop is GRATIS!

Dit is een geweldige kans om eens en voor altijd af te rekenen met die verschrikkelijke dashboards en rapporten met slechte visualisaties die we overal maar tegen komen. Dus als je iets te maken hebt met data visualisatie: mis deze kans niet en schrijf je nu in! In de onderstaande video vertelt Alberto je meer over de workshop.

Functionele dashboard kunst

Eerder dit jaar schreef ik over het boek el arte funcional van Alberto Cairo. Op dat moment was alleen de Spaanse versie beschikbaar, maar inmiddels is ook de engelse vertaling te koop: the functional art.

Zijn benadering van infographics en informatievisualisatie is wat breder dan die van bijvoorbeeld Stephen Few. Hij gaat bijvoorbeeld ook uitvoerig in op de artistieke en emotionele kant van informatievisualisatie, welke Few al snel zal classificeren als chartjunk.

Echter, ook Stephen Few is duidelijk onder de indruk van Alberto’s boek. Hij heeft er zelfs het volgende artikel over geschreven: Here at Last, “The Functional Art”.

Wat mij direct opviel in het boek was het zogenaamde Visualisatie Wiel. Het is een handig hulpmiddel om de verschillende afwegingen in kaart te brengen die horen bij het ontwerpen van een visualisatie of dashboard.

Alberto Cairo geeft de afwegingen weer met 6 verschillende assen. Iedere as verbind twee extremen (bijvoorbeeld origineel vs. stereotiep). Vervolgens kun je per as aangeven waar je visualisatie of dashboard op de as thuishoort. Al is dit slechts een subjectief proces, het helpt goed bij het structureren van je ontwerp-overwegingen. Laten we kort de verschillende assen bekijken.

Abstract – Concreet

Bij Concreet representeer je een object zoals deze er ook in werkelijkheid uit ziet. Hoe minder de representatie lijkt op het werkelijke object, hoe meer het richting Abstract gaat. In management dashboards wordt vooral gebruik gemaakt van Abstract.

Functioneel – Decoratief

Functioneel is alleen dat tonen wat noodzakelijk is voor het communiceren van de informatie. Bij Decoratief worden ook zaken getoond die niet noodzakelijk zijn, maar slechts ter verfraaiing van het beeld dienen. Decoratief valt in de meeste gevallen onder het kopje chart junk. Informatie visualisatie binnen management dashboards zal dus vooral neigen naar Functioneel.

Dichtheid – Luchtigheid

De positie op deze as wordt bepaald door de hoeveelheid getoonde informatie ten opzichte van de gebruikte hoeveelheid ruimte. Bij complexe omgevingen zal veel informatie nodig zijn om het overzicht te verkrijgen. Dit vraagt een hoge mate van Dichtheid van het management dashboard. Echter, er zijn ook onderwerpen waarbij de hoeveelheid meevalt, waardoor Luchtigheid mogelijk is.

Multidimensioneel – Unidimensioneel

Bij deze as gaat het om twee gerelateerde variabelen: de mogelijkheden om te navigeren door de verschillende niveaus van gegevens (bijv. drillen) en de verschillende manieren (grafiek- en tabelvormen) om dezelfde informatie af te beelden. Aangezien een belangrijke functie van een management dashboard het drillen is is hier de voorkeur duidelijk voor Multidimensioneel.

Origineel – Stereotiep

Als de visualisatie gebaseerd is op een bekend grafiektype (bijv. staaf- of lijngrafiek) is er sprake van Stereotiep. Echter, als de visualisatie zelf nieuw is voor de lezer is het Origineel. Aangezien we bij een management dashboard de kortst mogelijke route naar het antwoord willen ondersteunen heeft Stereotiep hier de voorkeur.

Noviteit – Redundantie

Een visualisatie kan een gegeven slechts één keer tonen (Noviteit), of meerdere keren op verschillende manieren (Redundantie). Voor een management dashboard zijn beide goed bruikbaar.

Inmiddels heb ik het Visualisatie Wiel al een paar keer toegepast tijdens het ontwerpen van een dashboard of rapport. Het heeft mij in ieder geval geholpen de verschillende overwegingen en keuzes te structureren. Wat denken jullie hiervan? Ik kijk uit naar jullie input en reacties op onze Linkedin pagina.

 

Management dashboard: technologie of kunst?

Bij het ontwerpen van een management dashboard maak ik veel gebruik van draadmodellen. Op basis van de eisen en wensen bepaal ik hoe het dashboard er uit moeten gaan zien en teken vervolgens voorbeelddashboards in een tekenprogramma.

Door deze werkwijze kan ik in een heel vroeg stadium de management dashboards laten zien en bespreken met de betrokkenen. Deze tekeningen of draadmodellen noem ik meestal een “artist’s impression”, maar ik zie mijzelf zeker niet als artiest of kunstenaar. De tekeningen zijn volgens mij geen kunst, maar eerder (technische) ontwerpen gemaakt door een ontwerper.

Volgens mij is een belangrijk verschil tussen kunst en technologie dat bij kunst de vorm belangrijker is dan de functie, maar bij technologie is dit precies andersom: form follows function.

Op dit moment ben ik het boek “the functional art” van Alberto Cairo aan het lezen1. Hij beschrijft het werkgebied van de informatievisualisatie als een vorm van functionele kunst. Het is volgens hem geen technologie of kunst, maar een combinatie van die twee. Volgens hem is het dus eerder: “function restricts form”.

Ik kan me goed vinden in zijn conclusie: begin bij de functie en gebruik de ruimte van de functie voor mooie vorm(-geving). Dit komt goed overeen met de valkuilen in dashboardontwerp van Stephen Few zoals besproken in het artikel van vorige week. De eerste twaalf valkuilen gaan over functie, maar de laatste valkuil duidelijk over vorm: voorkom onaantrekkelijk ontwerp. Hiermee krijgt de “artist’s impression” voor mij een andere betekenis: ben ik toch ook nog een beetje kunstenaar.

1Alberto Cairo is nog bezig met het vertalen van zijn boek uit het Spaans naar het Engels. Hij verwacht het boek deze zomer in het Engels uit te brengen. Dus iedereen die Spaans spreekt kan het direct lezen (titel: “el arte functional”), de rest zal helaas nog een paar maanden moeten wachten.