Si la #Data est le pétrole du XXIème siècle, c’était sûrement… le charbon du début du XXème siècle. L’almanach Hachette de1923 présente un graphique avec les réserves de charbon estimées dans les différents pays producteurs. Contraints au noir et blanc par les procédés d’impressions, l’illustrateur a eu cette idée géniale de représenter les données sous formes de … tas de charbon !
Cette petite #Dataviz de 1923 montre que l’art de présenter les données de manière originale parlante pour le grand public s’est peut être quelque peu perdu en route.
Je me demande dans un premier temps comment ice graphique a été généré… sans Excel et même sans outil de calcul pour générer le dessin. En même temps, on voit bien qu’un outil comme Excel, s’il est puissant et permet de créer très rapidement une représentation d’un jeu de donnée, nous enferme quelque peu dans un nomble limité de types de graphique standards et certainement moins imagés que ces tas de charbon.
Reconstruction numérique :
Première expérience : peut-on reproduire ce document scanné avec Excel ? Un coup de Web Plot Digitizer (un outil pour extraire manuellement un dataset à partir d’une image de courbe) et quelques trafficotage plus tard, et voilà le résultat, directement tiré d’Excel :
Pour les curieux, j’ai utilisé WhatTheFont pour identifier une fonte proche de la police de caractère employée par les illustrateurs de l’Almanach Hachette. En l’occurence, j’ai utilisé Gorilla Black et je suis assez fier du résultat. Par contre les motifs de remplissage n’ont plus ce naturel irrégulier du dessin d’origine, pour lequel les remplissages ont manifestement été tracés à la main.
Questions existentielles de #DataViz :
Mais le naturel de « data scientist » revient vite, et je me rends compte que le travail de notre illustrateur de 1923 n’est pas vraiment rigoureux : en effet, si le tas de charbon représente la réserve, l’aire de chaque tas de charbon devrait être à peu près proportionnelle à la donnée qu’elle représente. Maintenant que j’ai mon graphique dans Excel, facile de le modifier pour que l’aire de chaque tas soit strictement proportionnelle à la réserve de charbon qu’elle représente. Dans cette version, les Etats-Unis et le reste du monde (ROW) détiennent visiblement plus de réserves que dans la version d’origine, et la France, elle, semble en avoir beaucoup moins…
A ce stade, mon naturel de « physicien » me secoue un peu : un tas de charbon, c’est un volume, pas une aire ! Du coup, si on mettait réellement en tas le charbon de ces reserves mondiales, la vue de côté ne serait peut-être pas du tout celle-là ! Un petit peu de recherche sur le volume d’un cône de révolution, forme approximative de nos tas.
Le volume d’un cône de révolution est égal à un tiers de l’aire de sa base, multiplié par la hauteur H du cône. L’aire de la base du cône de rayon r est égal à π x r². Le volume V d’un cône de révolution de rayon r et de hauteur H est donc :
V = π r² H / 3 = π S H / 3 (où S est l’Aire de sa section)
Je reprends mon fichier Excel, et je crée un petit « générateur de tas » représentant la section 2D d’un tas irrégulier de volume proportionnel à la quantité de charbon à représenter. Le plus dur est de garder ce petit côté « irrégulier » qui fait le charme et le pouvoir évocateur de la figure d’origine tirée de l’almanach Hachette.
Avec ce « générateur de tas » sur Excel, j’obtiens finalement une figure encore plus lointaine de la figure originale.
Notre illustrateur de 1923 travaillait donc de manière intuitive et ne cherchait pas vraiment à représenter ses données de manière rigoureuse !
Passons maintenant au monde « moderne »
On peut donc maintenant comparer cette figure en Noir et Blanc avec une figure équivalente issue de notre monde moderne. Celle-ci est tirée du passionnant blog de Jean-Marc Jancovici et représente les réserves prouvée de charbon en 2013.
J’utilise maintenant mon « générateur de tas » pour représeter ces mêmes réserves de 2013, à la mode de mon graphique de 1923.
Si la figure « en tas » me semble infiniment plus parlante et intuitive, elle souffre cependant d’un défaut important : il est bien entendu impossible d’y reporter une échelle (rappelez-vous on représente des volumes 3D), et il est donc assez difficile au lecteur de faire des comparaisons précises entre deux pays. Dans la version « en histogrammes », un coup d’oeil sur le delta entre deux pays se fait très simplement en regardant leur écart sur l’échelle verticale.
Il reste que pour bien saisir ce que peut représenter 600Gt de charbon, rien ne vaut une comparaison avec quelque chose que l’on connaît. Compte tenu de la masse volumique du charbon (environ 1,4), ces réserves mondiales de 600Gt de charbon représentent un cube d’environ 7,5km de côté. Pour extraire le charbon utile, les mines générent à peu près dix fois le volume de charbon extrait en « stériles » (pierre, roches, résidus ne contenant pas ou pas assez de charbon – ce sont eux qui forment les terrils du Nord de la France).
On peut donc maintenant représenter en 3D ce volume… positionner sur la région parisienne, pour donner une échelle. A gauche en noir le volume des réserves mondiales de charbon, à droite, en ocre, le volume de stérile qui seront extraits du sol si on extrait tout le charbon. A titre personnel, avant de commencer cet effort de visualisation, je n’avais aucune idée de la taille qu’aurait ce cube…
Cohérence des données de 1923 et celles de 2013 ?
Un dernier point me turlupine : les données de 1923 sont-elles cohérentes avec les données de 2013? L’Almanach Hachette indique des réserves mondiales pour un total de 7 270 000 millions de tonnes de charbon (7 200 000 Mtec).
Les chiffres 2013 tirés du Blog de Jean-Marc Jancovici indiquent des réserves de l’ordre de 420 Gtep, soit environ 600Gtec (une tonne équivalent charbon ≈ 0,7 tonne équivalent pétrole), ou encore 600 000 Mtec pour des charbons de type Hard coal (Anthracite et Bitumineux) et Brown Coal (Sub-bitumineux et Lignite). Les chiffres de Wikipedia sont plus récents : fin 2020 on estime ces réserves à 1074 Gt.
Les réserves estimées en 1923 étaient donc près de 7 à 10 fois plus grande que celles que nous connaissons aujourd’hui. La différence pourrait en théorie s’expliquer par plusieurs facteurs : les estimations 1923 étaient peut-être erronnées ou faites avec une méthode différente; on a découvert quelques réserves depuis 1923 et on a consommé beaucoup de charbon depuis 1923 ! Sur ce dernier point, un rapide tour sur les bases de données du shift project nous donnent une idée. On a consommé environ 220 000 Mtec entre 1923 et 2013, ce qui ne suffit pas à expliquer la différences des estimations 1923 et 2013. Sur ce point le mystère reste entier.
Retour de ping : Yearbook 2022 perso - Nicopedies