Le pôle data accompagne une direction métier souhaitant s’équiper à courte échéance d’outils de BI dans l’intention de piloter son activité. Une équipe de 8 personnes est mobilisée. Différents profils constituent l’équipe (Project Manager, Business Data Analyst, Analytic Engineer) dont les niveaux d’expérience varient (apprentis, personnes en changement de poste récent, profils seniors et juniors).
La qualité des livrables attendue est élevée : l’ensemble de produits doivent être cohérents, en termes de design technique et design d’interface, et soutenus par une chaîne de valeur data robuste et réemployable par d’autres projets.
Qui plus est, les enjeux du projet sont centraux pour la stratégie de la direction métier.
Le Framework du projet BI&A élaboré par l’équipe Transformation Data a fourni une base de travail adaptable au contexte de ce projet. Les incontournables d’un projet de Business Intelligence y sont listés par ordre chronologique :
Analyse du besoin métier
Maquettage de la solution de datavisualisation
Conception de la solution data
Déploiement et Industrialisation de la solution
Amélioration continue
Une fois les grands principes du framework énoncés, nous avons déployé chez notre client une panoplie de pratiques et d’outils pour assurer la coordination de l’équipe projet aux compétences et expériences hétérogènes:
1. Un point d’équipe pour favoriser la circulation d’information, le partage de bonnes pratiques et la montée en compétence :
Une revue de espace de développement en séance
Une communication des data engineers
Un rappel et réajustement des objectifs de développement à moyen terme
Un suivi d’action transverse
La présentation d’un modèle de donnée par un des développeurs
La présentation par un membre volontaire d’un sujet au choix (technique de visualisation, culture informatique, organisation du travail, …)
2. Des communications internes projet et externes via des canaux dédiés pour impliquer les partenaires du projet (sponsors et utilisateurs)
via une landing page Sharepoint avec lien vers les contenus de ref (EB, Note de cadrage, …) pour les sponsors et parties prenantes métiers
via des Canal teams dédiés en fonction des types de communications (incidents et succès, mise à jour de rapports, questions à la communauté utilisateur)
3. Des supports pédagogiques pour vulgariser l’environnement technique et diffuser les bonnes pratiques de datavisualisation à tous les membres de l’équipe
4. Un stockage de la documentation projet avec des arborescences de dossier imposées et une nomenclature projet pour le nommage de fichier
Bénéfices
Le projet aboutit à la mise en production d’outils de pilotage de l’activité de la direction métier, et ce en respectant les délais et le budget annoncés pendant la phase de cadrage.
Les pratiques mises en place et adoptées au sein de l’équipe ont fortement contribué au succès de ce projet, et profitent au-delà de celui-ci. En effet, la communication projet interne et externe, ainsi que la structuration de la documentation ont permis de :
Faire foisonner les idées et ainsi proposer des produits complémentaires qui répondaient à d’autres besoins de la direction métier;
Accélérer le développement et d’améliorer la qualité des produits;
Assurer la transmission de l’ensemble des responsabilités de maintenance des outils en production sur un membre interne à l’organisation, et ce de manière naturelle ;
Garantir l’insertion des produits dans les processus existants.
De plus, on peut noter que les produits data et les documents projet ont pu être exploités par d’autres projets alors même que le projet n’était pas terminé.
Finalement, en fin de projet les alternants membres de l’équipe étaient autonomes pour interpréter un besoin métier et le retranscrire en un développement dans l’outil de datavisualisation.
Autres Success Stories qui pourraient vous intéresser
La dataviz périodique est une publication qui a pour objectif de mettre en évidence les bonnes pratiques et les écueils à éviter en matière de data visualisation (aussi appelée dataviz). A chaque publication, nous vous proposons de décrypter un nouveau sujet et un exemple de dataviz pour comprendre les ficelles de la réussite en datavisualisation.
Dans cette édition, nous aborderons le thème des biais de perception en dataviz et nous verrons comment les limiter en prenant exemple sur une publication du Monde : lien vers la dataviz.
Visuel extrait de l’article du Monde présenté en introduction (lien vers l’article)
Si vous souhaitez aborder un sujet complexe, comme celui du Monde qui s’attache à expliquer le positionnement des députés par rapport à la majorité de l’Assemblée nationale, il est nécessaire de porter une attention particulière au type de graphique utilisé.
Une pratique courante est de proposer une vision moyennée d’un phénomène mesurable sur un groupe (e.g. individus, produits) séparé en catégories (e.g. taille, lieu) en utilisant un graphique en barre. Ce type de visuel a l’avantage de comparer les sujets simplement et de donner l’impression de pouvoir appréhender la réalité d’un coup d’œil.
Or ce n’est qu’une impression. La plupart du temps, nous ne nous rendons pas compte du biais de perception qu’induisent les graphiques en barre en gommant les disparités présentes au sein de chaque catégorie (ou barre du graphique).
Dans son article publié sur Data Visualisation Society, Eli Holder explique l’importance de réintroduire de la dispersion dans la dataviz afin de ne pas créer ou confirmer des stéréotypes. [1]
Le stéréotype est une tendance naturelle, souvent inconsciente, qui consiste à penser aux individus en termes d’appartenance à leur groupe social. C’est une façon pratique et utile de réduire la complexité du monde qui nous entoure. Par exemple, au moment de visiter une ville que nous ne connaissons pas, nous pouvons nous adresser à un officier de police ou à un chauffeur de taxi pour demander notre direction, en partant du présupposé que ces personnes seront à même de détenir l’information. [2]
Cependant, il n’est pas opportun d’encourager cette tendance naturelle quand nous concevons des dataviz, en particulier quand le sujet est complexe et appelle une prise de décision éclairée et réfléchie.
Dans le cas du sujet traité par le Monde, il aurait été possible de représenter l’adhésion au texte de la majorité non pas par député mais par parti politique. Or une représentation en graphique en barre du taux d’adhésion moyen des parlementaires par parti politique aurait renvoyé une illusion de similarité au sein des différents partis et aurait amené mécaniquement le lecteur à penser (cf schéma ci-dessous) : « Le parti politique A vote davantage en faveur des textes portés par la majorité que le parti politique C. Donc tous les députés du parti politique A sont plus proches de la majorité que tous les députés du parti politique C. »
Schéma illustratif réalisé à partir de données fictives (toute ressemblance avec des éléments réels serait fortuite)
Pour casser ces biais de perception, il est possible d’introduire de la dispersion dans nos dataviz et ainsi mieux refléter la complexité de la réalité. Des visuels tels que le nuage de point (Scatter Plot) ou le Jitter Plot sont de bonnes alternatives aux graphiques en barre ou histogrammes.
Dans la dataviz du Monde, le nuage de points a été judicieusement choisi pour montrer le positionnement de chaque député. Cette représentation permet par ailleurs de croiser le taux d’adhésion des députés avec leur niveau de participation aux scrutins étudiés. Cela permet de calculer un indice de proximité plus complet et d’éclairer le sujet avec un nouvel axe d’analyse.
Le lecteur est alors moins tenté de confondre le positionnement des députés avec celui des partis politiques pour le comprendre, et donc moins enclins à faire des préjugés.
Visuel extrait de l’article du Monde présenté en introduction (lien vers l’article)
En définitive, nous observons à travers l’exemple du Monde, qu’il est parfois nécessaire d’introduire de la dispersion dans les représentations visuelles pour traiter un sujet complexe.
Les nuages de points et autres diagrammes de dispersion, permettent au lecteur d’appréhender un phénomène à la maille la plus fine et de limiter la création ou l’entretien de stéréotypes. Le lecteur est alors plus à-même de prendre du recul par rapport au sujet traité et de développer un point de vue éclairé quant au phénomène étudié.
De manière plus générale, Eli Holder propose d’élargir notre conception de la “bonne dataviz” et d’aller au-delà de la représentation claire, accessible et esthétique. Il est nécessaire de prendre en compte sa responsabilité, en tant que créateur de dataviz, vis-à-vis de son public et du sujet traité. Il est essentiel de porter une attention particulière aux visuels choisis pour minimiser les interprétations inexactes, et par extension, la création de stéréotypes.