Les conseils d’Irina Slavitch, Experte en data integration, chez Fivetran
Les données peuvent apporter de la valeur sur le plan informationnel ou opérationnel, et la différence est essentielle pour comprendre les résultats de votre équipe.
Le sujet du retour sur investissement (ROI) est omniprésent au sein des équipes de données aujourd'hui. Ces équipes peuvent rendre votre organisation plus décisive et plus efficace. Les équipes data facilitent le travail des autres équipes au sein de l’entreprises et leur travail devrait donc être pris en compte lors du calcul du retour sur investissement de chaque activité de l’entreprise. Mais comment ce ROI peut-il se traduire par une feuille de route pour le recrutement et la constitution d'équipes ?
Evaluer une équipe de données
Les données peuvent apporter de la valeur sur le plan informationnel et opérationnel. La valeur informationnelle est constituée par les idées que vous tirez de vos données. La valeur opérationnelle, quant à elle, est la valeur que vous obtenez lorsque les données sont là où elles doivent être et dans l'état approprié.
La valeur de cette information peut être difficile à mesurer :
- Y a-t-il des temps d'arrêt et si oui, de combien ?
- À quelle vitesse les bugs sont-ils résolus ?
- À quelle vitesse les nouvelles fonctionnalités sont-elles livrées ?
Cependant, tout comme la valeur informationnelle, elle n'a de valeur que si elle est utilisée :
- A quoi sert un pipeline de données stable et sans bug s'il n'alimente pas les prises de décisions de votre entreprise ?
Pour les équipes de modern data, ces deux valeurs vont de pair. Certains membres de l'équipe comme un data engineer peuvent être plus axés sur la valeur opérationnelle tandis que d'autres comme un data analyst sont plus axés sur la valeur informationnelle, mais les deux sont nécessaires. Cette division peut servir de cadre pour mesurer les résultats de votre équipe de données. Votre plus grande force est-elle opérationnelle ou informationnelle ? Et votre plus grande faiblesse ?
Maintenir et étendre la valeur des données
La fourniture d'informations et la prestation opérationnelle sont axées sur les résultats, mais le deuxième élément majeur d'une équipe de données performante est sa capacité à maintenir et à étendre ces résultats. Tout comme les équipes logicielles, une équipe de modern data se projette dans l’avenir. Les équipes de données créent des pipelines pour répondre aux questions d'aujourd'hui, mais tout cela ne sert à rien si le système s'effondre demain. Les pipelines de données solides peuvent être décrits par trois attributs simples : inspectabilité, maintenabilité et extensibilité.
Les pipelines de données inspectables sont faciles à comprendre, et pas seulement par leurs créateurs. La lisibilité est une priorité dans les systèmes inspectables, et s'il est important que les systèmes soient performants, il est encore plus important qu'ils soient compréhensibles. Les pipelines inspectables sont clairement documentés et sont organisés de manière réfléchie. Les data engineers doivent créer un code de connecteur de données personnalisé avec des commentaires et des noms de fonctions sensés. Les data analysts doivent créer des tableaux de bord et des visualisations avec des conventions de dénomination solides et une organisation adaptée à l'entreprise.
Les pipelines maintenables sont modulaires, testés et vérifiés. Les temps d'arrêt et la dette technologique sont deux préoccupations majeures lorsque l'on parle de maintenabilité : comment concevoir votre pipeline pour éviter les deux ? L'inspectabilité est un excellent point de départ, mais la modularité est l'étape suivante. Les pipelines modulaires sont plus rapides et plus simples à mettre à jour, et se prêtent souvent bien aux tests en raison de leur conception plus simple. Les composants individuels peuvent alors être testés et vérifiés selon les besoins, qu'il s'agisse de tests automatisés sur le code ou de tests d'acceptation par l'utilisateur sur un tableau de bord.
Les pipelines extensibles s'adaptent facilement au changement. Ils suivent des règles de conception solides qui permettent d'ajouter facilement de nouvelles fonctionnalités : c'est ainsi que les choses sont nommées, testées, organisées... L'extensibilité s'appuie sur l'inspectabilité et la maintenabilité, mais elle met davantage l'accent sur la réalité de l'évolution des besoins de l'entreprise. Votre code d'ingestion fonctionnera-t-il correctement si l'API change ? Votre tableau de bord fonctionnera-t-il correctement si les indicateurs clés de performance sont redéfinis ?
Les équipes data fournissent une valeur informationnelle et opérationnelle, qui dépendent de pipelines de données inspectables, maintenables et extensibles. Ces deux cadres seront traités par les différents membres de l'équipe de modern data et apporteront chacun une valeur différente. Le premier cadre vous aide à comprendre et à classer les résultats, une mesure commune du succès tandis que le second aide à mettre l'accent sur l'utilité future de votre pipeline ; une mesure beaucoup plus difficile à cerner.