Connexion
/ Inscription
Mon espace
Initiatives
ABONNÉS
Partager par Linked-In
Partager par Xing
Partager par Facebook
Partager par email
Suivez-nous sur feedly

[Initiative] Un multiplicateur de ressources pour les contributeurs individuels en Data

L'ELT automatisé : un multiplicateur de ressources pour les contributeurs individuels en Data

Pour être efficaces, les analystes ou ingénieurs data en solo doivent se concentrer sur le perfectionnement des algorithmes et l'analyse des données, et non sur la construction de pipelines de données.

Il n'est pas exagéré de dire que presque toutes les entreprises du monde se trouvent à un certain stade de la transformation numérique. Nombre d'entre elles sont encore en train d'élaborer leurs stratégies en matière de données, de chercher la meilleure façon de construire des pipelines de données fiables et de déterminer comment tirer parti d'une multitude de nouveaux outils pour générer de la valeur à partir des quantités de données qu'elles possèdent.

Cette démarche peut s'avérer décourageante, même pour les plus grandes entreprises. Mais qu'en est-il si vous êtes une petite entreprise ou une startup en plein développement, avec peu d'argent, de temps et de ressources ? Il se peut que toute l'équipe chargée des données soit constituée d'une seule et même personne. Dans ce cas, il est extrêmement difficile de justifier la création de pipelines de données à partir de zéro et leur maintenance en interne.

Tirer le meilleur parti de ressources réduites

Pour commencer, la création d'un pipeline de données est un processus notoirement intensif en main-d'œuvre qui peut prendre des mois. L'analyste ou l'ingénieur isolé devra probablement consacrer beaucoup de temps à l'obtention de l'accès aux sources de données, à la conception de schémas ou de modèles de données et à l'élaboration de cadres de connexion. La construction de pipelines de données en interne alourdit le travail de développement des entreprises au fur et à mesure de leur croissance. Chaque fois qu'une entreprise ajoute une nouvelle source d'information, elle doit créer un autre connecteur, ce qui implique davantage de codage.

Les demandes de maintenance représentent également beaucoup de travail pour les entreprises qui construisent leurs propres connecteurs. Les modifications d'API et de schémas doivent être suivies, puis mises à jour manuellement. N'oubliez pas que les entreprises d'aujourd'hui ajoutent constamment des sources de données, ce qui accroît la complexité. Lorsque les pipelines de données se brisent, c'est à l'équipe de données composée d'une seule personne de prendre un temps rare pour les réparer.

Les entreprises qui utilisent une solution prête à l'emploi peuvent ajouter de nouvelles sources de données en quelques étapes, ce qui leur permet d'être plus agiles et d'évoluer facilement. La collecte de données est relativement facile. Ce qui différencie les programmes de données les plus efficaces, la capacité à intégrer les informations dans l'ensemble de l'entreprise pour éclairer les décisions quotidiennes.

Pour les entreprises à court de ressources, le fait de consacrer le seul analyste ou ingénieur data du personnel à la construction ou à la réparation de pipelines défectueux signifie que l'employé y passe un temps précieux quitte à négliger ce qui compte le plus à savoir affiner les algorithmes, analyser les données et générer le genre de renseignements qui aident les entreprises à trouver l’équilibre produit-marché, à obtenir du financement et, en fin de compte, à croître.

Il est important de se rappeler que l'intégration de données est difficile à construire et à gérer. Elle exige beaucoup de codage et d'expertise.

Lire la suite...


Articles en relation