Par Stéphane Dulor, VP France et Afrique du Nord chez Dynatrace.
Pour identifier les causes et les effets sous-jacents d’un événement ou d’un comportement, certaines organisations continuent à s’appuyer sur une approche basée sur le principe de corrélation. Une approche traditionnelle qu’elles doivent aujourd’hui dépasser, afin de favoriser une meilleure automatisation DevOps.
C’est là que l’IA causale entre en scène.
Les organisations doivent aujourd’hui résoudre des problèmes humains de plus en plus complexes, qui rendent plus importantes que jamais les avancées réalisées en matière d’intelligence artificielle (IA). Les approches et les plateformes d’analyses conventionnelles de data science sont capables de prédire la corrélation entre un événement et ses origines potentielles. Mais elles ne parviennent en revanche pas à comprendre pourquoi un événement se produit. C’est à ce titre que l’IA causale, aussi appelée IA déterministe, joue un rôle crucial.
IA de corrélation vs. IA causale : quelles différences ?
La plupart des approches AIOps utilisent des analyses prédictives qui consistent à appliquer des algorithmes et du machine learning à des données historiques afin de présumer des événements futurs. On parle ici, par exemple, d’un pic de CPU susceptible de se transformer en panne système.
Les analyses prédictives peuvent ainsi observer un événement et prédire qu’un effet se produira. Mais elles ne sont pas capables de démontrer que cet effet est le produit direct de l’événement observé. Et c’est cet angle mort entre la cause et l’effet qui peut conduire à des interprétations biaisées et de mauvaises prises de décisions.
En d’autres termes, corrélation n’est pas synonyme de causalité.
L’IA causale, quant à elle, est capable de déterminer avec exactitude la cause sous-jacente d’un événement et sa relation précise avec l’effet produit. Là où l’IA basée sur la corrélation s’appuie sur des statistiques pour formuler des hypothèses sur ce qu’il se passe, l’IA causale peut tracer et expliquer avec précision ce qui se produit à chaque étape, à partir de données contextuelles spécifiques. Les organisations peuvent ainsi utiliser les frameworks et les algorithmes d’IA causale pour poser des questions et avoir une compréhension approfondie de leurs cas d’usage CloudOps, DevOps et SecOps. Des questions telles que :
- Pourquoi les clients ne vont-ils pas au bout de leur commande ?
- Qu’est-ce qui incite les clients à se désabonner ?
- Pourquoi cette application est-elle lente à certaines heures de la journée ?
L’approche déterministe de l’IA causale peut déterminer la relation de cause à effet des événements à partir d’une combinaison de métriques, de traces et de logs, ou encore de données relatives au comportement des utilisateurs. Les équipes peuvent donc immédiatement résoudre les incidents pour prévenir toute interruption de service et permettre à une organisation de rester conforme à ses accords de niveaux de service.
Les modèles de machine learning basés sur la corrélation s’avèrent utiles pour des scénarios tels que reconnaissance faciale, shopping personnel, ou encore maintenance prédictive. Ils peuvent également aider une organisation à mieux gérer ses ressources et à améliorer son temps de réponse aux incidents.
Mais les limites de ces modèles deviennent évidentes lorsque les équipes doivent déterminer la façon dont une action affecterait un résultat. Les modèles prédictifs peuvent identifier la probabilité que certains événements positifs ou négatifs se produisent, mais ils ne peuvent pas expliquer comment ils sont arrivés à cette prédiction. Ils ne peuvent pas non plus identifier les facteurs sous-jacents et les relations de cause à effet. Contrairement à l’IA causale qui peut expliquer comment elle est parvenue à une conclusion donnée.
Comment l’IA causale fonctionne-t-elle ?
L’IA causale fonctionne en deux étapes. Tout d’abord, elle collecte les informations et découvre les problèmes au sein d’un ensemble de données. Puis, elle recherche les relations causales qui peuvent expliquer ces problèmes en utilisant un plan élaboré à partir des données collectées.
Pour mieux comprendre le fonctionnement de l’IA causale, il faut d’abord comprendre l’analyse de l’arbre de défaillances. Car contrairement à l’IA basée sur la corrélation, qui calcule des probabilités à partir de données statistiques, l’IA causale utilise l’analyse de l’arbre de défaillances, une méthodologie d’arbre de défaillances basée sur les données, utilisée pour analyser des causalités. L’analyse de l’arbre de défaillances utilise la logique booléenne pour explorer les défaillances au niveau du système. C’est une approche descendante permettant d’identifier une défaillance au niveau d’un composant – ou événement basique – qui est l’origine d’une défaillance système – ou événement majeur.
Une IA causale utilisant l’analyse de l’arbre de défaillances fonctionne ainsi :
- Elle définit le périmètre du système et ce qui est considéré comme une défaillance.
- Elle définit les défauts de niveau supérieur et le point de départ de l’analyse avec les détails de la défaillance.
- Elle identifie les événements déclencheurs qui peuvent être à l’origine du défaut de niveau supérieur, que ce soit un événement isolé ou une combinaison d’événements simultanés.
- Elle trouve les root causes de chaque événement déclencheur et de leur séquence.
- Elle analyse l’arbre de défaillances en recherchant les événements qui conduisent à la défaillance ou sont les plus susceptibles de faillir.
Cette approche systématique apporte un degré de certitude qui permet aux équipes de comprendre comment minimiser les risques de défaillances, de mieux prendre en charge les améliorations du système, et d’automatiser les résolutions.
Grâce à son approche déterministe, l’IA causale fournit les fondations parfaites pour automatiser les réponses et former la base pour des recommandations fiables issues des technologies émergentes d’IA générative.