"L’analyse de Loïc Besnard, Director of Product
Marketing & Head Technology Evangelist chez EasyVista
Dans la gestion des
services informatiques (ITSM), les interruptions de services se traduisent le
plus souvent par des pertes graves pour l'entreprise. Rapidement identifier «
la root cause » (cause profonde) d’un incident permet pourtant à l’organisation
d’améliorer les processus de gestion des incidents et des problèmes. ITIL
(Information Technology Infrastructure Library) décrit la Root Cause Analysis
(analyse des causes profondes) comme un processus destiné à découvrir les
problèmes sous-jacents. Explications.
Qu'est-ce que la Root
Cause Analysis ?
Il s’agit d’une
méthodologie utilisée pour déterminer en profondeur les causes des incidents et
des problèmes au sein d'un environnement informatique. Contrairement aux
correctifs qui traitent simplement des symptômes, la Root Cause Analysis vise à
prévenir leur récurrence, améliorant ainsi la fiabilité globale du système.
3 méthodologies de la
Root Cause Analysis
1/ Analyse par arbre de
défaillances (Fault Tree Analysis)
Cette approche utilise
une structure arborescente pour représenter visuellement les causes
potentielles d'un incident. Cette méthodologie, développée à l'origine par H.
Watson et A. Mearns dans les laboratoires Bell, est maintenant utilisée par des
entreprises des secteurs de l'aérospatiale, de la chimie et des logiciels
informatiques pour déterminer la fiabilité des événements. En les décomposant
systématiquement en facteurs contributifs, ce procédé aide à identifier la
cause profonde (le résultat indésirable est considéré comme la racine de
l'arbre logique) et ses dépendances. L'arbre des défaillances est généralement
rédigé à l'aide de symboles de portes logiques. Les symboles de base utilisés
dans l’analyse sont des événements, des portes et des symboles de transfert.
2/ La méthode des « 5
pourquoi »
La méthode des « 5
pourquoi » repose sur un principe simple : se demander plusieurs fois
« pourquoi » avec l’idée de remonter à la source initiale des problèmes.
Celle-ci encourage les équipes informatiques à aller au-delà des explications
superficielles et à découvrir les causes plus profondes. Cela aide également à
éviter les suppositions et à se concentrer sur ce qui s’est (réellement)
passé.
Exemple :
Question 1 : Pourquoi l'application s'exécute-t-elle
lentement pour les utilisateurs ?
Réponse : Le serveur
hébergeant l’application surmène le processeur.
Question 2 : Pourquoi l’utilisation
du processeur est-elle si élevée ?
Réponse : Il y a une
augmentation soudaine du nombre de connexions d’utilisateurs simultanées.
Question 3 : Pourquoi y a-t-il
une augmentation du nombre de connexions d’utilisateurs ?
Réponse : Une nouvelle
campagne marketing lancée sans intervention informatique.
Question 4 : Pourquoi le service
informatique n'était-il pas au courant de la campagne ?
Réponse : Il y a un manque
de communication entre les équipes.
Question 5 : Pourquoi y a-t-il un
manque communication ?
Réponse : Il n’existe aucun processus formel pour
l’analyse de l’impact du projet.
Cela reste une approche
informelle mais sans elle, dans le cas présent, les techniciens auraient essayé
de gérer le problème de surmenage du processeur sans véritablement chercher à
comprendre pourquoi cela se produit en premier lieu, compliquant ainsi l’identification
de la cause première et de sa résolution.
3/ Diagramme d'Ishikawa
(arête de poisson)
Le diagramme d'Ishikawa
- également connu sous le nom de diagramme de cause à effet - classe les causes
potentielles d'un incident en grands groupes, tels que les personnes, les
processus, la technologie et l'environnement. Cet outil visuel facilite l'analyse
collaborative et la résolution holistique des problèmes.
Comment l'utiliser ?
- Commencez par placer le problème
au milieu du diagramme (la colonne vertébrale du squelette du poisson)
- Réfléchissez à plusieurs catégories
de causes (placées dans les branches émanant de la ligne principale, les arêtes
du poisson)
- Regroupez les catégories et
divisez-les en parties plus petites
- Creusez plus profondément pour
trouver les causes et les causes sous-jacentes et pour vous rapprocher de la
racine du problème en question
- Éliminez les catégories non
liées et identifiez les facteurs corrélés, c'est-à-dire, les causes racines
Comment mettre en place
des processus d’analyse efficaces ?
La mise en place de
processus d’analyse des causes profondes efficaces pour la gestion des services
informatiques facilitera le diagnostic et la résolution de bon nombre de
problèmes IT de manière proactive, ce qui permettra à chaque entreprise de
réduire ses coûts. Les trois étapes ci-dessous donnent un aperçu des bonnes
pratiques à suivre dans cette optique :
1. Mettre en place des procédures claires : Assurez-vous de
décrire les rôles et les responsabilités au sein de l'équipe et d'établir des
critères précis pour prioriser les incidents en fonction de leur impact et de
leur fréquence.
2. Encourager la
collaboration :
partagez toutes les informations, sans restriction, entre les équipes pour
obtenir des perspectives et des idées diverses.
3. Documenter les résultats : Ce référentiel servira de ressource précieuse et facilitera l’apprentissage organisationnel.