Drew Golden, Directeur de la gestion des produits
Dans le secteur informatique, nous comprenons qu'une augmentation de l'automatisation et du machine learning (ML) permettra aux opérations informatiques de passer au niveau supérieur. De nombreux fournisseurs sont impatients de sauter le pas entre le service et la valeur, comme illustré dans le graphique Gartner ci-dessous. L'automatisation est véritablement le seul moyen d'y parvenir.
La clé d'un centre d'opérations réseau sain et efficace est la fluidité du flux d'informations qui mène à une solution automatisée, avant qu'un client ne ressente même l'impact d'une panne.
Cependant, de nombreux centres NOC font l'objet de frictions internes qui se propagent vers le client et reviennent via des tickets et des appels mécontents. Pourquoi ? Il y a quelques raisons communes :
Chez Federos, nous ne comprenons que trop bien ces problèmes (ayant nous-mêmes l'expérience d'un centre d'opérations réseau), c'est pourquoi nous avons créé une solution d'assurance de services holistique et unifiée, Assure1®.
Avant de nous pencher sur la solution à ces problèmes, nous devons examiner de plus près comment nous, et le secteur d'activité dans son ensemble, envisageons l'automatisation.
Lorsqu'il s'agit d'automatisation, l'objectif ambitieux est de parvenir à un centre d'opérations réseau entièrement automatisé. On peut imaginer un environnement entièrement virtualisé qui fonctionne seul, avec peu ou pas d'intervention humaine.
Est-ce possible ? L'avenir semble aller dans ce sens, mais nous savons que l'état actuel et du futur proche n'en est pas encore tout à fait là.
En réalité, seulement 10 à 15 % du travail peuvent être entièrement automatisés. Les 85 à 90 % restants comptent toujours sur les humains pour l'exploitabilité.
Pourquoi ? La plupart des centres d'opérations réseau disposent d'équipements hérités, d'équipements et de technologies modernes et de systèmes virtualisés (où tout se trouve dans le cloud). Ces outils ne sont pas seulement séparés, mais ils ne communiquent pas, ce qui oblige le personnel des centres à jongler entre différents environnements. Il existera peut-être un monde où presque tout est virtualisé et entièrement automatisé, mais ce n'est qu'un objectif ambitieux pour le moment.
Le NOC a besoin de processus qui automatisent la façon dont le réseau identifie et résout les incidents ayant un impact sur le service en temps réel. Mieux encore, qui permettent de prévenir les incidents avant qu'ils ne se produisent. Réagir à des événements négatifs ou à des tickets de support client est inefficace et coûteux. L'automatisation et le machine learning peuvent faire évoluer votre capacité à prévoir et à prévenir les problèmes avant qu'ils ne surviennent.
La nécessité de consolider et de traiter rapidement les informations est primordiale pour la réussite de toute équipe d'opérations réseau. Pour le moment, les fournisseurs de services de communication (CSP), les fournisseurs de services gérés (MSP) et d'autres entreprises ont encore du mal à visualiser rapidement et précisément leurs réseaux toujours plus étendus dans une vue unique, et s'appuient sur des outils et des pratiques manuelles existants pour surveiller les fonctions et les services réseau critiques. La prolifération des systèmes d'inventaire, des applications cloisonnées et des infrastructures de réseau fracturées réunies dans le cadre d'acquisitions a entraîné des lacunes importantes en matière de visibilité pour le centre d'opérations réseau, avec un impact négatif sur la productivité et une augmentation des coûts.
Une fois les données consolidées sur une seule plateforme, vous devez identifier, analyser et résoudre rapidement les causes premières des événements ayant un impact sur le service. Un système comme Assure1® vous aide à éliminer et à supprimer des quantités considérables de bruit pour vous assurer que votre équipe opérationnelle traite toujours correctement les incidents qui impactent généralement les services.
Grâce au machine learning et à l'analyse d'événements, vous pouvez tirer parti d'algorithmes de machine learning standard avec des filtres de données spéciaux pour normaliser les données, en vous assurant que les modèles corrects sont introduits dans le moteur de machine learning.
Grâce à ces flux de données, la solution vous aide à détecter les anomalies, telles que les écarts temporels, les raretés statistiques et les comportements inhabituels, afin de générer un événement causal unique. Les événements causaux racine contiennent des modèles de suppression qui filtrent le bruit afin d'améliorer le taux de prévisibilité pour permettre aux opérateurs de centres d'opérations réseau de résoudre les problèmes, par opposition à répondre à une avalanche d'alarmes d'événement (ici encore afin de privilégier la proactivité par rapport à la réactivité).
Chez Federos, nous parlons beaucoup d'exploitabilité car c'est la clé d'une automatisation efficace. Les équipes opérationnelles doivent passer à un état d'esprit d'exploitabilité en vue de stimuler l'automatisation.
Le machine learning et l'analyse d'événements complètent la stratégie Assure1® à trois volets pour fournir aux clients une analyse des causes premières (RCA) de qualité. Federos fournit trois types de RCA, et le dernier est lié à une exploitabilité qui nécessite une intervention humaine :
Nous vous posons la question : combien de temps passez-vous en mode réactif ou sur des processus manuels et chronophages ? Vous demande-t-on d'en faire plus avec moins ?
Ce sont malheureusement ce sont des conditions typiques d'un centre d'opérations réseau, et elles n'ont pas lieu d'être.
Assure1® collecte et normalise les pannes, les performances, la topologie, le service et d'autres données externes dans une seule plateforme unifiée. La corrélation et l'analyse avancées, y compris par l'IA/le machine learning, produisent des informations exploitables qui favorisent l'automatisation et améliorent l'efficacité opérationnelle tout en réduisant considérablement les coûts.