5 Schlüssel zu einem umfassender automatisierten Netzwerk-Betriebszentrum

Drew Golden, Director, Product Management

Warum ist Automatisierung für ein effizientes Netzwerk-Betriebszentrum von entscheidender Bedeutung?

In der IT-Branche ist uns bewusst, dass mehr Automatisierung und maschinelles Lernen (ML) die IT-Abläufe auf ein neues Niveau heben werden. Das Ziel vieler Anbieter ist der Sprung von Service zu Nutzen (Value) , wie im Gartner-Diagramm unten dargestellt. Tatsächlich ist die Automatisierung die einzige Möglichkeit, das zu erreichen.

Das Problem

Der Schlüssel zu einem gesunden und effizienten Netzwerk-Betriebszentrum ist ein nahtloser Informationsfluss, der zu einer automatisierten Lösung führt – und zwar bevor ein Kunde jemals die Auswirkungen erleben muss.

Bei vielen Netzwerk-Betriebssystemen kommt es jedoch zu internen Reibungen, die sich bis auf den Kunden auswirken und ihr Echo in Kundendienst-Tickets und wütenden Anrufen finden. Warum? Dafür gibt es einige häufige Gründe:

  • Zu viele Bildschirme und Tools
  • Isolierte Daten (d. h. Altsysteme)
  • Wenig bis gar keine Geschäftsprozessautomatisierung
  • Eine ineffiziente Ursachenanalyse

Bei Federos verstehen wir diese Probleme nur allzu gut (wir haben selbst einst im Netzwerk-Betriebszentrum gesessen). Deshalb haben wir eine ganzheitliche, einheitliche Lösung für die Service-Sicherstellung entwickelt: Assure1®.

Bevor wir uns mit der Lösung dieser Probleme befassen, müssen wir uns genauer ansehen, wie wir und die Branche als Ganzes über Automatisierung denken.

Begriffsdefinition: Automatisierung

Die Branche strebt in Bezug auf die Automatisierung insgesamt ein Ziel an: – ein unbemanntes bzw. vollständig automatisiertes Netzwerk-Betriebszentrum Stellen Sie sich eine vollständig virtualisierte Umgebung vor, die von selbst ausgeführt wird und bei der nur minimale bis gar keine menschlichen Eingriffe erforderlich sind.

Ist so etwas möglich? Die Zukunft scheint in diese Richtung zu gehen, aber wir wissen, dass unsere Gegenwart und die nähere Zukunft noch nicht so weit sind.

Die derzeitige Realität ist, dass nur 10-15 % der Arbeit vollständig automatisiert werden kann. Die anderen 85-90 % erfordern nach wie vor menschliche Interventionen, um die Aktionsfähigkeit sicherzustellen.

Warum? Die meisten Netzwerk-Betriebszentren verfügen über eine Mischung aus Altgeräten, moderner Ausrüstung, Technologie und virtualisierten Systemen (bei denen alles in der Cloud ist). Diese Tools sind nicht nur voneinander getrennt, sondern kommunizieren auch nicht miteinander. Das bedeutet für die Mitarbeiter im Netzwerk-Betriebszentrum viel administrativen Aufwand. Vielleicht leben wir eines Tages in einer Welt, in der fast alles virtualisiert und voll automatisiert ist. Aber noch ist dies nicht so weit.

5 Schlüssel zu einem automatisierten Netzwerk-Betriebszentrum

1

Von reaktiv zu proaktiv

Ein Netzwerk-Betriebszentrum benötigt Prozesse, die automatisieren, wie das Netzwerk Service-relevante Vorfälle in Echtzeit identifiziert und löst. Oder, noch besser, Abläufe, die derartige Vorfälle verhindern, bevor sie auftreten. Auf negative Ereignisse oder Kunden-Tickets reagieren zu müssen, ist ineffizient und kostspielig. Automatisierung und maschinelles Lernen können Ihre Fähigkeit, Probleme vorherzusagen und zu verhindern, bevor sie auftreten, skalieren.

2

Integration der Daten in einer einheitlichen Plattform

Die Fähigkeit, Informationen schnell zu konsolidieren und zu verarbeiten, ist für den Erfolg jedes Netzwerk-Betriebsteams von größter Bedeutung. Bislang haben Kommunikationsdienstleister (Communication Service Provider, CSPs), Managed Service Provider (MSPs) und andere Unternehmen Schwierigkeiten, ihre wachsenden Netzwerke schnell und präzise in einer einzigen Ansicht zu visualisieren. Der Grund dafür ist, dass sie nach wie vor veraltete Tools und manuelle Praktiken zur Überwachung kritischer Netzwerkfunktionen und -dienste nutzen. Das häufige Vorkommen von Bestandssystemen, isolierten Anwendungen und den aus Akquisitionen hervorgehenden unterbrochenen Netzwerkinfrastrukturen erzeugt erhebliche Sichtbarkeitslücken bei einem Netzwerk-Betriebszentrum. Das wiederum wirkt sich negativ auf die Produktivität aus und führt zu steigenden Kosten.

3

Branchenführende Analyse der zugrunde liegenden Ursachen

Sobald Sie Daten in einer Plattform konsolidiert haben, müssen Sie die Ursachen von Ereignissen, die sich auf den Service auswirken, schnell ermitteln, analysieren und beheben können. Ein System wie Assure1® unterstützt Sie dabei, Signalrauschen in erheblichem Maße zu eliminieren und zu unterdrücken. Dadurch können Sie sicherstellen, dass Ihr Betriebsteam immer korrekt auf Vorfälle reagiert, die normalerweise die Services beeinträchtigen würden.

Mithilfe von ML- und Ereignisanalysen können Sie ML-Algorithmen nach Branchenstandards mit speziellen Datenfiltern nutzen, um Daten zu normalisieren und sicherzustellen, dass korrekte Muster in die ML-Engine eingespeist werden.

Mit diesen Datenströmen unterstützt Sie die Lösung dabei, Anomalien wie zeitliche Abweichungen, statistische Seltenheiten und ungewöhnliche Verhaltensweisen zu erkennen, um ein einziges zugrundeliegendes Ereignis zu generieren. Zugrundeliegende Ereignisse enthalten Unterdrückungsmuster, die das Rauschen herausfiltern, um die Vorhersehbarkeitsrate der Bediener im Netzwerk-Betriebszentrum zu verbessern. Dadurch können diese Probleme tatsächlich lösen, anstatt auf eine Flut von Ereignisalarmen reagieren zu müssen. Das heißt, sie können proaktiv statt reaktiv handeln.

4

Ermitteln, was umsetzbar ist

Bei Federos diskutieren wir viel über Aktionsfähigkeit, denn diese ist der Schlüssel für eine effektive Automatisierung. Betriebsteams müssen die Aktionsfähigkeit im Auge haben, um die Automatisierung voranzubringen.

ML- und Ereignisanalysen runden die dreiteilige Strategie von Assure1® ab, um Kunden eine branchenführende Ursachenanalyse (Root Cause Analysis, RCA) zu bieten. Federos bietet drei Arten von RCA und die letzte davon hängt von der Aktionsfähigkeit ab, die wiederum menschliches Eingreifen erfordert:

  • Eine topologische RCA durch Nutzung der physischen und virtuellen Topologieerkennung
  • Eine nicht überwachte RCA durch maschinelles Lernen, die aus Mustern lernt und keine Topologie benötigt
  • Eine überwachte RCA, bei der Bediener Störfelder kennzeichnen und diese mit bekannten Ursachen verknüpfen können
3

Was Sie jetzt automatisieren sollten:</

  • Bestandsdrift: Entdecken Sie, wenn es zu einem Bestandsdrift kommt und automatisieren Sie ein Problemticket (dies kann 20, 30 oder100 Mal am Tag geschehen). Assure1® Universal Topology kann topologische Veränderungen schnell und präzise in nahezu Echtzeit darstellen. Es umfasst eine vollständig integrierte Domain-übergreifende Topologie- und Beziehungsmanagementfunktion zur Handhabung jeder Art von Technologie – sei diese nun logisch oder physisch.
  • Ereignisstürme und -abfälle: Ausgelöst durch Ereignisstürme (oder plötzliche Abfälle von Ereignissen), die durch eine einzelne Ursache verursacht werden. Zum Beispiel: abgetrennte Glasfasern oder eine Trennung von Elementverwaltungssystemen
  • Abnormales Verhalten: Ermöglicht durch das Erlernen der Störfelder jedes Geräts, bis hin zu Ports an Switches. Die Regel für abnormes Verhalten generiert Ereignisse basierend auf Anomalien, die für diesen Port oder dieses Gerät nicht üblich sind, und leitet sie weiter. Beispiel: Ein Kern-Routerport, der zuvor stabil war, aber plötzlich Probleme aufweist, wird markiert und zur Analyse weitergeleitet.
  • Die betriebliche Performance des Netzwerk-Betriebszentrums: Beobachtet, wie verschiedene Arten von Ereignissen behandelt werden und lernt, wie jede Art von Ereignis im Netzwerk-Betriebszentrum verwaltet wird. Basierend auf diesen Informationen sendet die Lösung ein Alert, falls ein Ereignis nicht ordnungsgemäß gehandhabt wird. Beispiel: Wenn ein Bediener des Netzwerk-Betriebszentrums einen heruntergefahrenen Port bestätigt, indem er einen Journaleintrag hinzufügt und dann den Alarm löscht, wird dieser Vorfall von Assure1® als normal für diesen Ereignistyp „erlernt“. In diesem Fall würde diese Aktion in der Zukunft, falls jemand versehentlich ein Ereignis löscht, ohne daran zu arbeiten, einen Alarm auslösen.

Vereinfachung und Automatisierung des Netzwerk-Betriebszentrums

Nun möchten wir Sie etwas fragen: Wie viel Zeit verbringen Sie im reaktiven Modus oder mit manuellen, zeitaufwändigen Prozessen? Erwartet man von Ihnen, dass Sie mit weniger Informationen mehr erreichen?

Derartige Verhältnisse sind für Netzwerk-Betriebszentren leider typisch – und das sollte nicht so sein.

Assure1® sammelt und normalisiert Fehler-, Performance-, Topologie-, Service- und andere externe Daten in einer einzigen, einheitlichen Plattform. Die erweiterte Korrelation und Analyse, einschließlich von KI/maschinellem Lernen, liefert umsetzbare Erkenntnisse, welche die Automatisierung vorantreiben, die betriebliche Effizienz verbessern und gleichzeitig die Kosten deutlich senken.