5 claves para un centro de operaciones de red (NOC) más automatizado

Drew Golden, director de gestión de productos

¿Por qué la automatización es fundamental para un NOC eficiente?

En el sector de TI, entendemos que profundizar en la automatización y el aprendizaje automático (ML) llevarán las operaciones de TI al siguiente nivel. Muchos proveedores están ansiosos por dar el salto de Servicio a Valor, como se ilustra en la tabla de Gartner que se incluye a continuación. La automatización es realmente la única manera de conseguirlo.

El problema

La clave para lograr un NOC saludable y eficiente es el flujo continuo de información que conduzca a una solución automatizada, antes de que un cliente sienta el impacto de una interrupción.

Sin embargo, muchos NOC experimentan fricciones internas que afectan al cliente y se traducen en incidencias y llamadas enojadas. ¿Por qué? Existen diversas razones comunes:

  • Demasiadas pantallas y herramientas
  • Datos aislados (es decir, sistemas heredados)
  • Poco o nada de automatización de procesos de negocio
  • Análisis ineficiente de la causa principal

En Federos, conocemos demasiado bien estos problemas (justamente con un NOC), por lo que creamos una solución de garantía de servicio holística y unificada, Assure1®.

Antes de sumergirnos en la solución a estos problemas, tenemos que echar un vistazo más de cerca a cómo nosotros, y la industria en general, concebimos la automatización.

Definición de términos: automatización

Hay un objetivo aspiracional en la industria en términos de automatización: un NOC "ligero" o un NOC totalmente automatizado. Se puede imaginar un entorno completamente virtualizado que se ejecute por sí solo, con poca o ninguna participación humana necesaria.

¿Es posible? El futuro parece ir en esa dirección, pero sabemos que no será así ni ahora ni en el futuro cercano.

La realidad es que solo el 10-15% del trabajo puede ser completamente automatizado. El otro 85-90% todavía confía en los humanos para cumplir con la capacidad de acción.

¿Por qué? La mayoría de los NOC presenta una combinación de equipos antiguos, equipos modernos y tecnología, y sistemas virtualizados (donde todo está en la nube). Estas herramientas no solo están separadas, sino que no se comunican y, como resultado, crean un efecto de "silla giratoria" para los trabajadores de los NOC. Puede haber un mundo donde casi todo esté virtualizado y totalmente automatizado, pero hasta ahora, es solo una aspiración.

5 claves para un NOC más automatizado

1

Pasar de reactivo a proactivo

El NOC necesita procesos que automaticen la forma en que la red identifica y resuelve incidentes que afectan al servicio en tiempo real. O, mejor aún, que puede prevenir incidentes antes de que ocurran. Reaccionar a eventos negativos o tickets de clientes es ineficiente y costoso. La automatización y el aprendizaje automático pueden ampliar su capacidad para predecir y prevenir problemas antes de que se produzcan.

2

Incorporar datos a una plataforma unificada

La necesidad de consolidar y procesar la información rápidamente es fundamental para el éxito de cualquier equipo de operaciones de red. Hasta ahora, los proveedores de servicios de comunicación (CSP), los proveedores de servicios gestionados (MSP) y otras empresas han tenido dificultades para visualizar sus redes en expansión de forma rápida y precisa en una vista singular, confiando en herramientas heredadas y prácticas manuales para monitorear funciones y servicios esenciales de la red. La proliferación de sistemas de inventario, aplicaciones aisladas y las infraestructuras de red fracturadas reunidas a través de adquisiciones, ha creado importantes brechas de visibilidad para el NOC, lo que afecta negativamente a la productividad y aumenta los costos.

3

Análisis de la principal causa raíz del sector

Una vez que haya consolidado los datos en una plataforma, debe identificar, analizar y resolver rápidamente la causa raíz de los eventos que afectan al servicio. Un sistema como Assure1® te ayuda a eliminar y suprimir grandes cantidades de ruido para garantizar que tu equipo de operaciones siempre actúe correctamente contra los incidentes que normalmente perjudican a los servicios.

Con el aprendizaje automático y el análisis de eventos, puedes aprovechar los algoritmos de aprendizaje automático estándar del sector con filtros de datos especiales para normalizar los datos, lo que garantiza que los patrones correctos se incorporen al motor de aprendizaje automático.

Con estos flujos de datos, la solución te ayuda a detectar anomalías, como desviaciones temporales, excepcionalidades estadísticas y comportamientos inusuales, para generar un evento causal raíz singular. Los eventos causantes contienen patrones de supresión que filtran el ruido para mejorar la tasa de previsibilidad de los operadores del NOC, de cara a resolver problemas en lugar de responder a una tormenta de incidencias (una vez más, algo que te permite ser proactivo en lugar de reactivo).

4

Identificar lo que es factible

En Federos, hablamos mucho sobre la capacidad de llevar a la práctica algo, ya que ahí reside la eficacia de la automatización. Los equipos de operaciones deben cambiar a una mentalidad de capacidad de acción para impulsar la automatización.

El aprendizaje automático y el análisis de eventos completan la estrategia Assure1® de tres pilares para proporcionar a los clientes un análisis de la causa raíz (RCA) líder en la industria. Federos ofrece tres tipos de RCA, y el último está ligado a la capacidad de acción que requiere un humano:

  • RCA topológica mediante la detección de topología física y virtual
  • RCA de aprendizaje automático no supervisado que aprende de patrones y no requiere topología
  • RCA supervisada, donde los operadores pueden señalar campos de ruido y vincularlos a causas raíz conocidas
3

Lo que deberías automatizar en este momento:</

  • Imprecisión del inventario: descubre cuándo el inventario se está volviendo impreciso y automatiza la presentación de incidencias (esto puede suceder 20, 30, 100 veces al día). Assure1® Universal Topology puede representar de forma rápida y precisa los cambios topológicos casi en tiempo real. Incluye una función de gestión de relaciones y topología entre dominios totalmente integrada para manejar cualquier tecnología, lógica y física.
  • Múltiples turbulencias: Provocados por múltiples turbulencias (o agitaciones repentinas) que son causados por un motivo singular. Por ejemplo: corte de fibra y desconexión de los sistemas de gestión de elementos.
  • Comportamiento anormal: impulsado por el aprendizaje de los campos de ruido de cada dispositivo, hasta los puertos de los conmutadores. La regla de comportamiento anormal genera y escala eventos en función de anomalías que no son comunes a ese puerto o dispositivo. Por ejemplo, un puerto de un enrutador central que anteriormente ha estado estable pero que de repente comienza a tener problemas, se señalaría y reportaría para su análisis.
  • Rendimiento operativo del NOC: analiza cómo se manejan los diferentes tipos de eventos y aprende cómo se gestiona cada tipo de evento en el NOC. En función de esta información, la solución envía una alerta cuando un evento se gestiona de forma anormal. Por ejemplo, si un operador del NOC reconoce un puerto caído agregando un asiento contable y luego borrando la alarma, Assure1® "aprenderá" ese incidente como normal para ese tipo de evento. En este caso, de cara al futuro, si alguien accidentalmente solucionó un evento sin trabajar en él, esa acción provocaría una alarma.

Simplifica automatiza el NOC

Entonces, ahora te preguntamos: ¿cuánto tiempo pasas en modo reactivo o en procesos manuales que consumen mucho tiempo? ¿Se te pide que hagas más con menos información?

Desafortunadamente, esas son condiciones típicas de los NOC, pero no deberían serlo.

Assure1® recopila y normaliza los datos de fallos, rendimiento, topología, servicio y otra información externa en una única plataforma unificada. La correlación y el análisis avanzados, incluida la IA/aprendizaje automático, producen insights útiles que impulsan la automatización y mejoran la eficiencia operativa al tiempo que reducen significativamente los costos.