Jeff Erickson | Estratega de contenido tecnológico | 17 de septiembre de 2024
La mayoría de nosotros interactuamos regularmente con analítica en tiempo real, incluso si no somos conscientes de ello. Este tipo de analítica funciona en segundo plano para ayudar a elegir la ruta de un conductor que entrega nuestro paquete, escanear indicios de fraude en compras con tarjeta de crédito y ayudar a las compañías de servicios a mantener las luces encendidas con mantenimiento proactivo en equipos de generación de energía.
Y aunque no todos los negocios necesitan actuar sobre los datos en milisegundos, la analítica en tiempo real sigue mejorando, haciendo que la tecnología —y las ventajas comerciales que trae— sean posibles para muchas más organizaciones. Esto está cambiando cómo pensamos la analítica; en lugar de solo mirar hacia atrás para ver qué pasó y cómo mejorar la próxima vez, la analítica en tiempo real es una herramienta de decisiones operativas momento a momento.
La analítica en tiempo real toma los datos en el momento en que se generan —ya sea por un clic en un sitio web, un comentario en redes sociales, una transacción o un sensor— y los envía a un sistema para análisis y acción inmediata. La analítica en tiempo real en algunos procesos empresariales opera en milisegundos para extraer datos de múltiples fuentes y alimentarlos en un sistema donde se organiza y analiza, y luego actúa mediante un sistema automatizado o se comunica a las personas en gráficos, texto o voz. Es cómo los vendedores de boletos ajustan los precios según la demanda, cómo una aerolínea actualiza el estado de un vuelo o cómo un banco te alerta de inmediato cuando hay un cargo que su algoritmo de inteligencia artificial no aprueba.
Los sistemas de analítica de datos en tiempo real pueden obtener datos de fuentes estructuradas y no estructuradas. Los datos estructurados llegan en formatos predecibles y consistentes de fuentes como aplicaciones de negocio. Los datos no estructurados, a veces llamados big data, requieren procesamiento adicional y provienen de fuentes que incluyen sitios de redes sociales, documentos de texto y videos. Los sistemas de analítica de datos pueden combinar estos dos tipos de fuentes de datos para un análisis más completo y luego presentar hallazgos en formas que las personas puedan entender y usar fácilmente.
Las tecnologías que permiten la analítica en tiempo real incluyen bases de datos y data lakes, algoritmos de aprendizaje automático (ML), herramientas de integración de datos, lenguajes de programación, cuadernos de ciencia de datos y varios proyectos de código abierto. Combinados con aprendizaje automático, los sistemas de analítica en tiempo real pueden hacer más que ayudar en la toma de decisiones en el momento: también pueden buscar tendencias, cuellos de botella u oportunidades de negocio ocultas en los datos operativos.
Conclusiones clave
La analítica en tiempo real es una variante de la analítica de datos y está ganando popularidad entre los negocios digitales expertos. Es una extensión de la analítica de datos tradicional y usa muchas de las mismas competencias. La analítica tradicional, a menudo llamada analítica por lotes, es un proceso más lento en el que grandes cantidades de datos almacenados se preparan y luego se envían a una plataforma de analítica para generar gráficos o tablas en un panel. Los datos podrían tener horas, días, semanas o incluso meses de antigüedad y se usan para mostrar lo que sucedió en el pasado. Esto fue, y sigue siendo, un recurso clave para ayudar a guiar la toma de decisiones futuras.
En contraste con la analítica tradicional, la analítica en tiempo real trata de lo que sucede ahora. En lugar de almacenar datos y luego moverlos periódicamente a un sistema de analítica mediante un proceso técnico complejo llamado extract, transform, and load (ETL), la analítica en tiempo real envía los datos de inmediato al sistema para análisis y acción, a menudo solo milisegundos después de que se crean. Es fácil entender por qué a veces se le llama analítica en streaming.
Muchas organizaciones están cambiando del procesamiento por lotes al procesamiento en tiempo real y de arquitecturas basadas en solicitudes a arquitecturas basadas en eventos que permiten más automatización.
Muchas arquitecturas de gestión de datos pueden soportar analítica en tiempo real, pero una que está ganando popularidad debido a su simplicidad se llama analítica en base de datos. Esto permite a los analistas ejecutar analítica donde los datos se almacenan en lugar de dar el paso adicional y que consume tiempo de ETL de grandes conjuntos de datos a una base de datos de analítica separada. Analistas en Forrester han denominado a este modelo de analítica en base de datos como una plataforma “translytical”, que combina funciones transaccionales y analíticas, y puede facilitar el mantenimiento de la integridad de los datos y hacer analítica a gran escala.
At retail stores predicting demand, marketing agencies accelerating targeting decisions in milliseconds, and many other organizations, people are finding the in-the-moment insights of real-time analytics a valuable tool for making decisions or automating actions.
La analítica en tiempo real da a los negocios la información que necesitan para actuar en el momento, ya sea para cambiar rutas de conducción, reaccionar a un problema de manufactura, cambiar una campaña de marketing o actualizar a un partner de la cadena de suministro.
Los insights en tiempo real sobre la orden o solicitud de servicio de un cliente proporcionan una experiencia más fluida y personalizada.
Los negocios pueden ajustar precios, cambiar ofertas o actualizar la disponibilidad de productos en tiempo real para mejorar la eficiencia y los ingresos de maneras en que un competidor menos digitalmente capaz no puede.
La analítica en tiempo real puede ayudar a los mercadólogos a identificar tendencias a medida que se desarrollan. Usando analítica que combine factores diversos como ventas y sentimiento en redes sociales, la tecnología puede ajustar mensajes o incluso sugerir cambios en productos para aprovechar la tendencia antes que la competencia.
Crear la infraestructura de datos integrada y escalable necesaria para la analítica en tiempo real normalmente ha requerido planificación, experiencia y fondos. Un factor clave detrás de muchos de los desafíos de la analítica en tiempo real es ensamblar una arquitectura que sea lo suficientemente poderosa y eficiente para permitir que la recolección, integración y análisis de datos ocurran en tiempo real. Sin embargo, arquitecturas complejas pueden llevar a tiempos de inactividad y problemas para los ingenieros y posiblemente a una menor adopción si el servicio es poco confiable. A continuación se presentan tres pasos para ayudar a superar los desafíos.
Uno de los primeros desafíos para implementar analítica en tiempo real es tener en cuenta todas las fuentes de datos involucradas. Por ejemplo, una aplicación minorista obtiene datos de proveedores de productos y los envía a software de contabilidad financiera y aplicaciones de servicio al cliente. Las fuentes correctas para una iniciativa de analítica en tiempo real pueden estar dentro o fuera del negocio e incluir datos estructurados o no estructurados. Los equipos de TI pueden usar muchas herramientas para localizar y catalogar fuentes de datos.
Una vez que un equipo ha identificado las fuentes de datos, los datos deben integrarse en un flujo de datos que pueda ser usado por el sistema de analítica. Este paso a menudo requiere una plataforma de integración que proporcione las API y conectores preconstruidos necesarios para ingerir datos de múltiples fuentes.
Dado que la analítica en tiempo real obtiene datos de fuentes que cambian según la actividad del negocio, los volúmenes de datos pueden ser impredecibles. Los recursos de cómputo asignados a la analítica en tiempo real deben estar aprovisionados para el caso de uso más alto posible o construidos sobre un servicio en la nube que pueda escalar hacia arriba y hacia abajo para satisfacer las necesidades cambiantes.
Tanto los datos estructurados como los no estructurados pueden usarse en un sistema de analítica en tiempo real. De hecho, combinarlos para el análisis, para mostrar rápidamente una imagen más clara al negocio, es lo que hace que muchos sistemas en tiempo real sean tan valiosos. Estos dos tipos de datos son diferentes justo en la forma que sus nombres implican: los datos estructurados llegan en formatos consistentes y predecibles de fuentes como aplicaciones de negocio, lo que facilita ponerlos en una base de datos relacional. Los datos no estructurados carecen de formato predecible; se extraen de fuentes como redes sociales, formularios de comentarios de clientes, documentos de texto o videos y luego se formatean para usarlos en el sistema de analítica en tiempo real.
| Tipo de dato | Definición | Diferenciador clave | Ejemplo |
|---|---|---|---|
| Datos estructurados | Datos organizados en un formato claramente definido | Fáciles de ordenar, rastrear, clasificar y poner en una base de datos relacional | Resultados de ventas, respuestas de encuestas, direcciones de clientes o historial de compras |
| Datos no estructurados | Datos que no siguen un formato predeterminado | Difíciles de ajustar a una base de datos relacional | Texto de correos electrónicos, publicaciones en redes sociales, audio, videos |
Un proceso de analítica de datos en tiempo real dependerá de la calidad de las prácticas generales de gestión de datos de una organización. El software de gestión de datos empresariales debe incluir la capacidad de escalar rápidamente, integrar datos de muchas fuentes, garantizar calidad de datos y un gobierno sólido y, por supuesto, priorizar la seguridad de los datos. A continuación se presentan mejores prácticas para tener en cuenta.
Primero haz la pregunta: ¿para quién es este motor de analítica en tiempo real? Es poco probable que aplique a toda la empresa, así que necesitas evaluar si será usado por todo un departamento o solo por usuarios seleccionados dentro de él. Tener un conjunto claro y enfocado de objetivos ayudará con esta evaluación. Resolver esto llevará a determinar qué fuentes de datos dentro y fuera de la empresa necesitarás acceder. Otra pregunta que debes hacer en este proceso: ¿serías más ambicioso con esos objetivos si tuvieras más o mejores datos?
Mantén al mínimo el número de veces que los datos deben moverse o pasar por un proceso ETL. Los procesos ETL pueden crear latencia y aumentar riesgos de seguridad y cumplimiento a medida que los datos se mueven entre almacenes. Una tendencia actual es usar analítica en base de datos, donde el procesamiento de datos se realiza dentro de una base de datos transaccional para evitar mover grandes conjuntos de datos a una base de datos de analítica separada.
Incluso una empresa mediana promedia 20 productos SaaS pagos en uso, según una encuesta reciente. Agrega eso al software local y otras fuentes de datos de terceros o no estructurados, y tendrás muchas opciones. Identifica aquellas que requerirá tu iniciativa de analítica en tiempo real.
Diferentes modelos de aprendizaje automático revelan diferentes tipos de insights basados en cómo miran los datos. Los modelos de ML pueden entrenarse para tareas de regresión o clasificación, detección de anomalías u otros propósitos. Más allá de obtener insights en tiempo real, el aprendizaje automático puede ayudar a detectar tendencias, tomar decisiones más rápidas y automatizar acciones o recomendaciones.
Las herramientas de datos correctas pueden ayudarte a componer un sistema de analítica en tiempo real. Si usas procesos ETL, necesitarás herramientas para extraer datos, limpiar y transformar los conjuntos de datos y enviarlos a los sistemas apropiados.
Hay dos maneras de pensar en monitorear el rendimiento de tu analítica en tiempo real. Una es puramente humana: establecer relaciones con personas en el negocio que puedan informar cómo está funcionando en la práctica. ¿Está funcionando más fluida la planta de producción, o los clientes están recibiendo la información automatizada que necesitan? La segunda manera es monitorear tus procesos de datos para identificar tendencias negativas y cuellos de botella y poder reaccionar.
Un sistema de analítica en tiempo real puede tener muchas fuentes de datos y dependencias. Cuando un cambio en el entorno del negocio trae un cambio a una de esas entradas, asegúrate de que tu sistema de analítica en tiempo real y los empleados que lo usan tengan una manera de registrar el problema y un proceso para solucionarlo.
Tetris.co, con sede en Brasil, muestra cómo un negocio puede beneficiarse al dar a los responsables de decisiones acceso directo a la analítica en tiempo real. La empresa reúne datos de varias fuentes de medios en una base de datos MySQL y usa analítica en tiempo real para entender cómo funcionan las inversiones en publicidad. La empresa alcanzó la velocidad que su software requiere al migrar a HeatWave MySQL, donde podían ejecutar transacciones y cargas de trabajo de analítica en tiempo real directamente desde una base de datos MySQL, eliminando la necesidad de mover datos e integrarlos con una base de datos de analítica separada. El sistema de alto rendimiento ayudó a los analistas de primera línea a entender tendencias más rápido y mejorar resultados de marketing al trasladar inversiones de plataformas publicitarias con bajo rendimiento a canales de mayor rendimiento.
Muchas competencias y herramientas pueden ayudar a construir un sistema de analítica en tiempo real que produzca resultados para tu organización. Incluyen herramientas para modelado de datos, calidad de datos y visualización de datos. Un buen lugar para empezar es considerar tu software y competencias actuales. Por ejemplo, una organización que usa MySQL Database para transacciones podría simplemente optar por una versión en la nube que ofrezca analítica en base de datos más aprendizaje automático en base de datos, eliminando la necesidad de ETL de datos a sistemas de analítica y ML separados.
Si tu organización necesita las ventajas de la analítica en tiempo real, HeatWave MySQL ofrece una solución poderosa. HeatWave MySQL es un servicio de base de datos totalmente gestionado, impulsado por el acelerador de consultas en memoria integrado HeatWave. Ofrece analítica en tiempo real sin la complejidad, latencia, riesgos y costo de la duplicación de ETL.
Con HeatWave MySQL, puedes acceder a una variedad de capacidades integradas de HeatWave para analítica, aprendizaje automático e inteligencia artificial generativa. HeatWave Lakehouse te permite consultar hasta medio petabyte de datos en el almacén de objetos en una variedad de formatos de archivo, como CSV, Parquet, Avro, JSON y exportaciones de otras bases de datos, y opcionalmente combinarlo con datos en MySQL. HeatWave AutoML y HeatWave GenAI ofrecen los beneficios de aprendizaje automático e inteligencia artificial generativa integrados y automatizados, sin ETL entre servicios en la nube.
Aprenda a utilizar la IA generativa y la machine learning automatizados e integrados en un único servicio de la nube para transacciones y análisis de lakehouse.
¿Cuál es un ejemplo de analítica en tiempo real?
Hay muchos ejemplos de analítica en tiempo real en los negocios. Una empresa, FANCOMI, busca convertirse en la red de publicidad de marketing de rendimiento más grande del mundo que permite a los anunciantes pagar cuando se logra su resultado de marketing deseado, en lugar de la manera tradicional, cuando se colocan los anuncios. Está usando analítica en tiempo real para monitorear y medir el impacto de 20 000 anuncios a 2,6 millones de agencias y sitios web de medios las 24 horas del día.
¿Por qué las empresas necesitan analítica en tiempo real?
Los sistemas digitales, incluidos sensores de Internet de las Cosas, sitios y aplicaciones de redes sociales y comercio minorista en línea, combinados con sistemas de respaldo como CRM, ERP y gestión de capital humano (HCM), están generando datos en cantidades sin precedentes. Las empresas que puedan dar sentido rápidamente a ese diluvio de datos operativos para ver cambios en sus operaciones y responder con las decisiones correctas superarán a la competencia.
¿Cómo mejora la analítica en tiempo real la toma de decisiones?
La analítica en tiempo real usa los datos en el momento en que se crean, cuando son más relevantes. Las organizaciones que no usan analítica en tiempo real pueden tomar decisiones importantes basadas en datos que ya están obsoletos para cuando están disponibles para análisis.
Aprende cómo aprovechar la inteligencia artificial generativa, construir modelos de aprendizaje automático, consultar datos en almacenamiento de objetos o explorar otros temas de HeatWave de interés.