Alan Zeichick | Estratega de contenidos | 31 de mayo de 2023
Hacer un buen uso de los datos empresariales requiere un cálculo del retorno de la inversión, igual de seguro que invertir en una fábrica, una expansión de la oficina o un esfuerzo de I + D. Nuestras organizaciones no pueden operar sin datos: datos sobre clientes, productos, transacciones, empleados, finanzas, economía y competidores. Necesitamos esos datos para crecer y prosperar. Sin embargo, los datos de alta calidad vienen con un precio para adquirirlos, almacenarlos, gestionarlos, protegerlos y analizarlos. Cuantos más datos tengan las empresas, mejor podrán atender a los clientes y colaborar con los partners, y sin embargo, más tiempo, esfuerzo y recursos deberán invertir en todo el ecosistema de datos. Las empresas se benefician de un tratamiento consistente de los datos con este tipo de mentalidad de ROI.
Este artículo explorará principalmente el lado del costo de la ecuación del ROI de los datos y se centrará en formas de controlar y minimizar los costos de adquirir, almacenar, proteger y usar esos datos.
Los costos de datos son los gastos asociados con la adquisición, el mantenimiento, la protección y el uso de datos empresariales. Muchos de esos costos de datos son claros. Los datos en sí tienen que vivir en algún lugar, ya sea en las instalaciones de un disco duro o matriz de almacenamiento, por ejemplo, o en el almacenamiento basado en la nube (que en sí consiste en discos duros físicos). Hay software para organizar esos datos, como un sistema de gestión de contenido, una base de datos relacional, un almacén de datos o un lago de datos u otra estructura; ese software tiene costos de licencia comercial o contratos de suscripción/soporte al usar soluciones de código abierto. Se debe realizar una copia de seguridad de los datos, lo que requiere almacenamiento y software adicionales para gestionar esas copias de seguridad y prepararse para una posible recuperación limitada si se pierden algunos datos o una restauración completa si hay un desastre físico.
También puede haber tarifas de licencia u otros costos para adquirir datos de un proveedor externo. Debe haber controles de seguridad y acceso, tal vez para ajustarse a las regulaciones de la industria o del gobierno y para abordar las preocupaciones de privacidad. Hay costos asociados con la validación de los datos, así como la garantía o mejora de la calidad de los datos, como la corrección de la información desactualizada.
También puede haber costos para hacer un uso completo de los datos, lo que requiere software para interfaces de usuario, análisis e informes e incluso software de aprendizaje profundo o inteligencia artificial para descubrir información.
Por último, hay costos vinculados al rendimiento y la escalabilidad. Cuando los datos crecen de megabytes a terabytes o incluso petabytes, se requiere un software sofisticado, una planificación cuidadosa y herramientas de automatización para mantener y utilizar esos datos, además del hardware para almacenarlos y acceder a ellos a gran escala. Y para cada uno de los costos de datos mencionados anteriormente, las empresas deben contratar personas capacitadas para administrar y operar sus herramientas de gestión de datos.
Conclusiones clave
Minimizar los costos de los datos comienza con comprender qué tipo de datos tiene una organización. Parte de eso es relacional, es decir, los datos se pueden considerar como que viven en filas y columnas. Otros datos no están estructurados, y pueden consistir en documentos, imágenes y videos, y archivos binarios. Una vez que una organización entiende los activos de datos que tiene, el siguiente paso es determinar el mejor formato para almacenarlos (una base de datos relacional, una base de datos NoSQL, un repositorio de documentos, etc.) y considerar oportunidades de consolidación de bases de datos. También es esencial saber de dónde provienen los datos, dónde residen y dónde y cómo se utilizarán.
Una vez que una organización entiende sus datos y dónde mejor almacenarlos, el siguiente paso es adoptar una arquitectura de datos flexible que sea capaz de contabilizar todos esos orígenes y usos de datos y permita a la organización optimizar su adquisición, gestión, almacenamiento y análisis. Un elemento clave de esta arquitectura será encontrar el modelo de gobernanza de datos adecuado para determinar cómo se utilizarán los datos. Otra es elegir los sistemas de gestión de datos locales o en la nube adecuados para minimizar los costos y maximizar el rendimiento, la flexibilidad, la seguridad y la utilidad. Todos estos pasos le darán a una organización la capacidad de evaluar el valor y el uso de cualquier tramo de datos y tomar las medidas adecuadas para minimizar los costos de entregar ese valor.
No importa la cantidad de datos que tenga una empresa hoy en día, hay más llegando cada día, tal vez cada segundo. Gran parte de esos datos son necesarios para impulsar las operaciones comerciales, realizar transacciones, atender a clientes y socios, potenciar la gestión, impulsar la generación de informes financieros y garantizar el cumplimiento. Algunos de ellos, sin embargo, podrían ser de muy poco valor. A continuación se presentan 11 formas de minimizar los costos de adquisición, transformación, almacenamiento, protección y uso de todos esos datos. En algunos casos, estos pasos pueden conducir a ahorros indirectos, en lugar de reducciones directas del presupuesto, debido al aumento de la agilidad empresarial, la productividad del personal u otras eficiencias.
Determina los sistemas de gestión de datos más adecuados en función de tus casos de uso y volúmenes de datos previstos, teniendo en cuenta, por ejemplo, las bases de datos transaccionales, los almacenes de datos, los lagos de datos y las herramientas de aprendizaje automático. La consolidación de datos y cargas de trabajo en menos bases de datos puede reducir los costos de licencias de software y gestión de datos; elegir el mejor tipo de tecnología de almacenamiento y gestión de datos puede reducir los costos al simplificar la cantidad de trabajo necesario para crear y mantener las integraciones.
Los sistemas de gestión de datos basados en la nube pueden ofrecer escalabilidad y capacidad de gestión más allá de la de un sistema local, a un costo total menor, con las ventajas de una mejor resiliencia, conectividad, seguridad y servicios de gestión. Es probable que la nube también reduzca los costos de personal para la gestión de la infraestructura.
Los procesos manuales para la gestión de datos son difíciles de escalar y propensos a errores humanos o políticas aplicadas de manera inconsistente. Los procesos automatizados, como los que se encuentran en una base de datos autónoma, ofrecen previsibilidad y una seguridad sólida junto con ahorros de costos laborales.
Las políticas de gobernanza de datos describen cómo tu organización optimiza y protege sus datos, así como cómo puede aprovechar esos datos para respaldar las operaciones comerciales. Las sólidas políticas de gobernanza de datos pueden eliminar las redundancias de datos, entre otras ventajas, lo que significa que se deben almacenar, realizar copias de seguridad y analizar menos datos.
El uso de un sistema de base de datos de código abierto líder puede ofrecer muchas ventajas, incluyendo una comunidad de desarrolladores grande y diversa; confiabilidad; un amplio ecosistema de herramientas y software; la capacidad de personalizar el software; y, por supuesto, menores costos de licencias de software. Si el código abierto reduce sus costos totales requiere un análisis financiero cuidadoso. Los servicios gestionados en la nube basados en software de código abierto ofrecen otra opción para aprovechar estas ventajas.
Los datos son lo que necesita para ejecutar transacciones y operaciones diarias. Es un comienzo vital, pero la ventaja competitiva real proviene de la analítica. El análisis convierte tus datos en insights que pueden ayudarte a detectar tendencias, reducir los costos operativos, aumentar los ingresos y servir mejor a tus clientes. Esto podría incluir iniciativas de big data que utilizan la IA para extraer información de grandes y diversos almacenes de datos. Una palabra de precaución: El análisis de datos debe aumentar el "retorno" de su ecuación de ROI, pero es probable que no reduzca sus costos totales de gestión de datos, ya que está agregando los costos de las herramientas analíticas.
La depuración de datos implica corregir errores e incoherencias en las filas y columnas de los datos, de acuerdo con las reglas estándar y personalizadas del sector. Si bien los datos sin procesar y sin corregir pueden ser adecuados para las transacciones, el análisis de datos es más preciso y útil cuando los datos están limpios. No solo eso, sino que cuando los datos están limpios, puede tomar menos esfuerzo (y gastos) analizarlos. Sin embargo, tenga cuidado con la sobreventa de las ventajas de ahorro de costos de la higiene de datos. La cantidad de datos eliminados probablemente no sea enorme, y hay un costo para limpiar los datos, por lo que el beneficio aquí podría provenir principalmente de un mejor análisis en lugar de costos más bajos.
Ya sea que las operaciones de datos sean locales o en la nube, el análisis de tráfico de red muestra dónde funcionan las cosas de manera eficiente y dónde hay cuellos de botella innecesarios. La supervisión del uso y la actividad de red le ayuda a identificar áreas en las que los cambios de configuración pueden aumentar el rendimiento y la productividad del usuario. La supervisión de la red podría detectar casos en los que el acceso a los datos consuma un exceso de recursos informáticos y de almacenamiento, y haya una oportunidad para una arquitectura más eficaz que reduzca los costos.
¿De dónde provienen sus datos? ¿Dónde obtiene los datos en los que más confía? Analizar y, a continuación, visualizar el linaje de tus datos clave puede ayudarte a optimizar la gobernanza de datos para aprovechar estos datos de manera más eficiente, ya sea que se generen internamente o provengan de fuentes externas, especialmente con big data. Una vez más, esto probablemente no es un gran ahorro de dinero, pero puede detectar datos de terceros innecesarios o infrautilizados que está pagando.
Puede gestionar su arquitectura de datos, servidores, recursos y aplicaciones usted mismo, o puede permitir que un especialista se encargue de esas necesidades técnicas. Esto le permite centrarse en su negocio, en lugar de en las complejidades de la gestión de datos, a una mayor eficiencia y a un menor riesgo. Además, el personal especializado y las herramientas utilizadas por los proveedores de servicios pueden ser capaces de hacer el trabajo a un costo menor. Vale la pena correr los números.
Algunas partes de tu negocio dependen mucho de los datos, pero ¿qué datos son cruciales? ¿Cómo se utilizan los datos? ¿Dónde y cuándo se utiliza? ¿Quién lo utiliza? Utilice estas estadísticas para guiar el mejor uso de sus recursos tecnológicos y presupuesto de gestión de datos.
El objetivo de un programa de reducción de costos de datos es ayudarlo a hacer más con costos más bajos: Obtenga una mayor información empresarial y capacidad de respuesta operativa de sus datos mientras gasta menos en administrar esos datos.
Los datos ayudan a su negocio a funcionar, soportando todo, desde la facturación hasta los registros de traducción, desde documentos hasta catálogos de piezas, desde listas de precios hasta inventario. El uso de esos datos operativos desbloquea nuevas oportunidades de manera más eficaz. Pero todos los días, esos datos están creciendo, y con ello el costo. Afortunadamente, puede tomar medidas para minimizar el costo de los datos mientras sigue impulsando el crecimiento del negocio y mejorando la eficiencia.
HeatWave permite utilizar IA generativa y aprendizaje automático automatizados e integrados en un único servicio de la nube para transacciones y análisis de la escala del lakehouse. Las empresas pueden eliminar el costo y la complejidad de bases de datos vectoriales y analíticas independientes, servicios de aprendizaje automático y procesos ETL, evitando al mismo tiempo los riesgos de latencia y seguridad del movimiento de datos entre almacenes de datos. Gracias a la automatización integrada basada en el aprendizaje automático, los desarrolladores y administradores de bases de datos pueden ahorrar mucho tiempo, aumentar aún más el rendimiento y reducir los costos. HeatWave está disponible en Oracle Cloud Infrastructure (OCI), Amazon Web Services (AWS), Microsoft Azure y en los centros de datos de los clientes con OCI Dedicated Region.
El rendimiento de las consultas y la relación precio-rendimiento de HeatWave Lakehouse es significativamente mejor. Muchas organizaciones de rápido crecimiento utilizan HeatWave para simplificar su infraestructura de datos y reducir sus costos de gestión de datos, al tiempo que mejoran el rendimiento, la escalabilidad, la seguridad y la productividad.
¿Cuál es el primer paso para salir de un centro de datos?
Cuando planees salir de un centro de datos, haz una revisión exhaustiva de aplicaciones, datos, servicios, usuarios y requisitos de seguridad. Todo en esa revisión requerirá un plan de migración, ya sea para "lift and shift" las aplicaciones y datos existentes a la nube, elegir nuevas aplicaciones o construir nuevas aplicaciones desde cero.
¿Cuál es la vida útil de los equipos en un centro de datos?
Las principales partes de la infraestructura del centro de datos, como los sistemas de HVAC (calefacción, ventilación y aire acondicionado), la distribución de energía y los sistemas de seguridad física, podrían durar una década o más con un mantenimiento regular. Los equipos de cómputo, como servidores, enrutadores, conmutadores y almacenamiento, suelen tener una vida útil de tres a cinco años antes de quedar obsoletos.
¿Quién es responsable de la seguridad en la nube?
La seguridad física de la infraestructura en la nube, como los servidores, la infraestructura de red, y demás, está a cargo de los proveedores de la nube. La responsabilidad de asegurar el software y los servicios se comparte entre el proveedor de la nube y la empresa.
¿Cuánto tiempo es necesario para salir de un centro de datos?
Asume que una salida del centro de datos completa tomará meses. Una infraestructura de TI más grande podría llevar años. Todo depende del tamaño del centro de datos, su complejidad y la cantidad de información. Gran parte de ese tiempo se consumirá en realizar un inventario exhaustivo, desarrollar planes, crear y probar nuevo software (si es necesario) y capacitar al personal. Al igual que al mudarse de oficina, la migración y la salida en sí son fases relativamente cortas, una vez que se completa toda la planificación.
Descubre cómo aprovechar la IA generativa, crear modelos de aprendizaje automático, consultar datos en el almacenamiento de objetos o explorar otros temas de interés de HeatWave.