Kevin Bogusch | Analista sénior de inteligencia competitiva | 24 de enero de 2024
Los costos asociados con la salida de datos son una sorpresa desagradable a la que muchas organizaciones se enfrentan al principio de sus migraciones a la nube. Si bien los servicios en la nube, como las máquinas virtuales y el almacenamiento, tienen precios fijos, el costo de mover datos fuera de la nube es variable y, a menudo, impredecible.
Cuando las organizaciones aprenden esto, con frecuencia consideran volver a diseñar sus aplicaciones para reducir la cantidad de datos que viajan entre segmentos de red, ya sea utilizando técnicas como la compresión y la desduplicación o agregando una capa de almacenamiento en caché para reducir los bits que viajan a través del cable. Lo ideal es que las empresas que se trasladen a la nube diseñen sus aplicaciones teniendo en cuenta estas consideraciones para minimizar las tarifas de transferencia de datos y mejorar el rendimiento.
La salida de datos en la nube hace referencia a cualquier información que abandona la red de un proveedor de servicios en la nube con destino a otra ubicación. Esa otra ubicación podría ser un centro de datos on-premises, otro centro de datos en la nube en una región diferente, una "zona de disponibilidad" (centro de datos) en el mismo servicio en la nube, o incluso otra red virtual dentro del mismo centro de datos.
Los proveedores de servicios en la nube varían, a veces de forma significativa, en cuanto a cómo y cuánto cobran por la salida de datos, por lo que es importante comprender los componentes que influyen en sus cálculos de salida de datos. Las regiones, por ejemplo, son ubicaciones que suelen constar de varios centros de datos dentro de un límite geográfico estrecho. Los servicios en la nube suelen proporcionar una amplia conectividad de red entre regiones para admitir aplicaciones entre regiones de alta disponibilidad. Los datos que se mueven de una región a otra se miden y, por lo general, se cargan en función del número de gigabytes de datos enviados.
Las zonas de disponibilidad son el otro concepto principal de disponibilidad del servicio en la nube. Aunque cada proveedor de nube tiene un nombre ligeramente diferente para esta noción, incluidos los "dominios de disponibilidad" o simplemente las "zonas", el concepto abarca varios centros de datos en la misma región geográfica que tienen diversidad en sus proveedores de redes y energía y, por lo tanto, es poco probable que fallen simultáneamente. Los proveedores de servicios en la nube fomentan la ejecución de servicios en varias zonas para una alta disponibilidad, pero los datos que se mueven de una zona a otra se miden y se pueden cargar por gigabyte.
Las organizaciones obtienen varias ventajas al migrar los sistemas de TI a un modelo de computación en la nube. Entre ellos se encuentran el aprovechamiento del valor empresarial de la economía moderna de la nube, mejoras de TI más rápidas, niveles más altos de disponibilidad y acceso más temprano a nuevas tecnologías, como el aprendizaje automático y la inteligencia artificial.
Pero un aspecto potencialmente "oculto" de la economía de la nube es la salida de datos, que puede presentarse de múltiples formas. Los proveedores de servicios en la nube realizan un seguimiento y miden el tráfico de red que se mueve de una ubicación de sus nubes a otra, de una región a otra, de una zona a otra o incluso de una red virtual a otra en la misma región.
El tráfico entrante, es decir, los datos que llegan a la nube, es decir, la entrada de datos, casi siempre es gratuito, sin importar el volumen, en cada proveedor de nube. El tráfico saliente (salida de datos) se trata de forma diferente. Tanto si los datos se dirigen a internet, a centros de datos on-premises, a oficinas o incluso a otra región de la nube, las tarifas varían en función del proveedor de la nube, el servicio específico y la ruta de la red. Normalmente, la salida de datos tiene un precio fijo por gigabyte hasta un determinado umbral, y se aplican descuentos por la transmisión de datos por encima de ese nivel.
El tráfico de salida de datos en la nube puede ser tráfico de red estándar de máquinas virtuales en la nube a otras máquinas virtuales en la nube, como los datos que se mueven de una base de datos a la hoja de cálculo de un usuario profesional. Otro ejemplo, y una preocupación más significativa en términos de costo, es el tráfico relacionado con los activos de almacenamiento alojados en la nube utilizados en sitios web o en aplicaciones móviles. Una práctica habitual de los almacenes de objetos en la nube es alojar los activos del sitio web por separado de la aplicación del sitio web; esto mejora el rendimiento y la eficiencia del desarrollador. En esta arquitectura, un sitio web cargaría imágenes directamente desde un almacén de objetos en la nube, como Amazon Web Services (AWS) S3, Azure Blob Storage, Google Cloud Storage u Oracle Cloud Infrastructure (OCI) Object Storage, donde esos archivos existen como puntos finales HTTP, en lugar de almacenar esos archivos en un servidor web. Cuando las imágenes se cargan directamente desde el almacenamiento en la nube, la aplicación incurrirá en cargos por las operaciones de lectura en el almacenamiento y los costos de red asociados a la transferencia de esos datos de la nube a internet.
Las aplicaciones web de alta actividad pueden tener instancias en varias regiones en la nube, y almacenar sus imágenes en una cuenta en la nube en una sola región remota puede generar cargos por la salida considerable de datos. Si bien es probable que un sitio web o una aplicación importante utilicen una red de entrega de contenido (CDN) para reducir costos y mejorar el rendimiento, es posible que los sitios nuevos o de rápido crecimiento no estén diseñados para utilizar CDN, por lo que pueden generar costosos cargos por salida.
Estos son solo algunos ejemplos de salida de datos en aplicaciones en la nube. El tráfico entre máquinas virtuales e instancias de bases de datos, la interconexión de redes virtuales, los enlaces privados a ofertas de plataforma como servicio y otras arquitecturas pueden incurrir en tasas de salida significativas.
Conclusiones clave
Los proveedores de servicios en la nube cobran por la salida de datos para recuperar los costos de infraestructura asociados con la construcción de las grandes redes que entran en sus centros de datos y el ancho de banda entre sitios, lo que puede costar millones o miles de millones de dólares. Invertir en redes submarinas, como hizo Microsoft en 2017 al construir un cable submarino de 4104 millas entre la costa este de Estados Unidos y España, es un ejemplo de las inversiones de los proveedores de la nube en infraestructuras de red a gran escala para conectar sus centros de datos.
Los proveedores de servicios en la nube también invierten continuamente para garantizar la fiabilidad y el rendimiento de estas redes, y los cargos de salida respaldan esas inversiones. Los clientes se benefician de no tener que planificar y trabajar con varios proveedores para desarrollar una red global. Aunque los cargos por salida de datos en la nube pueden ser frustrantes, forman parte del precio que las organizaciones deben pagar para aprovechar la infraestructura de nube pública mundial.
Una diferencia significativa entre la nube pública y las implementaciones on-premises es que, en la nube pública, todos los cargos están en una sola factura. Por otro lado, las implementaciones on-premises suelen implicar facturas separadas para almacenamiento, servidores, componentes de red y servicios que probablemente se adquirieron a varios proveedores y en distintos momentos. Las organizaciones también pagan por separado la energía y refrigeración de sus centros de datos o el alquiler de una instalación de colocación, así como diversos costos de software y soporte. Ver los cargos equivalentes por el servicio en la nube para todo lo que hay en una sola factura puede ser un shock para los gerentes de TI que no estén preparados.
Además, la mayoría de los gastos asociados a las implementaciones on-premises son fijos, mientras que los proveedores de nubes públicas ofrecen muchas soluciones informáticas a costos variables. Los costos variables pueden ser beneficiosos porque suben y bajan según los requisitos informáticos, de modo que las organizaciones pueden evitar pagar de más por una capacidad que no necesitan. Aunque este modelo de costo variable suele ser útil para los servicios en la nube con patrones de demanda cambiantes, las configuraciones erróneas o el diseño deficiente pueden llevar a facturas en la nube de gran tamaño.
Los cargos por salida de datos se calculan de varias formas, en función del tipo de servicio y del proveedor en la nube. Sin embargo, el proceso básico es el mismo.
Para tener una idea de lo que esto podría significar en el mundo real, considera que el tamaño medio de todas las páginas en la web fue de 2315 kilobytes en junio de 2022, según el Web Almanac de HTTP Archive. Supongamos que un sitio web alojado en la nube consta de páginas de tamaño medio y recibe 10 000 visitantes mensuales, cada uno de los cuales ve dos páginas. Ese sitio web generaría aproximadamente 44,2 GB de salida de datos en la nube cada mes:
10 000 x 2 = 20 000
20 000 x 2315 KB = 46 300 millones de KB
46 300 millones de KB/1 GB (1 048 576 KB) = 44 155 GB
A continuación, veamos algunos ejemplos reales de costos de salida de datos en la nube. El primero es un ejemplo muy simple basado en los precios de Azure a partir de junio de 2023 para el tráfico de un servidor web saliente a internet.
Ahora examinemos un escenario un poco más complejo para un cliente de AWS. Los desarrolladores han cargado 1 TB de datos en un bloque de almacenamiento S3 y, a continuación, han transferido 4 TB a una región de AWS fuera de Estados Unidos y 2 TB a internet. Los costos a partir de junio de 2023 serían los siguientes:
En este escenario, los costos de almacenamiento representan menos del 10 % del total de cargos mensuales de salida de datos. El punto crítico es entender cuánto tráfico generará una aplicación o servicio y qué costo tendrá para los tipos de servicios que se utilizan. Un sitio web de gran volumen podría reducir su gasto en el ejemplo anterior mediante el uso de una red de entrega de contenido (CDN) para reducir la cantidad de tráfico que fluye directamente a internet. Las CDN almacenan en caché archivos de datos más cerca de los usuarios previstos y en las propias redes de los proveedores de CDN, por lo que el costo neto de sus servicios suele ser mucho menor que los cargos de salida de datos por servir los mismos archivos desde la nube cada vez.
Cabe destacar que Oracle Cloud Infrastructure ofrece a los clientes hasta 10 TB de salida de datos cada mes sin costo alguno. Por lo tanto, si se observa el ejemplo de AWS, un cliente de OCI solo pagaría USD 25,24 en tarifas de almacenamiento de datos por la misma cantidad de salida. Del mismo modo, los USD 882,18 de las tarifas de salida de red incurridas en el ejemplo de Azure se incluirían en el costo de la máquina virtual para los clientes de OCI.
Como se ve en los ejemplos anteriores, los cargos por salida de datos pueden escalar rápidamente. Este modelo de costos sin restricciones significa que las posibles configuraciones erróneas, como la conexión al punto final incorrecto de una cuenta de almacenamiento con replicación geográfica, pueden generar facturas en la nube fuera de control. ¿Cómo gestiona un equipo de TI esta realidad?
Es fundamental determinar el gasto de salida de datos en la nube más temprano que tarde para minimizar los costos. Los siguientes cinco consejos pueden ayudar:
El control y la gestión de las tasas de salida es un desafío. Reducirlas es otro. Para reducir los costos de salida, los equipos de TI de la empresa deben profundizar en la pila técnica.
Una CDN lee los activos del sitio web de una organización una vez y, a continuación, los almacena en caché en una ubicación perimetral mucho más cercana al cliente. El uso de una CDN significa que cuando un cliente solicita una imagen o un archivo de su sitio web, se sirve desde la CDN en lugar de directamente desde tu servidor web alojado en la nube. Los costos de una CDN son mucho más bajos que los cargos de salida de datos, y las CDN permiten a los clientes experimentar mejores tiempos de carga. Si bien el uso de una CDN puede requerir cambios menores en el código de la aplicación, los beneficios de costo y rendimiento casi siempre valen la pena.
No siempre es posible comprimir el tráfico de red, pero el tráfico de infraestructura (piense en VM a VM a través de una red virtual) generalmente se puede comprimir para una pequeña compensación en el aumento de los ciclos de CPU. El costo incremental de ese uso de CPU es órdenes de magnitud menor que las tarifas de salida de red.
Muchos servicios en la nube, incluso dentro del mismo proveedor en la nube, ofrecen varias formas de obtener funcionalidades casi idénticas. Por ejemplo, hay casi 20 formas de ejecutar un contenedor en AWS. Como parte del proceso de planificación, las organizaciones deben valorar cada enfoque, incluidos los cargos de red, que pueden variar significativamente.
Una conexión de red dedicada entre el proveedor de la nube y su sitio puede ser costosa, pero un enlace privado te da un uso ilimitado de la conexión una vez comprado. Para las organizaciones que no pueden evitar un gran volumen de salida de datos en la nube, esta inversión puede reducir el costo total de propiedad.
En un modelo de nube híbrida, con una mezcla de sistemas on-premises y alojados, pasar a un modelo "todo nube" puede reducir la cantidad de datos que fluyen fuera de la nube al localizar todo en un mismo lugar.
Estos cambios pueden ser difíciles de implementar, especialmente para aplicaciones de producción. En algunos casos, pueden requerir que los ingenieros de aplicaciones realicen cambios significativos. Pero los ahorros de costos a menudo hacen que esos esfuerzos valgan la pena. Si bien el uso de una conexión de red dedicada, como ExpressRoute y Direct Connect, puede requerir coordinación tanto con el proveedor de nube como con el proveedor de red de la organización, tanto Microsoft como Amazon ofrecen un descuento en los datos de salida a través de estas conexiones directas en comparación con la tarifa de salida normal.
No es de extrañar que los distintos proveedores de servicios en la nube tengan estructuras de precios diferentes. Azure, por ejemplo, cobra por el tráfico de una red virtual a otras redes virtuales conectadas, incluso dentro de la misma región de nube. Por lo tanto, vale la pena evaluar cuidadosamente cuáles podrían ser los costos de salida de datos, especialmente cuando se migra por primera vez a la nube pública.
Oracle es consciente de los altos costos de salida de datos que cobran otros proveedores de servicios en la nube y ha trabajado para que su reducción sea una de las principales ventajas de sus servicios en la nube. Oracle Cloud Infrastructure (OCI) ofrece precios de red bajos que permiten a las empresas migrar, a bajo costo, volúmenes significativos de datos, incluidos servicios que consumen con frecuencia las mayores cantidades de ancho de banda, como la transmisión de video en vivo, las videoconferencias y los juegos. Al igual que con otras nubes, la transferencia de datos entrantes es gratuita; sin embargo, OCI ofrece 10 TB de salida de datos cada mes sin costo alguno, considerablemente más que los 100 GB de AWS al mes, lo que permite a las organizaciones tener un ahorro considerable en la salida de datos. Además, los costos de ancho de banda saliente de OCI son hasta un 25 % más bajos que los de AWS, lo cual es un gran beneficio cuando se utilizan servicios que requieren grandes cantidades de ancho de banda.
Una de las principales consideraciones de la economía en la nube a las que se enfrentan los clientes es el ancho de banda para la salida de datos de los servicios y redes en la nube. Los costos asociados pueden ser una gran sorpresa en la factura de la nube, y los cargos pueden ser muy variables. Uno de los aspectos más importantes de la arquitectura en la nube es minimizar los costos de salida aprovechando tecnologías como la compresión, las redes de entrega de contenido y las capas de almacenamiento en caché, que pueden aumentar el rendimiento de un sitio o aplicación al tiempo que reducen los costos.
Descubre tácticas revolucionarias, desde impulsar la transformación con la IA hasta ajustar tu estrategia de fusiones y adquisiciones y asumir un liderazgo colaborativo, para superar los desafíos actuales y futuros y prosperar.
¿Se incluye una tarifa de salida en el almacenamiento en la nube?
No. Un par de factores contribuyen al costo del almacenamiento en la nube. El primero y más evidente es el volumen de datos almacenados en la cuenta de almacenamiento o bloque. El segundo es el número de lecturas y escrituras de los datos durante el periodo de facturación. Ambos factores se ven afectados por el nivel (caliente, frío, frío o archivo) de los datos: cuanto más caliente sea el nivel, menor será el costo asociado a esas transacciones de lectura y escritura, pero mayor será el costo de almacenamiento por volumen de datos. Estos cargos transaccionales son independientes de los cargos por salida de datos a través de la red.
¿Cuáles son los cargos por entrada y salida de datos en la nube?
Las tarifas de entrada y salida son costos asociados a la transferencia de datos entre regiones y zonas de la nube, desde y hacia internet, y desde y hacia las redes on-premises. La entrada de datos (entrada en la nube) suele ser gratuita, pero todos los proveedores cobran por la salida de datos (salida del proveedor en la nube). Los cargos de salida se basan en el volumen de datos y su ubicación, como internet, zonas de disponibilidad y otras regiones en la nube, y se denominan cargos no enlazados, lo que significa que son variables y pueden ser una sorpresa costosa para los clientes de la nube.
¿Por qué AWS cobra por la salida?
Al igual que otros proveedores de nube, AWS cobra por la salida de datos en la mayoría de sus servicios para cubrir los costos de construcción y mantenimiento de su red. AWS no incluye el costo de salida de datos en el precio de los servicios. Eso permite a Amazon cobrar precios más bajos en servicios como máquinas virtuales y bloques de almacenamiento. Los clientes cuyas aplicaciones realizan altos niveles de salida de datos terminan pagando la factura por esa infraestructura de transmisión de red, mientras que los clientes cuyas aplicaciones transfieren menos datos pagan una menor proporción de la factura.