Cloud Data Egress Costs: What They Are & How to Reduce Them

Kevin Bogusch | Analista sénior de inteligencia competitiva | 24 de enero de 2024

Los costos asociados con la salida de datos son una sorpresa desagradable a la que muchas organizaciones se enfrentan al principio de sus migraciones a la nube. Si bien los servicios en la nube, como las máquinas virtuales y el almacenamiento, tienen precios fijos, el costo de mover datos fuera de la nube es variable y, a menudo, impredecible.

Cuando las organizaciones aprenden esto, con frecuencia consideran volver a diseñar sus aplicaciones para reducir la cantidad de datos que viajan entre segmentos de red, ya sea utilizando técnicas como la compresión y la desduplicación o agregando una capa de almacenamiento en caché para reducir los bits que viajan a través del cable. Lo ideal es que las empresas que se trasladen a la nube diseñen sus aplicaciones teniendo en cuenta estas consideraciones para minimizar las tarifas de transferencia de datos y mejorar el rendimiento.

¿Qué es la salida de datos en la nube?

La salida de datos en la nube hace referencia a cualquier información que abandona la red de un proveedor de servicios en la nube con destino a otra ubicación. Esa otra ubicación podría ser un centro de datos on-premises, otro centro de datos en la nube en una región diferente, una "zona de disponibilidad" (centro de datos) en el mismo servicio en la nube, o incluso otra red virtual dentro del mismo centro de datos.

Los proveedores de servicios en la nube varían, a veces de forma significativa, en cuanto a cómo y cuánto cobran por la salida de datos, por lo que es importante comprender los componentes que influyen en sus cálculos de salida de datos. Las regiones, por ejemplo, son ubicaciones que suelen constar de varios centros de datos dentro de un límite geográfico estrecho. Los servicios en la nube suelen proporcionar una amplia conectividad de red entre regiones para admitir aplicaciones entre regiones de alta disponibilidad. Los datos que se mueven de una región a otra se miden y, por lo general, se cargan en función del número de gigabytes de datos enviados.

Las zonas de disponibilidad son el otro concepto principal de disponibilidad del servicio en la nube. Aunque cada proveedor de nube tiene un nombre ligeramente diferente para esta noción, incluidos los "dominios de disponibilidad" o simplemente las "zonas", el concepto abarca varios centros de datos en la misma región geográfica que tienen diversidad en sus proveedores de redes y energía y, por lo tanto, es poco probable que fallen simultáneamente. Los proveedores de servicios en la nube fomentan la ejecución de servicios en varias zonas para una alta disponibilidad, pero los datos que se mueven de una zona a otra se miden y se pueden cargar por gigabyte.

¿Son significativos los costos de salida de datos en la nube?

Las organizaciones obtienen varias ventajas al migrar los sistemas de TI a un modelo de computación en la nube. Entre ellos se encuentran el aprovechamiento del valor empresarial de la economía moderna de la nube, mejoras de TI más rápidas, niveles más altos de disponibilidad y acceso más temprano a nuevas tecnologías, como el aprendizaje automático y la inteligencia artificial.

Pero un aspecto potencialmente "oculto" de la economía de la nube es la salida de datos, que puede presentarse de múltiples formas. Los proveedores de servicios en la nube realizan un seguimiento y miden el tráfico de red que se mueve de una ubicación de sus nubes a otra, de una región a otra, de una zona a otra o incluso de una red virtual a otra en la misma región.

El tráfico entrante, es decir, los datos que llegan a la nube, es decir, la entrada de datos, casi siempre es gratuito, sin importar el volumen, en cada proveedor de nube. El tráfico saliente (salida de datos) se trata de forma diferente. Tanto si los datos se dirigen a internet, a centros de datos on-premises, a oficinas o incluso a otra región de la nube, las tarifas varían en función del proveedor de la nube, el servicio específico y la ruta de la red. Normalmente, la salida de datos tiene un precio fijo por gigabyte hasta un determinado umbral, y se aplican descuentos por la transmisión de datos por encima de ese nivel.

El tráfico de salida de datos en la nube puede ser tráfico de red estándar de máquinas virtuales en la nube a otras máquinas virtuales en la nube, como los datos que se mueven de una base de datos a la hoja de cálculo de un usuario profesional. Otro ejemplo, y una preocupación más significativa en términos de costo, es el tráfico relacionado con los activos de almacenamiento alojados en la nube utilizados en sitios web o en aplicaciones móviles. Una práctica habitual de los almacenes de objetos en la nube es alojar los activos del sitio web por separado de la aplicación del sitio web; esto mejora el rendimiento y la eficiencia del desarrollador. En esta arquitectura, un sitio web cargaría imágenes directamente desde un almacén de objetos en la nube, como Amazon Web Services (AWS) S3, Azure Blob Storage, Google Cloud Storage u Oracle Cloud Infrastructure (OCI) Object Storage, donde esos archivos existen como puntos finales HTTP, en lugar de almacenar esos archivos en un servidor web. Cuando las imágenes se cargan directamente desde el almacenamiento en la nube, la aplicación incurrirá en cargos por las operaciones de lectura en el almacenamiento y los costos de red asociados a la transferencia de esos datos de la nube a internet.

Las aplicaciones web de alta actividad pueden tener instancias en varias regiones en la nube, y almacenar sus imágenes en una cuenta en la nube en una sola región remota puede generar cargos por la salida considerable de datos. Si bien es probable que un sitio web o una aplicación importante utilicen una red de entrega de contenido (CDN) para reducir costos y mejorar el rendimiento, es posible que los sitios nuevos o de rápido crecimiento no estén diseñados para utilizar CDN, por lo que pueden generar costosos cargos por salida.

Estos son solo algunos ejemplos de salida de datos en aplicaciones en la nube. El tráfico entre máquinas virtuales e instancias de bases de datos, la interconexión de redes virtuales, los enlaces privados a ofertas de plataforma como servicio y otras arquitecturas pueden incurrir en tasas de salida significativas.

Conclusiones clave

  • Los costos de salida de datos en la nube dependen de la arquitectura de la aplicación. Al diseñar sistemas con la salida de datos en mente y aprovechar ciertas tecnologías, las organizaciones pueden reducir los costos.
  • Es esencial comprender cómo los flujos de datos afectan los costos de salida al migrar sistemas a la nube.
  • Los costos de salida de datos en la nube varían según el proveedor de servicios y la ruta de red.
  • Las organizaciones que tienen costos inherentemente altos de salida de datos pueden encontrar rentable comprar una conexión de red dedicada.
  • Los proveedores de servicios en la nube calculan los costos de salida en todo el tráfico, incluidos los servicios basados en plataformas como el almacenamiento y las bases de datos.

Por qué los proveedores de servicios en la nube cobran por la salida de datos

Los proveedores de servicios en la nube cobran por la salida de datos para recuperar los costos de infraestructura asociados con la construcción de las grandes redes que entran en sus centros de datos y el ancho de banda entre sitios, lo que puede costar millones o miles de millones de dólares. Invertir en redes submarinas, como hizo Microsoft en 2017 al construir un cable submarino de 4104 millas entre la costa este de Estados Unidos y España, es un ejemplo de las inversiones de los proveedores de la nube en infraestructuras de red a gran escala para conectar sus centros de datos.

Los proveedores de servicios en la nube también invierten continuamente para garantizar la fiabilidad y el rendimiento de estas redes, y los cargos de salida respaldan esas inversiones. Los clientes se benefician de no tener que planificar y trabajar con varios proveedores para desarrollar una red global. Aunque los cargos por salida de datos en la nube pueden ser frustrantes, forman parte del precio que las organizaciones deben pagar para aprovechar la infraestructura de nube pública mundial.

Por qué los costos de salida de datos en la nube parecen tan altos

Una diferencia significativa entre la nube pública y las implementaciones on-premises es que, en la nube pública, todos los cargos están en una sola factura. Por otro lado, las implementaciones on-premises suelen implicar facturas separadas para almacenamiento, servidores, componentes de red y servicios que probablemente se adquirieron a varios proveedores y en distintos momentos. Las organizaciones también pagan por separado la energía y refrigeración de sus centros de datos o el alquiler de una instalación de colocación, así como diversos costos de software y soporte. Ver los cargos equivalentes por el servicio en la nube para todo lo que hay en una sola factura puede ser un shock para los gerentes de TI que no estén preparados.

Además, la mayoría de los gastos asociados a las implementaciones on-premises son fijos, mientras que los proveedores de nubes públicas ofrecen muchas soluciones informáticas a costos variables. Los costos variables pueden ser beneficiosos porque suben y bajan según los requisitos informáticos, de modo que las organizaciones pueden evitar pagar de más por una capacidad que no necesitan. Aunque este modelo de costo variable suele ser útil para los servicios en la nube con patrones de demanda cambiantes, las configuraciones erróneas o el diseño deficiente pueden llevar a facturas en la nube de gran tamaño.

¿Cómo se calculan las tasas de salida?

Los cargos por salida de datos se calculan de varias formas, en función del tipo de servicio y del proveedor en la nube. Sin embargo, el proceso básico es el mismo.

  1. Cada proveedor de nube dispone de sensores en torno a sus servicios, lo que facilita la medición de todo el tráfico de datos.
  2. Los sensores registran el volumen de salida de datos de cada cliente y lo agregan a todas las regiones por servicio.
  3. En algunos casos, se permite a los clientes la salida de datos "gratuita" hasta un volumen de datos específico, por ejemplo, 100 GB. Por encima de ese nivel, se cobra al cliente.
  4. A cada cliente se le facturan sus gastos de salida de datos al final del ciclo de facturación mensual.

Para tener una idea de lo que esto podría significar en el mundo real, considera que el tamaño medio de todas las páginas en la web fue de 2315 kilobytes en junio de 2022, según el Web Almanac de HTTP Archive. Supongamos que un sitio web alojado en la nube consta de páginas de tamaño medio y recibe 10 000 visitantes mensuales, cada uno de los cuales ve dos páginas. Ese sitio web generaría aproximadamente 44,2 GB de salida de datos en la nube cada mes:

10 000 x 2 = 20 000

20 000 x 2315 KB = 46 300 millones de KB

46 300 millones de KB/1 GB (1 048 576 KB) = 44 155 GB

A continuación, veamos algunos ejemplos reales de costos de salida de datos en la nube. El primero es un ejemplo muy simple basado en los precios de Azure a partir de junio de 2023 para el tráfico de un servidor web saliente a internet.

  1. Los primeros 100 GB al mes de tráfico saliente se incluyen sin cargo adicional.
  2. A partir de ahí, cada GB cuesta 8,7 centavos.
  3. Para 10 TB (10 240 GB), el costo total es de 882,18 dólares.
  4. Después de 10 TB de tráfico y hasta 50 TB, el costo por gigabyte disminuye a 8,3 centavos de dólar. Después de 50 TB, el costo por gigabyte se reduce a 7 centavos de dólar.

Ahora examinemos un escenario un poco más complejo para un cliente de AWS. Los desarrolladores han cargado 1 TB de datos en un bloque de almacenamiento S3 y, a continuación, han transferido 4 TB a una región de AWS fuera de Estados Unidos y 2 TB a internet. Los costos a partir de junio de 2023 serían los siguientes:

  1. El costo de almacenamiento de datos es de USD 23,55.
  2. Los costos de transferencia de datos entrantes son de USD 0.
  3. El costo de salida de datos intra-AWS es de USD 81,92 (a 2 centavos de dólar por GB).
  4. El costo de salida de datos a internet es de USD 184,32 (a 9 centavos de dólar por GB).

En este escenario, los costos de almacenamiento representan menos del 10 % del total de cargos mensuales de salida de datos. El punto crítico es entender cuánto tráfico generará una aplicación o servicio y qué costo tendrá para los tipos de servicios que se utilizan. Un sitio web de gran volumen podría reducir su gasto en el ejemplo anterior mediante el uso de una red de entrega de contenido (CDN) para reducir la cantidad de tráfico que fluye directamente a internet. Las CDN almacenan en caché archivos de datos más cerca de los usuarios previstos y en las propias redes de los proveedores de CDN, por lo que el costo neto de sus servicios suele ser mucho menor que los cargos de salida de datos por servir los mismos archivos desde la nube cada vez.

Cabe destacar que Oracle Cloud Infrastructure ofrece a los clientes hasta 10 TB de salida de datos cada mes sin costo alguno. Por lo tanto, si se observa el ejemplo de AWS, un cliente de OCI solo pagaría USD 25,24 en tarifas de almacenamiento de datos por la misma cantidad de salida. Del mismo modo, los USD 882,18 de las tarifas de salida de red incurridas en el ejemplo de Azure se incluirían en el costo de la máquina virtual para los clientes de OCI.

5 formas de supervisar y gestionar los costos de salida de datos

Como se ve en los ejemplos anteriores, los cargos por salida de datos pueden escalar rápidamente. Este modelo de costos sin restricciones significa que las posibles configuraciones erróneas, como la conexión al punto final incorrecto de una cuenta de almacenamiento con replicación geográfica, pueden generar facturas en la nube fuera de control. ¿Cómo gestiona un equipo de TI esta realidad?

Es fundamental determinar el gasto de salida de datos en la nube más temprano que tarde para minimizar los costos. Los siguientes cinco consejos pueden ayudar:

  1. Diseño con costo en mente. Existen varias formas de diseñar sistemas para reducir los costos. Las técnicas más comunes implican la supervisión de sistemas para el tráfico de red saliente. Una vez identificados los sistemas con el mayor tráfico saliente, puedes evaluar técnicas como la minimización de la transferencia de datos, la compresión de flujos de red y el uso de métodos de almacenamiento en caché, como CDN. La configuración de alertas que señalan un tráfico de red saliente inusualmente alto es una buena práctica: siempre es mejor detectar un cargo ilimitado a principios de mes en lugar de recibir una factura enorme al final.
  2. Supervisar los costos de salida de datos. Todos los proveedores ofrecen una funcionalidad de gestión de gastos de servicios en la nube (CSEM) que permite a las empresas supervisar su gasto actual. Úsalo para realizar un seguimiento de los costos de salida.
  3. Etiquetar los recursos en la nube con el centro de costos. Todos los proveedores de servicios en la nube también ofrecen la posibilidad de etiquetar recursos con pares "key: value", por ejemplo, "Cost Center: Finance". Estas etiquetas se suelen utilizar tanto para la automatización en la nube como para la contabilidad. Las etiquetas se aplican en cascada a la factura del cliente, lo que permite al departamento de TI realizar un seguimiento del costo y el gasto de los centros de costos de las aplicaciones.
  4. Crear presupuestos y definir alertas sobre esos presupuestos. Los principales proveedores de nube permiten a los clientes conectar un presupuesto a sus sistemas de alertas para que los administradores reciban una notificación cuando los costos superen lo planificado. Configurar estas alertas es especialmente importante para nuevos proyectos en los que los costos iniciales pueden ser impredecibles.
  5. Almacenar datos cerca de los usuarios. Este enfoque arquitectónico puede parecer obvio, pero si los usuarios ejecutan informes desde un servidor de base de datos en la nube a un servidor local, se producirá una salida de datos significativa. En algunos casos, la salida de gran volumen puede ser inevitable, especialmente en medio de una migración a la nube. Pero es importante tener en cuenta la ubicación de almacenamiento y la proximidad a los usuarios para gestionar el rendimiento y los costos. La proximidad también es clave al almacenar objetos como imágenes de sitios web. Por último, aprovecha las opciones de almacenamiento en caché para reducir los datos salientes.

5 pasos para gestionar los costos de salida de datos en la nube (diagrama)
Céntrate en diseñar aplicaciones para reducir la salida de datos y, a continuación, controla el comportamiento real del sistema para evitar sorpresas costosas.

5 formas de minimizar las tarifas de salida de datos en la nube

El control y la gestión de las tasas de salida es un desafío. Reducirlas es otro. Para reducir los costos de salida, los equipos de TI de la empresa deben profundizar en la pila técnica.

1. Utilizar una red de entrega de contenido

Una CDN lee los activos del sitio web de una organización una vez y, a continuación, los almacena en caché en una ubicación perimetral mucho más cercana al cliente. El uso de una CDN significa que cuando un cliente solicita una imagen o un archivo de su sitio web, se sirve desde la CDN en lugar de directamente desde tu servidor web alojado en la nube. Los costos de una CDN son mucho más bajos que los cargos de salida de datos, y las CDN permiten a los clientes experimentar mejores tiempos de carga. Si bien el uso de una CDN puede requerir cambios menores en el código de la aplicación, los beneficios de costo y rendimiento casi siempre valen la pena.

2. Comprimir el tráfico de red en cualquier lugar posible

No siempre es posible comprimir el tráfico de red, pero el tráfico de infraestructura (piense en VM a VM a través de una red virtual) generalmente se puede comprimir para una pequeña compensación en el aumento de los ciclos de CPU. El costo incremental de ese uso de CPU es órdenes de magnitud menor que las tarifas de salida de red.

3. Elegir cuidadosamente los servicios

Muchos servicios en la nube, incluso dentro del mismo proveedor en la nube, ofrecen varias formas de obtener funcionalidades casi idénticas. Por ejemplo, hay casi 20 formas de ejecutar un contenedor en AWS. Como parte del proceso de planificación, las organizaciones deben valorar cada enfoque, incluidos los cargos de red, que pueden variar significativamente.

4. Utilizar una conexión de red dedicada

Una conexión de red dedicada entre el proveedor de la nube y su sitio puede ser costosa, pero un enlace privado te da un uso ilimitado de la conexión una vez comprado. Para las organizaciones que no pueden evitar un gran volumen de salida de datos en la nube, esta inversión puede reducir el costo total de propiedad.

5. Migrar aplicaciones completas a la nube

En un modelo de nube híbrida, con una mezcla de sistemas on-premises y alojados, pasar a un modelo "todo nube" puede reducir la cantidad de datos que fluyen fuera de la nube al localizar todo en un mismo lugar.

Estos cambios pueden ser difíciles de implementar, especialmente para aplicaciones de producción. En algunos casos, pueden requerir que los ingenieros de aplicaciones realicen cambios significativos. Pero los ahorros de costos a menudo hacen que esos esfuerzos valgan la pena. Si bien el uso de una conexión de red dedicada, como ExpressRoute y Direct Connect, puede requerir coordinación tanto con el proveedor de nube como con el proveedor de red de la organización, tanto Microsoft como Amazon ofrecen un descuento en los datos de salida a través de estas conexiones directas en comparación con la tarifa de salida normal.

Minimizar las tarifas de salida de datos en la nube con OCI

No es de extrañar que los distintos proveedores de servicios en la nube tengan estructuras de precios diferentes. Azure, por ejemplo, cobra por el tráfico de una red virtual a otras redes virtuales conectadas, incluso dentro de la misma región de nube. Por lo tanto, vale la pena evaluar cuidadosamente cuáles podrían ser los costos de salida de datos, especialmente cuando se migra por primera vez a la nube pública.

Oracle es consciente de los altos costos de salida de datos que cobran otros proveedores de servicios en la nube y ha trabajado para que su reducción sea una de las principales ventajas de sus servicios en la nube. Oracle Cloud Infrastructure (OCI) ofrece precios de red bajos que permiten a las empresas migrar, a bajo costo, volúmenes significativos de datos, incluidos servicios que consumen con frecuencia las mayores cantidades de ancho de banda, como la transmisión de video en vivo, las videoconferencias y los juegos. Al igual que con otras nubes, la transferencia de datos entrantes es gratuita; sin embargo, OCI ofrece 10 TB de salida de datos cada mes sin costo alguno, considerablemente más que los 100 GB de AWS al mes, lo que permite a las organizaciones tener un ahorro considerable en la salida de datos. Además, los costos de ancho de banda saliente de OCI son hasta un 25 % más bajos que los de AWS, lo cual es un gran beneficio cuando se utilizan servicios que requieren grandes cantidades de ancho de banda.

Una de las principales consideraciones de la economía en la nube a las que se enfrentan los clientes es el ancho de banda para la salida de datos de los servicios y redes en la nube. Los costos asociados pueden ser una gran sorpresa en la factura de la nube, y los cargos pueden ser muy variables. Uno de los aspectos más importantes de la arquitectura en la nube es minimizar los costos de salida aprovechando tecnologías como la compresión, las redes de entrega de contenido y las capas de almacenamiento en caché, que pueden aumentar el rendimiento de un sitio o aplicación al tiempo que reducen los costos.

Cinco medidas que los CFO puede tomar ahora para impulsar la rentabilidad y el crecimiento

Descubre tácticas revolucionarias, desde impulsar la transformación con la IA hasta ajustar tu estrategia de fusiones y adquisiciones y asumir un liderazgo colaborativo, para superar los desafíos actuales y futuros y prosperar.

Preguntas frecuentes sobre los costos de salida de datos en la nube

¿Se incluye una tarifa de salida en el almacenamiento en la nube?

No. Un par de factores contribuyen al costo del almacenamiento en la nube. El primero y más evidente es el volumen de datos almacenados en la cuenta de almacenamiento o bloque. El segundo es el número de lecturas y escrituras de los datos durante el periodo de facturación. Ambos factores se ven afectados por el nivel (caliente, frío, frío o archivo) de los datos: cuanto más caliente sea el nivel, menor será el costo asociado a esas transacciones de lectura y escritura, pero mayor será el costo de almacenamiento por volumen de datos. Estos cargos transaccionales son independientes de los cargos por salida de datos a través de la red.

¿Cuáles son los cargos por entrada y salida de datos en la nube?

Las tarifas de entrada y salida son costos asociados a la transferencia de datos entre regiones y zonas de la nube, desde y hacia internet, y desde y hacia las redes on-premises. La entrada de datos (entrada en la nube) suele ser gratuita, pero todos los proveedores cobran por la salida de datos (salida del proveedor en la nube). Los cargos de salida se basan en el volumen de datos y su ubicación, como internet, zonas de disponibilidad y otras regiones en la nube, y se denominan cargos no enlazados, lo que significa que son variables y pueden ser una sorpresa costosa para los clientes de la nube.

¿Por qué AWS cobra por la salida?

Al igual que otros proveedores de nube, AWS cobra por la salida de datos en la mayoría de sus servicios para cubrir los costos de construcción y mantenimiento de su red. AWS no incluye el costo de salida de datos en el precio de los servicios. Eso permite a Amazon cobrar precios más bajos en servicios como máquinas virtuales y bloques de almacenamiento. Los clientes cuyas aplicaciones realizan altos niveles de salida de datos terminan pagando la factura por esa infraestructura de transmisión de red, mientras que los clientes cuyas aplicaciones transfieren menos datos pagan una menor proporción de la factura.