Kevin Bogusch | Analista Sênior de Inteligência Competitiva | 24 de janeiro de 2024
Os custos associados à saída de dados são uma surpresa indesejada que muitas organizações enfrentam logo no início da jornada de migração para a nuvem. Embora os serviços de nuvem, como máquinas virtuais e armazenamento, tenham preços fixos, o custo para remover dados da nuvem é variável e, muitas vezes, imprevisível.
Quando as organizações tomam conhecimento disso, frequentemente consideram a possibilidade de rearquitetar as aplicações para reduzir a quantidade de dados que trafegam entre os segmentos da rede, seja usando técnicas como compactação e eliminação de duplicidade ou adicionando uma camada de cache para reduzir os bits que trafegam pelo cabo. O ideal é que as empresas que estiverem migrando para a nuvem projetem suas aplicações com essas considerações em mente, reduzindo os custos de transferência de dados e melhorando o desempenho.
A saída de dados da nuvem se refere a qualquer informação que sai da rede de um provedor de nuvem para outro local. Esse outro local pode ser um data center on-premises, outro data center na nuvem em uma região diferente, uma "zona de disponibilidade" (data center) no mesmo serviço de nuvem ou até mesmo outra rede virtual no mesmo data center.
Às vezes, existe uma variação muito grande na forma e no valor que os provedores de nuvem cobram pela saída de dados. Por isso é importante entender os componentes incluídos nos cálculos da saída de dados. As regiões, por exemplo, são locais que geralmente consistem em vários data centers dentro de um limite geográfico. Os serviços em nuvem normalmente oferecem ampla conectividade de rede entre regiões para dar suporte a aplicações altamente disponíveis e entre regiões. A movimentação de dados de uma região para outra é medida e normalmente cobrada com base no número de gigabytes de dados enviados.
As zonas de disponibilidade são o outro conceito principal de disponibilidade de serviços em nuvem. Embora cada provedor de nuvem tenha um nome ligeiramente diferente para esse conceito, incluindo "domínios de disponibilidade" ou simplesmente "zonas", o conceito engloba vários data centers na mesma região geográfica com variações nos provedores de rede e energia e, portanto, é improvável que ocorra uma falha simultânea. Os provedores de nuvem incentivam a execução de serviços em várias zonas de alta disponibilidade, mas os dados que passam de uma zona para outra são medidos e podem ser cobrados por gigabyte.
As organizações obtêm vários benefícios ao mover os sistemas de TI para um modelo de computação em nuvem. Entre eles estão o desbloqueio do valor comercial da economia da nuvem moderna, melhorias mais rápidas de TI, níveis mais altos de disponibilidade e acesso antecipado a novas tecnologias, como machine learning e inteligência artificial.
Outro aspecto da economia da nuvem que pode estar "oculto" é a saída de dados, que pode ocorrer de várias formas. Os provedores de serviços de nuvem monitoram e medem o tráfego de rede à medida que ele se move de um local para outro na nuvem (ou seja, de região para região, de zona para zona e até mesmo de uma rede virtual para outra dentro da mesma região).
O tráfego de entrada, ou os dados que chegam à nuvem, quase sempre é gratuito em qualquer provedor de nuvem, independentemente do volume. O tráfego de saída, ou o envio de dados, é tratado de forma diferente. Se os dados estiverem trafegando pela internet, sendo enviados para data centers locais, escritórios ou até mesmo outra região de nuvem, as cobranças serão feitas de formas diferentes, dependendo do provedor de nuvem, do serviço específico e do caminho da rede. Normalmente, a saída de dados tem um preço fixo por gigabyte até um determinado limite, com descontos aplicados para a transmissão de dados além desse nível.
O tráfego de saída de dados na nuvem pode ser o tráfego de rede padrão de uma máquina virtual na nuvem para outra máquinas, como mover dados de um banco de dados para a planilha de um usuário corporativo, por exemplo. Outro exemplo, e uma preocupação de custo mais significativa, é o tráfego associado aos ativos de armazenamento hospedados na nuvem usados por sites ou aplicações móveis. Uma prática comum para armazenamentos de objetos na nuvem é hospedar os ativos do site separadamente da aplicação do site; isso melhora o desempenho e a eficiência do desenvolvedor. Nessa arquitetura, um site carregaria imagens diretamente do armazenamento de objetos na nuvem, como o Oracle Cloud Infrastructure (OCI) Object Storage, onde os arquivos existem como endpoints HTTP, em vez de armazenar esses arquivos em um servidor Web. Quando as imagens são carregadas diretamente do armazenamento em nuvem, a aplicação cobrará pelas operações de leitura no armazenamento e pelos custos de rede associados à transferência desses dados da nuvem para a internet.
Uma aplicação da Web ocupada pode ter instâncias em várias regiões de nuvem, e o armazenamento de uma imagem dessa aplicação em uma conta de nuvem em uma única região remota pode resultar em custos significativos de saída de dados. Embora um site ou uma aplicação importante provavelmente use uma rede de distribuição de conteúdo (CDN) para reduzir os custos e melhorar o desempenho, sites novos ou em rápido crescimento podem não ser projetados para usar CDNs e podem incorrer em altas taxas de saída.
Esses são apenas alguns exemplos de saída de dados em aplicações em nuvem. O tráfego entre máquinas virtuais e instâncias de banco de dados, peering de rede virtual, links privados para ofertas de plataforma como serviço e outras arquiteturas podem gerar altas taxas de saída.
Principais conclusões
Os provedores de nuvem cobram pela saída de dados para recuperar os custos de infraestrutura associados à construção das grandes redes que vão até seus data centers e à largura de banda entre os locais, o que pode custar milhões ou bilhões de dólares. O investimento em redes submarinas – como a Microsoft fez em 2017 quando instalou 4.104 milhas de cabos submarinos entre a costa leste dos EUA e a Espanha – é um exemplo de como os provedores de nuvem estão investindo em infraestrutura de rede para conectar seus grandes data centers.
Os provedores de nuvem também investem continuamente para garantir a confiabilidade e o desempenho dessas redes, e as taxas de saída ajudam a pagar por esses investimentos. Os clientes se beneficiam por não terem que planejar e trabalhar com vários provedores para desenvolver uma rede global. Embora as cobranças de saída de dados da nuvem possam ser frustrantes, elas são um custo necessário que as organizações precisam pagar para aproveitar a infraestrutura de nuvem pública mundial.
A grande diferença entre as implementações na nuvem pública e no local é que, na nuvem pública, todos os custos são cobrados em uma única fatura. Por outro lado, as implementações on-premises normalmente têm faturas separadas para armazenamento, servidores, componentes de rede e serviços que são adquiridos em momentos diferentes e de fornecedores diferentes. As organizações também pagam separadamente pela energia e refrigeração do data center, pelo aluguel da instalação de colocation e por vários custos de software e suporte. Ver as taxas de serviços de nuvem equivalentes para todos esses itens em uma única fatura pode ser uma surpresa para gerentes de TI despreparados.
Na maioria das vezes, os custos associados às implementações on-premises são fixos, enquanto os provedores de nuvem pública oferecem várias soluções de computação a custos variáveis. Esses custos variáveis podem ser vantajosos. Isso porque, à medida que os requisitos de computação aumentam e diminuem, o custo também é ajustado de acordo, evitando que as organizações paguem a mais por uma capacidade da qual não precisam. Embora esse modelo de custo variável seja útil para os serviços em nuvem com padrões de demanda em constante mudança, a configuração incorreta ou o design inadequado pode resultar em altos custos de faturamento da nuvem.
Os custos de saída de dados são calculados de várias maneiras, dependendo do tipo de serviço e do provedor de nuvem. No entanto, o processo básico é o mesmo.
Para ter uma ideia do que isso significa no mundo real, considere que o tamanho médio de todas as páginas na Web era de 2.315 KB em junho de 2022, de acordo com o Web Almanac do HTTP Archive. Suponha que um site hospedado na nuvem tenha páginas de tamanho médio e receba 10.000 visitantes por mês e cada um deles visualize duas páginas. Esse site geraria aproximadamente 44,2 GB de saída de dados na nuvem todos os meses:
10.000 x 2 = 20.000
20.000 x 2.315 KB = 46,3 bilhões KB
46,3 bilhões KB / 1 GB (1.048.576 KB) = 44,155 GB
A seguir, vamos analisar alguns exemplos reais de custos de saída de dados na nuvem. O primeiro é um exemplo muito simples baseado nos preços do Azure em junho de 2023 para o tráfego de uma saída do servidor Web para a internet.
Agora, vamos examinar um cenário um pouco mais complexo para um cliente de um de nossos concorrentes. Um desenvolvedor fez o upload de 1 TB de dados em um bucket de armazenamento e, em seguida, transferiu 4 TB para uma região de nuvem fora dos EUA e 2 TB para a internet. Os custos em junho de 2023 seriam os seguintes:
Nesse cenário, os custos de armazenamento representam menos de 10% da taxa mensal total de transferência de dados. O que você precisa entender é o volume de tráfego que a aplicação ou o serviço gerará e quanto custará para o tipo de serviço que você está usando. No exemplo acima, um site de grande porte pode usar uma rede de distribuição de conteúdo (CDN) para diminuir os gastos, pois ela reduz a quantidade de tráfego enviado diretamente para a internet. As CDNs armazenam em cache os arquivos de dados mais próximos dos usuários previstos e nas próprias redes dos provedores de CDN, de modo que o custo líquido de seus serviços é muito menor do que as taxas de saída de dados para servir os mesmos arquivos da nuvem todas as vezes.
É importante observar que a Oracle Cloud Infrastructure oferece aos clientes até 10 TB de saída de dados por mês gratuitamente. Portanto, analisando o exemplo de nosso concorrente, um cliente da OCI pagaria apenas US$ 25,24 pelo armazenamento de dados para o mesmo volume de saída de dados. Da mesma forma, os encargos de saída de rede de US$ 882,18 incorridos no exemplo do Azure seriam incluídos no custo da VM para clientes da OCI.
Como pode ver no exemplo acima, as cobranças de saída de dados podem aumentar rapidamente. O modelo de custo ilimitado significa que uma configuração incorreta (por exemplo, conectar-se ao endpoint errado de uma conta de armazenamento com replicação geográfica) pode fazer com que os custos da nuvem disparem. Então, como as equipes de TI podem gerenciar essa realidade?
É fundamental determinar os gastos com a saída de dados da nuvem o quanto antes para minimizar os custos. As cinco dicas a seguir podem ajudar:
Monitorar e gerenciar as taxas de saída é um desafio. E reduzi-las também. As equipes de TI das empresas precisam se aprofundar um pouco mais na pilha de tecnologia para reduzir os custos de saída.
Uma CDN lê os ativos do site da organização uma vez e depois os armazena em cache em um local de borda muito mais próximo dos clientes. Usar uma CDN significa que, quando um cliente solicita uma imagem ou um arquivo do seu site, ele é obtido a partir da CDN, em vez de diretamente do seu servidor da Web hospedado na nuvem. Os custos de uma CDN são muito menores do que as taxas de saída de dados, e os clientes terão um tempo de carregamento melhor ao usarem uma CDN. Embora o seu uso possa exigir pequenas alterações no código da aplicação, os benefícios de custo e desempenho geralmente valem a pena.
Embora nem sempre seja possível compactar o tráfego de rede, o tráfego de infraestrutura (pense em conectar VMs a VMs em uma rede virtual) geralmente pode ser compactado por uma pequena compensação no aumento dos ciclos de CPU. O custo incremental do uso da CPU é muito menor do que os encargos de saída da rede.
Muitos serviços de nuvem, mesmo dentro do mesmo provedor de nuvem, oferecem várias maneiras de obter funcionalidades quase idênticas. Por exemplo, existem quase 20 formas de executar um contêiner na nuvem. Como parte do processo de planejamento, as organizações devem precificar cada abordagem, incluindo os custos de rede, que podem variar muito.
Criar uma conexão de rede dedicada entre o provedor de nuvem e o seu site pode ser caro, porém um link privado permite usar a conexão por tempo ilimitado após a compra. Para as organizações que precisam enviar um alto volume de dados da nuvem, esse investimento pode reduzir o custo total de propriedade.
Em um modelo de nuvem híbrida, com uma combinação de sistemas on-premises e hospedados, a mudança para um modelo "totalmente na nuvem" pode reduzir a quantidade de dados que saem da nuvem, reunindo tudo em um só lugar.
Essas alterações podem ser difíceis de implementar, principalmente para aplicações de produção. Em alguns casos, pode ser necessário fazer alterações significativas. No entanto, ao considerar a redução dos custos, o esforço geralmente vale a pena. Ao usar uma conexão de rede dedicada, como ExpressRoute e Direct Connect, talvez seja necessário alinhar o provedor de rede e de nuvem da organização (outras empresas cobram o preço da saída de dados por essas conexões diretas com um desconto, em comparação com taxas normais de saída).
Não é de se surpreender que diferentes provedores de nuvem tenham estruturas de preços distintas. O Azure, por exemplo, gera uma cobrança pelo tráfego de uma rede virtual para outras redes virtuais conectadas, inclusive dentro da mesma região de nuvem. Portanto, vale a pena avaliar atentamente quais podem ser os custos de saída de dados, especialmente na primeira migração para a nuvem pública.
A Oracle reconhece que outros provedores de nuvem cobram um preço alto pela saída de dados e tem trabalhado para tornar a redução dos custos de dados um dos principais benefícios de seus serviços em nuvem. A Oracle Cloud Infrastructure (OCI) oferece redes de baixo custo, permitindo que as empresas migrem, de forma econômica, grandes volumes de dados, incluindo serviços que frequentemente consomem mais largura de banda, como streaming de vídeo ao vivo, videoconferência e jogos. Assim como qualquer outra nuvem, a transferência de dados de entrada é gratuita. No entanto, a OCI oferece 10 TB de saída de dados por mês sem custo. Isso é muito mais do que os 100 GB mensais fornecidos pela concorrência. Dessa forma, as organizações podem reduzir significativamente os custos de saída de dados. Além disso, os custos de largura de banda de saída da OCI são até 25% menores do que os de outras empresas, o que é um grande benefício ao usar serviços que exigem grandes quantidades de largura de banda.
Uma das principais questões econômicas da nuvem que os clientes da nuvem enfrentam é a largura de banda para saída de dados entre serviços e redes de nuvem. Os custos associados podem ser uma surpresa na fatura de cobrança da nuvem, e as tarifas podem variar muito. Um dos aspectos mais importantes da arquitetura de nuvem é minimizar os custos de saída, aproveitando as vantagens de tecnologias, como compactação, redes de distribuição de conteúdo e camadas de cache, que podem aumentar o desempenho de um site ou aplicação e, ao mesmo tempo, reduzir os custos.
Descubra táticas revolucionárias, desde impulsionar a transformação com IA até ajustar a estratégia de fusões e aquisições e adotar a liderança colaborativa, para ajudar você a enfrentar os desafios atuais e futuros e alcançar o sucesso.
A taxa de saída está incluída no armazenamento em nuvem?
Não. Alguns fatores contribuem para o custo do armazenamento em nuvem. O primeiro e o mais óbvio é o volume de dados armazenados em uma conta de armazenamento ou em um bucket. O segundo é o número de leituras e gravações dos dados durante o período de faturamento. Ambos os fatores são afetados pela camada dos dados (quente, fria, acesso frio ou arquivos): quanto mais quente for a camada, menor será o custo associado às transações de leitura e gravação para essa camada, porém maior será o custo de armazenamento por volume de dados. Essas cobranças transacionais são separadas das taxas de saída de dados na rede.
O que são cobranças de entrada e saída de dados na nuvem?
Os custos de entrada e saída estão associados à transferência de dados entre regiões e zonas de nuvem, e entre a internet e redes locais. Geralmente, a entrada de dados (entrada na nuvem) é gratuita, mas todos os fornecedores cobram pela saída de dados (saída do provedor de serviços em nuvem). Os custos de saída são baseados no volume e na localização de dados (como internet, zonas de disponibilidade e outras regiões de nuvem) e são chamadas de cobranças irrestritas, o que significa que são variáveis e que os clientes da nuvem podem ser surpreendidos por custos mais elevados do que esperavam.
Por que algumas empresas cobram pela saída?
Alguns provedores de serviços em nuvem cobram pela saída de dados na maioria de seus serviços para cobrir os custos de construção e manutenção da rede. O preço do serviço não inclui o custo do envio de dados. Isso permite oferecer preços mais baixos em serviços como máquinas virtuais e buckets de armazenamento. Se a aplicação do seu cliente enviar muitos dados, acabará pagando por essa infraestrutura de transmissão de rede; se a aplicação do seu cliente transferir menos dados, pagará o proporcional na fatura.