Kevin Bogusch | Analyste principal en intelligence compétitive | 24 janvier 2024
Les coûts associés à la sortie des données sont une mauvaise surprise à laquelle de nombreuses organisations sont confrontées au début de leur migration vers le cloud. Alors que les services cloud tels que les machines virtuelles et le stockage ont une tarification fixe, le coût de déplacement des données hors du cloud est variable et imprévisible.
Lorsque les organisations apprennent cela, elles envisagent souvent de modifier l'architecture de leurs applications pour réduire la quantité de données circulant entre les segments du réseau, soit en utilisant des techniques telles que la compression et la déduplication, soit en ajoutant une couche de mise en cache afin de réduire le nombre de bits circulant sur le réseau. Idéalement, les entreprises qui migrent vers le cloud concevront leurs applications en tenant compte de ces considérations afin de limiter les frais de transfert de données et d'améliorer les performances.
La sortie de données cloud fait référence à toute information qui quitte le réseau d'un fournisseur cloud pour un autre emplacement. Cet emplacement peut être un centre de données sur site, un centre de données cloud dans une autre région, une zone de disponibilité (centre de données) dans le même service cloud ou même un autre réseau virtuel dans le même centre de données.
Les fournisseurs de cloud varient, parfois de manière significative, dans la façon et le montant qu'ils facturent pour la sortie de données. Il est donc important de comprendre les composants pris en compte dans leur calcul de sortie de données. Par exemple, les régions sont généralement constituées de plusieurs centres de données situés dans une zone géographique restreinte. Les services cloud fournissent normalement une connectivité réseau étendue entre les régions pour prendre en charge des applications interrégionales hautement disponibles. Les données qui se déplacent d'une région à une autre sont mesurées et généralement facturées en fonction du nombre de gigaoctets de données envoyés.
Les zones de disponibilité sont l'autre concept principal de disponibilité des services cloud. Bien que chaque fournisseur cloud ait un nom légèrement différent pour cette notion, y compris "domaines de disponibilité" ou "zones", le concept englobe plusieurs centres de données d'une même région géographique où les réseaux et fournisseurs d'énergie sont diversifiés et, par conséquent, ne risquent pas de tomber en panne en même temps. Les fournisseurs de cloud encouragent l'exécution de services dans plusieurs zones de disponibilité pour une haute disponibilité, mais les données qui passent d'une zone à l'autre sont mesurées et peuvent être facturées au gigaoctet.
Les organisations bénéficient de plusieurs avantages lorsqu'elles migrent leurs systèmes informatiques vers un modèle de cloud. Parmi eux, citons la valeur commerciale de l'économie moderne du cloud, l'accélération des améliorations informatiques, des niveaux de disponibilité plus élevés et un accès plus rapide aux nouvelles technologies, telles que le machine learning et l'intelligence artificielle.
Toutefois, un aspect parfois "caché" de l'économie du cloud est la sortie de données, qui peut prendre plusieurs formes. Les fournisseurs de services cloud suivent et mesurent le trafic réseau passant d'un emplacement dans leur cloud à un autre, d'une région à l'autre, d'une zone à l'autre ou même d'un réseau virtuel à un autre dans la même région.
Le trafic entrant, c'est-à-dire les données qui entrent dans le cloud, est presque toujours gratuit, quel qu'en soit le volume, chez tous les fournisseurs de cloud. Le trafic sortant, ou sortie des données, est traité différemment. Que les données soient dirigées vers Internet, des centres de données sur site, des bureaux ou même une autre région cloud, les frais sont calculés à des taux variables en fonction du fournisseur de cloud, du service spécifique et du chemin du réseau. En général, la sortie des données se fait à un prix fixe par gigaoctet jusqu'à un certain seuil, des remises étant appliquées pour la transmission de données au-delà de ce seuil.
Le trafic de sortie des données cloud peut être un trafic réseau standard entre des machines virtuelles cloud, comme des données passant d'une base de données à la feuille de calcul d'un utilisateur professionnel. Un autre exemple, et une préoccupation plus importante en termes de coûts, est le trafic lié aux ressources de stockage hébergées dans le cloud utilisées sur les sites web ou dans les applications mobiles. Une pratique habituelle pour les magasins d'objets cloud consiste à héberger les ressources de site web séparément de l'application du site web, ce qui améliore les performances et l'efficacité des développeurs. Dans cette architecture, un site web chargerait des images directement à partir d'une banque d'objets cloud, telle qu'Amazon Web Services (AWS) S3, Azure Blob Storage, Google Cloud Storage ou Oracle Cloud Infrastructure (OCI) Object Storage, où ces fichiers existent en tant que terminaux HTTP, au lieu de stocker ces fichiers dans un serveur web. Lorsque des images sont chargées directement à partir d'un système de stockage cloud, l'application génère des frais, à la fois pour les opérations de lecture sur le système de stockage et pour les coûts de réseau associés au transfert de ces données du cloud vers Internet.
Les applications web occupées peuvent avoir des instances dans plusieurs régions cloud, et le stockage de leurs images dans un compte cloud dans une seule région distante peut entraîner des frais élevés de sortie de données. Alors qu'un site web ou une application de grande envergure utiliserait probablement un réseau de diffusion de contenu (CDN) pour réduire les coûts et améliorer les performances, les sites nouveaux ou à croissance rapide peuvent ne pas être architecturés pour utiliser des CDN et peuvent donc entraîner des frais de sortie élevés.
Ce ne sont là que quelques exemples de sortie de données dans les applications cloud. Le trafic entre les machines virtuelles et les instances de base de données, l'appairage de réseau virtuel, les liens privés vers les offres Platform-as-a-Service et d'autres architectures peuvent tous entraîner des frais de sortie importants.
Points à retenir
Les fournisseurs de cloud facturent la sortie des données pour récupérer les coûts d'infrastructure associés à la création de grands réseaux dans leurs centres de données et la bande passante entre les sites, ce qui peut coûter des millions ou des milliards de dollars. Investir dans les réseaux sous-marins, comme l'a fait Microsoft en 2017 en construisant un câble sous-marin de 4 10 miles entre la côte est des États-Unis et l'Espagne, est un exemple des investissements des fournisseurs de cloud dans des infrastructures de réseau à grande échelle pour connecter leurs centres de données.
Les fournisseurs de cloud investissent également en permanence pour garantir la fiabilité et les performances de ces réseaux, et les frais de sortie soutiennent ces investissements. Les clients bénéficient du fait qu'ils n'ont pas à planifier et à travailler avec plusieurs fournisseurs pour développer un réseau mondial. Bien que les frais de sortie des données cloud puissent être frustrants, ils font partie du prix que les entreprises doivent payer pour tirer parti de l'infrastructure de cloud public mondiale.
Une différence importante entre le cloud public et les déploiements sur site est que dans le cloud public, tous les frais sont facturés en une seule fois. En revanche, les déploiements sur site impliquent généralement des factures distinctes pour le stockage, les serveurs, les composants de réseau et les services achetés auprès de plusieurs fournisseurs et à des moments différents. Les organisations paient également séparément pour l'alimentation électrique et le refroidissement de leurs centres de données ou pour le loyer d'une installation de colocation, ainsi que pour divers logiciels et coûts de support. Le fait de voir l'équivalent des frais de services cloud sur une seule facture peut être un choc pour les responsables informatiques.
De plus, la plupart des dépenses associées aux déploiements sur site sont fixes, tandis que les fournisseurs de cloud public proposent de nombreuses solutions informatiques à coûts variables. Les coûts variables peuvent être avantageux car ils augmentent et diminuent en fonction des besoins informatiques, ce qui permet aux organisations d'éviter de payer trop cher pour une capacité dont elles n'ont pas besoin. Bien que ce modèle de coût variable soit utile pour les services cloud avec des modèles de demande changeants, des erreurs de configuration ou une mauvaise conception peuvent entraîner des factures plus élevées.
Les frais de sortie des données sont calculés de plusieurs manières, en fonction du type de service et du fournisseur de cloud. Cependant, le processus de base reste le même.
Pour se faire une idée concrète, rappelons que la taille médiane de toutes les pages sur le web était de 2 315 kilo-octets en juin 2022, selon le Web Almanac de HTTP Archive. Supposons qu'un site web hébergé dans le cloud comprend des pages de taille médiane et reçoive 10 000 visiteurs mensuels, chacun consultant deux pages. Ce site générerait environ 44,2 Go de sortie de données cloud chaque mois :
10 000 x 2 = 20 000
20 000 x 2 315 Ko = 46,3 milliards de Ko
46,3 milliards de Ko / 1 Go (1 048 576 Ko) = 44,155 Go
Examinons ensuite quelques exemples concrets de coûts de sortie des données cloud. Le premier exemple est très simple et se base sur la tarification d'Azure en vigueur en juin 2023 pour le trafic sortant d'un serveur web vers Internet.
Examinons maintenant un scénario un peu plus complexe pour un client AWS. Les développeurs ont téléchargé 1 To de données vers un compartiment de stockage S3, puis transféré 4 To vers une région AWS en dehors des États-Unis et 2 To vers Internet. Les coûts au mois de juin 2023 seraient les suivants :
Dans ce scénario, les coûts de stockage représentent moins de 10 % du total des frais mensuels de sortie des données. Le point essentiel à comprendre est la quantité de trafic qu'une application ou un service va générer et ce que cela va coûter pour les types de services utilisés. Un site web à fort trafic pourrait réduire ses dépenses dans l'exemple ci-dessus en utilisant un réseau de diffusion de contenu (CDN) pour réduire la quantité de trafic circulant directement sur Internet. Les CDN mettent en cache les fichiers de données plus près des utilisateurs prévus et dans les propres réseaux des fournisseurs de CDN, de sorte que le coût net de leurs services est généralement beaucoup moins élevé que les frais de sortie de données pour servir les mêmes fichiers du cloud à chaque fois.
Soulignons qu'Oracle Cloud Infrastructure offre gratuitement aux clients jusqu'à 10 To de données sortantes par mois. Ainsi, en regardant l'exemple d'AWS, un client OCI ne paierait que 25,24 $ de frais de stockage de données pour la même quantité de sortie de données. De même, les 882,18 $ de frais de sortie du réseau encourus dans l'exemple d'Azure seraient inclus dans le coût de la machine virtuelle pour les clients OCI.
Comme indiqué dans les exemples ci-dessus, les frais de sortie des données peuvent augmenter rapidement. Ce modèle de coût sans contrainte signifie que des erreurs de configuration potentielles, telles que la connexion au mauvais terminal d'un compte de stockage géo-répliqué, peuvent entraîner des factures incontrôlées. Comment l'équipe informatique peut-elle gérer cette situation ?
Les dépenses liées à la sortie des données du cloud doivent être déterminées le plus tôt possible afin de limiter les coûts. Les cinq conseils suivants peuvent vous aider :
Surveiller et gérer les frais de sortie est un défi. Les réduire en est un autre. Pour réduire les coûts de sortie, les équipes informatiques des entreprises doivent aller plus loin dans la pile technique.
Un réseau CDN lit une fois les ressources du site web d'une organisation, puis les met en cache à un emplacement beaucoup plus proche du client. L'utilisation d'un CDN signifie que lorsqu'un client demande une image ou un fichier à partir sur votre site web, il est servi à partir du CDN plutôt que directement à partir de votre serveur web hébergé dans le cloud. Les coûts d'un réseau CDN sont beaucoup plus faibles que les frais de sortie de données, et les réseaux CDN offrent aux clients de meilleurs temps de chargement. Bien que l'utilisation d'un réseau CDN puisse nécessiter de légères modifications du code de l'application, les avantages en termes de coûts et de performances en valent presque toujours la peine.
La compression du trafic réseau n'est pas toujours possible, mais le trafic d'infrastructure (par exemple, de machine virtuelle à machine virtuelle) peut généralement être compressé pour une contrepartie minime en termes d'augmentation du nombre de cycles du processeur. Le coût différentiel de l'utilisation du processeur est nettement inférieur aux frais de sortie du réseau.
De nombreux services cloud, même au sein d'un même fournisseur, offrent plusieurs moyens d'obtenir des fonctionnalités presque identiques. Par exemple, il existe près de 20 façons d'exécuter un conteneur dans AWS. Dans le cadre du processus de planification, les organisations doivent évaluer le prix de chaque approche, y compris les frais de réseau, qui peuvent varier considérablement.
Une connexion réseau dédiée entre le fournisseur de cloud et votre site peut être coûteuse, mais un lien privé vous donne une utilisation illimitée de la connexion une fois achetée. Pour les entreprises qui ne peuvent éviter un volume élevé de sortie de données cloud, cet investissement peut réduire le coût total de possession.
Dans un modèle de cloud hybride, avec un mélange de systèmes sur site et hébergés, le passage à un modèle "tout cloud" peut réduire la quantité de données qui sortent du cloud en les regroupant en un seul endroit.
Ces modifications peuvent être difficiles à implémenter, en particulier pour les applications de production. Dans certains cas, les ingénieurs d'application peuvent être amenés à apporter des modifications importantes. Mais les économies réalisées justifient souvent ces efforts. Bien que l'utilisation d'une connexion réseau dédiée, telle que ExpressRoute et Direct Connect, puisse nécessiter une coordination avec le fournisseur de cloud et de réseau de l'entreprise, Microsoft et Amazon facturent la sortie des données via ces connexions directes à un tarif inférieur à celui de la sortie normale.
Il n'est pas surprenant que différents fournisseurs de cloud proposent des structures de tarification différentes. Azure, par exemple, facture le trafic d'un réseau virtuel vers d'autres réseaux virtuels connectés, même au sein de la même région cloud. Il vaut donc la peine d'évaluer soigneusement les coûts de sortie des données, en particulier lors de la première migration vers le cloud public.
Oracle est bien conscient des coûts élevés de sortie des données facturés par d'autres fournisseurs de cloud et s'efforce de faire de la réduction des coûts des données un avantage majeur de ses services cloud. Oracle Cloud Infrastructure (OCI) offre des tarifs de réseau bas qui permettent aux entreprises de déplacer, à faible coût, d'importants volumes de données, y compris des services qui consomment fréquemment les plus grandes quantités de bande passante, tels que le streaming vidéo en direct, la vidéoconférence et les jeux. Comme avec d'autres clouds, le transfert de données entrant est gratuit. Cependant, OCI offre 10 To de sortie de données chaque mois sans frais, soit bien plus que les 100 Go mensuels d'AWS, ce qui permet aux organisations d'économiser considérablement sur la sortie de données. En outre, les coûts de bande passante sortante d'OCI sont jusqu'à 25 % inférieurs à ceux d'AWS, ce qui est un avantage important lorsque vous utilisez des services qui nécessitent de grandes quantités de bande passante.
L'une des principales considérations d'économie du cloud auxquelles les clients sont confrontés est la bande passante pour la sortie de données des services et réseaux cloud. Les coûts associés peuvent constituer une surprise de taille sur la facture cloud, et les frais peuvent être très variables. L'un des aspects les plus importants de l'architecture cloud est la réduction des coûts de sortie en tirant parti de technologies, telles que la compression, les réseaux de diffusion de contenu et les couches de mise en cache, qui peuvent en outre améliorer les performances d'un site ou d'une application.
Découvrez des tactiques innovantes, de la transformation avec l'IA à l'ajustement de votre stratégie de fusions et acquisitions et l'adoption d'un leadership collaboratif, qui vous aideront à relever les défis d'aujourd'hui, et de demain, et à prospérer.
Des frais de sortie sont-ils inclus dans le stockage cloud ?
Non. Plusieurs facteurs contribuent au coût du stockage cloud. Le premier, et le plus évident, est le volume de données stockées dans le compte de stockage ou le compartiment. Le second est le nombre de lectures et d'écritures des données au cours de la période de facturation. Ces deux facteurs sont influencés par le niveau (chaud, froid ou archive) des données. Plus le niveau est chaud, plus le coût associé à ces transactions de lecture et d'écriture est faible, mais plus le coût de stockage par volume de données est élevé. Ces frais transactionnels sont distincts des frais de sortie des données sur le réseau.
Quels sont les frais d'entrée et de sortie de données dans le cloud ?
Les frais d'entrée et de sortie sont des coûts associés au transfert de données entre les régions et les zones cloud, vers et depuis Internet, et vers et depuis les réseaux sur site. L'entrée des données (vers le cloud) est généralement gratuite, mais tous les fournisseurs facturent la sortie des données (depuis le fournisseur de cloud). Les frais de sortie sont basés sur le volume de données et son emplacement, tels qu'Internet, les zones de disponibilité et d'autres régions cloud, et sont appelés frais non liés ou non limités, ce qui signifie qu'ils sont variables et peuvent être une surprise coûteuse pour les clients cloud.
Pourquoi AWS facture-t-il la sortie ?
Comme d'autres fournisseurs cloud, AWS facture la sortie de données sur la plupart de ses services pour couvrir les coûts de construction et de maintenance de son réseau. AWS n'inclut pas le coût de la sortie des données dans la tarification des services. Amazon peut donc pratiquer des prix plus bas sur des services tels que les machines virtuelles et les espaces de stockage. Les clients dont les applications génèrent des niveaux élevés de sortie de données finissent par payer la facture de l'infrastructure de transmission réseau, tandis que les clients dont les applications transfèrent moins de données en paient une plus petite partie.