What Is Cloud Infrastructure?

Michael Chen | Senior Writer | December 20, 2024

无论您需要什么类型的云服务,基础设施都是基础。弹性、安全性、可靠性、正常运行时间、成本效率、全球覆盖范围、灵活的部署、数据库支持和客户服务—希望停用或补充本地数据中心的组织在选择合作伙伴时需要考虑所有这些因素。如果他们希望将资源密集型 AI 工具和工作负载集成到其运营中,则更是如此。

本文将重点介绍使用云基础设施而不是维护自己的数据中心的一些优势,并将这些点与云提供商的技术选择联系起来,使这些优势成为可能。

什么是云基础设施?

云基础设施是硬件和软件元素的集合,包括服务器、存储、网络和数据库等资源。云提供商可按需按量计费地提供这些资源。

云基础设施的要素通常分为三个部分:

硬件:这包括提供商数据中心内的服务器、存储阵列和其他支持硬件,例如配电、冷却和安全设施。云技术提供商负责维护和升级硬件;客户专注于如何充分利用资源来满足需求。

虚拟化:使用虚拟化软件时,单个服务器可以显示尽可能多的服务器,也称为虚拟机 (VM) 。VM 通过创建称为容器的软件环境来支持具有不同操作系统和硬件要求的应用,以支持每个应用的要求。由于虚拟机是软件,因此可以轻松地将虚拟机停止、启动或从一个物理服务器移动到另一个物理服务器,从而为组织提供灵活性来满足其工作负载需求。虚拟化管理软件通常称为虚拟机管理程序。

网络:云数据中心中使用的网络可能是云提供商之间的差异化因素。所有这些都将提供高速、低延迟的网络。有些更进一步,并提供通常仅在高性能计算环境中发现的网络功能。高级提供商通过在网络路由和管理中构建零信任原则,将网络层用作安全实施点。这有助于确保服务器和存储系统之间的通信仅在具有明确许可的情况下进行。

云基础设施供应商还专注于物理安全,通过锁定的门、警卫和严格的访问控制来保护资产。

云基础设施的一个关键特性是可扩展性。在传统数据中心中,除非 IT 人员实际升级硬件(可能需要新的租用或设施构建),否则容量是固定的。如果产品的需求激增,例如正在病毒式传播或合并或收购,这种不灵活性可能会产生性能和可用性问题。借助云基础设施,可以轻松应对需求变化。

云基础设施与云架构对比

虽然术语“云基础设施”和“云架构”指的是重叠的概念,但它们是不同的。云基础设施包括构成云产品的物理和虚拟组件,通常由云服务提供商管理。云架构是指设计、集成和资源管理方面的注意事项,这些注意事项决定了云基础设施的使用和配置方式。架构考虑的一个例子是自动负载平衡,这确保了共享公共云的所有客户的最佳稳定性。

关键要点

  • 云基础设施是指通过互联网提供技术服务(而不是使用本地数据中心)所需的服务器、存储、虚拟化和网络。
  • 虽然传统数据中心使用 CapEx 模型,并倾向于构建以适应最坏情况的需求水平,但云基础设施使用 OpEx 模型,可以纵向扩展和收缩。
  • 与传统数据中心相比,云基础设施可提供更高的灵活性、可扩展性和易管理性。
  • 云基础设施可以满足区域数据支持或合规性要求的地理需求。

云基础设施详解

随着技术变得越来越复杂和运营中心化,许多组织已经认识到从自己的数据中心迁移到云的好处,其中包括添加和删除资源的能力满足不断变化的需求,只需为您使用的服务付费,灵活购买各种服务和技术,以及顶级云服务提供商 (CSP) 提供的卓越可靠性。大多数 CSP 都有正常运行时间跟踪记录,内部 IT 团队很难进行匹配,并为数据集成工作流提供内置工具,例如自助分析和自动化。

强大且可扩展的基础设施具有许多优势,包括:

  • 集中管理来自设备、应用和远程员工的数据,从而实现更及时、更准确的数据分析。当云基础设施支持自动数据集成时,准备的数据可以无缝地流入数据湖和其他存储库。
  • 快速扩展软件资源,其成本在本地硬件上可能过高。
  • 适应向远程工作的转变,这需要更广泛的可访问性和更高级的安全性。
  • 升级灾难恢复,为故障转移策略增加高可用性和灵活性。
  • 与内部维护和升级成本相比,云基础设施的固定成本更具可预测性,因此预算更高。
  • 满足区域和/或行业相关的数据存储合规性要求,例如,数据存储在特定地理区域或客户指定的位置的要求。云区域可帮助企业遵守这些要求,云技术提供商也可以在客户数据中心或托管中心部署云技术。

云基础设施的工作原理

云基础设施可结合使用软件、硬件和网络工具来管理传入资源需求。虽然每个客户的基础设施的具体情况将取决于提供商的产品和组织需求,但该过程通常工作如下:客户请求一个资源,例如新的虚拟机,云提供商从其可用容量池中供应资源,客户通常在几分钟内通过互联网访问资源。

让我们更深入地看看它是如何发生的。

在云数据中心内,提供商需要配置必要的硬件。由于服务器、存储、配电单元、路由器和其他所需设备都安装和维护在数据中心,因此客户组织只需要担心其互联网连接、访问控制和预算。

为了在数据中心从逻辑上分离客户资源,虚拟机管理程序会创建新的虚拟机和其他虚拟化资源,这些资源可以安全、独立地运行。在虚拟层中,计算能力、存储功能和其他关键元素等资源将集中在一起。管理软件监督这些资源,自动平衡负载,因为不同的客户端提供了不同的资源需求。通过自动化管理,云提供商的资源将作为一个整体高效运行,而不会让任何个人账户陷入困境。

这一切都发生在供应商的方面。服务的交付通常通过标准的互联网连接进行,但在某些情况下,服务可能通过专用线路提供,甚至通过客户自己的数据中心中的齿轮架在托管系统上提供。

云基础设施在云计算中的作用

云计算是指租用和购买计算资源、存储或其他服务。这是一个非常广泛的类别,几乎适用于通过网络访问的任何内容,例如存储在备份服务、企业 CRM 或 ERP 套件或支持 GenAI 的数据库即服务的照片。庞大的云计算市场由云基础设施支撑。虽然从理论上讲,云应用公司可以纯粹从本地拥有的数据中心运营,但如果需求突然激增,提供商可能缺乏跟上需求的能力,因此可能会失去客户。企业级服务的提供商不会冒风险,这就是为什么这些系统中的许多都建立在超大规模云基础设施上。

由于对云计算服务的需求可能会出现波动,因此灵活性是关键。云基础设施是解决这一核心业务需求的优秀且经济高效的方式。

云基础设施中包括哪些内容?

“云基础设施”是指包含提供商的物理硬件、管理和虚拟化软件以及网络功能的复杂系统,这些系统结合起来通过互联网为许多客户提供数据中心体验。主要的云提供商提供各种特性和优势,包括每个平台独有的工具,例如自助分析,甚至是特定于运营的应用,例如 ERP 和 CRM。

为了确定最适合组织,IT 人员需要考虑其处理、存储、延迟、应用、安全性和合规性需求。

云基础设施的组成部分

云基础设施不仅包括数据中心内的服务器,云基础设施中组件的清单取决于提供商,其中包括用于隔离段、防火系统、电源、冷却等的硬件、软件、网络和物理元素(例如笼子)。

主要组件包括:

  • 设施本身:超大规模云数据中心(即专为满足大量工作负载而设计的数据中心)通常采用自动化、冷却和连接等先进技术,以优化性能并降低成本。它们通常位于提供低成本且可靠的能源、廉价的土地以及靠近主要网络中心的地点,以最大限度地减少延迟并增强连接性。预计将找到多层物理安全和访问控制,以及先进的气候系统和对冲,以防止停电,火灾,洪水和其他不可预测的事件。
  • 服务器和其他硬件:您在云数据中心可以找到的装备包括具有 GPU 和 CPU、安全系统、网络、冷却和电源的服务器。各种存储设备可满足从高性能访问到长期归档(硬盘、固态硬盘和阵列)的需求,可存储客户数据以实现主要和冗余/恢复功能。与本地数据中心不同,容量扩展完全由云提供商处理。
  • 虚拟化:云基础设施中使用的虚拟化的关键组件是用于虚拟机监视的虚拟机管理程序、在虚拟机管理程序中运行的各个虚拟机、用于监视虚拟化基础结构的管理软件以及用于将资源池到虚拟机的硬件物理集群。
  • 网络:云提供商负责的组件允许其客户(如适用)和客户的客户进行网络访问。此外,还有连接服务器、存储和其他组件的内部网络基础设施,包括路由器、交换机和负载平衡器。
  • 安全性:除了讨论的物理度量外,云技术提供商还维护防火墙、入侵检测系统、加密和逻辑访问控制,以保护和隔离客户数据,并在客户需要时提供专用硬件。
  • 管理系统:为了高效运营业务,云技术提供商需要专门的软件来管理和变现资源,包括自动预配客户账户、添加和停用服务以及在非常精细的级别上计费的软件。

云基础设施交付模式

云基础设施有三种主要交付模式。客户选择什么取决于其需求、IT 资源和预算。企业通常使用多种模型来满足其需求,在许多情况下,提供商包括自助分析、自动化数据转换和运营应用等工具,以更好地满足客户的特定短期和长期需求。

基础设施即服务 (IaaS)

IaaS 将数据中心部署在云中,无论是公有云、私有云还是与本地数据中心结合使用的混合云。借助 IaaS,计算能力、存储和其他关键资源由提供商虚拟化和管理,并通过互联网或专用连接提供给组织。

平台即服务 (PaaS)

PaaS 基于 IaaS 构建,提供旨在简化应用开发和交付的服务。流行的 PaaS 产品包括数据库管理系统、身份和授权系统、分析功能、低代码开发工具和 AI 基础设施,可加快开发周期(即使有繁重的工作负载需求),并可帮助企业轻松使用先进的服务来满足各种需求。

软件即服务 (SaaS)

SaaS 是指通过 Internet 提供的软件,通常是通过 Web 浏览器或前端应用程序(例如智能手机)提供的。SaaS 的热门示例包括视频和音频流、在线游戏和个人云存储。在企业方面,包括 HR、财务和营销在内的全组织部门都可以从通过云交付的应用中受益。借助 SaaS,软件由服务提供商管理,并自动提供扩展、新功能和安全更新功能。

相关服务是企业集成平台即服务或 EiPaaS。这是一组基于云的服务,用于链接公司的许多应用、数据库和服务,无论这些应用是在本地数据中心还是在云端运行。

什么是云基础设施采用模式或云架构类型?

云基础设施有四个主要模型。适合组织的具体需求取决于组织的具体需求,例如敏感数据量、旧应用的关键性和数量以及预期的资源需求。

以下是四种类型的云基础设施:

公有云技术

在公有云中,由第三方云服务提供商拥有的资源会与该服务的所有客户共享。公有云是可扩展的,并具有按量计费的定价模式。提供商管理资源来分配工作负载,以便每个账户都能获得适当的支持。这对需求不均衡的公司很有吸引力,例如在假期期间出现飙升的零售商,或者在月底或季度末可能会看到更多需求的公司。

私有云

私有云使用与公有云相同的模型,但由单个组织使用。此配置提供更高的安全性和隐私性,但成本更高。可以定制私有云来满足非常特定的业务需求、安全性或合规性要求,并且可以在私有数据中心、托管设施或客户自己的数据中心中进行预配。

混合云策略

借助混合云,企业可以将本地数据中心资源与公有云产品相结合。IT 团队通过此配置获得了显著的灵活性。例如,公司可以选择将本地数据中心用于无法顺利迁移的旧应用,或用于需要本地化的受监管数据。

多云策略

多云是指使用来自不同提供商的多个云平台。此类设置可以将 IaaS、PaaS 和 SaaS 集成到紧密或松散耦合的体系结构中。多云方法为组织提供了灵活性、可恢复性和避免供应商锁定的能力,尽管管理起来可能更复杂。

主要云技术提供商之间的新协议使之成为企业更具吸引力的选择。

云基础设施的优势

一般来说,由于 CSP 池和物理资源的虚拟化方式,云基础设施比本地数据中心更快、更可扩展、更易于访问且更具成本效益。此外,云提供商通常具有特定于其平台的功能和工具,可提供分析、数据管理、数据集成、AI 和其他服务。

以下是云基础设施的一些普遍优势:

  • 成本效率:本地数据中心需要硬件和软件的资本支出以及设施和维护方面的投资。它们通常旨在满足最坏情况的需求水平,尽管在大多数情况下,该组织不会要求这种能力。云基础设施可以扩展和收缩,使服务与需求保持一致,每月运营成本反映实际使用情况。
  • 弹性:通过使用虚拟化、物理资源池和自动缩放,云基础设施提供了一个弹性环境,能够按需预配和自动分配处理能力和存储。这对于资源密集型工作负载(例如 AI 模型训练)尤其重要。
  • 灵活性和敏捷性:与自有数据中心相比,云基础设施的可扩展性和成本效率使企业能够采用更灵活、更敏捷的 IT 方法。此外,云提供商还可以提供地理分布,帮助企业满足区域性能或合规性需求,并支持混合云和多云战略。
  • 全球覆盖范围:云基础设施可以使用提供商的区域数据中心集合,提供特定于不同地理区域的快速、安全和高可用性访问。这种地理上的灵活性可以满足本地数据中心无法满足的延迟、合规性和边缘访问需求。
  • 灾难恢复和业务连续性:云基础设施提供商通常具有非常强大的灾难恢复计划和自动备份和恢复技术,可以最大限度地减少停机时间并简化事件发生后恢复操作的流程。云数据中心的地理分布有助于防止本地化灾难(如飓风)的影响,因为数据在多个位置冗余存储。云技术支持用户从任意位置访问关键应用和数据,帮助员工在发生中断时保持工作效率。
  • 可靠性和高可用性:鉴于 CSP 的冗余电源、冷却和网络(包括来自多个运营商的互联网连接),云提供商在内部复制所需的可靠性水平既困难又昂贵。许多提供商还提供没有单点故障的高可用性计算系统,并为关键工作负载提供不间断服务。虽然高可用性系统拥有或用作云资源的成本历来很高,但近期的架构创新使更多客户能够负担得起这些系统。
  • 可扩展性:在本地数据中心,扩展处理能力或存储容量通常需要硬件升级。这会影响资本预算,几乎不可能实时解决需求激增问题。云基础设施允许横向分配资源以满足当前需求。
  • 安全性:云基础设施安全团队通常可以访问大多数本地数据中心无法比拟的高级工具和顶级专业知识。云系统提供核心安全功能,例如加密和基于角色的访问控制,并更加强调合规性和认证。领先的提供商现在还提供零信任架构,通过限制对明确授权使用给定资源的个人和系统的访问来提高安全性。

云基础设施挑战

每个组织都有自己独特的网络和处理需求,这意味着一些云提供商将比其他提供商更适合。在评估云平台时,IT 团队应考虑以下挑战:

  • 合规性:区域和行业对安全性、数据存储的地理位置等提出了一系列合规性要求。主权数据管理要求往往超越了地方限制,包括工作人员的国籍要求以及如何使用和保持数据安全的规则。云提供商越来越多地提供满足这些要求的方法,包括将云基础设施放入任何数据中心,并让客户指定谁来管理系统。
  • 成本管理:由于云基础设施是基于“按量计费”模式计费的,因此每月的确切成本一般会有所不同。这意味着,如果没有适当的规划和管理,意外费用可能会堆积起来。为了实现这一目标,IT 部门应实施云成本控制,以确保为满足临时需求而启动的 VM 退役,并应用所有适用的折扣。
  • 数据管理:云基础设施为更灵活、更敏捷地使用数据打开了大门。随着 AI 嵌入到应用中,并通过自然语言界面向更多用户开放,企业需要更新数据管理、集成和治理策略。自动化和数据目录等提供商工具可帮助企业处理大量数据,从而实现更快速、更顺畅的数据管理,并帮助企业过渡到自助分析和其他应用,从而提高效率和洞察力。
  • 治理:拥有合适工具集的云基础设施提供商在帮助企业满足治理需求方面可发挥重要作用。借助工具、应用和存储库之间的互连,迁移到云可以显著增强员工从数据中获得更多数据的能力。建立连接到企业应用、非结构化数据来源和 AI 分析工具的数据湖,企业可以更全面地使用数据并更轻松地进行分析。然而,权衡是需要加强监督,往往需要治理战略,如基于角色的访问控制。AI 工具可帮助执行治理任务,包括数据分类和异常检测。实现所有这些目标(只让合适的用户使用合适的数据)是一项新的治理任务,但洞察和生产力的潜在改进可能值得努力。
  • 集成和多云:公有云基础设施是专为集成而构建的,这要归功于开放标准,可以实现更顺畅的数据流,尽管出站费用仍然是一个关键点。在不同提供商云上运行的应用之间共享数据在技术上可能很简单,但可能会造成治理、性能和成本问题。为了解决这个问题,行业领导者已经开始支持真正的多云设置。例如,Oracle 与其他超大规模企业合作,在 AWS、Google Cloud 和 Microsoft Azure 数据中心内运行数据库和其他云服务,从而提高性能并尽可能降低出站费用。多云战略至关重要,特别是对于在两个或更多云中运行应用的大型公司而言。
  • 迁移:虽然许多迁移可以简单快速地完成,但组织应始终考虑可能需要获得更多支持的各种因素:旧应用需求、第三方应用需求、内部部署数据、基于云的应用升级可用性以及多云/混合云注意事项。这些现实要求组织制定迁移路线图来展示迁移与价值之间的权衡,在许多情况下,云提供商将提供工具和服务来帮助解决迁移问题,并对解决出现的各种问题所需的时间进行现实的估计。

    如果您使用的是本地部署的第三方应用,那么将它们迁移到云端的工作将高度依赖于相关供应商、您正在运行的版本以及添加的自定义功能。现在,供应商通常会提供其应用的云版本,只要您使用的是最新版本,供应商就会提供有助于迁移的工具。定制仍需要处理。这与验证您的应用的云版本是否正常工作一起需要时间。所谓的直接迁移操作(即将应用迁移到云而无需更改性能或功能)可能需要三个月到一年或更长时间。任何迁移路线图都应包括迁移后如何从这些应用中获得更多价值。
  • 性能:云基础设施快速运行。在某些情况下,它们可以显著提高性能,尤其是在您的本地部署基础设施过时的情况下。此外,如果您有员工远程工作,他们通常会在使用通过云交付的应用程序时看到工作效率的提升。然而,在特定情况下可能会出现潜在的性能问题,例如当网络正在处理资源密集型工作负载时,当旧应用程序没有针对云进行优化时,或者当最终用户互联网连接较差时。此外,区域特定的需求和边缘设备可能会带来基于距离的延迟问题。为了应对这些挑战,请制定可靠的迁移计划并进行频繁的测试,以确保性能如预期。请注意,当数据存储库保持本地状态但应用程序迁移到云时,性能问题可能会出现。未设计用于通过 Internet 连接运行的应用程序可能会出现性能问题。
  • 安全性:云技术提供商的安全程序和专业知识优于大多数组织。他们必须这样做,因为提供商的声誉取决于为客户保护系统和数据。但这并不意味着安全仍然不是一个主要考虑因素。赎金攻击已经变得更加复杂和成功。因此,无论系统是本地部署还是云端部署,安全方法都需要不断发展。例如,零信任原则(只允许显式允许的用户、系统和操作)变得越来越重要。云提供商可为基于角色的访问控制、证书、加密密钥和漏洞监视等功能提供管理工具,帮助满足安全要求。
  • 技能差距:迁移到云基础设施提供商需要您采用一组新的管理工具和功能。您的 IT 人员在拟议的 CSP 方面有哪些经验?对于每个组织,答案会有所不同。技能差距不一定是阻碍因素,但随着团队考虑其迁移策略以及正在进行的运营和发展,他们应该仔细考虑培训需求。
  • 供应商锁定:云提供商可能会为其平台使用专有工具和 API,这可能会造成供应商锁定。同样,如果组织的 IT 团队只专注于为特定 CSP 培养技能,则供应商锁定可能是一种有机副产品。为了解决这个问题,IT 人员应尽可能避免使用专有技术。大多数云提供商至少在某种程度上支持开放标准,开放标准在多大程度上应成为选择云提供商的关键因素。

使用 OCI 安全、快速地运行

Oracle Cloud Infrastructure (OCI) 是一个全球可用的超大规模云,提供企业工作负载所需的所有服务,包括 GenAI。OCI 在多个全球云区域和客户指定的位置提供安全、快速和可扩展的 OCI,可帮助企业满足数据治理要求。此外,OCI 提供 100 多个基础设施和平台服务,所有这些服务都具有灵活的增量服务使用,因此客户只需为所需的性能付费。

了解 Gartner 为何将 Oracle Distributed Cloud 评为“领导者”。该产品为受监管的数据客户提供云技术的所有优势,包括更好地控制操作、数据驻留和邻近性。

云基础设施常见问题解答

什么是云计算基础设施示例?

云基础设施的日常实例是流视频服务。这些服务需要一个可扩展的基础来优化计算性能并按需提供存储,同时最大限度地提高最终客户的可用性。Netflix 等公司在全球拥有数千台服务器,由于用户和服务器之间的地理位置接近,因此可以实现冗余和最小延迟的组合。在企业层面,请考虑一家大型电子商务公司,该公司使用 IaaS 提供商托管其在线平台,并在购物高峰期(例如黑色星期五或网络星期一)快速扩展其基础设施,而无需对物理服务器或数据中心进行大量资本投资。这种灵活性使企业只需为其使用的资源付费,有助于确保高效的成本管理,同时还能够快速部署额外的计算能力、存储和网络功能以满足客户需求。

云基础设施如何帮助实施数据治理?

云基础设施可通过集中控制、提高可见性和自动化合规性管理来增强数据治理。企业可以在云端存储的所有资产中实施一致的策略,从而确保数据根据监管要求和内部标准进行管理。此外,云平台通常附带用于跟踪数据移动、监视访问和审计使用的内置工具,可帮助组织保持问责制和透明度。一些云提供商还提供区域支持来帮助满足本地合规性需求,事实上,顶级超大规模提供商甚至提供其公有云的私有版本,这些版本可以位于客户的站点。

为什么云基础设施优于本地数据中心?

云基础设施具有高度的可扩展性,可在全球范围内使用,并配备了丰富的数据管理和分析工具集,可供内部运行的系统使用。最近,AI 工具(包括 GenAI 和 AI 代理)被证明擅长开发易于在云中使用的新应用。在云基础设施中,用户可以使用自然语言提示挖掘数据,并使用低代码和无代码工具开发应用。所有这些都无需 IT 人员来管理本地数据中心内的更多服务和更多硬件。

服务级别协议如何适用于云基础设施?

服务级别协议 (Service Level Agreement,SLA) 可为客户提供运行时间、速度、灾难恢复和其他关键指标的分层保证。对于企业工作负载,了解哪些 SLA 可用以及成本是决定云提供商的关键部分。对于特别复杂的工作负载,有时可以在提供商和客户之间协商定制 SLA。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. 除Oracle隐私政策外,本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国 。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。