国家/地区

Kubernetes Engine (OKE)

OKE 可简化任意规模的云原生、企业级 Kubernetes 运营。您可以利用 OKE 的自动升级、智能扩展和内置安全性优势，轻松部署、管理和扩展您的要求严苛的工作负载，包括 AI 和微服务。

立即了解 OKE

规模化 AI：利用 OCI Kubernetes Engine (OKE) 将创新快速推向市场

12 月 11 日，了解如何加速开发并简化生产环境中的 AI 工作负载管理。

了解如何加速开发并简化生产环境中的 AI 工作负载管理。

立即注册

为什么要选择 OKE？

性价比

了解 8x8 如何利用 OCI 提高性能，优化总拥有成本。
自动伸缩

了解 DMCC 如何通过弹性扩展满足峰值需求。
效率

了解 Cohere 如何利用 OCI 提高服务效率。
可移植性

了解 CNCF 如何以尽可能小的变更代价将 Kubernetes 工作负载迁移到 OCI。
简易性

了解 EZ Cloud 如何简化部署和 Day 2 运维。
可靠性

了解 B3 如何在 OCI 上实现严苛的可用性目标。
弹性

了解 Zimperium 如何设计区域故障转移和快速恢复方案。

众多客户之所以选择 OKE，是因为 OKE 既能交付出色成果，又具有强大的可靠性，支持企业轻松运行和扩展旗下业务。

OCI Kubernetes Engine (OKE) 获得了云原生计算基金会 (CNCF) 的 Kubernetes 平台和 Kubernetes AI 平台合规性认证。

这彰显了 OKE 对开放标准的一贯支持，可确保您在一个完全遵循行业优秀实践且能够与全球 Kubernetes 生态系统互操作的平台上运行您的云原生和 AI/机器学习工作负载。

详细了解 OCI 新获得的 AI 合规性认证。

OKE 使用场景

加速构建 AI 模型

AI 模型构建流程的第一步是数据准备和试验，而这离不开安全、共享式访问 GPU 以及集中管理。OKE 使工作团队能够：

– 通过安全的多租户集群来充分提高 GPU 利用率

– 在一个集中管理的环境中高效协作

– 集成 Kubeflow，从而简化模型开发和部署工作

了解关于使用 OKE 在基于 GPU 的节点上运行应用的更多信息。

OKE：专为 AI 和机器学习打造

OKE 基于 OCI 的高性能基础设施构建，可提供以下优势：

– 访问新款 NVIDIA GPU（H100、A100、A10 等）

– 超高速 RDMA 网络，尽可能提高吞吐量并降低延迟

– 完整控制托管式或自管理式 Kubernetes 工作节点

了解如何创建 Kubernetes 集群并在其中安装 Kubeflow。

高效编排训练工作负载

数据科学家依靠精心调度来充分利用资源，运行训练工作负载。OKE 支持 Volcano 和 Kueue 等高级调度工具，有助于高效运行并行和分布式工作负载。

大规模 AI 训练还离不开快速、低延迟的集群网络。得益于 OCI 基于 RDMA 的基础设施，OKE 支持直接与 GPU 内存交换数据，由此尽可能降低延迟和提高吞吐量。

OKE：高性能 AI 训练解决方案

OKE 基于可靠的 OCI 基础设施构建，可提供以下优势：

– 访问 NVIDIA GPU（H100、A100、A10 等）

– 超快速 RDMA 网络连接

– 灵活地在自管理式 Kubernetes 节点上运行训练作业

了解关于使用 OKE 在基于 GPU 的节点上运行应用的更多信息。

在 OKE 上使用 NVIDIA A100 裸金属节点运行 GPU 工作负载？本教程将为您展示操作方法。

高效、可扩展的 AI 推理

OKE 充分利用 Kubernetes 来高效管理推理 Pod，通过自动化调节资源满足推理需求。利用 Kubernetes Cluster Autoscaler，OKE 能够基于实时工作负载需求自动化调整托管式节点池大小，在扩展推理服务的同时提供高可用性保障并优化成本。

OKE 的高级调度和资源管理功能支持精确地为推理 Pod 分配 CPU 和内存资源，即使工作负载波动时也能为您提供一致、可靠的性能。了解关于在 OKE 上部署和管理应用的更多信息。

OKE 为实现可扩展、成本高效的 AI 推理提供强大解决方案，不仅能通过虚拟节点实现快速的 Pod 级扩展，还具有出色的灵活性，支持使用 GPU 或 Arm 处理器运行工作负载。

了解如何使用 OCI Kubernetes Engine 来规模化部署 NVIDIA NIM 推理微服务。

有关使用 GPU 节点运行 AI 推理的更多信息，请查看使用 GPU 节点运行应用文档。

使用 OKE 轻松进行应用迁移

使用 OKE，您可以：

按原样迁移应用 — 直接迁移和运行应用，无需重新设计应用架构。
利用内置自动化功能来轻松执行应用扩展、打补丁和升级，简化日常工作。
简化基础设施管理，进而缩短维护工作用时，投入更多时间来开展创新。
使用高级编排工具来大幅提升资源效率，优化成本。
使用 Oracle 高度可用的全球云区域提高敏捷性、优化正常运行时间、增强韧性。
使用 Oracle 的企业级控制和认证功能增强安全性，确保合规。

基于 OKE 实现应用现代化，意味着 Oracle 全面负责幕后的所有复杂工作，您可以更快速、更安全地迁移应用。使用 OKE 轻松迁移应用，您就可以专注于最重要的事情：您的业务。

请参见基于 OKE、OCI Bastion 和 GitHub Actions 的部署指南分步操作，安全、自动化地迁移应用。

有关 OKE 特性和管理的更多信息，请参见官方 OKE 文档。

使用 OKE 为微服务开发注入强劲动力

使用 OKE 构建微服务，您可以：

独立开发和部署微服务，更快地将优秀创意变成现实。
使用 OCI 的 CI/CD 集成特性自动化构建和部署微服务，更顺畅地更新微服务 — 您的周末时光再也不会被打扰。
按需扩展微服务，满足业务需求 — 再也无需为资源分配而烦心。
走向现代化架构，以出色的敏捷性和弹性成功应对未来挑战和机遇。

选择 OKE，您可以畅享 Oracle 久负盛名的强大工具和企业级安全性保障，还可以获得微服务所需的灵活性。OKE 将改变您的应用构建、更新和扩展方式，为您解决几乎所有棘手难题，赋予您更强大的控制力。

更多微服务开发和管理资讯：

了解关于在 OCI 上构建微服务的参考架构和优秀实践
使用面向微服务的 Oracle Application Performance Monitoring Cloud Service 监视和优化应用
前往实操 LiveLab 研讨会，了解如何在 OKE 上部署、管理和扩展微服务
查看基于 Oracle Cloud 的 Spring Boot 微服务参考实现

OKE 资源

通过 Oracle 版本说明了解 OKE 的新特性

查阅 OKE 文档，快速上手并解答相关疑问

如需解答关于 Oracle 及 OCI 的更多疑问，请查阅 Oracle 文档

注：为免疑义，本网页所用以下术语专指以下含义：

除Oracle隐私政策外，本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国。
相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。