了解如何在 OCI 上构建可使用 AI 智能体做出高级决策的智能 RAG 系统。
了解 AI 驱动的 NL2SQL 以及 Oracle Autonomous Database 将如何助您实现实时的自然语言式数据交互。
了解如何使用 GCP 上的 Oracle Database 23ai 和 Google Vertex AI 部署一个 RAG 聊天机器人。
使用 PICASO 和生成式 AI 技术来即时检索文档内容,增强 PeopleSoft。
使用 OCI、Google Cloud 以及 Gemini AI,为 Oracle Fusion Financials 构建 AI 驱动的聊天界面。
了解如何使用 Oracle Digital Assistant、OCI Data Science、LangChain 以及 Oracle Database 23ai 构建 AI 驱动的聊天机器人。
了解如何使用 GCP 上的 Oracle Database 23ai 和 Google Vertex AI 部署一个 RAG 聊天机器人。
了解如何使用生成式 AI、Oracle Cloud Infrastructure 以及 Streamlit 来创建一个图像分析应用。
了解 AI 驱动的 NL2SQL 以及 Oracle Autonomous Database 将如何助您实现实时的自然语言式数据交互。
使用 Oracle 23ai Vector Search、Oracle OCI Generative AI 服务和 LlamaIndex 构建 AI 聊天机器人。整合私有数据集和公共数据集来实现更智能的......
使用 Oracle Database 23ai 在 Oracle APEX 中实施 AI Vector Search 功能,进行情景感知的语义相似性搜索。
使用无人机和 OCI Vision 的 AI 功能及早检测异常,简化建筑过程。通过自动化的质量控制节约时间和成本。
了解如何使用 OCI Document Understanding 来自动提取发票,在 ERP 系统中使用 AI 简化文档处理。
了解 OCI Vision 和 Oracle APEX 能够如何通过高级 AI 和机器学习模型来助力乳腺癌和肺癌研究。
了解 GenAI 应用如何帮助用户使用自然语言查询实时 ERP 系统数据,革新采购职能。
使用 HeatWave AutoML、Oracle APEX 和机器学习技术创建电影推荐应用,既为用户提供个性化建议,又为管理员提供强大的分析仪表盘。
学习本综合教程,了解如何使用 Oracle Database 23ai 和 OCI Generative AI 构建一个智能聊天机器人。
了解如何使用 SQL 对话框构建聊天机器人,运用 AI 和机器学习技术进行自然语言处理和数据库交互。
使用自然语言查询,从 PDF 文档和非结构化手册中捕获宝贵洞察。
了解如何使用 OCI Document Understanding 和 Oracle Integration Cloud 来自动处理发票电子邮件,使员工专注于重要工作。
使用 AI 解决方案,通过实时分类、情感分析和即时回复来自动处理电子邮件,提高工作率效率。
观看交互式演示,了解如何使用 OCI Generative AI、OpenSearch 和 RAG 将文档转换为切实可行的洞察。
了解 OCI Vision 如何为制造、零售以及更多其他行业提供对象检测支持,利用高级 AI 技术改善质量控制和分析。
了解如何使用 ONNX 模型进行 PDF 内容矢量化,以及如何使用 Oracle APEX 构建一个 AI 搜索引擎。
在 OCI Kubernetes Engine 上部署 NVIDIA NIM,使用 OCI Object Storage 和 NVIDIA GPU 来以强大的性能实现可扩展的高效推断。
了解 OCI Language 如何规模化地进行文本分析和翻译,通过强大的 AI 技术增强您的应用。
了解如何基于单一 GPU 运行 RAG 和 LLM,安全实现任务自动化,在可靠保护数据隐私的同时提高工作效率。
使用 OCI Language 实时分析和翻译 30 种语言的文本,整个过程不需要任何 AI 专业知识。
集成 OCI Speech 和 Oracle Siebel CRM,高效转录客户服务呼叫,提高合规性并增强自定义功能。
使用 OCI Generative AI,基于职位名称、企业以及部门信息创建职位描述草稿。
使用 HeatWave AutoML、Oracle APEX 和机器学习技术创建电影推荐应用,既为用户提供个性化建议,又为管理员提供强大的分析仪表盘。
使用自然语言查询,从 PDF 文档和非结构化手册中捕获宝贵洞察。
了解如何使用 HeatWave GenAI 轻松构建聊天机器人,从而使用自然语言来与非结构化数据进行情境化“对话”。
使用 AI 解决方案,通过实时分类、情感分析和即时回复来自动处理电子邮件,提高工作率效率。
使用 OCI Vision、Oracle Digital Assistant 和 Oracle Analytics Cloud 等 AI 服务自动识别破损包裹,实现高效物流管理。
了解 Oracle Autonomous Database Select AI 如何使用自然语言技术简化数据查询,提高工作效率,改善数据分析。
使用 GenAI、OCI 和 OpenSearch 加速开展安全的文档分析,确保投资数据满足合规要求。
了解如何使用 GCP 上的 Oracle Database 23ai 和 Google Vertex AI 部署一个 RAG 聊天机器人。
了解如何使用生成式 AI、Oracle Cloud Infrastructure 以及 Streamlit 来创建一个图像分析应用。
了解基于 OCI Generative AI 和 RAG 技术的自动化 Q&A 生成,构建高效率的企业解决方案。
了解如何使用 minikube 和 Kubernetes 在 Ampere A1 计算实例上部署 AI 聊天机器人,增强部署技能......
了解如何在 OCI Container Engine for Kubernetes 上部署 Kubeflow,开展机器学习和机器学习运维 (MLOps)。
了解如何使用 Hugging Face 和基于 OCI 的 Kubernetes 来部署大语言模型 (LLM),实现安全、可扩展的 AI 部署。
使用 Oracle Cloud 和 Kubernetes 加速部署 AI 应用,利用云原生策略提高可扩展性和可靠性。
观看交互式演示,了解如何使用 OCI Generative AI、OpenSearch 和 RAG 将文档转换为切实可行的洞察。
使用 OCI、Google Cloud 以及 Gemini AI,为 Oracle Fusion Financials 构建 AI 驱动的聊天界面。
了解如何使用 Oracle Digital Assistant、OCI Data Science、LangChain 以及 Oracle Database 23ai 构建 AI 驱动的聊天机器人。
了解如何使用 GCP 上的 Oracle Database 23ai 和 Google Vertex AI 部署一个 RAG 聊天机器人。
了解如何使用生成式 AI、Oracle Cloud Infrastructure 以及 Streamlit 来创建一个图像分析应用。
使用 HeatWave AutoML、Oracle APEX 和机器学习技术创建电影推荐应用,既为用户提供个性化建议,又为管理员提供强大的分析仪表盘。
自动化创建 Jira 子任务,以节约时间、减少错误并轻松扩展敏捷工作流。
使用 PICASO 和生成式 AI 技术来即时检索文档内容,增强 PeopleSoft。
使用 OCI、Google Cloud 以及 Gemini AI,为 Oracle Fusion Financials 构建 AI 驱动的聊天界面。
了解如何使用 Oracle Digital Assistant、OCI Data Science、LangChain 以及 Oracle Database 23ai 构建 AI 驱动的聊天机器人。
了解如何使用生成式 AI、Oracle Cloud Infrastructure 以及 Streamlit 来创建一个图像分析应用。
了解 AI 驱动的 NL2SQL 以及 Oracle Autonomous Database 将如何助您实现实时的自然语言式数据交互。
使用自然语言查询,从 PDF 文档和非结构化手册中捕获宝贵洞察。
使用 Oracle Cloud 和 Kubernetes 加速部署 AI 应用,利用云原生策略提高可扩展性和可靠性。
使用 OCI、Google Cloud 以及 Gemini AI,为 Oracle Fusion Financials 构建 AI 驱动的聊天界面。
使用 OCI Language 分析和识别电子邮件并做出准确响应,实现电子邮件分流自动化。这将简化业务流程,助力企业改善业务成果......
自动化创建 Jira 子任务,以节约时间、减少错误并轻松扩展敏捷工作流。
在 Oracle APEX 中使用生成式 AI 技术,基于自然语言提示创建应用,构建真正符合您需求的应用蓝图、页面和特性。
利用 OCI Vision 探索图像智能。在应用中运用预训练/自定义模型来检测对象和提取文本。
使用 OCI Vision、Oracle Digital Assistant 和 Oracle Analytics Cloud 等 AI 服务自动识别破损包裹,驱动高效......
在 OCI Kubernetes Engine 上部署 NVIDIA NIM,使用 OCI Object Storage 和 NVIDIA GPU 来以强大的性能实现可扩展的高效推断。
使用 HeatWave AutoML、Oracle APEX 和机器学习技术创建电影推荐应用,既为用户提供个性化建议,又为管理员提供强大的分析仪表盘。
使用 HeatWave GenAI 来快速为电商网站生成产品评价摘要,整个解决方案不仅可扩展,而且易于实施。
阅读教程,详细了解如何使用 HeatWave GenAI 和向量存储技术来快速解答特定领域问题。
观看交互式演示,了解如何使用 OCI Generative AI、OpenSearch 和 RAG 将文档转换为切实可行的洞察。
使用 OCI、Google Cloud 以及 Gemini AI,为 Oracle Fusion Financials 构建 AI 驱动的聊天界面。
了解如何使用 Oracle Digital Assistant、OCI Data Science、LangChain 以及 Oracle Database 23ai 构建 AI 驱动的聊天机器人。
了解如何使用 GCP 上的 Oracle Database 23ai 和 Google Vertex AI 部署一个 RAG 聊天机器人。
了解 AI 驱动的 NL2SQL 以及 Oracle Autonomous Database 将如何助您实现实时的自然语言式数据交互。
自动化创建 Jira 子任务,以节约时间、减少错误并轻松扩展敏捷工作流。
使用 Oracle 23ai Vector Search、Oracle OCI Generative AI 服务和 LlamaIndex 构建 AI 聊天机器人。整合私有数据集和公共数据集来实现更智能的......
使用 OCI Vision、Oracle Digital Assistant 和 Oracle Analytics Cloud 等 AI 服务自动识别破损包裹,实现高效物流管理。
使用 Oracle 低代码、模块化的 LLM 应用引擎将实时数据摄取到 RAG 知识搜索引擎。
使用 OCI Language 在 Siebel CRM 中检测服务请求中的个人可识别信息 (PII),解决呼叫中心运营中的隐私保护和合规性问题。
集成 OCI Speech 和 Oracle Siebel CRM,高效转录客户服务呼叫,提高合规性并增强自定义功能。
使用 Oracle Cloud 和 Kubernetes 加速部署 AI 应用,利用云原生策略提高可扩展性和可靠性。
使用 OCI AI 服务、Oracle Integration Cloud 和一个适用于所有行业的便捷工具来分析零部件规格、检查 RFP 合规性以及扫描电子邮件...
了解如何在 OCI Generative AI 游乐场中高效微调大语言模型 (LLM)。
在 OCI Container Engine for Kubernetes 上部署 NVIDIA NIM,基于 OCI Object Storage 和 NVIDIA GPU 以更强大的性能高效进行大规模推断。
利用 Java Database Connectivity (JDBC),在 AI Vector Search 功能中使用 Oracle Generative AI Cohere 嵌入模型。
了解如何使用 minikube 和 Kubernetes 在 Ampere A1 计算实例上部署 AI 聊天机器人,增强部署技能。
了解如何使用 OCI Generative AI 构建员工能力开发系统,分析并执行信息摘要,创建员工成长建议。
了解如何使用 OCI Generative AI 和 Oracle Autonomous Database 构建一个推荐引擎。
了解如何使用 OCI Vision 和 OCI Generative AI 构建餐食推荐引擎,让餐食规划更简单、更高效。
了解如何通过 Node.js 来使用 OCI Generative AI Cohere 模型,执行向量搜索。
了解如何使用 HeatWave GenAI 轻松构建聊天机器人,从而使用自然语言来与非结构化数据进行情境化“对话”。
使用 OCI Generative AI 洞悉供应链问题,捕获实时洞察和切实可行的解决方案,最终高效解决供应链问题。
了解如何在 OCI Container Engine for Kubernetes 上为机器学习和 MLOps 设置 Kubeflow。
在 OCI Anomaly Detection 中使用 AI 来检测心血管健康报告(例如 ECG)中的异常,从而基于模式研究心血管风险。
了解如何在 OCI 上使用 NVIDIA GPU 运行分布式多节点训练,以实现高效的深度神经网络训练。
了解如何在基于裸金属机的 NVIDIA GPU 的 OCI 上部署大型语言模型。
了解如何在 OCI 上使用 Hugging Face 和 Kubernetes 部署 LLM,以实现可扩展、安全的 AI 部署。
使用 OCI Generative AI 提取和概括 Web 内容,实现快速分析和理解。
使用 OCI Generative AI 和 Streamlit 即时概括文档,通过快速生成摘要节约时间,提高工作效率。
使用 Oracle Cloud 和 Kubernetes 加速部署 AI 应用,利用云原生策略提高可扩展性和可靠性。
了解 OCI Language 如何规模化地进行文本分析和翻译,通过强大的 AI 技术增强您的应用。
了解如何使用 OCI Generative AI 和 Oracle APEX 构建 AI 驱动的创新型应用。
参照分步式指南,了解如何使用 Terraform 来在 Oracle Cloud 上构建生成式 AI 基础设施。
使用 HeatWave GenAI 来快速为电商网站生成产品评价摘要,整个解决方案不仅可扩展,而且易于实施。
使用检索增强生成 (RAG) 技术充分挖掘实时数据,捕获更深入洞察,做出更明智的决策。
了解如何使用生成式 AI、Java 和 Oracle Database 23ai 的 AI Vector Search 构建高级知识管理系统。
了解基于 OCI Generative AI 和 RAG 技术的自动化 Q&A 生成,构建高效率的企业解决方案。
观看交互式演示,了解如何使用 OCI Generative AI、OpenSearch 和 RAG 将文档转换为切实可行的洞察。
了解如何使用 Oracle APEX 和 Oracle REST Data Services 创建一个支持更强大对话功能的实时 AI 聊天机器人。
了解如何基于单一 GPU 运行 RAG 和 LLM,安全实现任务自动化,在可靠保护数据隐私的同时提高工作效率。
基于私有数据,运用生成式 AI 构建个性化的促销优惠。
使用 Oracle 低代码、模块化的 LLM 应用引擎将实时数据摄取到 RAG 知识搜索引擎。
了解 Oracle Database 23ai AI Vector Search 如何将语义和业务数据相结合,更快速提供精确、可靠的搜索结果。
了解如何使用 SQL 对话框构建聊天机器人,运用 AI 和机器学习技术进行自然语言处理和数据库交互。
学些本综合教程,了解如何使用 Oracle Database 23ai 和 OCI Generative AI 构建一个智能聊天机器人。
使用 Oracle Database 23ai 在 Oracle APEX 中实施 AI Vector Search 功能,进行情景感知的语义相似性搜索。
了解如何使用 Oracle Autonomous Database Select AI 将自然语言转换为 SQL 查询,利用前沿 AI 技术实现无缝数据库查询。
使用 Oracle APEX AI 助手,通过自然语言提示创建 SQL 查询语句,简化开发、优化查询以及学习编码知识。
了解如何使用 OCI Document Understanding 来自动提取发票,在 ERP 系统中使用 AI 简化文档处理。
使用 AI 服务(包括 OCI Vision、Oracle Digital Assistant 和 Oracle Analytics Cloud)自动识别损坏的包,实现高效的物流管理。
使用无人机和 OCI Vision 的 AI 功能及早检测异常,简化建筑过程。通过自动化的质量控制节约时间和成本。
了解 OCI Vision 和 Oracle APEX 如何通过高级 AI 和机器学习模型帮助开展乳腺癌和肺癌研究。
了解如何使用 OCI Document Understanding 和 Oracle Integration Cloud 来自动处理发票电子邮件,使员工专注于重要工作。
了解 OCI Vision 如何为制造、零售以及更多其他行业提供对象检测支持,利用高级 AI 技术改善质量控制和分析。
使用 OCI Speech 和 OCI Generative AI 轻松转录和概括音频信息,提高工作效率,捕获宝贵洞察 — 只需一步操作!
集成 OCI Speech 和 Oracle Siebel CRM,高效转录客户服务呼叫,提高合规性并增强自定义功能。
了解 OCI Speech 如何运用 AI 革新医学转录,助力医疗卫生行业构建更准确、更快速的文档流程。立即行动,优化工作流!
使用 OCI Language 实时分析和翻译 30 种语言的文本,整个过程不需要任何 AI 专业知识。
使用 AI 解决方案,通过实时分类、情感分析和即时回复来自动处理电子邮件,提高工作率效率。
使用 OCI Language 在 Siebel CRM 中检测服务请求中的个人可识别信息 (PII),解决呼叫中心隐私保护和合规性问题。
在快节奏的软件开发领域,保持信息畅通至关重要。试想一下,如果有一个 AI 助手可以迅速将复杂的网页内容转化为简洁、易于理解和分享的形式,那将会是多么好。Oracle Cloud Infrastructure (OCI) Generative AI 正是能帮助您实现这一目标的功能之一。
下面举例说明如何使用 OCI Generative AI 构建此类 AI 助手。
AI 驱动的 GitHub 趋势项目汇总器是一个个人内容生成引擎,可自动检索和汇总排名前 25 位的 GitHub 趋势项目。OCI Generative AI 可提取、读取每个项目的 README 文件,并将其编译成简明扼要、引人入胜且包含大量信息的摘要,以便与他人共享。
您只需修改 summarize_llm.py
中的 model_id
变量,即可轻松在 OCI Generative AI 提供的多个 LLM 之间切换。
以上是可用模型的子集,我们将不断提供更新的模型。
下面是调用 OCI Generative AI 的代码片段:
content.text = """Generate an abstractive summary of the given Markdown contents. Here are the contents to summarize: {}""".format(summary_txt)
chat_detail.content = content.text
chat_detail.serving_mode = oci.generative_ai_inference.models.OnDemandServingMode(model_id="meta.llama-3.1-405b-instruct") # configurable model chat_response = generative_ai_inference_client.chat(chat_detail)
检索增强生成 (RAG) 是其中一个重要的 AI 用例。RAG 可以在不重新训练 LLM 的情况下增强 LLM 的知识。这是让 LLM 从数据库或其他地方提取新信息并快速呈现给最终用户的一种方法。
这样一来,无论何时训练 LLM 以及何时运行推理,LLM 都可以获取最新的知识。因此,更新的数据几乎不费吹灰之力就可以让 LLM 更加智能。
将文档上传到 Oracle Cloud Infrastructure (OCI) GenAI Agents 后,该服务将处理数据,并提供通过聊天机器人使用数据的方法。
下面是在 OCI 中使用 RAG agent 的代码片段:
# ask a question to RAG agent question = "What steps do I take if I have a new patient under the patient admission recommendations?" # Initialize service client with default config file agent_runtime_client = GenerativeAiAgentRuntimeClient(config)
chat_response = agent_runtime_client.chat( agent_endpoint_id="ocid1.test.oc1..<id>", chat_details=ChatDetails(user_message=question))
# Get the data from response print(chat_response.data)
Oracle Database 23ai 支持包括向量在内的所有现代数据类型和工作负载,并在数据库中直接集成了 AI 和机器学习功能。通过生成和存储相关数据的向量嵌入,开发人员可以使用数学计算来搜索语义相似性。通过此技术,可以使用简单的 SQL 将相似性搜索与业务数据搜索相结合,这样一来,任何对 SQL 有基本了解的人都可以利用它。
通过在 Oracle Database 23ai 上运行低代码应用平台 Oracle APEX,您无需额外费用即可原生使用 Oracle AI Vector Search。APEX 开发人员可以将这些高级搜索功能无缝纳入其应用,从而创建更准确、更能感知上下文的结果。
本方案将通过 Oracle APEX,使用 Oracle Database 23ai 中的 AI Vector Search 进行语义搜索。
下面是将图像描述转换为向量并将其存储到数据库中的代码:
UPDATE SM_POSTS
SET
AI_IMAGE_VECTOR = TO_VECTOR(VECTOR_EMBEDDING ( DOC_MODEL
USING AI_IMAGE_DESCRIPTION AS DATA
));
现在,我们可以使用向量来执行语义搜索。在本演示中,我们可以在“卡片区域”的源查询中执行此操作:
SELECT A.*, TO_CHAR(ROUND(VECTOR_DISTANCE,2), '0.99')AS VECTOR_DISTANCE_DISPLAY FROM
(SELECT
p.id,
p.user_name,
p.comment_text,
p.file_blob,
p.file_mime,
p.post_date,
p.REACTIONS,
p.USER_REACTION_CSS,
p.CREATED,
(
CASE
WHEN :P1_SEARCH IS NOT NULL AND :P1_VECTOR_SEARCH = 'Y'
THEN VECTOR_DISTANCE (
TO_VECTOR(VECTOR_EMBEDDING (doc_model USING :P1_SEARCH AS data)),
ai_image_vector
)
ELSE NULL
END
) AS vector_distance,
ai_image_description
FROM
mv_SM_POSTS p
WHERE
(:P1_VECTOR_SEARCH <> 'Y' AND :P1_SEARCH IS NOT NULL AND UPPER(ai_image_description) LIKE UPPER('%'||:P1_SEARCH||'%'))
OR :P1_VECTOR_SEARCH = 'Y'
OR :P1_SEARCH IS NULL
ORDER BY
vector_distance ASC, p.CREATED asc) A
通过结合使用具有 AI Vector Search 功能的 Oracle Database 23ai 与 Oracle APEX,开发人员能够快速构建具有更强搜索功能的情境感知应用。
如本方案所示所示,生成式 AI 特别擅长帮助总结情感。一个电商网站可能有数百个库存单位 (SKU),每个库存单位都有数十条评论。为了帮助快速总结产品评论,开发人员可以利用 HeatWave GenAI 的集成功能,使用数据库内的大型语言模型和数据库内的自动向量存储。
HeatWave GenAI 还可以帮助按需翻译和分析情感。所有操作均可通过 HeatWave GenAI 实现自动化,并在添加新评论时保持摘要更新。
通过将数据和处理保留在 HeatWave 中,开发人员可以根据 GenAI 需求扩展解决方案,使 AI 变得像数据库查询一样简单。
下面的代码片段说明了如何汇总正面评论:
SELECT "################### Computing summaries for EXISTING reviews on a product ###################" AS "";
SELECT "" AS "";
CALL SUMMARIZE_TRANSLATE(1, "POSITIVE", "en", @positive_english_summary);
SELECT @positive_english_summary AS "--- English summary of positive reviews on the T-Shirt ---";
开源 LLM(如 Hugging Face 创建的 LLM)是功能强大的工具,可让开发人员相对快速地尝试 GenAI 解决方案。Kubernetes 与 Oracle Cloud Infrastructure (OCI) 相结合,支持 GenAI 解决方案进行扩展,同时提供灵活性、可移植性和弹性。
在本演示中,您将看到在 OCI Kubernetes Engine 上部署经过微调的 LLM 推理容器是多么简单。OCI Kubernetes Engine 是一种托管 Kubernetes 服务,可简化企业的大规模部署和运营。借助该服务,开发人员可以在自己的租户内保留自定义模型和数据集,而无需依赖第三方推理 API。
我们将使用文本生成推理作为推理框架来公开 LLM。
下面的代码片段说明了如何部署开源 LLM:
# select model from HuggingFace
model=HuggingFaceH4/zephyr-7b-beta
# deploy selected model
docker run ghcr.io/huggingface/text-generation-inference:2.0 --model-id $model
# invoke the deployed model
curl IP_address:port/generate_stream \
-X POST \
-d '{"inputs":"What is Deep Learning?","parameters":{"max_new_tokens":50}}' \
-H 'Content-Type: application/json'
Oracle Code Assist 是一款人工智能代码辅助工具,旨在帮助提高开发人员的开发速度并增强代码一致性。Oracle Code Assist 由 Oracle Cloud Infrastructure (OCI) 上的大型语言模型 (LLM) 提供支持,并针对 OCI 上的 Java、SQL 和应用开发进行了微调和优化,为开发人员提供了特定于具体情境的建议。您可以根据组织的优秀实践和代码库进行定制。
该工具目前处于测试阶段,适用于 JetBrains IntelliJ IDEA 和 Microsoft Visual Studio Code,可帮助编写文档、理解旧代码和完成代码。
要了解如何加入测试版计划并开始使用,请访问我们的 GitHub 资源库。
Oracle Cloud Infrastructure (OCI) AI Blueprints 提供完整的硬件建议、软件组件以及现成可用的监视工具,将助您在短短数分钟内部署、扩展并监视 GenAI 工作负载。
使用 vLLM 有效部署和扩展 LLM,轻松实现超快速推断和无缝集成。
选择自定义模型,或通过 Hugging Face 获取各种开源模型。
自动供应 GPU 节点,并在 OCI Object Storage 中存储模型。
获取现成可用的 API 端点,即时进行模型推断。
为关键任务应用启用基于推断延迟的自动缩放。
轻松集成和扩展推断工作负载 — 无需具备深厚的专业技术知识。
使用 Prometheus、Grafana 等内置观测工具来监视性能。
更智能地微调性能 — 基于数据驱动的洞察来开展性能基准测试,优化 AI 训练结果。
使用 MLCommons 方法进行性能微调基准测试。
使用标准化数据集微调量化的 Llama 2 70B 模型。
跟踪训练时间、资源利用率和性能指标。
自动在 MLflow 中记录结果,在 Grafana 中以可视化方式呈现洞察。
制定数据驱动的基础设施决策,优化微调工作。
使用低秩适应 (LoRA) 方法显著优化 LLM 微调过程 — 更快速、更高效且部署就绪。
使用 LoRA 方法高效进行 LLM 微调,尽可能降低计算开销。
利用自定义数据集或来自 Hugging Face 的公共数据集来开展训练。
跟踪和分析 MLflow 在整个微调过程中记录的训练指标。
在对象存储桶中存储微调后模型和训练结果,实现无缝部署。
通过相应的设计来优化性能,确保模型具有快速、有效的适应性并降低资源需求。
按需扩展解决方案,满足从小型数据集到大规模模型微调的所有需求。
注:为免疑义,本网页所用以下术语专指以下含义: