AI 解决方案

使用 RAG 和 LLM 选项安全地自动执行任务

AI 解决方案主题

介绍
演示
先决条件和设置
快速入门

查看所有 AI 解决方案

介绍

为了简化重复性任务或实现完全自动化，为什么不寻求 AI 的帮助？使用基础模型来自动执行重复性任务听起来可能很有吸引力，但可能会使机密数据面临风险。检索增强生成 (Retrieval-augmented Generation，RAG) 是微调的替代方案，可保持推断数据与模型语料库的隔离。

我们希望将推理数据和模型分开，但我们也希望能够选择我们使用的大语言模型 (LLM) 和强大的 GPU 来提高效率。想象一下，如果你能用一个 GPU 来完成这一切！

在本演示中，我们将展示如何使用单个 NVIDIA A10 GPU 部署 RAG 解决方案；LangChain、LlamaIndex、Qdrant 或 vLLM 等开源框架；以及来自 Mistral AI 的 70 亿参数 LLM。它是价格和性能的完美平衡，并保持推断数据分离，同时根据需要更新数据。

演示

演示：使用 RAG 和多种 LLM 安全地自动执行任务 (1:15)

先决条件和设置

Oracle Cloud 账户 — 注册页面
Oracle GPU 计算实例— 文档
LlamaIndex — 文档
LangChain — 文档
vLLM — 文档
Qdrant — 文档

快速入门

GitHub 上的详细步骤和示例代码

注：为免疑义，本网页所用以下术语专指以下含义：

除Oracle隐私政策外，本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国。
相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。