AI 解決方案

利用開放式神經網路交換模型將 PDF 中的內容向量化

簡介

在查詢外部大型語言模型 (LLM) 以取得問題的答案時,通常會解決問題,執行這項作業的需求可能與搜尋內部公司知識儲存庫和資料集略有不同。

假設進行內部研究的組織有數個 PDF,這些 PDF 應由 AI 搜尋引擎而非公用 LLM 搜尋相關答案。此外,使用傳統的關聯式資料庫管理系統查詢以及生成式 AI 查詢,讓搜尋功能更強大。

此解決方案示範如何使用 Open Neural Network Exchange (ONNX) 概念、建立自己的 ONNX 模型,以及使用這些模型讀取 PDF 和向量化內容,最終開發能夠查詢內部知識儲存區域 (有時也會查詢外部 LLM) 的 Oracle APEX 向量型搜尋引擎。

展示

示範:運用開放式神經網路交換模型將 PDF 中的內容向量化 (1:57)

先決條件與設定

  1. Oracle Cloud 帳戶 — 註冊頁面
  2. Oracle Database 23ai —文件
  3. Oracle Machine Learning for Python — 文件
  4. ONNX — 文件
  5. Oracle APEX —文件