AI 解决方案

使用 OCI Generative AI 和 OCI Speech 简化音频转录

介绍

如果你曾经需要进行音频录音,转录它,并总结所说的话,你知道在处理几个文件时可以采取多少步骤。让我们使用 AI 来更有效地解决问题。

借助 Oracle Cloud Infrastructure (OCI) SpeechOCI Generative AI ,我们可以自动执行音频到文本转换,同时构建简洁的摘要。例如,这可以应用于处理数千个呼叫的呼叫中心,使用呼叫记录摘要来获取洞察以改善客户体验。

OCI Speech 是一项 AI 服务,使用自动语音识别技术将基于音频的内容转换为文本。OCI Generative AI 可分析此文本,并从中生成、汇总、转换和提取信息。您甚至可以采取下一步行动,利用这些 AI 功能通过 Oracle Visual Builder 构建低代码应用。

尝试此项目以调用 OCI Speech REST API、将音频文件转换为文本,以及调用生成式 AI REST API 来进行汇总。

演示

演示:使用 OCI Generative AI 和 OCI Speech 简化翻译 (1:44)

先决条件和设置

  1. Oracle Cloud 账户 - 注册页面
  2. Visual Builder — 面向 Visual Builder 的文档
  3. OCI 语音识别服务— 文档(适用于 OCI 语音识别服务)
  4. 集成工作流— Oracle Integration 3
  5. OCI Generative AI — Python SDK

注:为免疑义,本网页所用以下术语专指以下含义:

  1. Oracle专指Oracle境外公司而非甲骨文中国。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。