AI 语音转文本

OCI Speech 是一项 AI 服务,使用自动语音识别技术将基于音频的内容转换为文本。开发人员可以轻松地进行 API 调用,将 OCI Speech 的预训练模型集成到应用中。通过控制台和 REST API 以及 CLI 或 SDK,OCI Speech 可用于进行准确、文本规范化且带时间戳的转写。您还可以在 OCI Data Science 记事本会话中使用 OCI Speech。借助 OCI Speech,您可以过滤粗言秽语,获得单词和完整转写的置信度评分等功能。

OCI Speech 的特性

预构建声学和语言模型

OCI Speech 采用深度学习流程 — 自动语音识别技术,可准确转写自然对话。即使不了解数据科学,您也可以通过预构建的声学和语言模型轻松使用该服务。

分析音频和视频文件中的数据

搜索音频文件中的数据,为其编索引,并进行分析。将录制的音频对话转为文本数据,并使用 AI 服务进行分析。您还可以使用 OCI Language 检索客户情绪,并使用 OCI Speech 的异常检测功能预测客户流失的可能性。

原生多语言支持

OCI Speech ASR 模型支持英语、西班牙语和葡萄牙语,您可将音频文件转写为您偏好的语言。

通过声纹分割聚类功能提高可读性和理解能力

OCI Speech 支持声纹分割聚类功能,可对语音交互进行组织、分析,然后从中提取有意义的信息。


一体化转写服务

无需依赖第三方转写产品,提供端到端的安全性和合规性流程,助您更好地控制数据。

易于集成

OCI Speech 是一个通用服务,可通过 REST API、不同的 SDK 和 Oracle CLI 进行调用。开发人员即使不具备数据科学或机器学习专业知识,也可轻松部署可扩展的语音识别服务。

专为保护安全和隐私而打造

Oracle Cloud Infrastructure Speech 可保障客的隐私。预构建的自动语音识别模型可转写您的内容,但不会存储任何数据用于训练、调试或其他目的。


一体化转写服务

OCI Speech 使用专有模型和架构,快速将语音转换为文本。

每个单词的置信度评分

新增的单词级别的置信度评分可帮助您识别可能被错误转写的单词。您还可以使用单词置信度评分来确定构建应用时的重点。

粗言秽语过滤器

使用精选的粗言秽语列表,添加预建的单词过滤功能。您可以屏蔽、删除或标记粗言秽语。


OCI Speech 使用场景

  • 客户反馈分析

  • 数字媒体内容搜索和隐藏字幕

    自动在 OCI 平台上针对数字媒体服务创建和定制的所有内容提供工作流隐藏字幕。使用 OCI Speech 为内容编索引,实现轻松搜索。

  • 呼叫中心和呼叫分析

    OCI Speech 可转写客户通话,以便您轻松搜索和检索信息。同时使用 OCI Language 和 OCI Anomaly Detection,检测客户情绪,识别客户流失迹象和员工培训机会。

OCI Speech 资源

2022 年 4 月 27 日

OCI Speech 现已支持标点、隐藏字幕和 8kHz 模式。

高级首席产品经理 Guy Michaeli

今天,我们很高兴推出三项新的 OCI Speech 服务功能,这三项功能无需额外付费,分别是 8kHz 音频文件原生支持、SRT(一种隐藏字幕文件格式)输出以及自动为输出文本添加标点。目前,这三项功能已上线所有 OCI 商用区域,将更好地为客户提供高质量、经济高效的转写服务。

阅读全文

赶快行动


Oracle Cloud 免费套餐

免费在 OCI 上构建、测试和部署应用。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. Oracle专指Oracle境外公司而非甲骨文中国。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。