Oracle 云基础设施 (OCI) 语音识别是一项 AI 服务,使用自动语音识别 (ASR) 技术将基于音频的内容转换为文本。开发人员可以轻松地进行 API 调用,将 OCI 语音识别服务的预训练模型集成到应用中。通过控制台和 REST API 以及 CLI 或 SDK,OCI 语音识别服务可用于进行准确、文本规范化且带时间戳的转写。您还可以在数据科学记事本会话中使用 OCI 语音识别服务。借助 OCI 语音识别服务,您可以过滤粗言秽语,获得单词和完整转写的置信度评分等功能。
OCI 语音识别服务采用深度学习流程 — 自动语音识别技术,可准确转写自然对话。即使不了解数据科学,您也可以通过预构建的声学和语言模型轻松使用该服务。
搜索音频文件中的数据,为其编索引,并进行分析。将录制的音频对话转为文本数据,并使用 AI 服务进行分析。您还可以使用 OCI 语言处理服务检索客户情绪,并使用 OCI 语音识别服务的异常检测功能预测客户流失的可能性。
OCI 语音识别服务 ASR 模型支持英语、西班牙语和葡萄牙语,您可将音频文件转写为您偏好的语言。
无需依赖第三方转写产品,提供端到端的安全性和合规性流程,助您更好地控制数据。
OCI 语音识别是一项通用服务,可通过 REST API、不同的 SDK 和 Oracle CLI 进行调用。开发人员即使不具备数据科学或机器学习专业知识,也可轻松部署可扩展的语音识别服务。
Oracle Cloud Infrastructure 语音识别服务可保障客户的隐私。预构建的自动语音识别模型可转写您的内容,但不会存储任何数据用于训练、调试或其他目的。
OCI 语音识别服务使用专有模型和架构,快速将语音转换为文本。
新增的单词级别的置信度评分可帮助您识别可能被错误转写的单词。您还可以使用单词置信度评分来确定构建应用时的重点。
使用精选的粗言秽语列表,添加预建的单词过滤功能。您可以屏蔽、删除或标记粗言秽语。
自动在 OCI 平台上针对数字媒体服务创建和定制的所有内容提供工作流隐藏字幕。使用 OCI 语音识别服务为内容编索引,实现轻松搜索。
OCI 语音识别服务可转写客户通话,以便您轻松搜索和检索信息。同时使用 OCI 语言处理服务和 OCI 异常检测服务,检测客户情绪,识别客户流失迹象和员工培训机会。
高级首席产品经理 Guy Michaeli
今天,我们很高兴推出三项新的 OCI 语音识别服务功能,这三项功能无需额外付费,分别是 8kHz 音频文件原生支持、SRT(一种隐藏字幕文件格式)输出以及自动为输出文本添加标点。目前,这三项功能已上线所有 OCI 商用区域,将更好地为客户提供高质量、经济高效的转写服务。
阅读全文免费在 Oracle 云上构建、测试和部署应用。
获取关于 OCI 语音识别服务的所有问题解答。