OCI Speech 是一項 AI 服務,可套用自動語音辨識技術將音訊型內容轉換為文字。開發者可以輕鬆呼叫 API,將 OCI Speech 的預先訓練模型整合至其應用程式。透過主控台和 REST API,以及命令行介面或 SDK,OCI Speech 可用於準確、文字規範化且帶時間戳的轉錄。您也可以在 OCI Data Science 記事本工作階段中使用 OCI Speech。使用 OCI Speech,您可以篩選髒話、取得單一字詞與完整轉錄內容的可信度分數,以及更多功能。
OCI Speech 使用自動語音辨識這種深度學習的流程,從自然對話中獲得準確的轉錄內容。預建聲學和語言模型不需使用者擁有資料科學經驗,即可輕鬆開始使用。
搜尋、索引及解碼隱藏在音訊檔案中的資料。將錄製的音訊對話轉換成文字資料,以透過人工智慧服務進行分析。例如,您可以使用 OCI 語言擷取情感和 OCI Speech 的異常偵測功能,以識別客戶流失的機率。
OCI Speech ASR 模型支援多種語言,例如英文、西班牙文及葡萄牙文,因此您可以使用偏好的語言轉錄音訊檔案。
消除依賴第三方轉錄的方案,並透過端對端安全性和規範,更有效控制您的資料。
OCI Speech 是一種多功能服務,可透過 REST API、不同的 SDK 以及 Oracle CLI 呼叫此服務。開發人員無需具備資料科學或機器學習專長,即可輕鬆部署可調整的語音服務。
Oracle Cloud Infrastructure Speech 會保護客戶隱私權。預建的自動語音辨識模型會轉錄您的內容,但不會儲存任何用於訓練、除錯或其他用途的資料。
OCI Speech 使用專屬模型和架構,以將語音轉換成文字並進行快速轉換。
我們新增了字詞級可信度分數,以協助您識別未正確轉錄的字詞。使用字詞可信度分數來決定建置應用程式時重點位置。
我們使用髒話精選清單新增了預建字詞篩選條件。您可以遮蔽、移除或標記髒話。
針對所有由數位媒體服務建立及計費的內容,在 OCI 平台自動提供工作流程內的隱藏字幕。使用 OCI Speech 索引編製內容,以便輕鬆搜尋您的內容。
OCI Speech 可以轉錄客戶電話,以便快速搜尋及擷取資訊。使用「OCI 語言與異常偵測」來偵測情感,並識別客戶流失與員工訓練機會。
Guy Michaeli,資深首席產品經理
今日,我們很高興宣佈 Speech 服務的三個新功能,無須額外付費:原生支援 8kHz 音效檔案、支援 SRT (關閉標題檔案格式) 的輸出,以及自動的輸出文字標點符號。這些新功能現在已在所有 OCI 的商業區域提供,同時是我們承諾提供高品質且經濟實惠的價格轉譯。
閱讀完整文章免費在 Oracle Cloud 上建構、測試及部署應用程式。
對 OCI Speech 的所有問題解答。