AIによるスピーチからテキストへの変換

OCISpeechは、自動音声認識テクノロジーを応用して、音声ベースのコンテンツをテキストに変換するAIサービスです。開発者は、OCI Speechの事前学習済みモデルをアプリケーションに統合するためのAPI呼び出しを簡単に実行できます。OCI Speechは、コンソールやREST API、コマンドライン・インタフェースやSDKを介して、正確で正規化されたテキストやタイムスタンプ付きテキストに使用できます。また、OCI Data Scienceノートブック・セッションでOCI Speechを使用することも可能です。OCI Speechでは、不適切な言葉のフィルタリングや、単一単語と完全なテキストの両方に対する信頼度スコアの取得などが可能です。

OCI Speechの機能

組込みの音響/言語モデル

OCI Speechは、ディープ・ラーニング・プロセスである自動音声認識を使用して、自然言語の会話を正確に文字化します。データ・サイエンスの経験がなくても、組込みの音響モデルと言語モデルを使用して、簡単に利用を開始できます。

オーディオ/ビデオファイルのデータの分析

オーディオファイルに埋め込まれたデータを検索、索引付けし、復号します。記録された音声会話をテキストデータに変換し、AIサービスを使用して分析します。OCI Languageでセンチメントを取得し、異常検出で顧客離れの可能性を特定します。

ネイティブな多言語サポート

OCI Speech ASRモデルは、英語、スペイン語、ポルトガル語をサポートしているため、任意の言語でオーディオファイルを文字化できます。

読みやすさ、理解しやすさを高めるダイアライゼーション

OCI Speechは、音声対話から価値ある情報を整理、分析、抽出するためのダイアライゼーションをサポートしています。


統合された文字化サービス

サードパーティの文字化サービスに依存することなく、エンドツーエンドのセキュリティとコンプライアンスでデータをより適切に管理します。

統合が簡単

OCI Speechは、REST API、様々なSDK、Oracle CLIを介して呼び出すことのできる汎用性の高いサービスです。開発者は、データサイエンスやMLの専門知識がなくても、スケーラブルな音声サービスを簡単にデプロイできます。

セキュリティとプライバシーに特化した設計

Oracle Cloud Infrastructure Speechは、顧客のプライバシーを保護します。組込みの自動音声認識モデルは、コンテンツを文字化しますが、トレーニングやデバッグ、その他の目的でデータを格納することはありません。


統合された文字化サービス

OCI Speechは、独自のモデルとアーキテクチャにより、音声をテキストに高速変換できます。

単語ごとの信頼度スコア

誤って文字化された可能性のある単語を特定するために、単語ごとの信頼度スコア機能を追加しました。単語ごとの信頼度スコアを使用することで、アプリケーションを構築する際に、どこに重点を置くべきかを判断できます。

不適切な言葉のフィルタリング

不適切な言葉を厳選してフィルタリングする機能を追加しました。不適切な言葉に対し、マスク、削除、タグ付けのいずれかを選択できます。


OCI Speechのユースケース

  • カスタマ・フィードバック分析

  • デジタル・メディア・コンテンツの検索およびクローズド・キャプション

    デジタル・メディア・サービスによって作成およびキュレートされたすべてのコンテンツについて、OCIプラットフォームでワークフロー内クローズド・キャプションを自動的に提供します。OCI Speechを使用してコンテンツに索引付けし、コンテンツ全体を簡単に検索できます。

  • コールセンター、コール分析

    OCI Speechは、カスタマコールを文字化し、情報を簡単に検索および取得できるようにします。OCI Languageと異常検知を組み合わせて、センチメントを検出し、顧客の離反やスタッフのトレーニング機会を特定できます。

OCI Speechに関するリソース

2022年4月27日

OCI Speechで句読点、クローズド・キャプション、8kHzモデルが使用できるようになりました。

シニア・プリンシパル・プロダクト・マネージャー Guy Michaeli

本日、Speechサービスに3つの新機能(8kHz 音声ファイルのネイティブサポート、SRT(クローズド・キャプション)ファイル形式の出力サポート、出力テキストの自動句読点)を追加費用なしで提供することを発表します。これらの新機能は、OCIの全商用リージョンで利用できるようになります。この取り組みは、お客様に高品質で低価格のトランスクリプションを提供するという当社のコミットメントの一環なのです。

記事全体を読む

OCI Speechを始めよう


Oracle Cloud Free Tier

Oracle Cloudでアプリケーションを無料で構築、テスト、デプロイしましょう。