OCISpeechは、自動音声認識テクノロジーを応用して、音声ベースのコンテンツをテキストに変換するAIサービスです。開発者は、OCI Speechの事前学習済みモデルをアプリケーションに統合するためのAPI呼び出しを簡単に実行できます。OCI Speechは、コンソールやREST API、コマンドライン・インタフェースやSDKを介して、正確で正規化されたテキストやタイムスタンプ付きテキストに使用できます。また、OCI Data Scienceノートブック・セッションでOCI Speechを使用することも可能です。OCI Speechでは、不適切な言葉のフィルタリングや、単一単語と完全なテキストの両方に対する信頼度スコアの取得などが可能です。
OCI Speechは、ディープ・ラーニング・プロセスである自動音声認識を使用して、自然言語の会話を正確に文字化します。データ・サイエンスの経験がなくても、組込みの音響モデルと言語モデルを使用して、簡単に利用を開始できます。
オーディオファイルに埋め込まれたデータを検索、索引付けし、復号します。記録された音声会話をテキストデータに変換し、AIサービスを使用して分析します。OCI Languageでセンチメントを取得し、異常検出で顧客離れの可能性を特定します。
OCI Speech ASRモデルは、英語、スペイン語、ポルトガル語をサポートしているため、任意の言語でオーディオファイルを文字化できます。
サードパーティの文字化サービスに依存することなく、エンドツーエンドのセキュリティとコンプライアンスでデータをより適切に管理します。
OCI Speechは、REST API、様々なSDK、Oracle CLIを介して呼び出すことのできる汎用性の高いサービスです。開発者は、データサイエンスやMLの専門知識がなくても、スケーラブルな音声サービスを簡単にデプロイできます。
Oracle Cloud Infrastructure Speechは、顧客のプライバシーを保護します。組込みの自動音声認識モデルは、コンテンツを文字化しますが、トレーニングやデバッグ、その他の目的でデータを格納することはありません。
OCI Speechは、独自のモデルとアーキテクチャにより、音声をテキストに高速変換できます。
誤って文字化された可能性のある単語を特定するために、単語ごとの信頼度スコア機能を追加しました。単語ごとの信頼度スコアを使用することで、アプリケーションを構築する際に、どこに重点を置くべきかを判断できます。
不適切な言葉を厳選してフィルタリングする機能を追加しました。不適切な言葉に対し、マスク、削除、タグ付けのいずれかを選択できます。
デジタル・メディア・サービスによって作成およびキュレートされたすべてのコンテンツについて、OCIプラットフォームでワークフロー内クローズド・キャプションを自動的に提供します。OCI Speechを使用してコンテンツに索引付けし、コンテンツ全体を簡単に検索できます。
OCI Speechは、カスタマコールを文字化し、情報を簡単に検索および取得できるようにします。OCI Languageと異常検知を組み合わせて、センチメントを検出し、顧客の離反やスタッフのトレーニング機会を特定できます。
OCI Speechサービスに関する、さまざまなドキュメントを提供しています。トランスクリプション・ジョブの作成方法、開発者ツールの使用方法などについてご覧いただけます。
シニア・プリンシパル・プロダクト・マネージャー Guy Michaeli
本日、Speechサービスに3つの新機能(8kHz 音声ファイルのネイティブサポート、SRT(クローズド・キャプション)ファイル形式の出力サポート、出力テキストの自動句読点)を追加費用なしで提供することを発表します。これらの新機能は、OCIの全商用リージョンで利用できるようになります。この取り組みは、お客様に高品質で低価格のトランスクリプションを提供するという当社のコミットメントの一環なのです。
記事全体を読むOracle Cloudでアプリケーションを無料で構築、テスト、デプロイしましょう。
OCIスピーチに関するあらゆる疑問にお答えします。