OCI Document Understandingは、光学式文字認識(OCR)およびその他の高度なモデルを使用して、回転、傾斜、陰影のあるドキュメントを含むさまざまなドキュメント・ファイルからテキストを自動的に抽出し、経費処理や顧客オンボーディングの際に起こりがちな品質の問題をサポートします。
表内の行と列の関係を含む、表構造を文書から自動的に識別し、抽出します。OCI Document Understandingは、請求書、領収書、パスポート、運転免許証、健康保険IDカードなどの経費書類や身分証明書類から、キーと値のペアを識別して抽出できます。
ドキュメントを識別し、請求書、領収書、履歴書などの一般的なカテゴリに分類します。代表的なアプリケーションには、経費処理とドキュメントの拡張検索および取得などがあります。
光学式文字認識およびキーと値のペアを処理するOCI Document Understandingの事前トレーニング済モデルは、アラビア語、中国語、オランダ語、英語、フランス語、ドイツ語、ヘブライ語、日本語、ポルトガル語、ロシア語、スペイン語、ウクライナ語を含む複数の言語をサポートしています。
キーと値のペア、およびドキュメント分類を処理するカスタム・モデルを作成できます。OCI Document Understandingでは、自社データを使用してモデルのトレーニング、評価、導入、分析を行うことができます。
OCI Document Understandingは、トレーニング、デバッグ、その他の目的のためにデータを保存しないモデルで、お客様のプライバシーを守ります。
OCI Document Understandingは、REST API、複数のSDK(PythonとJavaを含む)、またはOCIコマンドラインを介して呼び出すことができる汎用性の高いサービスです。開発者は、データサイエンスや機械学習の専門知識がなくても、スケーラブルなドキュメント・サービスを簡単にデプロイできます。
専用エンドポイントをプロビジョニングして、OCI Document Understandingのワークフローで必要となる高度な制御や高スループットの要件に対応できます。