Oracle Cloud Infrastructure(OCI)Data LabelingはAIおよび機械学習モデルをさらに正確にトレーニングするラベル付きデータセットを構築するためのサービスです。開発者とデータ・サイエンティストは、OCI Data Labelingによって、ユーザー・インターフェースとパブリックAPIでデータのアセンブル、データセットの作成と閲覧、およびデータ・レコードへのラベルの適用を行うことができます。ラベル付きデータセットは、オラクルのAIおよびデータ・サイエンス・サービスでモデル開発のためにエクスポートして、シームレスなモデル構築を実現できます。
PDF、TIFF形式などのドキュメントをアップロードし、ラベルを追加できます。このようなラベルはサポート・チケットを分類するためのカスタム・ドキュメント分類モデルのトレーニング、顧客の説明に基づく返金の自動的な処理などのシナリオに役立ちます。
開発者は、生の画像をアップロードし、ラベルを追加し、画像の領域を強調表示できます。このようなラベルを画像に追加して、結果のデータセットを画像分類と物体検出のカスタム・モデルのトレーニングに使用できます。
テキスト分類ラベルをアップロードし、OCI Data Labelingを使用して、テキスト内の重要な情報を自動的に識別します。このラベル付きテキストは、情報抽出、インテント分類、感情分析などのためのカスタムの自然言語処理モデルのトレーニングに使用できます。
OCI Data Labelingはカスタム・テンプレートと複数のアノテーション形式を実装しています。機械学習モデルのニーズに応じて、データにラベル付けします。画像、テキスト、またはドキュメントにわずか3ステップでアノテーションできます。データを読み込み、アノテーションし、エクスポートして、データセットを作成します。
アノテーション付きデータ・レコードのスナップショットをオブジェクト・ストレージにJSON形式でエクスポートします。オラクルのAIおよびデータ・サイエンス・サービスでエクスポートされたラベル付きデータセットにアクセスし、変換せずに、カスタム・モデル構築プロセスと統合します。
OCI Data Labelingを単独で使用するか、OCI Vision、OCI Languageなど、他のサービス内でOCI Data Labelingにアクセスできます。開発者とデータ・エンジニアは、データセットをアセンブルおよびラベル付けした後、カスタム・モデル・トレーニングのワークフローの一部としてOCI AI Servicesで簡単に参照できます。独自のディープ・ラーニングまたは自然言語処理モデルの構築とトレーニングを好むデータ・サイエンティストはOCI Data Scienceでラベル付きデータセットを使用できます。
ロゴ、人気の服のシルエットと色、製品の種類、および医療画像からなるデータセットにラベル付けします。このようなラベル付きデータセットを在庫計画、製品分類、棚管理、および医療診断に使用します。
不規則な画像にラベル付けして、モデルを作成し、製品の品質検査、欠陥検出、安全監視、および在庫管理の要素を自動化できます。
患者の請求処理、医療報告書の診断、および細胞研究で貴重な情報をさらに簡単に抽出するために、ドキュメントにラベル付けします。
領収書、請求書、POなどのデータセットを分類して、カスタマー・サポートのチャットボットと経費の自動申告に使用します。
単語のグループにタグ付けおよびラベル付けします。ラベル付きテキスト・データセットは、顧客調査分析、トピック・モデリング、およびカスタマー・サポートに使用できます。
プリンシパル・データ・サイエンティスト、Praveen Patil氏
OCI Data Labelingサービスでは、データをセットとしてアセンブルし、データセットを作成および閲覧し、レコード(画像、テキストなど)を表示できます。このサービスは、オラクルのAIおよびデータ・サイエンス・サービスでカスタム・モデルをトレーニングおよび構築できるように、ラベルを適用、編集、および保存した後、ラベル付きデータを照合するためのリッチなユーザー・インターフェースを実装しています。このような機能には、コンソール、および独自のデータ・ラベル付けワークフローを構築できるAPIでアクセスできます。
全文を読むデータのラベル付けを開始すると、機械学習モデルで高品質なデータをさらに簡単に使用できます。