OCI Data Labeling

Oracle Cloud Infrastructure (OCI) Data Labeling is a service for building labeled datasets to more accurately train AI and machine learning models. With OCI Data Labeling, developers and data scientists assemble data, create and browse datasets, and apply labels to data records through user interfaces and public APIs. The labeled datasets can be exported for model development across Oracle’s AI and data science services for a seamless model-building experience.

Oracle Cloud Infrastructure Data Labeling: Overview (1:58)

Data Labeling 的特性

标注不同类型的数据

上载文档(包括 PDF 和 TIFF 格式),并添加标注。这些标注对培训自定义文档分类模型等场景很有用,可以对支持请求单进行分类并根据客户说明自动处理退款。

图像标注

开发人员可以上传原始图像、添加标注并突出显示图像区域。通过对图像添加标注,生成的数据集可用于训练自定义图像分类和对象检测模型。

文本标注

上传文本分类标注并使用 OCI Data Labeling 自动识别文本中的关键信息。此已标注的文本可用于训练自定义自然语言处理模型,以便进行信息提取、意图分类、情感分析等。


轻松标注和使用数据

更快地标注数据

OCI Data Labeling 提供自定义模板和多种注释格式,可根据机器学习模型的需要对数据进行标注。您只需三个步骤即可为图像、文本或文档添加注释:通过加载数据、为其添加注释并导出数据来创建数据集。

更快地导出已标注的数据

将带注释的 JSON 格式数据记录的快照导出到对象存储。访问从 Oracle 人工智能和数据科学服务中导出的已标注数据集,并在不进行任何转换的情况下将它们集成到自定义模型构建流程中。

无缝集成

单独使用 OCI Data Labeling,或通过其他服务(例如 OCI Vision 和 OCI Language)访问 OCI Data Labeling。在自定义模型训练工作流的过程中,开发人员和数据工程师可以汇编数据集,并对其进行标注,然后通过 OCI AI Services 轻松引用数据集。有些数据科学家喜欢构建和训练深度学习或自然语言处理模型,他们可以通过 OCI Data Science 使用已标注的数据集。


CMRI 徽标

Children’s Medical Research Institute 以 Oracle AI 推动进步

 

Data Labeling 使用场景

  • 图像分类

    对数据集进行标注,包括徽标、流行的服装轮廓和颜色、产品类型和医学图像。这些已标注的数据集可用于库存规划、产品分类、货架管理和医疗诊断。

  • 不规则检测

    对不规则图像进行标注,以创建模型来自动进行产品质量检查、缺陷检测、安全监视和库存管理。

  • 表单处理

    对文档进行标注,以便在处理患者索赔、进行医疗报告诊断和细胞研究的过程中更轻松地提取有价值的信息。

  • 虚拟助手

    对各种数据集(包括收据、发票和采购订单)进行分类,以支持聊天机器人,并实现费用归档自动化。

  • 信息提取

    对单词分组进行标记并分配标注。已标注的文本数据集可用于客户调查分析、主题建模和客户支持。

2021 年 10 月 14 日

需要为机器学习进行 ZB 级数据标注?有一个应用可以做到

首席数据科学家 Praveen Patil

通过 OCI 数据标注服务,您可以将数据汇编到数据集中、创建和浏览数据集以及查看记录(例如图像和文本)。此服务提供了一个丰富的用户界面,用于应用、编辑和存储标注,然后对已标注的数据进行整理,以便您可以通过 Oracle 人工智能和数据科学服务来训练和构建自定义模型。您可以通过控制台和 API 访问这些功能,构建自己的数据标注工作流。

阅读全文

精选博客

查看全部

相关产品

OCI Anomaly Detection

更快地进行检测并解决问题

OCI Speech

实时语音识别

OCI Language

规模化的文本分析

OCI Data Science

开源算法和框架

赶快行动


试用 OCI 数据标注

开始对数据进行标注,通过机器学习模型更轻松地使用高质量的数据。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. Oracle专指Oracle境外公司而非甲骨文中国。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。