OCI Data Labeling

Oracle Cloud Infrastructure (OCI) Data Labeling 是一个给数据集做标注的服务,以更准确地训练人工智能和机器学习模型。通过 OCI Data Labeling,开发人员和数据科学家可以汇编数据、创建和浏览数据集以及为数据记录添加标注。同时,可以导出有标注的数据集,并在 Oracle 的各种人工智能和数据科学服务中使用这些数据集进行模型开发,从而获得无缝的模型构建体验。

Data Labeling 的特性

标注不同类型的数据

上载文档(包括 PDF 和 TIFF 格式),并添加标注。这些标注对培训自定义文档分类模型等场景很有用,可以对支持请求单进行分类并根据客户说明自动处理退款。

图像标注

开发人员可以上传原始图像、添加标注并突出显示图像区域。通过对图像添加标注,生成的数据集可用于训练自定义图像分类和对象检测模型。

文本标注

上传文本分类标注并使用 OCI Data Labeling 自动识别文本中的关键信息。此已标注的文本可用于训练自定义自然语言处理模型,以便进行信息提取、意图分类、情感分析等。


轻松标注和使用数据

更快地标注数据

OCI Data Labeling 提供自定义模板和多种注释格式,可根据机器学习模型的需要对数据进行标注。您只需三个步骤即可为图像、文本或文档添加注释:通过加载数据、为其添加注释并导出数据来创建数据集。

更快地导出已标注的数据

将带注释的 JSON 格式数据记录的快照导出到对象存储。访问从 Oracle 人工智能和数据科学服务中导出的已标注数据集,并在不进行任何转换的情况下将它们集成到自定义模型构建流程中。

无缝集成

单独使用 OCI Data Labeling,或通过其他服务(例如 OCI Vision 和 OCI Language)访问 OCI Data Labeling。在自定义模型训练工作流的过程中,开发人员和数据工程师可以汇编数据集,并对其进行标注,然后通过 OCI AI Services 轻松引用数据集。有些数据科学家喜欢构建和训练深度学习或自然语言处理模型,他们可以通过 OCI Data Science 使用已标注的数据集。


CMRI 徽标

Children’s Medical Research Institute 以 Oracle AI 推动进步

 

Data Labeling 使用场景

  • 图像分类

    对数据集进行标注,包括徽标、流行的服装轮廓和颜色、产品类型和医学图像。这些已标注的数据集可用于库存规划、产品分类、货架管理和医疗诊断。

  • 不规则检测

    对不规则图像进行标注,以创建模型来自动进行产品质量检查、缺陷检测、安全监视和库存管理。

  • 表单处理

    对文档进行标注,以便在处理患者索赔、进行医疗报告诊断和细胞研究的过程中更轻松地提取有价值的信息。

  • 虚拟助手

    对各种数据集(包括收据、发票和采购订单)进行分类,以支持聊天机器人,并实现费用归档自动化。

  • 信息提取

    对单词分组进行标记并分配标注。已标注的文本数据集可用于客户调查分析、主题建模和客户支持。

2023 年 1 月 27 日

使用 OCI Document Understanding 和 OCI Data Labeling 服务自动执行文档分类和键值提取任务

利用 AI 技术自动执行业务文档的分类和处理工作有助于减少手动操作和错误,尤其是处理不同类别的大量文档时。了解如何使用 OCI Document Understanding 和 OCI Data Labeling 服务来训练自定义的文档分类和键值提取 AI 模型。

阅读全文

精选博客

查看全部

相关产品

OCI Anomaly Detection

更快地进行检测并解决问题

OCI Speech

实时语音识别

OCI Language

规模化文本分析

OCI Data Science

开源算法和框架

赶快行动


试用 OCI 数据标注

开始对数据进行标注,通过机器学习模型更轻松地使用高质量的数据。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. 除Oracle隐私政策外,本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国 。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。