Oracle Cloud Infrastructure (OCI) Data Labeling is a service for building labeled datasets to more accurately train AI and machine learning models. With OCI Data Labeling, developers and data scientists assemble data, create and browse datasets, and apply labels to data records through user interfaces and public APIs. The labeled datasets can be exported for model development across Oracle’s AI and data science services for a seamless model-building experience.
上载文档(包括 PDF 和 TIFF 格式),并添加标注。这些标注对培训自定义文档分类模型等场景很有用,可以对支持请求单进行分类并根据客户说明自动处理退款。
开发人员可以上传原始图像、添加标注并突出显示图像区域。通过对图像添加标注,生成的数据集可用于训练自定义图像分类和对象检测模型。
上传文本分类标注并使用 OCI 数据标注自动识别文本中的关键信息。此已标注的文本可用于训练自定义自然语言处理模型,以便进行信息提取、意图分类、情感分析等。
OCI 数据标注提供自定义模板和多种注释格式,可根据机器学习模型的需要对数据进行标注。您只需三个步骤即可为图像、文本或文档添加注释:通过加载数据、为其添加注释并导出数据来创建数据集。
将带注释的 JSON 格式数据记录的快照导出到对象存储。访问从 Oracle 人工智能和数据科学服务中导出的已标注数据集,并在不进行任何转换的情况下将它们集成到自定义模型构建流程中。
单独使用 OCI 数据标注,或通过其他服务(例如 OCI 视觉识别和 OCI 语言处理)访问 OCI 数据标注。在自定义模型训练工作流的过程中,开发人员和数据工程师可以汇编数据集,并对其进行标注,然后通过 OCI AI 服务轻松引用数据集。有些数据科学家喜欢构建和训练深度学习或自然语言处理模型,他们可以通过 OCI 数据科学使用已标注的数据集。
对数据集进行标注,包括徽标、流行的服装轮廓和颜色、产品类型和医学图像。这些已标注的数据集可用于库存规划、产品分类、货架管理和医疗诊断。
对不规则图像进行标注,以创建模型来自动进行产品质量检查、缺陷检测、安全监视和库存管理。
对文档进行标注,以便在处理患者索赔、进行医疗报告诊断和细胞研究的过程中更轻松地提取有价值的信息。
对各种数据集(包括收据、发票和采购订单)进行分类,以支持聊天机器人,并实现费用归档自动化。
对单词分组进行标记并分配标注。已标注的文本数据集可用于客户调查分析、主题建模和客户支持。
OCI 数据标注每月免费提供 1000 条带注释的数据记录,之后每条带注释的数据记录收费为 0.0002 美元。
带注释的数据记录数 |
价格 |
套餐限制 |
0-1000 个事务 |
1000 个事务 |
|
前 1000 个事务后的每 1000 个事务 |
无 |
开始对数据进行标注,通过机器学习模型更轻松地使用高质量的数据。
注:为免疑义,本网页所用以下术语专指以下含义: