Oracle 云基础设施 (OCI) 数据标注是一个给数据集做标注的服务,以更准确地训练人工智能和机器学习模型。通过 OCI 数据标注服务,开发人员和数据科学家可以汇编数据、创建和浏览数据集以及为数据记录添加标注。同时,可以导出有标注的数据集,并在 Oracle 的各种人工智能和数据科学服务中使用这些数据集进行模型开发,从而获得无缝的模型构建体验。
Oracle 云基础设施数据标注:概览 (1:58)
上载文档(包括 PDF 和 TIFF 格式),并添加标注。这些标注对培训自定义文档分类模型等场景很有用,可以对支持请求单进行分类并根据客户说明自动处理退款。
开发人员可以上传原始图像、添加标注并突出显示图像区域。通过对图像添加标注,生成的数据集可用于训练自定义图像分类和对象检测模型。
上传文本分类标注并使用 OCI 数据标注自动识别文本中的关键信息。此已标注的文本可用于训练自定义自然语言处理模型,以便进行信息提取、意图分类、情感分析等。
OCI 数据标注提供自定义模板和多种注释格式,可根据机器学习模型的需要对数据进行标注。您只需三个步骤即可为图像、文本或文档添加注释:通过加载数据、为其添加注释并导出数据来创建数据集。
将带注释的 JSON 格式数据记录的快照导出到对象存储。访问从 Oracle 人工智能和数据科学服务中导出的已标注数据集,并在不进行任何转换的情况下将它们集成到自定义模型构建流程中。
单独使用 OCI 数据标注,或通过其他服务(例如 OCI 视觉识别和 OCI 语言处理)访问 OCI 数据标注。在自定义模型训练工作流的过程中,开发人员和数据工程师可以汇编数据集,并对其进行标注,然后通过 OCI AI 服务轻松引用数据集。有些数据科学家喜欢构建和训练深度学习或自然语言处理模型,他们可以通过 OCI 数据科学使用已标注的数据集。
对数据集进行标注,包括徽标、流行的服装轮廓和颜色、产品类型和医学图像。这些已标注的数据集可用于库存规划、产品分类、货架管理和医疗诊断。
对不规则图像进行标注,以创建模型来自动进行产品质量检查、缺陷检测、安全监视和库存管理。
对文档进行标注,以便在处理患者索赔、进行医疗报告诊断和细胞研究的过程中更轻松地提取有价值的信息。
对各种数据集(包括收据、发票和采购订单)进行分类,以支持聊天机器人,并实现费用归档自动化。
对单词分组进行标记并分配标注。已标注的文本数据集可用于客户调查分析、主题建模和客户支持。
OCI 数据标注每月免费提供 1000 条带注释的数据记录,之后每条带注释的数据记录收费为 0.0002 美元。
带注释的数据记录数 |
价格 |
套餐限制 |
0-1000 个事务 |
1000 个事务 |
|
前 1000 个事务后的每 1000 个事务 |
无 |
开始对数据进行标注,通过机器学习模型更轻松地使用高质量的数据。