Oracle Cloud Infrastructure (OCI) Data Labeling 是一个给数据集做标注的服务,以更准确地训练人工智能和机器学习模型。通过 OCI Data Labeling,开发人员和数据科学家可以汇编数据、创建和浏览数据集以及为数据记录添加标注。同时,可以导出有标注的数据集,并在 Oracle 的各种人工智能和数据科学服务中使用这些数据集进行模型开发,从而获得无缝的模型构建体验。
上载文档(包括 PDF 和 TIFF 格式),并添加标注。这些标注对培训自定义文档分类模型等场景很有用,可以对支持请求单进行分类并根据客户说明自动处理退款。
开发人员可以上传原始图像、添加标注并突出显示图像区域。通过对图像添加标注,生成的数据集可用于训练自定义图像分类和对象检测模型。
上传文本分类标注并使用 OCI Data Labeling 自动识别文本中的关键信息。此已标注的文本可用于训练自定义自然语言处理模型,以便进行信息提取、意图分类、情感分析等。
OCI Data Labeling 提供自定义模板和多种注释格式,可根据机器学习模型的需要对数据进行标注。您只需三个步骤即可为图像、文本或文档添加注释:通过加载数据、为其添加注释并导出数据来创建数据集。
将带注释的 JSON 格式数据记录的快照导出到对象存储。访问从 Oracle 人工智能和数据科学服务中导出的已标注数据集,并在不进行任何转换的情况下将它们集成到自定义模型构建流程中。
单独使用 OCI Data Labeling,或通过其他服务(例如 OCI Vision 和 OCI Language)访问 OCI Data Labeling。在自定义模型训练工作流的过程中,开发人员和数据工程师可以汇编数据集,并对其进行标注,然后通过 OCI AI Services 轻松引用数据集。有些数据科学家喜欢构建和训练深度学习或自然语言处理模型,他们可以通过 OCI Data Science 使用已标注的数据集。
对数据集进行标注,包括徽标、流行的服装轮廓和颜色、产品类型和医学图像。这些已标注的数据集可用于库存规划、产品分类、货架管理和医疗诊断。
对不规则图像进行标注,以创建模型来自动进行产品质量检查、缺陷检测、安全监视和库存管理。
对文档进行标注,以便在处理患者索赔、进行医疗报告诊断和细胞研究的过程中更轻松地提取有价值的信息。
对各种数据集(包括收据、发票和采购订单)进行分类,以支持聊天机器人,并实现费用归档自动化。
对单词分组进行标记并分配标注。已标注的文本数据集可用于客户调查分析、主题建模和客户支持。
开始对数据进行标注,通过机器学习模型更轻松地使用高质量的数据。
注:为免疑义,本网页所用以下术语专指以下含义: