数据标注的方式之一

如题所述

数据标注的方式之一是分类标注。

数据标注是对未经处理过的语音、图片、文本、视频等数据进行加工处理,从而转变成机器可识别信息的过程。一张图能够有很多分类或标签,比如成人、长发等;对于文字,可以标注主谓宾语、名词动词等。除此之外,数据标注还包含描点标注、标框标注等方式,数据标注的方式之一是分类标注。

数据标注可以说是AI的入门级岗位,未来可转向其他AI岗位。如项目实施顾问等,这就要求更多的工作技能,需要再工作中积累。主流的机器学习方式是以有监督的深度学习方式为主,对于标注数据有着强依赖性需求,未经标注处理过的原始数据多以非结构化数据为主,这些数据难以被机器识别和学习,只有经过标注处理后的结构化数据才能被算法模型训练使用。

数据标注的其他方式

1、手动划词标注,智能推荐相似描述

手动划词文书内容,选择需要标注的标签,确认后即可将划词内容所在案件标注到该标签。当标签为文本类标签时,系统还会智能推荐同段落相似描述,可以点击对应页面提示,批量将有相似描述的案件标注到同一个标签。

2、关键词抽取(智推)

该标注方式,需要打开标签编辑器,批量标注规则选择“关键词抽取(智推)”,划词对应文书表述,系统会根据标签类型及文书标注,智能生成标注段落、规则标注,方便友友们批量智能标注数据。该标注方式适合无规则书写基础的研究人员使用。

3、关键词抽取(支持正则表达式)

该标注方式,需要在标签编辑器页面,批量标注规则选择“关键词抽取(智推)”,自行自行勾选标注段落、依据输入提示填写关键词、正则表达式等。该标注方式适合有正则表达式基础的研究人员使用。

温馨提示:答案为网友推荐,仅供参考