资源类型

期刊论文 3

年份

2021 1

2020 2

关键词

交互式可视化标注;主动学习;可视分析 1

命名实体识别;无标注数据;深度学习;半监督学习方法 1

问答网站;标注;自然顺序;Skip gram 1

检索范围:

排序: 展示方式:

交互式可视化标注与主动学习:实验比较 Research

Mohammad CHEGIN, Jürgen BERNARD, Jian CUI, Fatemeh CHEGINI, Alexei SOURIN, Keith Keith, Tobias SCHRECK

《信息与电子工程前沿(英文)》 2020年 第21卷 第4期   页码 524-535 doi: 10.1631/FITEE.1900549

摘要: 监督式机器学习的质量不仅依赖于使用的算法类型,也依赖于用于训练分类器的标注数据集的质量。训练数据集中的标注实例通常依赖于专业分析人员的手工选择与注释,且通常是一个单调与耗时的过程。交互式可视化标注技术是有前景的选择,它提供有效的视觉概览,分析人员可从中同时查看数据记录与选择项目标签。将分析人员置于循环中,生成的分类器可得到更高准确率。虽然交互式可视化标注技术的初步结果在某种意义上有前景的,考虑到用户标注可改善监督式学习,但是该技术的许多方面仍有待探索。本文使用mVis工具标注一个多元数据集以比较3种交互式可视化技术(相似图、散点矩阵与平行坐标图)以及主动学习。结果表明3种交互式可视化标注技术的分类准确率均高于主动学习算法,相对于散点矩阵与平行坐标图,用户主观上更偏爱使用相似图标注。用户也可以根据使用的可视化技术采用不同标注策略。

关键词: 交互式可视化标注;主动学习;可视分析    

特定领域问答网站中的标签自然顺序研究

贾俊芳1,李国强2

《信息与电子工程前沿(英文)》 2021年 第22卷 第2期   页码 141-286 doi: 10.1631/FITEE.1900645

摘要: 标注是Web 2.0的一个重要特征。它使得社会计算系统(如问答网站)的用户们可以自由地标记内容。然而,标注真的是自由不受限的吗?然而,目前还没有针对用户在标注过程中对标签排序的规律性开展研究。

关键词: 问答网站;标注;自然顺序;Skip gram    

学习挑选伪标签:一种用于命名实体识别的半监督学习方法 Research Articles

李真真,冯大为,李东升,卢锡城

《信息与电子工程前沿(英文)》 2020年 第21卷 第6期   页码 809-962 doi: 10.1631/FITEE.1800743

摘要: 本文提出一种用于NER任务的半监督方法,其通过学习一个判别模块筛除错误伪标签,以创建高质量标注数据。伪标签是为未标记数据自动生成的标签,并被当作真实标签用来训练模型。

关键词: 命名实体识别;无标注数据;深度学习;半监督学习方法    

标题 作者 时间 类型 操作

交互式可视化标注与主动学习:实验比较

Mohammad CHEGIN, Jürgen BERNARD, Jian CUI, Fatemeh CHEGINI, Alexei SOURIN, Keith Keith, Tobias SCHRECK

期刊论文

特定领域问答网站中的标签自然顺序研究

贾俊芳1,李国强2

期刊论文

学习挑选伪标签:一种用于命名实体识别的半监督学习方法

李真真,冯大为,李东升,卢锡城

期刊论文