期刊首页 优先出版 当期阅读 过刊浏览 作者中心 关于期刊 English

《信息与电子工程前沿(英文)》 >> 2020年 第21卷 第4期 doi: 10.1631/FITEE.1900549

交互式可视化标注与主动学习:实验比较

1. 1Institute of Computer Graphics and Knowledge Visualisation, Graz University of Technology, Graz 8010, Austria
2. 2School of Computer Science and Engineering, Nanyang Technological University, Singapore 639798, Singapore
3. 3InfoVis Group, University of British Columbia, Vancouver V6T1Z4, Canada
4. 4Max Planck Institute for Meteorology, Hamburg 20146, Germany
5. 5Institute of Interactive Systems and Data Science, Graz University of Technology, Graz 8010, Austria

发布日期: 2020-05-13

下一篇 上一篇

摘要

监督式机器学习方法可自动分类新数据,且对数据分析非常有帮助。监督式机器学习的质量不仅依赖于使用的算法类型,也依赖于用于训练分类器的标注数据集的质量。训练数据集中的标注实例通常依赖于专业分析人员的手工选择与注释,且通常是一个单调与耗时的过程。标签可以在学习过程中为主动学习算法提供有用的输入,以自动确定数据实例的子集。交互式可视化标注技术是有前景的选择,它提供有效的视觉概览,分析人员可从中同时查看数据记录与选择项目标签。将分析人员置于循环中,生成的分类器可得到更高准确率。虽然交互式可视化标注技术的初步结果在某种意义上有前景的,考虑到用户标注可改善监督式学习,但是该技术的许多方面仍有待探索。本文使用mVis工具标注一个多元数据集以比较3种交互式可视化技术(相似图、散点矩阵与平行坐标图)以及主动学习。结果表明3种交互式可视化标注技术的分类准确率均高于主动学习算法,相对于散点矩阵与平行坐标图,用户主观上更偏爱使用相似图标注。用户也可以根据使用的可视化技术采用不同标注策略。

相关研究