《信息与电子工程前沿(英文)》
>> 2022年
第23卷
第5期
doi:
10.1631/FITEE.2100465
基于自适应在线双词主题模型的应用程序评论新兴主题识别
1安徽工程大学计算机与信息学院,中国芜湖市,241000;2南京大学计算机软件新技术国家重点实验室,中国南京市,210000;3哈尔滨工业大学(深圳)计算机科学与技术学院,中国深圳市,518000;4之江实验室,中国杭州市,310000
收稿日期:
2021-09-30
录用日期:
2022-05-19
发布日期:
2022-05-19
下一篇
上一篇
摘要
应用程序评论中的新兴主题突出了用户在一定时期内关注的主题(如软件漏洞)。准确、及时地识别新兴主题能帮助开发者更有效地更新应用程序。已有文献基于主题模型或聚类方法识别应用程序评论中的新兴主题。然而,由于评论文本长度较短,提供的信息有限,新兴主题识别准确率较低。为解决该问题,提出一种改进的新兴主题识别方法(IETI)。首先采用自然语言处理技术减少评论文本中的噪音数据,然后使用自适应在线双词主题模型识别评论中的新兴主题。最后利用新兴主题中相关的短语和句子解释新兴主题的含义。采用官方更新日志作为新兴主题的评估标准,选择6个常见的应用程序对IETI进行评估。实验结果表明,IETI在识别新兴主题方面优于传统方法,短语标签F1值增量为0.126,句子标签F1值增量为0.061。我们在Github(https://github.com/wanizhou/IETI)上发布了IETI的代码。