资源类型

期刊论文 11

年份

2023 1

2022 2

2021 1

2020 1

2019 2

2018 2

2017 2

展开 ︾

关键词

主题提取;主题演化;评价方法 1

主题模型 1

主题爬虫;本体;优先度评估;模拟退火;暴雨灾害 1

主题爬虫;禁忌搜索算法;本体;主机信息;优先度评估 1

国家形象;新冠肺炎;主题挖掘;实体;新闻立场;情感 1

图神经网络 1

应用程序评论;新兴主题识别;主题模型;自然语言处理 1

引用网络 1

新兴产业 1

有监督主题模型;多标签分类;类别频率;有监督隐含狄利克雷分配模型;判别隐含狄利克雷分配模型 1

查询子主题挖掘;查询意图;分布式表示;语义组合 1

查询词自动推荐;基于同类用户的信息检索;主题模型 1

用户生成内容;协同过滤;矩阵分解;层次主题模型 1

知识融合 1

论文演化图;学术文献检索;元图分解;主题连贯性 1

展开 ︾

检索范围:

排序: 展示方式:

基于本体和模拟退火算法的暴雨灾害主题爬虫策略 Research Article

刘景发1,2,李帆3,丁若尧1,2,刘子昂4

《信息与电子工程前沿(英文)》 2022年 第23卷 第8期   页码 1189-1204 doi: 10.1631/FITEE.2100360

摘要: 目前,主题爬虫是从海量异构网络中获取有效领域知识的重要方法。目前大多数主题爬虫技术难以获得高质量爬行结果。主要难点包括主题基准模型的建立、超链接主题相关性的评估和爬行策略的设计。本文采用领域本体为特定主题构建主题基准模型,并提出一种新的基于局部本体和全局本体的多重筛选策略(MFSLG)。为提高待访问超链接主题相关性计算精度,提出一种基于网页文本和链接结构的综合优先度评估方法(CPEM),同时,采用模拟退火(SA)算法避免主题爬虫陷入局部最优搜索。本文首次设计融合SA算法、MFSLG策略和CPEM策略实现主题爬虫,提出两种新的基于本体和SA主题爬虫策略(FCOSA),包括基于全局本体的FCOSA策略(FCOSA_G)和基于局部本体和全局本体的FCOSA实验结果表明,针对不同性能指标,所提爬虫策略优于其他主题爬虫策略。

关键词: 主题爬虫;本体;优先度评估;模拟退火;暴雨灾害    

一种新的融合本体和主机信息的改进禁忌搜索算法的主题爬虫方法 Research Article

刘景发1,王震1,2,钟国1,杨志和1

《信息与电子工程前沿(英文)》 2023年 第24卷 第6期   页码 859-875 doi: 10.1631/FITEE.2200315

摘要: 为解决传统主题爬虫方法存在的主题描述不完整和重复爬取已访问链接的问题,本文提出一种新的融合本体和主机信息的改进禁忌搜索算法的主题爬虫方法(FCITS_OH)。该方法基于形式概念分析(FCA)构建领域本体,在语义和知识层面描述主题。为避免重复爬取已访问的链接和扩大搜索范围,提出一种改进的禁忌搜索(ITS)算法和记忆主机信息的策略。此外,为改进未访问链接的主题相关性的评估方法,提出一种基于Web文本和链接结构的综合优先度评估方法。以旅游和暴雨灾害为主题的实验结果表明,对于不同的性能指标,所提出的爬虫方法优于文献中其它主题爬虫策略。

关键词: 主题爬虫;禁忌搜索算法;本体;主机信息;优先度评估    

基于内容和引用的科研文献的主题发现和演化 Article

Hou-kui ZHOU, Hui-min YU, Roland HU

《信息与电子工程前沿(英文)》 2017年 第18卷 第10期   页码 1511-1524 doi: 10.1631/FITEE.1601125

摘要: 科研文献数据库中的重要主题随时间的演化的方式已经越来越受到全球研究者的关注。在一个科研论文数据集中,任何一篇论文可以被认为是由组成论文本身的词和论文引用的文献所组成的。在本文中,我们提出了一种名为“Citation-content-LDA (latent Dirichlet allocation)”的主题发现方法,该方法在一个概率生成模型中同时生成文献的引用关系和文献本身的词Citation-content-LDA模型利用了一种两层结构的主题模型,即利用引用信息生成父主题和利用文本信息生成子主题。模型参数通过吉布斯采样算法来估计。我们还提出了一个主题演化算法,该算法包括主题分割和主题间依赖关系计算两个步骤。,证明了我们提出的算法能有效的发现重要的主题和反映重要研究主题主题演化情况。

关键词: 主题提取;主题演化;评价方法    

基于自适应在线双词主题模型的应用程序评论新兴主题识别 Research Article

周芄1,王勇1,2,高翠芸3,杨非4

《信息与电子工程前沿(英文)》 2022年 第23卷 第5期   页码 678-691 doi: 10.1631/FITEE.2100465

摘要: 应用程序评论中的新兴主题突出了用户在一定时期内关注的主题(如软件漏洞)。准确、及时地识别新兴主题能帮助开发者更有效地更新应用程序。已有文献基于主题模型或聚类方法识别应用程序评论中的新兴主题。然而,由于评论文本长度较短,提供的信息有限,新兴主题识别准确率较低。为解决该问题,提出一种改进的新兴主题识别方法(IETI)。首先采用自然语言处理技术减少评论文本中的噪音数据,然后使用自适应在线双词主题模型识别评论中的新兴主题。最后利用新兴主题中相关的短语和句子解释新兴主题的含义。采用官方更新日志作为新兴主题的评估标准,选择6个常见的应用程序对IETI进行评估。实验结果表明,IETI在识别新兴主题方面优于传统方法,短语标签F1值增量为0.126,句子标签F1值增量为0.061。

关键词: 应用程序评论;新兴主题识别;主题模型;自然语言处理    

基于分布式表示语义组合的查询子主题挖掘 None

Wei SONG, Ying LIU, Li-zhen LIU, Han-shi WANG

《信息与电子工程前沿(英文)》 2018年 第19卷 第11期   页码 1409-1419 doi: 10.1631/FITEE.1601476

摘要: 查询子主题挖掘旨在找到可能的子主题,用于表示给定查询的潜在意图。由于查询较短,子主题挖掘具有挑战性。学习词或句子分布式表示推动和影响了很多领域的发展。然而,没有清晰的结论表明该分布式表示是否有助于应对查询子主题挖掘面临的挑战。提出并比较利用分布式表示的语义组合进行查询子主题挖掘。Testbeds and Community for Information Access Research,NTCIR)提供的公开数据集上的实验结果表明,与传统语义表示相比,分布式语义表示能获得更优查询子主题挖掘性能

关键词: 查询子主题挖掘;查询意图;分布式表示;语义组合    

基于个性化主题模型的用户生成内容推荐 Article

Wei ZHANG, Jia-yu ZHUANG, Xi YONG, Jian-kou LI, Wei CHEN, Zhe-min LI

《信息与电子工程前沿(英文)》 2017年 第18卷 第5期   页码 708-718 doi: 10.1631/FITEE.1500402

摘要: 基于层次主题模型和矩阵分解模型,我们构造了一个新的推荐模型。实验证明我们的新模型显著的优于其它已有模型,并且可以为用户和内容对应的主题给出直观解释。

关键词: 用户生成内容;协同过滤;矩阵分解;层次主题模型    

词加权有监督主题模型:多标签文本分类 None

Yue-peng ZOU, Ji-hong OUYANG, Xi-ming LI

《信息与电子工程前沿(英文)》 2018年 第19卷 第4期   页码 513-523 doi: 10.1631/FITEE.1601668

摘要: 有监督主题模型已成功应用于多标签文本分类任务。实验结果表明,相比传统有监督主题模型,基于CF-weight的模型在多标签分类性能上具有优势。

关键词: 有监督主题模型;多标签分类;类别频率;有监督隐含狄利克雷分配模型;判别隐含狄利克雷分配模型    

基于同类用户的个性化查询词自动推荐方法 Regular Papers-Research Articles

Dan-yang JIANG, Hong-hui CHEN

《信息与电子工程前沿(英文)》 2019年 第20卷 第9期   页码 1246-1258 doi: 10.1631/FITEE.1800010

摘要: 首先,通过主题模型得到用户的主题兴趣,建立每个用户的兴趣肖像,然后将兴趣肖像相似的用户聚集起来建立同类用户群。由于传统主题模型不能自动识别同类用户,提出两个同类用户主题模型,将主题建模与同类用户识别包含在同一个模型框架内。根据不同的同类用户识别方法,提供4个不同的基于同类用户的个性化QAC方法。

关键词: 查询词自动推荐;基于同类用户的信息检索;主题模型    

论文演化图:学术文献多视角结构化检索 None

Dan-ping LIAO, Yun-tao QIAN

《信息与电子工程前沿(英文)》 2019年 第20卷 第2期   页码 187-205 doi: 10.1631/FITEE.1700105

摘要: PEG采用多个演化链描述查询输入信息在不同主题方向的演化情况。通过论文作者、参考文献引用、论文内容信息这3个视角,PEG能够发现文献之间各种潜在关系,并多视角展示文献演化过程。PEG构造主要有3个步骤:首先,采用元图分解法把文献软聚合为多个群落,获取每篇论文的主题分布;其次,从与查询相关的文献群落中提取主题连贯性演化链。每条演化链反映查询信息的某一视角;最后,提取的演化链组合形成论文演化图,可以覆盖查询涉及的所有主题。基于真实文献数据库的实验结果表明,该方法能够建立对用户有意义的论文演化图。

关键词: 论文演化图;学术文献检索;元图分解;主题连贯性    

战略性新兴产业多领域知识融合路径研究——基于引用网络和文本信息的分析

刘宇飞,苗仲桢,黎凌峰,孔德婧

《中国工程科学》 2020年 第22卷 第2期   页码 120-129 doi: 10.15302/J-SSCAE-2020.02.016

摘要:

针对战略性新兴产业开展技术融合过程分析,有助于深入理解产业技术的产生过程和发展规律,从而捕捉领域发展动向、推动产业健康发展。本文针对战略性新兴产业中呈现融合发展趋势且备受社会关注的高端装备制造、新一代信息技术、新医药、新能源4个技术领域进行多案例研究,以期识别出技术融合发展的路径和程度。采用基于引用网络和文本信息的知识融合路径分析方法,使用图神经网络同时将论文的引用网络、标题和摘要信息编码为向量;分析4个技术领域的论文数据,识别出了 5 条技术融合路径。研究结果表明,信息技术与数控设备技术、生物医药与太阳能光伏技术均呈现深度融合的趋势,且前者的融合程度更为深入;数控设备与太阳能光伏技术、信息技术与太阳能光伏技术也呈现融合趋势,但限于发展时间较短而显融合程度较浅;数控设备与生物医药技术领域尚未呈现融合发展的趋势。

关键词: 新兴产业     知识融合     图神经网络     引用网络     主题模型    

新闻媒体眼中的中国:新冠肺炎疫情下的案例研究 Research Article

黄宏1,2,3,4,陈哲学1,2,3,4,石宣化1,2,3,4,王晨旭1,2,3,4,何泽鹏1,2,3,4,金海1,2,3,4,张明新5,李宗亚5

《信息与电子工程前沿(英文)》 2021年 第22卷 第11期   页码 1443-1457 doi: 10.1631/FITEE.2000689

摘要: 中国作为新冠肺炎疫情早期爆发地区之一,在2020年初就引起全球新闻媒体关注。疫情期间,中国人民团结一致,积极抗击疫情。然而,在国际公众眼中,有关中国疫情的报道并不乐观。为更好了解国际公众如何看待中国,特别是在疫情期间,我们利用大数据技术进行了案例研究。我们主要想回答3个问题:(1)新冠肺炎疫情期间,国际媒体关注的焦点是什么?(2)媒体报道中国时的立场是什么?(3)媒体谈论中国时的态度是什么?具体来说,我们从22个国家的57家主流媒体中收集了28万则以上相关新闻,从中分析出一些有趣现象。例如,新冠肺炎疫情期间,国际媒体更加关注中国民生;在3月和4月,“中国疫苗进展”“特定药物和治疗”“美国病毒爆发”成为媒体最常见话题;在新闻态度方面,古巴、马来西亚、委内瑞拉对中国持正面态度,而法国、加拿大、英国则持负面态度。我们的研究有助于理解中国在国际媒体眼中的形象,并为形象分析提供良好依据。

关键词: 国家形象;新冠肺炎;主题挖掘;实体;新闻立场;情感    

标题 作者 时间 类型 操作

基于本体和模拟退火算法的暴雨灾害主题爬虫策略

刘景发1,2,李帆3,丁若尧1,2,刘子昂4

期刊论文

一种新的融合本体和主机信息的改进禁忌搜索算法的主题爬虫方法

刘景发1,王震1,2,钟国1,杨志和1

期刊论文

基于内容和引用的科研文献的主题发现和演化

Hou-kui ZHOU, Hui-min YU, Roland HU

期刊论文

基于自适应在线双词主题模型的应用程序评论新兴主题识别

周芄1,王勇1,2,高翠芸3,杨非4

期刊论文

基于分布式表示语义组合的查询子主题挖掘

Wei SONG, Ying LIU, Li-zhen LIU, Han-shi WANG

期刊论文

基于个性化主题模型的用户生成内容推荐

Wei ZHANG, Jia-yu ZHUANG, Xi YONG, Jian-kou LI, Wei CHEN, Zhe-min LI

期刊论文

词加权有监督主题模型:多标签文本分类

Yue-peng ZOU, Ji-hong OUYANG, Xi-ming LI

期刊论文

基于同类用户的个性化查询词自动推荐方法

Dan-yang JIANG, Hong-hui CHEN

期刊论文

论文演化图:学术文献多视角结构化检索

Dan-ping LIAO, Yun-tao QIAN

期刊论文

战略性新兴产业多领域知识融合路径研究——基于引用网络和文本信息的分析

刘宇飞,苗仲桢,黎凌峰,孔德婧

期刊论文

新闻媒体眼中的中国:新冠肺炎疫情下的案例研究

黄宏1,2,3,4,陈哲学1,2,3,4,石宣化1,2,3,4,王晨旭1,2,3,4,何泽鹏1,2,3,4,金海1,2,3,4,张明新5,李宗亚5

期刊论文