资源类型

期刊论文 1218

会议视频 102

会议信息 59

年份

2024 2

2023 102

2022 117

2021 138

2020 102

2019 99

2018 64

2017 76

2016 37

2015 24

2014 52

2013 38

2012 41

2011 37

2010 42

2009 29

2008 51

2007 45

2006 48

2005 59

展开 ︾

关键词

2020 19

应用 17

人工智能 16

数学模型 13

智能制造 13

2019 12

神经网络 12

机器学习 11

模型 10

模式识别 10

数值模拟 9

模型试验 9

深度学习 9

农业科学 8

信息技术 7

战略性新兴产业 7

新兴产业 7

仿真技术 6

图像处理 6

展开 ︾

检索范围:

排序: 展示方式:

基于自适应在线双词主题模型应用程序评论新兴主题识别 Research Article

周芄1,王勇1,2,高翠芸3,杨非4

《信息与电子工程前沿(英文)》 2022年 第23卷 第5期   页码 678-691 doi: 10.1631/FITEE.2100465

摘要: 应用程序评论中的新兴主题突出了用户在一定时期内关注的主题(如软件漏洞)。准确、及时地识别新兴主题能帮助开发者更有效地更新应用程序。已有文献基于主题模型或聚类方法识别应用程序评论中的新兴主题。然而,由于评论文本长度较短,提供的信息有限,新兴主题识别准确率较低。为解决该问题,提出一种改进的新兴主题识别方法(IETI)。首先采用自然语言处理技术减少评论文本中的噪音数据,然后使用自适应在线双词主题模型识别评论中的新兴主题。最后利用新兴主题中相关的短语和句子解释新兴主题的含义。采用官方更新日志作为新兴主题的评估标准,选择6个常见的应用程序对IETI进行评估。实验结果表明,IETI在识别新兴主题方面优于传统方法,短语标签F1值增量为0.126,句子标签F1值增量为0.061。

关键词: 应用程序评论新兴主题识别主题模型自然语言处理    

预训练语言模型及其应用 Review

王海峰, 李纪为, Hua Wu, Eduard Hovy, Yu Sun

《工程(英文)》 2023年 第25卷 第6期   页码 51-65 doi: 10.1016/j.eng.2022.04.024

摘要:

预训练语言模型(pre-trained languages model, PTLM)在自然语言处理(natural language processing, NLP)领域取得了令人瞩目的成功,并由此引发了下游任务从监督学习到预训练在此之后,一系列预训练模型的创新研究涌现出来。本文系统性、全面的回顾了自然语言处理的代表性工作和最新进展,并按照类别系统性的介绍了自然语言处理领域的预训练模型。首先我们简要介绍了预训练模型,以及不同的模型特点和框架。之后,我们介绍并分析了预训练模型的影响和挑战以及下游任务中的应用。最后,我们简要总结并阐述了预训练模型未来的研究方向。

关键词: 预训练模型     自然语言处理    

神经自然语言处理最新进展——模型、训练和推理 Review

周明, 段楠, 刘树杰, 沈向洋

《工程(英文)》 2020年 第6卷 第3期   页码 275-290 doi: 10.1016/j.eng.2019.12.014

摘要:

自然语言处理(natural language processing, NLP)是人工智能研究的一个重要领域,旨在构建能够理解和生成自然语言、实现人机自然交互的技术方案。近5年,基于神经网络的自然语言处理方法取得突飞猛进的发展。基于海量无标注数据和大量标注数据进行建模,使得机器翻译、自动问答和阅读理解等很多任务的水准都得到了极大的提高。本文将从3个角度回顾神经自然语言处理的最新进展,包括模型、训练和推理。在模型部分,我们将介绍典型的神经网络建模方法,包括词嵌入建模、句子嵌入建模和序列到序列建模等。之所以强调推理方面的研究,是因为推理是构建基于知识的可解释自然语言处理模型的关键技术。本文的最后将概括介绍我们对自然语言处理未来发展方向的一些思考。

关键词: 自然语言处理     深度学习     建模、学习和推理    

肿瘤临床大数据管理系统设计与应用

马麟,包晨露,李青,吴静依,潘虹安,李鹏飞,张路霞,詹启敏

《中国工程科学》 2022年 第24卷 第6期   页码 127-136 doi: 10.15302/J-SSCAE-2022.06.011

摘要: text-align: justify;">肿瘤是人类生命健康的重要威胁,随着我国医疗行业信息化的发展,医疗机构积累了大量的肿瘤临床数据,但因数据标准不统一、治理难度大等原因制约了数据价值的充分挖掘;应用人工智能(AI)等前沿信息技术建设肿瘤临床大数据管理系统,有助于肿瘤临床数据的深入应用、临床诊疗管理质量与效率提升。本文剖析了我国肿瘤临床数据治理与应用面临的问题及挑战,研判了肿瘤临床大数据管理体系的应用价值;针对肿瘤临床数据多来源、多模态的复杂特性,探索了AI 技术应用于肿瘤临床大数据管理与科研的机制及路径;设计了包括肿瘤通用数据模型构建、临床数据采集与安全管理、标准化结构化治理、分析与建模应用、数据质量管理在内的全流程解决方案,阐述了相应系统的建设框架与技术体系;以某三甲医院肺癌临床大数据平台为案例,展示了所提方案在临床实践中的可行性及应用价值

关键词: 临床大数据;管理系统;肿瘤;人工智能;通用数据模型自然语言处理    

ACM-2019第二届机器学习与自然语言处理国际会议

会议日期: 2019年12月20日

会议地点: 海南海口 三亚

主办单位: IAASE

第十六届自然语言处理青年学者研讨会(YSSNLP2019)

会议日期: 2019年05月03日

会议地点: 中国/海南/琼海

主办单位: 中国中文信息学会青年工作委员会

运用数字技术应对新冠病毒肺炎疫情——病毒接触者追踪应用程序

Mitch Leslie

《工程(英文)》 2020年 第6卷 第10期   页码 1064-1066 doi: 10.1016/j.eng.2020.09.001

词加权有监督主题模型:多标签文本分类 None

Yue-peng ZOU, Ji-hong OUYANG, Xi-ming LI

《信息与电子工程前沿(英文)》 2018年 第19卷 第4期   页码 513-523 doi: 10.1631/FITEE.1601668

摘要: 有监督主题模型已成功应用于多标签文本分类任务。代表性模型包括有监督隐含狄利克雷分配模型(labeled latent Dirichlet allocation,L-LDA)和判别隐含狄利克雷分配模型(dependency-LDA)。这些已有模型忽略单词类别频率信息,即训练集中单词出现的类别数量,对分类任务的影响。将CF-weight方法应用于L-LDA和dependency-LDA模型。实验结果表明,相比传统有监督主题模型,基于CF-weight的模型在多标签分类性能上具有优势。

关键词: 有监督主题模型;多标签分类;类别频率;有监督隐含狄利克雷分配模型;判别隐含狄利克雷分配模型    

战略性新兴产业多领域知识融合路径研究——基于引用网络和文本信息的分析

刘宇飞,苗仲桢,黎凌峰,孔德婧

《中国工程科学》 2020年 第22卷 第2期   页码 120-129 doi: 10.15302/J-SSCAE-2020.02.016

摘要:

针对战略性新兴产业开展技术融合过程分析,有助于深入理解产业技术的产生过程和发展规律,从而捕捉领域发展动向、推动产业健康发展。本文针对战略性新兴产业中呈现融合发展趋势且备受社会关注的高端装备制造、新一代信息技术、新医药、新能源4个技术领域进行多案例研究,以期识别出技术融合发展的路径和程度。采用基于引用网络和文本信息的知识融合路径分析方法,使用图神经网络同时将论文的引用网络、标题和摘要信息编码为向量;分析4个技术领域的论文数据,识别出了 5 条技术融合路径。

关键词: 新兴产业     知识融合     图神经网络     引用网络     主题模型    

基于内容和引用的科研文献的主题发现和演化 Article

Hou-kui ZHOU, Hui-min YU, Roland HU

《信息与电子工程前沿(英文)》 2017年 第18卷 第10期   页码 1511-1524 doi: 10.1631/FITEE.1601125

摘要: 在本文中,我们提出了一种名为“Citation-content-LDA (latent Dirichlet allocation)”的主题发现方法,该方法在一个概率生成模型中同时生成文献的引用关系和文献本身的词Citation-content-LDA模型利用了一种两层结构的主题模型,即利用引用信息生成父主题和利用文本信息生成子主题模型参数通过吉布斯采样算法来估计。我们还提出了一个主题演化算法,该算法包括主题分割和主题间依赖关系计算两个步骤。Analysis and Machine Intelligence (PAMI)和IEEE Computer Society (CS)两个数据集上测试了提出的Citation-content-LDA模型主题演化算法,证明了我们提出的算法能有效的发现重要的主题和反映重要研究主题主题演化情况。

关键词: 主题提取;主题演化;评价方法    

基于个性化主题模型的用户生成内容推荐 Article

Wei ZHANG, Jia-yu ZHUANG, Xi YONG, Jian-kou LI, Wei CHEN, Zhe-min LI

《信息与电子工程前沿(英文)》 2017年 第18卷 第5期   页码 708-718 doi: 10.1631/FITEE.1500402

摘要: 然而,传统的推荐模型没有考虑用户和内容之间的创作关系。本文中,我们验证了:通过引入创作关系信息,可以显著提高推荐算法的各项指标。基于层次主题模型和矩阵分解模型,我们构造了一个新的推荐模型。实验证明我们的新模型显著的优于其它已有模型,并且可以为用户和内容对应的主题给出直观解释。另外,由于从用户生成的内容我们可以推测其兴趣偏好,因此可以解决冷启动问题。

关键词: 用户生成内容;协同过滤;矩阵分解;层次主题模型    

第五十七届国际计算语言学年会

会议日期: 2019年07月28日

会议地点: 意大利/佛罗伦萨

主办单位: 国际计算语言学协会(ACL)

脚本学习综述 Review

韩毅1,乔林波1,郑建明2,吴贺丰3,李东升1,廖湘科1

《信息与电子工程前沿(英文)》 2021年 第22卷 第3期   页码 287-436 doi: 10.1631/FITEE.2000347

摘要: 学习脚本中蕴含的丰富常识知识可以帮助机器理解自然语言并做出常识性推理。脚本学习是一个颇具用途及潜力的研究方向,一个经过训练的脚本学习系统可以处理叙事文本,捕捉其中的脚本知识进而做出推理。脚本学习主要包括3个重点研究内容:事件表示方式、脚本学习模型以及性能评估方法。针对每一主题,对现有脚本学习系统进行了系统总结和分类,仔细分析和比较了其中代表性系统的优缺点。

关键词: 脚本学习;自然语言处理;常识知识建模;事件推理    

基于本体和模拟退火算法的暴雨灾害主题爬虫策略 Research Article

刘景发1,2,李帆3,丁若尧1,2,刘子昂4

《信息与电子工程前沿(英文)》 2022年 第23卷 第8期   页码 1189-1204 doi: 10.1631/FITEE.2100360

摘要: 目前,主题爬虫是从海量异构网络中获取有效领域知识的重要方法。目前大多数主题爬虫技术难以获得高质量爬行结果。主要难点包括主题基准模型的建立、超链接主题相关性的评估和爬行策略的设计。本文采用领域本体为特定主题构建主题基准模型,并提出一种新的基于局部本体和全局本体的多重筛选策略(MFSLG)。为提高待访问超链接主题相关性计算精度,提出一种基于网页文本和链接结构的综合优先度评估方法(CPEM),同时,采用模拟退火(SA)算法避免主题爬虫陷入局部最优搜索。策略(FCOSA_LG),以从网络中获取与暴雨灾害主题相关的网页。实验结果表明,针对不同性能指标,所提爬虫策略优于其他主题爬虫策略。

关键词: 主题爬虫;本体;优先度评估;模拟退火;暴雨灾害    

标题 作者 时间 类型 操作

基于自适应在线双词主题模型应用程序评论新兴主题识别

周芄1,王勇1,2,高翠芸3,杨非4

期刊论文

预训练语言模型及其应用

王海峰, 李纪为, Hua Wu, Eduard Hovy, Yu Sun

期刊论文

神经自然语言处理最新进展——模型、训练和推理

周明, 段楠, 刘树杰, 沈向洋

期刊论文

肿瘤临床大数据管理系统设计与应用

马麟,包晨露,李青,吴静依,潘虹安,李鹏飞,张路霞,詹启敏

期刊论文

ACM-2019第二届机器学习与自然语言处理国际会议

2019年12月20日

会议信息

第十六届自然语言处理青年学者研讨会(YSSNLP2019)

2019年05月03日

会议信息

运用数字技术应对新冠病毒肺炎疫情——病毒接触者追踪应用程序

Mitch Leslie

期刊论文

词加权有监督主题模型:多标签文本分类

Yue-peng ZOU, Ji-hong OUYANG, Xi-ming LI

期刊论文

战略性新兴产业多领域知识融合路径研究——基于引用网络和文本信息的分析

刘宇飞,苗仲桢,黎凌峰,孔德婧

期刊论文

基于内容和引用的科研文献的主题发现和演化

Hou-kui ZHOU, Hui-min YU, Roland HU

期刊论文

基于个性化主题模型的用户生成内容推荐

Wei ZHANG, Jia-yu ZHUANG, Xi YONG, Jian-kou LI, Wei CHEN, Zhe-min LI

期刊论文

第五十七届国际计算语言学年会

2019年07月28日

会议信息

赵振杰:具有物理常识的自然语言处理(2020年11月6日)

2022年10月14日

会议视频

脚本学习综述

韩毅1,乔林波1,郑建明2,吴贺丰3,李东升1,廖湘科1

期刊论文

基于本体和模拟退火算法的暴雨灾害主题爬虫策略

刘景发1,2,李帆3,丁若尧1,2,刘子昂4

期刊论文