资源类型

期刊论文 540

会议信息 45

会议视频 25

会议专题 1

年份

2024 1

2023 79

2022 79

2021 84

2020 74

2019 77

2018 32

2017 37

2016 12

2015 15

2014 9

2013 4

2012 9

2011 4

2010 6

2009 8

2008 4

2007 12

2006 7

2005 8

展开 ︾

关键词

机器学习 27

深度学习 15

2020 12

人工智能 12

医学 7

过程强化 6

2019 5

增材制造 5

绿色化工 5

中药 4

学术会议 4

治疗 4

COVID-19 3

MATLAB 3

SARS-CoV-2 3

临床试验 3

图像处理 3

ACM 2

IEEE 2

展开 ︾

检索范围:

排序: 展示方式:

监督毒症治疗推荐算法 Research Articles

朱思涵1,浦剑2

《信息与电子工程前沿(英文)》 2021年 第22卷 第7期   页码 926-939 doi: 10.1631/FITEE.2000127

摘要: 由于每个毒症患者治疗反应可能不同,为病人提供量身定制的治疗建议来帮助医生有效、准确地做出决定,并采取有效治疗方案,是降低医院重症监护病房死亡率的一项极具挑战性的工作。本文将强化应用于个人治疗推荐,采用对样本不确定性进行建模并评估的方法,根据患者对治疗的反应和状态,将患者样本分为两个域,然后使用辅助迁移学习任务重建两个域的样本,使用特权学习的蒸馏方法与用于迁移学习的变分自动编码器框架关联低质量域和高质量域间的任务通过结合监督方式获得更好的状态和动作表示,本文提出一种针对引起较高风险的不确定性进行控制的深度强化方法;模型提供一定的灵活性使之可以在不同场景对模糊样本做出保守预测或明确判断,并降低预期死亡率。

关键词: 治疗推荐毒症监督强化电子病历    

面向强化自动驾驶模型的异步监督预训练方法 Research Articles

王云鹏,郑坤贤,田大新,段续庭,周建山

《信息与电子工程前沿(英文)》 2021年 第22卷 第5期   页码 615-766 doi: 10.1631/FITEE.1900637

摘要: 强化训练需要大量训练数据,然后模型才能达到合理的性能要求,这使得基于强化的模型不适用于现实环境,尤其在数据昂贵的情况下。本文为基于强化的端到端自动驾驶模型提出一种异步监督(asynchronous supervised learning,ASL)方法,以解决在实际环境中训练基于强化模型时初始性能差的问题。具体而言,通过在多个驾驶演示数据集上并行且异步执行多个监督过程,在异步监督预训练阶段引入先验知识。经过预训练后,模型将被部署到真实车辆上进一步开展强化训练,以适应实际环境并不断突破性能极限。仿真结果表明,在有监督的预训练阶段使用一些演示,可以显著提高强化训练阶段的初始性能和收敛速度。

关键词: 自主驾驶;自动驾驶车辆;强化监督    

融合监督学习与目标自适应屏蔽的会话型推荐方法 Research Article

王祎童,蔡飞,潘志强,宋城宇

《信息与电子工程前沿(英文)》 2023年 第24卷 第1期   页码 73-87 doi: 10.1631/FITEE.2200137

摘要: 会话型推荐旨在根据用户在短时间内有限的交互来预测下一个时间戳将要进行交互的物品。现有模型主要使用循环神经网络(RNN)或图神经网络(GNN)来建模顺序序列或物品之间的传递关系。为了解决上述问题,本文提出一种融合监督学习与目标自适应屏蔽的会话型推荐方法(SGL-TM)。具体来说,首先根据所有涉及到的会话构建全局图,然后从物品之间的全局连接中捕捉监督信号,用来监督模型生成当前会话中准确的物品表示。之后,通过比较真值与经过我们设计的目标自适应屏蔽模块调整后的物品的预测分数来计算主监督损失。最后,将主监督组件与辅助监督模块相结合,以获得用来优化模型参数的最终损失。

关键词: 会话型推荐监督;图神经网络;目标自适应屏蔽    

学习挑选伪标签:一种用于命名实体识别的半监督方法 Research Articles

李真真,冯大为,李东升,卢锡城

《信息与电子工程前沿(英文)》 2020年 第21卷 第6期   页码 809-962 doi: 10.1631/FITEE.1800743

摘要: 深度学习模型在命名实体识别(NER)中实现了最先进的性能;然而,其良好性能很大程度上依赖于大量标记数据。在某些特定领域,例如医学、金融和军事领域,标记数据非常稀缺,而未标记数据则很容易获得。本文提出一种用于NER任务的半监督方法,其通过学习一个判别模块筛除错误伪标签,以创建高质量标注数据。伪标签是为未标记数据自动生成的标签,并被当作真实标签用来训练模型。该半监督框架包括3个步骤:为特定NER任务构建最佳单神经网络模型,学习一个评价伪标签的模块,以及迭代创建新的标记数据和改进NER模型。

关键词: 命名实体识别;无标注数据;深度学习;半监督方法    

基于自适应置信度校准的交互式医疗图像分割框架

沈楚云,李文浩,徐琪森,胡斌,金博,蔡海滨,朱凤平,李郁欣,王祥丰

《信息与电子工程前沿(英文)》 2023年 第24卷 第9期   页码 1332-1348 doi: 10.1631/FITEE.2200299

摘要: 为更好地利用不同时间尺度上的交互信息,本文提出一种基于自适应置信度校准的交互式医疗图像分割框架MECCA,其结合了基于分割决策的置信度学习技术和多智能体强化技术,并通过预测分割决策与短期交互信息的对齐水平来学习一个新颖的置信度网络

关键词: 医疗图像分割     交互式分割     多智能体强化     置信度学习     监督    

NGAT:基于广度和深度探索注意力机制的半监督图表示学习 Research Articles

胡荐苛,张引

《信息与电子工程前沿(英文)》 2022年 第23卷 第3期   页码 409-421 doi: 10.1631/FITEE.2000657

摘要: 近年来图神经网络(GNN)在图结构数据表示学习方面取得显著成绩。然而,随着网络层数增加,由于过度平滑问题,基于邻域信息聚合策略的GNN性能恶化,这也是GNN应用于真实图的主要瓶颈。为缓解过度平滑,本文提出一种嵌套的图注意网络,即基于双重注意力机制的多尺度特征融合模型NGAT,该网络可以半监督形式工作。本文在公开数据集上对比了现有图神经网络模型,实验表明本文提出的NGAT模型具备更强的节点嵌入学习能力。

关键词: 学习;半监督;节点分类;注意力机制    

联邦无监督表示学习 Research Article

张凤达1,况琨1,陈隆1,游兆阳1,沈弢1,肖俊1,张寅1,吴超2,吴飞1,庄越挺1,李晓林3,4,5

《信息与电子工程前沿(英文)》 2023年 第24卷 第8期   页码 1181-1193 doi: 10.1631/FITEE.2200268

摘要: 为利用分布式边缘设备上大量未标记数据,我们在联邦学习中提出一个称为联邦无监督表示学习(FURL)的新问题,以在没有监督的情况下学习通用表示模型,同时保护数据隐私。

关键词: 联邦学习;无监督;表示学习;对比学习    

监督堆叠距离自动编码器的表征学习在图像分类上的应用 Research Articles

侯亮,罗潇逸,汪子扬,梁军

《信息与电子工程前沿(英文)》 2020年 第21卷 第7期   页码 963-1118 doi: 10.1631/FITEE.1900116

摘要: 图像分类是深度学习的重要应用。在典型分类任务中,分类精度与通过深度学习方法提取的特征密切相关。自动编码器是一种特殊神经网络,常用于降维和特征提取。该模型被称为半监督距离自动编码器。首先以无监督方式对每一层进行预训练。在随后的监督训练中,将优化的参数设置为初始值。为获得更好性能,使用堆叠式模型代替具有单一隐含层的传统自动编码器结构。将所提半监督距离自动编码器方法分别与传统自动编码器、稀疏自动编码器和监督自动编码器比较,实验结果证明该模型有效。

关键词: 自动编码器;图像分类;半监督;神经网络    

基于主动学习的不确定性感知补标签查询 Perspective

刘圣源1,陈珂2,胡天磊1,毛云青3

《信息与电子工程前沿(英文)》 2023年 第24卷 第10期   页码 1497-1503 doi: 10.1631/FITEE.2200589

摘要: 许多主动学习方法假设学习者可便捷地向注释者询问训练数据的完整标注信息。这些方法主要试图通过最小化标注数量降低标注成本。然而,对于许多现实中的分类任务来说,精确标注实例仍然非常昂贵。为降低单次标注行为成本,本文试图解决一种新的主动学习范式,称为具有补标签的主动学习(ALCL)。ALCL学习器只针对样例特定类别提出是或否的问题。在收到标注者答案后,ALCL学习器获得一些有监督实例和更多具有补标签的训练实例,这些补标签仅表示对应标签与该实例无关。。针对第一个问题,在主动学习范式下提出一种基于不确定性的抽样策略。针对第二个问题,改进了一种已有的ALCL方法,同时适配了我们的抽样策略。在各种数据集上的实验结果验证了本文方法的有效性。

关键词: 主动学习;图片分类;弱监督    

MDLB:一种基于强化的元数据动态负载均衡机制 Research Articles

武兆琪1,卫今2,3,张帆1,郭威1,谢光伟2,3

《信息与电子工程前沿(英文)》 2020年 第21卷 第7期   页码 963-1118 doi: 10.1631/FITEE.1900121

摘要: 提出一种基于强化的动态负载平衡机制(MDLB)。采用Q_learning算法,所提基于强化机制由3个模块组成,即策略选择网络、负载均衡网络和参数更新网络。

关键词: 面向对象的存储系统;元数据;动态负载均衡;强化;Q_learning    

Actor-Critic强化算法及其在开发基于计算机视觉的界面跟踪中的应用 Article

Oguzhan Dogru, Kirubakaran Velswamy, 黄彪

《工程(英文)》 2021年 第7卷 第9期   页码 1248-1261 doi: 10.1016/j.eng.2021.04.027

摘要: 强化(RL)智能体成功跟踪了两种液体之间的界面,这通常是化学、石化、冶金和石油行业中跟踪的关键变量。该方法使用少于100 张图像来创建环境,智能体无需专家知识即可从中生成自己的数据。与依赖大量参数的监督(SL)方法不同,这种方法需要的参数少得多,这自然降低了维护成本。除了经济性外,该智能体还对环境不确定性(如遮挡、强度变化和过度噪声)具有鲁棒性。

关键词: 界面跟踪     对象跟踪     遮挡     强化     均匀流形逼近和投影    

非独立同分布推荐系统:推荐范式转换的综述和框架 Artical

Longbing Cao

《工程(英文)》 2016年 第2卷 第2期   页码 212-224 doi: 10.1016/J.ENG.2016.02.013

摘要:

虽然推荐系统在我们的生活、学习、工作和娱乐中扮演着越来越重要的角色,但是很多时候我们收到的推荐都是不相关的、重复的,或者包含不感兴趣的产品和服务。这些差的推荐系统产生的原因来源于一个本征假设:传统的理论和推荐系统认为用户和物品是独立同分布的(IID)。本文先讨论了推荐系统的非独立同分布性,紧接着介绍了非独立同分布性原理,目的是从耦合和异构性的角度来深入阐述传统的推荐系统的固有本质。这种非独立同分布推荐系统引起了传统推荐系统范式的转化—— 从独立同分布向非独立同分布进行转化,希望能够形成高效的、相关性高的、个人订制和可操作的推荐系统。

关键词: 独立同分布     非独立同分布     异构性     关系耦合     耦合学习     关系学习     独立同分布学习     非独立同分布学习     推荐系统     推荐     非独立同分布推荐    

带有网络智能体的去中心化多智能体强化进展 Review Article

张凯清1,杨卓然2,Tamer BAŞAR1

《信息与电子工程前沿(英文)》 2021年 第22卷 第6期   页码 802-814 doi: 10.1631/FITEE.1900661

摘要: 多智能体强化长期以来一直是机器学习和控制领域的重要研究课题。最近在(单智能体)深度强化领域的进展重新唤醒了对多智能体强化的研究兴趣,尤其在理论分析方面。本文回顾这个大课题中的一个子领域:带有网络智能体的去中心化多智能体强化

关键词: 强化;多智能体系统;网络系统;一致性优化;分布式优化;博弈论    

基于专家示教聚类经验池的高效深度强化 Research Article

王士珉1,赵彬琦1,张政锋1,张军平1,浦剑2

《信息与电子工程前沿(英文)》 2023年 第24卷 第11期   页码 1541-1556 doi: 10.1631/FITEE.2300084

摘要: 作为强化领域最基本的主题之一,样本效率对于深度强化算法的部署至关重要。通过这种方式,我们的方法能够更多地利用专家示教数据中的监督信息。在6种不同的连续运动环境中进行了实验,结果表明选择性采样方法具有卓越的强化性能和更快的收敛速度。

关键词: 强化;采样效率;采样过程;聚类方法;自动驾驶    

基于解耦价值和策略强化的家庭能源管理方法

熊珞琳,唐漾,刘臣胜,毛帅,孟科,董朝阳,钱锋

《信息与电子工程前沿(英文)》 2023年 第24卷 第9期   页码 1261-1272 doi: 10.1631/FITEE.2200667

摘要: 本文提出一种基于数据驱动的深度强化家庭能源管理方法。

关键词: 家庭能源系统     电动汽车     强化     泛化性    

标题 作者 时间 类型 操作

监督毒症治疗推荐算法

朱思涵1,浦剑2

期刊论文

面向强化自动驾驶模型的异步监督预训练方法

王云鹏,郑坤贤,田大新,段续庭,周建山

期刊论文

融合监督学习与目标自适应屏蔽的会话型推荐方法

王祎童,蔡飞,潘志强,宋城宇

期刊论文

学习挑选伪标签:一种用于命名实体识别的半监督方法

李真真,冯大为,李东升,卢锡城

期刊论文

基于自适应置信度校准的交互式医疗图像分割框架

沈楚云,李文浩,徐琪森,胡斌,金博,蔡海滨,朱凤平,李郁欣,王祥丰

期刊论文

NGAT:基于广度和深度探索注意力机制的半监督图表示学习

胡荐苛,张引

期刊论文

联邦无监督表示学习

张凤达1,况琨1,陈隆1,游兆阳1,沈弢1,肖俊1,张寅1,吴超2,吴飞1,庄越挺1,李晓林3,4,5

期刊论文

监督堆叠距离自动编码器的表征学习在图像分类上的应用

侯亮,罗潇逸,汪子扬,梁军

期刊论文

基于主动学习的不确定性感知补标签查询

刘圣源1,陈珂2,胡天磊1,毛云青3

期刊论文

MDLB:一种基于强化的元数据动态负载均衡机制

武兆琪1,卫今2,3,张帆1,郭威1,谢光伟2,3

期刊论文

Actor-Critic强化算法及其在开发基于计算机视觉的界面跟踪中的应用

Oguzhan Dogru, Kirubakaran Velswamy, 黄彪

期刊论文

非独立同分布推荐系统:推荐范式转换的综述和框架

Longbing Cao

期刊论文

带有网络智能体的去中心化多智能体强化进展

张凯清1,杨卓然2,Tamer BAŞAR1

期刊论文

基于专家示教聚类经验池的高效深度强化

王士珉1,赵彬琦1,张政锋1,张军平1,浦剑2

期刊论文

基于解耦价值和策略强化的家庭能源管理方法

熊珞琳,唐漾,刘臣胜,毛帅,孟科,董朝阳,钱锋

期刊论文