检索范围:
排序: 展示方式:
基于多智能体深度强化学习的工业无线网络端边协同资源分配 Research Article
刘晓宇1,2,3,4,许驰1,2,3,于海斌1,2,3,曾鹏1,2,3
《信息与电子工程前沿(英文)》 2022年 第23卷 第1期 页码 47-60 doi: 10.1631/FITEE.2100331
带有网络智能体的去中心化多智能体强化学习进展 Review Article
张凯清1,杨卓然2,Tamer BAŞAR1
《信息与电子工程前沿(英文)》 2021年 第22卷 第6期 页码 802-814 doi: 10.1631/FITEE.1900661
认知无线网络中一种基于投影梯度的多用户功率控制方法 None
Yun-zheng TAO, Chun-yan WU, Yu-zhen HUANG, Ping ZHANG
《信息与电子工程前沿(英文)》 2018年 第19卷 第3期 页码 367-378 doi: 10.1631/FITEE.1700067
命名数据多跳无线网络中的联合优化的拥塞控制、转发策略和链路调度
Cheng-cheng Li, Ren-chao Xie, Tao Huang, Yun-jie Liu,lengcangche@bupt.edu.cn,renchao_xie@bupt.edu.cn,htao@bupt.edu.cn
《信息与电子工程前沿(英文)》 2017年 第18卷 第10期 页码 1573-1590 doi: 10.1631/FITEE.1601585
针对意外崩溃智能体的教练辅助多智能体强化学习框架 Research Article
赵鉴1,赵有朋1,王维埙2,阳明宇1,胡迅晗1,周文罡1,郝建业2,李厚强1
《信息与电子工程前沿(英文)》 2022年 第23卷 第7期 页码 1032-1042 doi: 10.1631/FITEE.2100594
关键词: 多智能体系统;强化学习;意外崩溃智能体
无线多媒体传感器网络中端对端时延资源调配的多层次跨层协议 Regular Papers-Research Articles
Hossein HADADIAN NEJAD YOUSEFI, Yousef SEIFI KAVIAN, Alimorad MAHMOUDI
《信息与电子工程前沿(英文)》 2019年 第20卷 第9期 页码 1266-1276 doi: 10.1631/FITEE.1700855
基于多智能体强化学习的车载自组织网络协作信道分配 Research Articles
王云鹏,郑坤贤,田大新,段续庭,周建山
《信息与电子工程前沿(英文)》 2020年 第21卷 第7期 页码 1047-1058 doi: 10.1631/FITEE.1900308
大规模天线多入多出认知无线网络中的多用户传输速率和能量分析 None
Shang LIU, Ishtiaq AHMAD, Ping ZHANG, Zhi ZHANG
《信息与电子工程前沿(英文)》 2018年 第19卷 第5期 页码 674-684 doi: 10.1631/FITEE.1700081
多智能体协作与博弈展望:挑战、技术和应用 Perspective
刘瑜1,李徵2,姜智卓2,何友1
《信息与电子工程前沿(英文)》 2022年 第23卷 第7期 页码 1002-1009 doi: 10.1631/FITEE.2200055
未来无线网络的非正交多址接入技术 None
Zhi-guo DING, Mai XU, Yan CHEN, Mu-gen PENG, H. Vincent POOR
《信息与电子工程前沿(英文)》 2018年 第19卷 第3期 页码 322-339 doi: 10.1631/FITEE.1800051
利用软件定义网络结构提升未来无线通信网络性能的方法研究与展望 Review
Mingjie FENG,Shiwen MAO,Tao JIANG
《信息与电子工程前沿(英文)》 2016年 第17卷 第7期 页码 606-619 doi: 10.1631/FITEE.1500336
基于带积分补偿近端策略优化算法的四旋翼控制 Research
胡欢,王庆领
《信息与电子工程前沿(英文)》 2020年 第21卷 第5期 页码 649-808 doi: 10.1631/FITEE.1900641
基于多智能体微分博弈的数据驱动协同一致控制 Research Article
石宇1,化永朝2,于江龙1,董希旺1,2,任章1
《信息与电子工程前沿(英文)》 2022年 第23卷 第7期 页码 1043-1056 doi: 10.1631/FITEE.2200001
人在回路的深度强化学习算法及其在自动驾驶智能决策中的应用 Article
吴京达, 黄志宇, 胡中旭, 吕辰
《工程(英文)》 2023年 第21卷 第2期 页码 75-91 doi: 10.1016/j.eng.2022.05.017
由于机器学习智能和能力有限,它目前仍无法处理各种情况,因此不能在现实应用中完全取代人类。因为人类在复杂场景中表现出稳健性和适应性,所以将人类引入人工智能(AI)的训练回路并利用人类智能进一步提升机器学习算法变得至关重要。本研究开发了一种基于实时人类指导(Hug)的深度强化学习
(DRL)方法,用于端到端自动驾驶案例中的策略训练。通过新设计的人类与自动化之间的控制转移机制,人类能够在模型训练过程中实时干预和纠正智能体的不合理行为。所提出的Hug-DRL的快速收敛允许实时的人类指导行为融合到智能体的训练回路中,进一步提高了DRL的效率和性能。
标题 作者 时间 类型 操作
命名数据多跳无线网络中的联合优化的拥塞控制、转发策略和链路调度
Cheng-cheng Li, Ren-chao Xie, Tao Huang, Yun-jie Liu,lengcangche@bupt.edu.cn,renchao_xie@bupt.edu.cn,htao@bupt.edu.cn
期刊论文
无线多媒体传感器网络中端对端时延资源调配的多层次跨层协议
Hossein HADADIAN NEJAD YOUSEFI, Yousef SEIFI KAVIAN, Alimorad MAHMOUDI
期刊论文