检索范围:
排序: 展示方式:
MDLB:一种基于强化学习的元数据动态负载均衡机制 Research Articles
武兆琪1,卫今2,3,张帆1,郭威1,谢光伟2,3
《信息与电子工程前沿(英文)》 2020年 第21卷 第7期 页码 963-1118 doi: 10.1631/FITEE.1900121
线性离散时间系统H∞控制的极小极大Q-学习设计 Research Articles
李新兴1,奚乐乐2,3,查文中1,彭志红2
《信息与电子工程前沿(英文)》 2022年 第23卷 第3期 页码 438-451 doi: 10.1631/FITEE.2000446
Actor-Critic强化学习算法及其在开发基于计算机视觉的界面跟踪中的应用 Article
Oguzhan Dogru, Kirubakaran Velswamy, 黄彪
《工程(英文)》 2021年 第7卷 第9期 页码 1248-1261 doi: 10.1016/j.eng.2021.04.027
本文通过将对象跟踪形式化为序列决策过程,使控制理论与计算机视觉实现同步。强化学习(RL)智能体成功跟踪了两种液体之间的界面,这通常是化学、石化、冶金和石油行业中跟踪的关键变量。该方法使用少于100 张图像来创建环境,智能体无需专家知识即可从中生成自己的数据。与依赖大量参数的监督学习(SL)方法不同,这种方法需要的参数少得多,这自然降低了维护成本。除了经济性外,该智能体还对环境不确定性(如遮挡、强度变化和过度噪声)具有鲁棒性。在闭环控制情境下,基于界面位置的偏差被选作训练阶段的优化目标。该方法展示了RL方法在油砂行业中的实时对象跟踪应用。本文除了介绍界面跟踪问题外,还详细回顾了最有效的RL方法之一——actor-critic策略。
面向强化学习自动驾驶模型的异步监督学习预训练方法 Research Articles
王云鹏,郑坤贤,田大新,段续庭,周建山
《信息与电子工程前沿(英文)》 2021年 第22卷 第5期 页码 615-766 doi: 10.1631/FITEE.1900637
面向人—多机器人协同系统的带记忆强化学习行为控制任务管理器 Research Article
黄捷1,2,3,莫智斌1,2,3,张祯毅1,2,3,陈宇韬1,2,3
《信息与电子工程前沿(英文)》 2022年 第23卷 第8期 页码 1174-1188 doi: 10.1631/FITEE.2100280
工程化DNA材料构建DNA活字系统实现可持续的数据存储 Article
巩子祎, 宋理富, 裴广胜, 董雨菲, 李炳志, 元英进
《工程(英文)》 2023年 第29卷 第10期 页码 130-136 doi: 10.1016/j.eng.2022.05.023
DNA分子作为一种具有潜力的数据存储绿色材料,具有密度高和保存期长的优势。然而,目前DNA数据存储的数据写入依赖于DNA从头合成,写入成本高昂,且产生有害物,限制了其实际应用。在本研究中,我们开发了一种DNA活字存储系统,该系统可以利用由细胞工厂预生产的DNA活字片段进行数据写入。在这个系统中,这些预先生成的DNA片段,在这里称为“DNA活字”,是可重复使用的基本数据单元。通过这些DNA活字的快速组装来实现数据写入,从而避免了昂贵且对环境有害的DNA化学合成过程。通过DNA活字片段的反复使用和生物组装,该系统在降低写入成本方面的潜力非常突出,为经济和可持续的DNA数据存储技术开辟了一条新颖路线。
关键词: 合成生物学 DNA信息存储 DNA活字存储系统 经济性DNA数据存储
熊珞琳,唐漾,刘臣胜,毛帅,孟科,董朝阳,钱锋
《信息与电子工程前沿(英文)》 2023年 第24卷 第9期 页码 1261-1272 doi: 10.1631/FITEE.2200667
带有网络智能体的去中心化多智能体强化学习进展 Review Article
张凯清1,杨卓然2,Tamer BAŞAR1
《信息与电子工程前沿(英文)》 2021年 第22卷 第6期 页码 802-814 doi: 10.1631/FITEE.1900661
基于多智能体强化学习的车载自组织网络协作信道分配 Research Articles
王云鹏,郑坤贤,田大新,段续庭,周建山
《信息与电子工程前沿(英文)》 2020年 第21卷 第7期 页码 1047-1058 doi: 10.1631/FITEE.1900308
ONFS:面向高性能计算的基于内存、固态硬盘和磁盘的层次式混合文件系统 Article
Xin LIU, Yu-tong LU, Jie YU, Peng-fei WANG, Jie-ting WU, Ying LU
《信息与电子工程前沿(英文)》 2017年 第18卷 第12期 页码 1940-1971 doi: 10.1631/FITEE.1700626
针对意外崩溃智能体的教练辅助多智能体强化学习框架 Research Article
赵鉴1,赵有朋1,王维埙2,阳明宇1,胡迅晗1,周文罡1,郝建业2,李厚强1
《信息与电子工程前沿(英文)》 2022年 第23卷 第7期 页码 1032-1042 doi: 10.1631/FITEE.2100594
关键词: 多智能体系统;强化学习;意外崩溃智能体
面向物联网的激励感知区块链辅助的智能边缘缓存与计算迁移研究 Article
王倩, 陈思光, 吴蒙
《工程(英文)》 2023年 第31卷 第12期 页码 127-138 doi: 10.1016/j.eng.2022.10.014
人工智能的快速发展将物联网推向了一个新阶段,面对数据的爆炸性增长和用户对更高服务质量的迫切需求,边缘计算和缓存被视为富有前景的技术解决手段。然而,边缘节点(Edge Nodes, ENs)中的资源并不是取之不尽的。本文提出了一种面向物联网的激励感知区块链辅助的智能边缘缓存与计算迁移方案,该方案致力于为协作ENs在资源优化和控制方面提供安全和智能的解决方案。具体地,该方案通过联合优化迁移和缓存决策以及计算和通信资源分配,以最大限度地降低EN中完成任务的总成本。此外,为解决上述优化问题,本文设计了区块链激励和贡献联合感知的联邦深度强化学习算法。在本地训练期间,该算法构建了一个激励感知区块链辅助的协作机制,即在安全保障前提下增强ENs参与协作的意愿。
人在回路的深度强化学习算法及其在自动驾驶智能决策中的应用 Article
吴京达, 黄志宇, 胡中旭, 吕辰
《工程(英文)》 2023年 第21卷 第2期 页码 75-91 doi: 10.1016/j.eng.2022.05.017
由于机器学习智能和能力有限,它目前仍无法处理各种情况,因此不能在现实应用中完全取代人类。因为人类在复杂场景中表现出稳健性和适应性,所以将人类引入人工智能(AI)的训练回路并利用人类智能进一步提升机器学习算法变得至关重要。本研究开发了一种基于实时人类指导(Hug)的深度强化学习
(DRL)方法,用于端到端自动驾驶案例中的策略训练。所提出的Hug-DRL的快速收敛允许实时的人类指导行为融合到智能体的训练回路中,进一步提高了DRL的效率和性能。本研究通过40 名受试者的人在回路实验对开发的方法进行了验证,并与其他最先进的学习方法进行了比较。
基于专家示教聚类经验池的高效深度强化学习 Research Article
王士珉1,赵彬琦1,张政锋1,张军平1,浦剑2
《信息与电子工程前沿(英文)》 2023年 第24卷 第11期 页码 1541-1556 doi: 10.1631/FITEE.2300084
基于多智能体微分博弈的数据驱动协同一致控制 Research Article
石宇1,化永朝2,于江龙1,董希旺1,2,任章1
《信息与电子工程前沿(英文)》 2022年 第23卷 第7期 页码 1043-1056 doi: 10.1631/FITEE.2200001
标题 作者 时间 类型 操作
ONFS:面向高性能计算的基于内存、固态硬盘和磁盘的层次式混合文件系统
Xin LIU, Yu-tong LU, Jie YU, Peng-fei WANG, Jie-ting WU, Ying LU
期刊论文