Search | Engineering

订阅投稿

首页工程期刊工程焦点工程成就工程前沿关于我们 English

资源类型

期刊论文 1719

会议视频 222

会议信息 104

会议专题 2

年份

2024 6

2023 214

2022 255

2021 285

2020 249

2019 188

2018 127

2017 113

2016 75

2015 46

2014 31

2013 22

2012 29

2011 24

2010 28

2009 20

2008 28

2007 38

2006 42

2005 41

展开︾

关键词

智能制造 113

人工智能 89

2020 35

机器学习 27

神经网络 27

农业科学 19

深度学习 15

2019 14

大数据 10

新一代智能制造 10

智能工业 10

仿真技术 9

信息技术 9

可持续发展 9

智能 9

智能化 9

物联网 9

学术会议 8

工业互联网 8

展开︾

检索范围：

排序：展示方式：

基于多智能体深度强化学习的工业无线网络端边协同资源分配 Research Article

刘晓宇1,2,3,4,许驰1,2,3,于海斌1,2,3,曾鹏1,2,3

《信息与电子工程前沿（英文）》 2022年第23卷第1期页码 47-60 doi: 10.1631/FITEE.2100331

摘要：边缘人工智能通过协同利用设备侧和边缘侧有限的网络、计算资源，赋能工业无线网络以支持复杂和动态工业任务。面向资源受限的工业无线网络，我们提出一种基于多智能体深度强化学习的资源分配（MADRL-RA）算法，实现了端边协同资源分配，支持计算密集型、时延敏感型工业应用。首先，建立了端边协同的工业无线网络系统模型，将具有感知能力的工业设备作为自学习的智能代理。然后，采用马尔可夫决策过程对端边资源分配问题进行形式化描述，建立关于时延和能耗联合优化的最小系统开销问题。接着，利用多智能体深度强化学习克服状态空间维灾，同时学习关于计算决策、算力分配和传输功率的有效资源分配策略。为了打破训练数据的时间相关性，同时加速MADRL-RA学习过程，设计了一种带经验权重的经验回放方法，对经验进行分类存储和采样。在此基础上，提出步进的ε-贪婪方法来平衡智能代理对经验的利用与探索。

关键词：多智能体深度强化学习；端边协同；工业无线网络；时延；能耗

HTML PDF 收藏

带有网络智能体的去中心化多智能体强化学习进展 Review Article

张凯清1,杨卓然2,Tamer BAŞAR1

《信息与电子工程前沿（英文）》 2021年第22卷第6期页码 802-814 doi: 10.1631/FITEE.1900661

摘要：多智能体强化学习长期以来一直是机器学习和控制领域的重要研究课题。最近在（单智能体）深度强化学习领域的进展重新唤醒了对多智能体强化学习的研究兴趣，尤其在理论分析方面。本文回顾这个大课题中的一个子领域：带有网络智能体的去中心化多智能体强化学习。在这一场景中，多个智能体在一个共同的环境中进行序贯决策，无需中心控制器的协调，且智能体被允许和它们在通信网络上的邻居交换信息。这样的一个模型在很多方向都有相关应用，包括机器人控制、无人车控制、移动传感器网络控制、智能电网，等等。本综述旨在覆盖和整理我们和其他科研人员在这一方向的相关工作。

关键词：强化学习；多智能体系统；网络系统；一致性优化；分布式优化；博弈论

HTML PDF 收藏

基于价格机制的无线网自适应接纳控制算法

张雪

《中国工程科学》 2006年第8卷第4期页码 32-38

摘要：

为了有效地控制对无线网资源的使用，针对自适应的多媒体应用带宽可以动态调整的特点以及价格对用户行为的影响，提出一种与价格机制相结合的自适应的接纳控制算法，该算法适合于无线网中具有多服务类、多优先级服务的情况，并根据网络当前状况动态地调整价格以缓解拥塞问题。最后与未结合价格机制的自适应接纳控制算法进行性能对比表明，将价格机制与接纳控制结合起来，可以很大程度上改善无线网的性能。

关键词：无线网络自适应的接纳控制微观经济学价格机制连接级QoS

HTML PDF 收藏

认知无线网络中一种基于投影梯度的多用户功率控制方法 None

Yun-zheng TAO, Chun-yan WU, Yu-zhen HUANG, Ping ZHANG

《信息与电子工程前沿（英文）》 2018年第19卷第3期页码 367-378 doi: 10.1631/FITEE.1700067

摘要： 5G网络被认为能够支持未来爆炸性增长的数据需求，这主要得益于不断增长的高速移动用户数量以及人与物之间的交互预期。认知无线电（cognitive radio, CR）是提高频谱利用率的有效技术之一，可适应日益增长的数据流量和稀缺的频谱资源。本文研究了基于衬垫式频谱共享的认知无线网络中的次用户功率控制问题。与现有文献大多通过假设单一主用户或者单一信道来简化问题不同，本文研究了多主用户多次用户多信道这一更符合实际的场景。我们将功率控制问题描述为一个具有耦合约束的非合作博弈，其帕累托最优性和最大次网络吞吐量可通过纳什均衡解得。仿真结果验证了所提出算法的收敛性、有效性和优势，并且在网络规模增大的情况下验证了算法的鲁棒性。

关键词：认知无线网络；多用户功率控制；非合作博弈；纳什均衡；投影梯度

HTML PDF 收藏

命名数据多跳无线网络中的联合优化的拥塞控制、转发策略和链路调度

Cheng-cheng Li, Ren-chao Xie, Tao Huang, Yun-jie Liu,lengcangche@bupt.edu.cn,renchao_xie@bupt.edu.cn,htao@bupt.edu.cn

《信息与电子工程前沿（英文）》 2017年第18卷第10期页码 1573-1590 doi: 10.1631/FITEE.1601585

摘要：概要：作为一种非常有希望的未来网络架构，命名数据网络已经被公认为一种非常适合多跳无线网络的网络协议。在命名数据的多跳无线网络中，拥塞控制是一个关键问题。如果单独优化拥塞控制，而不考虑与其它协议层协同，那么有可能造成性能的严重降低。跨层优化的拥塞控制是一种提升性能的潜在方式。在利用互联网协议（internet protocol, IP）构造的多跳无线网络中，已经有很多跨层的拥塞控制机制。然而，这些机制无法应用在命名数据的多跳无线网络中，因为IP与命名数据网络的通信特点不同。本文研究了命名数据的多跳无线网络的联合拥塞控制、转发策略和链路调度问题。就我们所知，我们的算法是命名数据的多跳无线网络中的第一个跨层的拥塞控制机制。通过与现有的拥塞控制机制对比，证明了JOCFS在网络吞吐量、公平性和待定兴趣表大小方面性能更优。

关键词：信息中心网络；拥塞控制；跨层优化；多跳无线网络

HTML PDF 收藏

针对意外崩溃智能体的教练辅助多智能体强化学习框架 Research Article

赵鉴1,赵有朋1,王维埙2,阳明宇1,胡迅晗1,周文罡1,郝建业2,李厚强1

《信息与电子工程前沿（英文）》 2022年第23卷第7期页码 1032-1042 doi: 10.1631/FITEE.2100594

摘要：多智能体强化学习在实际场景中很难应用，一部分原因在于模拟环境和现实环境之间存在差距。造成这种差距的一个原因是，模拟系统总是假设智能体可以一直正常工作，而实际上，由于不可避免的硬件或软件故障，一个或多个智能体可能会在合作过程中意外 “崩溃”。这样的崩溃会破坏智能体之间的合作，导致系统性能下降。本文中，我们给出了意外崩溃情况下合作多智能体强化学习系统的正式定义。为增强系统应对崩溃时的鲁棒性，提出教练辅助多智能体强化学习框架，其在训练过程中引入一个虚拟教练智能体，以调整系统的崩溃概率。为教练智能体设计了3种教练策略和重采样策略。据我们所知，这是研究多智能体系统中意外崩溃情况的首项工作。在网格环境和星际争霸微管理任务上的大量实验表明，相比固定崩溃概率和课程学习的教练策略，自适应策略更加有效。

关键词：多智能体系统；强化学习；意外崩溃智能体

HTML PDF 收藏

无线多媒体传感器网络中端对端时延资源调配的多层次跨层协议 Regular Papers-Research Articles

Hossein HADADIAN NEJAD YOUSEFI, Yousef SEIFI KAVIAN, Alimorad MAHMOUDI

《信息与电子工程前沿（英文）》 2019年第20卷第9期页码 1266-1276 doi: 10.1631/FITEE.1700855

摘要：近年来信息和通信技术的讯速发展让无线多媒体传感器网络（WMSNs）面临重要挑战。在传感器网络多媒体应用中，端对端时延和可靠性是关键问题。本文提出一种新的跨层方法，使得网络端对端时延可以确保理想的数据包分组传送率（PDR），此处PDR被用来度量网络可靠性。在提出的多层次跨层（MLCL）协议中，利用远离接收器的跃点数设置每个节点级别。该协议利用网络和多址接入协议（MAC）层之间跨层特性估计最小时延，在该时延下节点能够将数据包传送给接收器。当节点想要发送一个数据包时，MLCL协议会将最小时延与数据包存活时间（TTL）作比较。如果该数据包存活时间大于最小时延，节点通过最小时延路径发送数据包。否则，由于节点不能在TTL内将数据包发送至接收器而丢弃数据包。该数据包的丢弃能够提高网络性能，因为节点能够发送有用数据包以取代无用数据包。结果表明，与当前最先进协议相比，所提协议在端对端时延和可靠性方面表现出优越性能。

关键词：无线多媒体传感器网络；跨层；存活时间；端对端时延；服务质量

HTML PDF 收藏

基于多智能体强化学习的车载自组织网络协作信道分配 Research Articles

王云鹏,郑坤贤,田大新,段续庭,周建山

《信息与电子工程前沿（英文）》 2020年第21卷第7期页码 1047-1058 doi: 10.1631/FITEE.1900308

摘要：动态信道分配（DCA）在扩展车载自组织网络容量和缓解其拥塞方面起着关键作用。然而，在车—车直连通信场景下，信道分配面临大规模节点相互影响、缺乏集中式协调、全局网络状态信息未知以及其他挑战。为解决该问题，提出一种基于多智能体强化学习（RL）的协作动态信道分配（RL-CDCA）机制。具体而言，每个车辆节点都可借助2个互相协作的RL模型，从实时信道状态信息中成功学习信道选择和信道接入自适应退避的正确策略。多智能体RL-CDCA驱动节点共享本地奖励并合并区域内其他节点各自的奖励，以便它们能够以分布式协作方式优化各自策略。仿真结果表明，与4种现有机制相比，所提多智能体RL-CDCA算法即便在路网车辆高度密集的情况下仍能将单跳数据包传输延迟减少不小于73.73％，将平均数据包递送成功率提高不小于12.66％，并更好地保证网络资源分配公平性

关键词：车载自组织网络；强化学习；动态信道分配；多信道

HTML PDF 收藏

大规模天线多入多出认知无线网络中的多用户传输速率和能量分析 None

Shang LIU, Ishtiaq AHMAD, Ping ZHANG, Zhi ZHANG

《信息与电子工程前沿（英文）》 2018年第19卷第5期页码 674-684 doi: 10.1631/FITEE.1700081

摘要：讨论了在包含中继和大规模多入多出天线下的认知无线网络传输性能和能量分配问题。首先得到了在不考虑认知情况下的中继辅助大规模天线网络的下行传输性能，运用功率分配准则，第k个用户的渐近信干噪比与快衰落无关，当基站天线数和中继天线数的比值趋于无穷大时，整个传输过程的传输性能只与从中继到用户侧的传输有关接着给出了在完美和非完美信道情况下的认知大规模多入多出天线中继网络性能的闭式表达式。当主用户基站、次级用户基站、中继基站的天线数目趋于无穷大时，传输性能与快衰落无关，主、次网络之间的干扰能被完全消除，次级网络传输性能与干扰温度无关，次级网络可用峰值功率进行传输而不对主用户网络产生干扰。在多用户认知无线网络中，运用大规模多入多出天线的线性预编码方式能够极大减少干扰，提高传输效率，主用户网络和次级用户网络可以独立传输。

关键词：大规模多入多出；认知无线电；中继网络；传输速率；功率分析

HTML PDF 收藏

多智能体协作与博弈展望：挑战、技术和应用 Perspective

刘瑜1,李徵2,姜智卓2,何友1

《信息与电子工程前沿（英文）》 2022年第23卷第7期页码 1002-1009 doi: 10.1631/FITEE.2200055

摘要：近年来，多智能体系统在解决复杂环境中各种决策问题方面取得显著进步，并已实现与人类相似甚至更好的决策性能。本文从任务挑战、技术方向和应用领域3个角度简要回顾多智能体协作和博弈相关技术。首先回顾近期多智能体系统工作中的典型研究问题和挑战，然后进一步讨论关于多智能体协作和游戏任务的前沿研究方向，最后对多智能体协作与博弈的应用领域进行重点展望。

关键词：多智能体；博弈论；集体智能；强化学习；智能控制

HTML PDF 收藏

未来无线网络的非正交多址接入技术 None

Zhi-guo DING, Mai XU, Yan CHEN, Mu-gen PENG, H. Vincent POOR

《信息与电子工程前沿（英文）》 2018年第19卷第3期页码 322-339 doi: 10.1631/FITEE.1800051

摘要：本文就新兴通信技术——非正交多址接入（non-orthogonal multiple access, NOMA）——对未来无线网络的影响进行了全面综述。具体地，介绍了NOMA原理对下一代多址接入技术设计的影响。讨论了NOMA在其他先进通信技术上的应用，包括无线缓存、多入多出技术、毫米波通信以及协同中继。阐述了NOMA对蜂窝网络之外通信系统的影响，例如数字电视、卫星通信、车联网及可见光通信。最后，讨论并总结了NOMA的主要研究挑战及未来发展方向。

关键词：非正交多址；多天线技术；毫米波；混合多址；无线缓存；协作非正交多址；可见光通信

HTML PDF 收藏

利用软件定义网络结构提升未来无线通信网络性能的方法研究与展望 Review

Mingjie FENG,Shiwen MAO,Tao JIANG

《信息与电子工程前沿（英文）》 2016年第17卷第7期页码 606-619 doi: 10.1631/FITEE.1500336

摘要：随着互联网的负载高速增长和各种应用的日益丰富，为提供方便、快捷的互联网接入服务，现有的网络结构已经变得相当复杂和多样，这给网络管理提出了新的挑战。为了应对这一挑战，软件定义网络的概念被提出，并被认为是一种有前景的解决方案。在软件定义网络结构中，网络控制域和数据传输域是分开的；所有的网络设备被抽象化，通过一个集中式的控制器来进行管理。通过使用软件定义网络的结构，网络管理变得灵活和高效，因此可以潜在地提升网络性能。为了充分利用软件定义网络的优势，最近又提出了软件定义无线网络结构。本文首先分析在不同无线网络中软件定义网络结构的应用。然后讨论在基于软件定义网络结构的无线网络中使性能提升的几个关键技术环节。最后，提出一些关于软件定义无线网络可能的未来研究方向。

关键词：软件定义网络结构；软件定义无线网络；OpenFlow；性能提升

HTML PDF 收藏

基于带积分补偿近端策略优化算法的四旋翼控制 Research

胡欢,王庆领

《信息与电子工程前沿（英文）》 2020年第21卷第5期页码 649-808 doi: 10.1631/FITEE.1900641

摘要：使用先进的近端策略优化强化学习算法优化随机控制策略，实现对无模型四旋翼飞行器速度的稳定控制。飞行器模型由4个可以学习训练的子神经网络控制，神经网络以一种端到端的方式将模型状态映射为控制命令输送给飞行器执行。将积分补偿器引入行为评估算法框架，可大大提高模型速度跟踪的准确性和鲁棒性。此外，开发了包括离线学习和在线学习的两阶段学习方案，以供实际飞行之需。在在线学习阶段，不断优化模型的飞行策略。最后，对比提出的算法与传统PID算法的实验效果。

关键词：强化学习；近端策略优化；四旋翼控制；神经网络

HTML PDF 收藏

基于多智能体微分博弈的数据驱动协同一致控制 Research Article

石宇1,化永朝2,于江龙1,董希旺1,2,任章1

《信息与电子工程前沿（英文）》 2022年第23卷第7期页码 1043-1056 doi: 10.1631/FITEE.2200001

摘要：本文研究了多智能体微分博弈问题及其在协同一致控制中的应用。提出系统化的多智能体微分博弈构建和分析方法，同时给出一种基于强化学习技术的数据驱动方法。首先论证了由于网络交互的耦合特性，典型的分布式控制器无法充分保证微分博弈的全局纳什均衡。其次通过定义最优对策的概念，将问题分解为局部微分博弈问题，并给出局部纳什均衡解。构造了一种无需系统模型信息的离轨策略强化学习算法，利用在线邻居交互数据对控制器进行优化更新，并证明控制器的稳定性和鲁棒性。进一步提出一种基于改进耦合指标函数的微分博弈模型及其等效的强化学习求解方法。与现有研究相比，该模型解决了多智能体所需信息的耦合问题，并实现分布式框架下全局纳什均衡和稳定控制。构造了与此纳什解对应的等价并行强化学习方法。最后，仿真结果验证了学习过程的有效性和一致控制的稳定性。

关键词：多智能体系统；微分博弈；一致控制；数据驱动；强化学习

HTML PDF 收藏

人在回路的深度强化学习算法及其在自动驾驶智能决策中的应用 Article

吴京达, 黄志宇, 胡中旭, 吕辰

《工程（英文）》 2023年第21卷第2期页码 75-91 doi: 10.1016/j.eng.2022.05.017

摘要：

由于机器学习智能和能力有限，它目前仍无法处理各种情况，因此不能在现实应用中完全取代人类。因为人类在复杂场景中表现出稳健性和适应性，所以将人类引入人工智能（AI）的训练回路并利用人类智能进一步提升机器学习算法变得至关重要。本研究开发了一种基于实时人类指导（Hug）的深度强化学习
（DRL）方法，用于端到端自动驾驶案例中的策略训练。通过新设计的人类与自动化之间的控制转移机制，人类能够在模型训练过程中实时干预和纠正智能体的不合理行为。所提出的Hug-DRL的快速收敛允许实时的人类指导行为融合到智能体的训练回路中，进一步提高了DRL的效率和性能。