Search | Engineering

订阅投稿

首页工程期刊工程焦点工程成就工程前沿关于我们 English

资源类型

期刊论文 644

会议信息 44

会议视频 43

会议专题 2

年份

2024 2

2023 79

2022 98

2021 78

2020 69

2019 87

2018 56

2017 43

2016 20

2015 11

2014 12

2013 8

2012 8

2011 10

2010 12

2009 13

2008 13

2007 13

2006 9

2005 16

展开︾

关键词

机器学习 27

汽车 15

深度学习 15

2020 13

人工智能 13

2019 6

电动汽车 6

绿色化工 6

过程强化 6

农业科学 5

汽车产业 5

汽车强国 5

决策 4

学术会议 4

稳健设计 4

MATLAB 3

三峡工程 3

图像处理 3

智慧城市 3

展开︾

检索范围：

排序：展示方式：

基于混合强化学习的自动驾驶汽车行人避撞方法 Research Article

李惠乾1,黄晋1,曹重1,杨殿阁1,钟志华2

《信息与电子工程前沿（英文）》 2023年第24卷第1期页码 131-140 doi: 10.1631/FITEE.2200128

摘要：确保行人的安全对自动驾驶汽车而言至关重要，同时也具有一定挑战。经典的行人避撞策略无法应对不确定性，而基于学习的方法缺乏明确的性能保障。本文提出一种基于混合强化学习的行人避撞方法，以使自动驾驶车辆能够与具有行为不确定性的行人安全交互。该方法集成了规则策略和强化学习策略，并设计了一个激活函数选择具有更高置信度的作为最终策略，通过这种方式保证最终策略的表现不亚于规则策略。为说明所提方法的有效性，本文使用一种加速测试方法生成了行为随机的行人进行仿真验证。结果表明，该方法在测试场景中的成功率，相比基准方法的94.4%，提升至98.8%。

关键词：行人；混合强化学习；自动驾驶汽车；决策

HTML PDF 收藏

人在回路的深度强化学习算法及其在自动驾驶智能决策中的应用 Article

吴京达, 黄志宇, 胡中旭, 吕辰

《工程（英文）》 2023年第21卷第2期页码 75-91 doi: 10.1016/j.eng.2022.05.017

摘要：

由于机器学习智能和能力有限，它目前仍无法处理各种情况，因此不能在现实应用中完全取代人类。因为人类在复杂场景中表现出稳健性和适应性，所以将人类引入人工智能（AI）的训练回路并利用人类智能进一步提升机器学习算法变得至关重要。本研究开发了一种基于实时人类指导（Hug）的深度强化学习
（DRL）方法，用于端到端自动驾驶案例中的策略训练。通过新设计的人类与自动化之间的控制转移机制，人类能够在模型训练过程中实时干预和纠正智能体的不合理行为。本研究通过40 名受试者的人在回路实验对开发的方法进行了验证，并与其他最先进的学习方法进行了比较。

关键词：人在回路AI 深度强化学习人类指导自动驾驶

HTML PDF 收藏

面向强化学习自动驾驶模型的异步监督学习预训练方法 Research Articles

王云鹏,郑坤贤,田大新,段续庭,周建山

《信息与电子工程前沿（英文）》 2021年第22卷第5期页码 615-766 doi: 10.1631/FITEE.1900637

摘要：基于人定规则所设计的自动驾驶系统可能会因大规模相互耦合的规则而变得越来越复杂，因此许多研究人员致力于探索基于学习的解决方案。强化学习（reinforcement learning，RL）因其在各种顺序控制问题上的出色表现而被应用于自动驾驶系统设计。然而，基于RL的自动驾驶系统落地应用所面临的主要挑战是其初始性能不佳。强化学习训练需要大量训练数据，然后模型才能达到合理的性能要求，这使得基于强化学习的模型不适用于现实环境，尤其在数据昂贵的情况下。本文为基于强化学习的端到端自动驾驶模型提出一种异步监督学习（asynchronous supervised learning，ASL）方法，以解决在实际环境中训练基于强化学习模型时初始性能差的问题。本文在赛车模拟器TORCS（The Open Racing Car Simulator）上对所提出的预训练方法进行评估，以验证该方法在改善强化学习训练阶段端到端自动驾驶模型的初始性能和收敛速度方面足够可靠

关键词：自主驾驶；自动驾驶车辆；强化学习；监督学习

HTML PDF 收藏

迈向L5级自动驾驶汽车的发展原则 Article

王建强, 黄荷叶, 李克强, 李骏

《工程（英文）》 2021年第7卷第9期页码 1313-1325 doi: 10.1016/j.eng.2020.10.018

摘要：

自动驾驶汽车的快速发展给现有交通出行方式带来了全新面貌和潜在挑战。然而，针对L5 级自动驾驶汽车的发展思路始终未明确，而现有针对L0~L4级自动驾驶发展过程的研发方式主要基于任务驱动来进行特定场景下的功能开发，难以揭示高等级自动驾驶汽车所需解决问题的本质逻辑和物理机制本文通过探索高等级自动驾驶系统背后的物理机制，并从驾驶的本质出发，采用推理演绎方式，提出“大脑-小脑-器官”协调平衡框架，基于“乌鸦推理+鹦鹉学舌”的混合模式，探索“自主学习+先验知识”的研究范式，实现自动驾驶汽车“自学习、自适应、自超越”特性。从系统、统一、均衡的角度出发，基于最小作用量原理和统一安全场思想，旨在为高等级自动驾驶汽车，尤其是L5 级自动驾驶的研发提供一种全新的研发思路与有效途径。

关键词：自动驾驶汽车最小作用量原理行车安全场自主学习基础范式

HTML PDF 收藏

基于专家示教聚类经验池的高效深度强化学习 Research Article

王士珉1,赵彬琦1,张政锋1,张军平1,浦剑2

《信息与电子工程前沿（英文）》 2023年第24卷第11期页码 1541-1556 doi: 10.1631/FITEE.2300084

摘要：作为强化学习领域最基本的主题之一，样本效率对于深度强化学习算法的部署至关重要。在6种不同的连续运动环境中进行了实验，结果表明选择性采样方法具有卓越的强化学习性能和更快的收敛速度。特别地，在LGSVL任务中，该方法可以减少46.7%的收敛步数和28.5%的收敛时间。

关键词：强化学习；采样效率；采样过程；聚类方法；自动驾驶

HTML PDF 收藏

自动驾驶地图有关政策的思考和建议

刘经南,董杨,詹骄,高柯夫

《中国工程科学》 2019年第21卷第3期页码 92-97 doi: 10.15302/J-SSCAE-2019.03.004

摘要：

自动驾驶地图作为实现汽车自动驾驶的关键基础设施，对于推动我国自动驾驶领域的商业化开发至关重要。现阶段，我国受地图测绘、应用和监管等相关法律法规的制度掣肘，在自动驾驶地图的产业化进程方面相对滞后。为此，本文着重分析了我国在自动驾驶地图开发、应用和管理中面临的主要政策法规问题：自动驾驶地图是否需加密的问题、自动驾驶地图部分地理信息表达受限的问题、自动驾驶地图地理信息采集资质和审图流程的问题、自动驾驶地图事故责任和保险问题、自动驾驶地图相关测试规范和测试场景问题。同时结合国内外自动驾驶领域的发展趋势，给出加快我国自动驾驶汽车开发和商业化进程的四点建议：制定自动驾驶地图管理模式、允许自动驾驶地图应用试点及有序开放、适当放开企业权限及优化审核流程、建立国家级自动驾驶地图平台

关键词：自动驾驶地图自动驾驶法规自动驾驶政策

HTML PDF 收藏

智能城市(iCity) 中自动驾驶汽车工业的关键挑战——高清地图 Perspective

Heiko G. Seif,胡晓龙

《工程（英文）》 2016年第2卷第2期页码 159-162 doi: 10.1016/J.ENG.2016.02.010

摘要：

本文对未来城市中自动驾驶的必要技术进行了深入的分析，从车载电脑运算、数据处理、路边基础设施和云解决方案等不同方面反映了科技的发展状况，主要对自动驾驶的核心技术——高清地图的应用所带来的挑战进行了描述

关键词：自动驾驶交通基础设施智能城市(iCity) Car-to-X 通信系统汽车通信高清地图

HTML PDF 收藏

全自动驾驶技术仍面临诸多挑战

Chris Palmer

《工程（英文）》 2023年第26卷第7期页码 6-8 doi: 10.1016/j.eng.2023.05.002

HTML PDF 收藏

一种用于自动驾驶的车辆概率性长期轨迹预测框架 Article

刘金鑫, 罗禹贡, 钟志华, 李克强, 黄荷叶, 熊辉

《工程（英文）》 2022年第19卷第12期页码 228-239 doi: 10.1016/j.eng.2021.12.020

摘要：

在混合动态交通环境中，准确地预测周围车辆长期范围内的运动轨迹是自动驾驶车辆（AV）实现合理行为决策和保障行车安全不可或缺的前提条件之一。本文提出了一种车辆长期轨迹预测的概率框架，由驾驶意图推理模型（DIM）和轨迹预测模型（TPM）组成。DIM基于动态贝叶斯网络进行设计和应用，用于准确推断车辆潜在的驾驶意图。

关键词：自动驾驶动态贝叶斯网络驾驶意图识别高斯过程车辆轨迹预测

HTML PDF 收藏

基于解耦价值和策略强化学习的家庭能源管理方法

熊珞琳,唐漾,刘臣胜,毛帅,孟科,董朝阳,钱锋

《信息与电子工程前沿（英文）》 2023年第24卷第9期页码 1261-1272 doi: 10.1631/FITEE.2200667

摘要：由于电动汽车的普及性和家用电器的灵活性，在动态电价下对家庭能源系统进行能源调度优化电力成本和保障居民舒适度是可行的。本文提出一种基于数据驱动的深度强化学习家庭能源管理方法。首先，为揭示影响电动汽车充电行为的多种不确定因素，引入一种结合驾驶员经验、突发事件和交通状况的改进数学模型描述电动汽车在家庭能源系统中的动态能量需求。

关键词：家庭能源系统电动汽车强化学习泛化性

HTML 收藏

NIG-AP：一种自动化渗透测试新方法 Regular Papers-Research Articles

Tian-yang ZHOU, Yi-chao ZANG, Jun-hu ZHU, Qing-xian WANG

《信息与电子工程前沿（英文）》 2019年第20卷第9期页码 1277-1298 doi: 10.1631/FITEE.1800532

摘要：自动化渗透测试为解决该问题提供了思路，其中最为关键的是攻击规划。不少学者对攻击路径发现进行了大量深入研究，但是大都基于完备的网络拓扑信息，这与实际渗透测试情况不符。为了从攻击者视角发现网络中存在的所有攻击路径，提出一种基于网络信息增益的攻击规划算法（NIG-AP），该算法将渗透测试过程形式化为马尔科夫决策过程，并利用网络信息构建回报函数，并指导代理从入侵者角度发现隐藏的攻击路径

关键词：渗透测试；强化学习；经典规划；部分观测的马尔科夫决策过程

HTML PDF 收藏

碳配额市场下以乙醇胺溶液进行碳捕集的电厂的优化竞标和运行：基于强化学习的Sarsa时间差分算法的解决

李子昂, 王美宏, 丁正桃

《工程（英文）》 2017年第3卷第2期页码 257-265 doi: 10.1016/J.ENG.2017.02.014

摘要：

对于处在碳配额市场条件下以乙醇胺(MEA) 进行碳捕集的燃煤电厂，本文应用了基于强化学习的Sarsa 时间差分算法为其自行搜寻一种统一的竞标和运行策略。电厂的决策者的目的被定义为最大化电厂寿命下的贴现累计利润。第二个案例中，相互独立设计的运行和竞标策略与统一设计的运行和竞标策略相互比较，以表明加入了随时间变化、市场导向的碳捕集水平后，Sarsa 算法将有助于电厂决策者获得更高的贴现累计利润。比较两家电厂的贴现累计利润，结果表明：采用Sarsa 学习算法、找到统一的竞标和运行策略的原电厂会更具竞争力。

关键词：电厂燃烧后碳捕集化学吸收碳配额市场决策优化强化学习

HTML PDF 收藏

一种适用于自动驾驶汽车的多层地图模型和车道级轨迹规划 Article

江昆, 杨殿阁, 柳超然, 张涛, 肖中阳

《工程（英文）》 2019年第5卷第2期页码 305-318 doi: 10.1016/j.eng.2018.11.032

摘要：

越来越多的司机依赖于汽车或手机上的电子地图导航系统来选择最佳的驾驶路线，以节省时间和提高安全性，在不久的将来，电子地图和导航系统有望在未来交通运输系统中发挥更大的作用。为了将现有的导航系统扩展到更多的应用领域，如自动驾驶，需要考虑在传统道路地图模型的基础上，建立车道级地图模型和车道级轨迹规划。本研究针对传统电子地图内容不够丰富的局限性，提出了一种全新的七层自动驾驶地图结构模型，并将它命名为清华地图模型。考虑车辆换道、转向和直行等不同行车特点，建立了车道级路段行车代价模型，建立一种分层路径轨迹搜索方法，能够在道路和车道网络中实现快速的轨迹规划，能够很好地支持自动驾驶的车道级轨迹规划。

关键词：车道级地图路径规划清华地图模型行车代价模型

HTML PDF 收藏

MDLB：一种基于强化学习的元数据动态负载均衡机制 Research Articles

武兆琪1,卫今2,3,张帆1,郭威1,谢光伟2,3

《信息与电子工程前沿（英文）》 2020年第21卷第7期页码 963-1118 doi: 10.1631/FITEE.1900121

摘要：提出一种基于强化学习的动态负载平衡机制（MDLB）。采用Q_learning算法，所提基于强化学习机制由3个模块组成，即策略选择网络、负载均衡网络和参数更新网络。

关键词：面向对象的存储系统；元数据；动态负载均衡；强化学习；Q_learning

HTML PDF 收藏

带有网络智能体的去中心化多智能体强化学习进展 Review Article

张凯清1,杨卓然2,Tamer BAŞAR1

《信息与电子工程前沿（英文）》 2021年第22卷第6期页码 802-814 doi: 10.1631/FITEE.1900661

摘要：多智能体强化学习长期以来一直是机器学习和控制领域的重要研究课题。最近在（单智能体）深度强化学习领域的进展重新唤醒了对多智能体强化学习的研究兴趣，尤其在理论分析方面。本文回顾这个大课题中的一个子领域：带有网络智能体的去中心化多智能体强化学习。在这一场景中，多个智能体在一个共同的环境中进行序贯决策，无需中心控制器的协调，且智能体被允许和它们在通信网络上的邻居交换信息。

关键词：强化学习；多智能体系统；网络系统；一致性优化；分布式优化；博弈论