Search | Engineering

订阅投稿

首页工程期刊工程焦点工程成就工程前沿关于我们 English

资源类型

期刊论文 35

年份

2023 10

2022 4

2021 4

2020 3

2018 2

2017 3

2016 2

2015 2

2011 1

2006 1

2004 1

2003 1

1999 1

展开︾

关键词

异构化 2

烯烃 2

CPU-GPU异构；多核；共享内存；访存调度 1

FCC汽油 1

GPU；密度峰值；聚类；并行计算 1

RIDOS 1

上下行解耦；用户接入；资源划分；异构蜂窝网络；联合博弈 1

不确定威胁 1

二氧化碳 1

二甲苯 1

传输安全 1

位置异构体 1

体绘制；体积光照；体数据；单绘制遍多切片 1

催化剂 1

催化裂化 1

关系学习 1

关系耦合 1

刨煤机成套装备 1

动力学分离 1

展开︾

检索范围：

排序：展示方式：

MyWAL：一种基于精简输入输出堆栈的键值存储系统性能优化方案 Research Article

方娟,林胜,杨会静,徐艺翔,苏醒

《信息与电子工程前沿（英文）》 2023年第24卷第7期页码 994-1006 doi: 10.1631/FITEE.2200449

摘要：当多个处理器（CPU）核心和集成图形处理器（GPU）共享片外主存时，CPU和GPU应用程序会竞争关键内存资源，导致严重的资源竞争，并对系统整体性能产生负面影响。本文描述了CPU-GPU异构多核架构下共享内存资源的竞争情况，提出一种基于感知和预测的批处理共享内存请求调度策略。该策略通过感知请求缓冲区中CPU和GPU内存请求情况，估计GPU延迟容忍度，并通过批量处理CPU或GPU内存请求减少CPU和GPU之间的相互干扰。实验结果表明，CPU性能提升8.53%，相互干扰降低10.38%，该调度策略具有较低硬件复杂度。

关键词： CPU-GPU异构；多核；共享内存；访存调度

HTML PDF 收藏

CPU-GPU异构系统感知和预测的批处理内存调度策略 Research Article

吴子梁1,陈为1,马昱欣2,徐彤1,严凡1,吕檑1,钱中昊1,夏佳志3

《信息与电子工程前沿（英文）》 2023年第24卷第7期页码 1007-1027 doi: 10.1631/FITEE.2200409

摘要：自动可视化技术能够为不熟悉可视化设计的用户生成有意义的可视化，以支持他们的数据分析和模式发现需求。当前，主流的自动可视化方法采用聚合与过滤从原始数据抽取模式信息。然而，这些有限的数据变换并不能捕获聚类、关联等复杂的模式。尽管特征工程领域的最新进展为更加广泛的自动数据变换提供了可能，其结果却缺少可解释性，导致变换后的模式无法与原始数据特征建立联系。为应对上述挑战，我们面向自动可视化中广泛的数据变换类型，提出一种创新的可解释推荐方法。我们通过回顾既往文献总结可行的数据变换空间，通过开展预实验总结变换可解释性的度量。我们的推荐算法能够计算最优的数据变换，这种变换能够在维持可解释性的同时揭示数据的模式信息。真实场景下的使用案例与用户实验验证了我们方法的有效性。

关键词：数据变换；数据变换推荐；自动可视化；可解释性

HTML PDF 收藏

Improving performance portability for GPU-specific OpenCL kernels onmulti-core/many-coreCPUs by analysis-based

Mei WEN,Da-fei HUANG,Chang-qing XUN,Dong CHEN

《信息与电子工程前沿（英文）》 2015年第16卷第11期页码 899-916 doi: 10.1631/FITEE.1500032

摘要： OpenCL is an open heterogeneous programming framework. Although OpenCL programs are functionally portable, they do not provide performance portability, so code transformation often plays an irreplaceable role. When adapting GPU-specific OpenCL kernels to run on multi-core/many-core CPUs, coarsening the thread granularity is necessary and thus has been extensively used. However, locality concerns exposed in GPU-specific OpenCL code are usually inherited without analysis, which may give side-effects on the CPU performance. Typically, the use of OpenCL’s local memory on multi-core/many-core CPUs may lead to an opposite performance effect, because local-memory arrays no longer match well with the hardware and the associated synchronizations are costly. To solve this dilemma, we actively analyze the memory access patterns using array-access descriptors derived from GPU-specific kernels, which can thus be adapted for CPUs by (1) removing all the unwanted local-memory arrays together with the obsolete barrier statements and (2) optimizing the coalesced kernel code with vectorization and locality re-exploitation. Moreover, we have developed an automated tool chain that makes this transformation of GPU-specific OpenCL kernels into a CPU-friendly form, which is accompanied with a scheduler that forms a new OpenCL runtime. Experiments show that the automated transformation can improve OpenCL kernel performance on a multi-core CPU by an average factor of 3.24. Satisfactory performance improvements are also achieved on Intel’s many-integrated-core coprocessor. The resultant performance on both architectures is better than or comparable with the corresponding OpenMP performance.

关键词： OpenCL Performance portability Multi-core/many-core CPU Analysis-based transformation

HTML PDF 收藏

基于双CPU结构的数据监控系统设计

贾贵玺,齐乐

《中国工程科学》 2006年第8卷第4期页码 68-71

摘要：

针对通信系统中，对所有客户线路的电压、电流、温度等数据进行实时多路采集监控，提出了一种基于双CPU结构的数据监控系统的设计方法以及硬件组成。讨论了系统主要芯片之间的连线方法以及软件流程。实践证明，双CPU设计方案不仅满足了系统高运算量、高实时性、抗干扰性要求，而且优化了软硬件设计。

关键词：数据监控双CPU 双口RAM

HTML PDF 收藏

运动规划的高效配置空间构建与优化 Article

潘佳, Dinesh Manocha

《工程（英文）》 2015年第1卷第1期页码 46-57 doi: 10.15302/J-ENG-2015009

摘要：得出的碰撞查询结果将用来计算配置空间的近似表达，可快速聚合至准确的配置空间；同时还提出了基于并行图形处理器（GPU）的算法，以便加速配置空间优化与搜索计算的性能情况。笔者特别设计出了基于GPU的并行k最近邻算法与并行碰撞检测算法，并使用这些算法来加快运动规划。

关键词：配置空间运动规划图形处理器（GPU）并行算法

HTML PDF 收藏

CWLP：一种在GPU中协同的线程束调度和局部性保护的高速缓存分配策略 None

Yang ZHANG, Zuo-cheng XING, Cang LIU, Chuan TANG

《信息与电子工程前沿（英文）》 2018年第19卷第2期页码 206-220 doi: 10.1631/FITEE.1700059

摘要：由于片上存储器的严重缺少，受较差的缓存性能影响，GPU的计算能力急剧下降，限制了系统性能和能效。提出一种协同的线程束调度和局部性保护的缓存分配策略（CWLP），以充分利用数据局部性和隐藏延迟。首先，设计了一种基于指令PC的局部性保护方法（LPC）以提升GPU性能。使用一个基于PC的收集器收集每个高速缓存块的重用信息。

关键词：局部性GPU；cache分配；线程束调度

HTML PDF 收藏

Optimizing non-coalesced memory access for irregular applications with GPU computing

Ran Zheng, Yuan-dong Liu, Hai Jin,zhraner@hust.edu.cn,1531364016@qq.com,hjin@hust.edu.cn

《信息与电子工程前沿（英文）》 2020年第21卷第9期页码 1267-1412 doi: 10.1631/FITEE.1900262

摘要： (GPGPUs) can be used to improve computing performance considerably for regular applications. However, irregular memory access exists in many applications, and the benefits of graphics processing units (GPUs) are less substantial for irregular applications. In recent years, several studies have presented some solutions to remove static irregular memory access. However, eliminating dynamic irregular memory access with software remains a serious challenge. A pure software solution without hardware extensions or offline profiling is proposed to eliminate dynamic irregular memory access, especially for indirect memory access. and index redirection are suggested to reduce the number of memory transactions, thereby improving the performance of GPU kernels. To improve the efficiency of , an operation to reorder data is offloaded to a GPU to reduce overhead and thus transfer data. Through concurrently executing the compute unified device architecture (CUDA) streams of and the data processing kernel, the overhead of can be reduced. After these optimizations, the volume of memory transactions can be reduced by 16.7%–50% compared with CUSPARSE-based benchmarks, and the performance of irregular kernels can be improved by 9.64%–34.9% using an NVIDIA Tesla P4 GPU.

HTML PDF 收藏

基于GPU的密度峰值并行聚类算法 Article

Ke-shi GE, Hua-you SU, Dong-sheng LI, Xi-cheng LU

《信息与电子工程前沿（英文）》 2017年第18卷第7期页码 915-927 doi: 10.1631/FITEE.1601786

摘要：在本文中，我们提出了一种基于GPU （graphics processing unit）的高效并行密度峰值算法。我们分析密度峰值聚类算法的原理来研究其计算瓶颈，并评估其并行的潜力。根据分析，我们提出了CUDA-DP （compute unified device architecture-DP），一种针对GPU架构的高效并行密度峰值聚类算法，并用CUDA实现了这种并行方法。更进一步，为了利用GPU的合并访问机制，我们将CUDA-DP程序的数据结构从AOS （array of structures）重构为SOA （structure of arrays）。实验结果表明，与基于CPU的密度峰值实现相比，CUDA-DP可以实现超过45倍的加速。

关键词： GPU；密度峰值；聚类；并行计算

HTML PDF 收藏

交互式体积光照绘制中基于GPU的单绘制遍多切片算法 Research Articles

罗德宁,林毅,张建伟

《信息与电子工程前沿（英文）》 2021年第22卷第8期页码 1092-1103 doi: 10.1631/FITEE.2000214

摘要：本文提出一种基于GPU的可扩展单绘制遍多切片（multi-slice per pass，MSPP）体绘制算法，该算法可以快速生成全局体阴影，并基于传递函数实现半透明效果，以改善体数据的形状和深度感知。

关键词：体绘制；体积光照；体数据；单绘制遍多切片

HTML PDF 收藏

C₈芳烃异构化催化剂的开发及应用

乔映宾

《中国工程科学》 1999年第1卷第1期页码 73-77

摘要：

文章介绍了SKI系列C₈芳烃异构化催化剂研究工作的进展。阐述了催化剂研制开发的创新思路以及该催化剂的优异性能。该催化剂可使贫对二甲苯或贫对、邻二甲苯的混合C₈芳烃异构为接近热力学平衡的C₈芳烃，C₈芳烃的选择性大于97%，使用寿命可达5年以上。并介绍了该催化剂在引进的七套C₈芳烃异构化工业装置上取代了进口催化剂，将该科技成果转化为现实的生产力所取得的成绩。

关键词：异构化催化剂二甲苯

HTML PDF 收藏

多产异构烷烃的催化裂化工艺技术开发与工业应用

许友好,张久顺,龙军,何鸣元,徐惠,郝希仁

《中国工程科学》 2003年第5卷第5期页码 55-58

摘要： 1.4 Mt/a多产异构烷烃的催化裂化装置试验标定结果表明：与现有的催化裂化工艺相比，该工艺不仅优化了产物分布，干气和油浆产率分别下降了0.41%和0.99%，液体收率增加了1.17%，而且所生产的汽油烯烃含量下降约14.1%，异构烷烃增加约为12.9%，硫的质量分数ω（s）下降26.5%,诱导期增加,汽油的RON下降而MON增加,总的抗爆指数略有下降。

关键词：催化裂化汽油烯烃异构烷烃芳烃

HTML PDF 收藏

基于分布式事件触发策略的异构非线性多智能体系统包含控制 Research Articles

孙雅妮,邹文成,郭健,向峥嵘

《信息与电子工程前沿（英文）》 2021年第22卷第1期页码 1-140 doi: 10.1631/FITEE.2000034

摘要：研究分布式事件触发策略下高阶异构非线性多智能体系统包含控制问题。为实现包含控制目标并减少智能体间的通讯损耗，采用反推控制法、李雅普诺夫函数分析法和神经网络，提出一种分布式事件触发控制策略。

关键词：多智能体系统；分布式事件触发控制；包含控制；异构非线性系统；Zeno现象

HTML PDF 收藏

联邦相互学习：一种针对异构数据、模型和目标的协同机器学习方法 Research Article

沈弢1,张杰2,贾鑫康2,张凤达1,吕喆奇1,况琨1,吴超3,吴飞1

《信息与电子工程前沿（英文）》 2023年第24卷第10期页码 1390-1402 doi: 10.1631/FITEE.2300098

摘要：然而，由于每个客户端的数据分布、算力和场景都不同，联邦学习面临客户端异构环境的挑战。现有方法（如FedAvg）无法有效满足每个客户的定制化需求。为解决联邦学习中的异构挑战，本文首先详述了数据、模型和目标（DMO）这3个主要异构来源，然后提出一种新的联邦相互学习（FML）框架。该框架使得每个客户端都能训练一个考虑到数据异构（DH）的个性化模型。在模型异构（MH）问题上，引入一种“模因模型”作为个性化模型与全局模型之间的中介，并且采用深度相互学习（DML）的知识蒸馏技术在两个异构模型之间传递知识。针对目标异构（OH）问题，通过共享部分模型参数，设计针对特定任务的个性化模型，同时，利用模因模型进行相互学习。本研究通过实验评估了FML在应对DMO异构性方面的表现，并与其他常见FL方法在相似场景下进行对比。实验结果表明，FML在处理FL环境中的DMO问题的表现卓越，优于其他方法。

关键词：联邦学习；知识蒸馏；隐私保护；异构环境

HTML PDF 收藏

一种高效的异构车辆集群协同框架 Research Articles

Iftikhar AHMAD1,2,Rafidah Md NOOR2,Zaheed AHMED3,Umm-e-HABIBA3,Naveed AKRAM4, 5,Fausto Pedro GARCÍA MÁRQUEZ6

《信息与电子工程前沿（英文）》 2021年第22卷第9期页码 1247-1259 doi: 10.1631/FITEE.2000260

摘要：异构车辆集群集成了多种类型通信网络，可在各种车辆应用中高效运行。长期演进（LTE）和专用短程通信的集成是异构网络的一种普遍形式。这种网络基础设施的异构性和成本/数据共享的不合作性是需要解决的潜在问题。为解决这些问题，提出一种异构的车辆集群框架，称为目标和兴趣感知集群框架。该框架集成了车载自组织网络与LTE网络，以提高道路交通效率。在此基础上，给出该框架的模型系统。为在微观层面评估该框架性能，通过整合最先进的工具创建异构仿真环境。仿真结果表明，与其他方法相比，该框架具有更好性能。

关键词：车辆集群；异构性；协同；形式验证；系统模型

HTML PDF 收藏

基于频谱动态控制的异构蜂窝网络安全高效传输方案 Article

李晨曦, 关磊, 吴华清, 承楠, 李赞, 沈学民

《工程（英文）》 2022年第17卷第10期页码 220-231 doi: 10.1016/j.eng.2021.04.019

摘要：

异构蜂窝网络（heterogeneous cellular network, HCN）是一种具有发展前景的结构，可以提供无缝无线覆盖并提高网络容量

关键词：异构蜂窝网络频谱动态控制传输安全高效数据传输