Search | Engineering

订阅投稿

首页工程期刊工程焦点工程成就工程前沿关于我们 English

资源类型

期刊论文 578

年份

2024 2

2023 46

2022 44

2021 45

2020 36

2019 39

2018 48

2017 41

2016 29

2015 26

2014 19

2013 12

2012 9

2011 13

2010 20

2009 14

2008 14

2007 17

2006 12

2005 19

展开︾

关键词

颠覆性技术 19

可靠性 9

可持续性 8

安全性 8

战略性新兴产业 7

耐久性 5

肠道菌群 5

鲁棒性 5

新冠病毒肺炎 4

有效性 4

COVID-19 3

半旱地农业 3

增材制造 3

调节性T细胞 3

4D打印 2

优化设计 2

农业节水 2

创造性思维 2

区块链 2

展开︾

检索范围：

排序：展示方式：

CWLP：一种在GPU中协同的线程束调度和局部性保护的高速缓存分配策略 None

Yang ZHANG, Zuo-cheng XING, Cang LIU, Chuan TANG

《信息与电子工程前沿（英文）》 2018年第19卷第2期页码 206-220 doi: 10.1631/FITEE.1700059

摘要：由于片上存储器的严重缺少，受较差的缓存性能影响，GPU的计算能力急剧下降，限制了系统性能和能效。提出一种协同的线程束调度和局部性保护的缓存分配策略（CWLP），以充分利用数据局部性和隐藏延迟。首先，设计了一种基于指令PC的局部性保护方法（LPC）以提升GPU性能。使用一个基于PC的收集器收集每个高速缓存块的重用信息。在获取缓存块的动态重用信息后，采用一个智能缓存分配单元（PCAU），它结合了重用信息和LRU（最近最少使用）替换策略，以找到拥有最少局部性的缓存块并将其逐出。此外，局部性信息被线程束调度器用来实现一个智能的重排序策略，用以获取局部性和隐藏延迟。实验结果表明，CWLP能够提供高达19.8%的性能加速比和超过基准策略平均8.8%的性能提升。

关键词：局部性GPU；cache分配；线程束调度

HTML PDF 收藏

多处理器系统中的数据局部性及其优化技术研究

杨学军,戴华东,夏军

《中国工程科学》 2002年第4卷第5期页码 44-52

摘要：

数据局部性是多处理器系统中的重要研究方向之一。结合该领域目前国内外研究现状和我们近一阶段的研究进展，讨论了多处理器系统中的数据局部性及其优化问题。针对现有局部性度量模型存在的不足，提出了一种增强的可用于层次式并行计算机体系结构的局部性度量模型。在静态和动态局部性优化技术方面，分别探讨了基于投影分层的数据变换框架和基于瞬时访问信息的动态页迁移策略，并展开了系列相关的讨论。另外，针对利用数据局部性时必须解决的一个关键问题——存储一致性问题，进行了深入的研究，提出了以操作系统为中心的线程存储一致性模型。

关键词：计算机多处理器系统数据局部性局部性度量模型数据变换框架页迁移线程一致性模型

HTML PDF 收藏

FTRP：基于进程复制和预取的高性能计算容错框架 Research

Wei HU, Guang-ming LIU, Yan-huang JIANG

《信息与电子工程前沿（英文）》 2018年第19卷第10期页码 1273-1290 doi: 10.1631/FITEE.1601450

摘要：随着超级计算机规模迅速增大，可靠性成为制约系统可用性的主要问题。现有容错机制，包括检查点技术和进程冗余等，不能有效解决该问题。与程序运行过程中的局部性相似，我们第一次观察到超级计算机故障局部性现象。基于故障局部性，提出一种新的进程复制和进程预取相结合的容错机制，无论故障能否被预测到，都能够有效避免故障引起的损失。

关键词：高性能计算；主动容错；故障局部性；进程复制；进程预取

HTML PDF 收藏

局部高空间分辨率的应用适应性PET系统设计初探

刘晶晶,谢庆国

《中国工程科学》 2011年第13卷第10期页码 105-112

摘要： justify;">研制成本可负担的高空间分辨率正电子发射断层成像（positron emission tomography，PET）系统在PET成像应用中具有决定性的意义，也是PET成像面临的关键性挑战之一提出了一种应用适应性PET系统原型，由大部分普通固有空间分辨率的探测模块和少量更高甚至极端高固有空间分辨率的探测模块组成。初步研究结果表明，所提出的系统能够为局部区域带来高空间分辨率，其空间分辨率提升程度与高性能模块布局位置有关，在同一高性能模块布局位置下，视场中不同位置点的提升程度不同。该研究结果也显示，根据应用需求规划探测模块的构成和布局以在感兴趣区域获得局部高空间分辨率是可能的。

关键词：正电子发射断层成像应用适应性PET系统感兴趣区域局部空间分辨率不同性能探测模块

HTML PDF 收藏

运动规划的高效配置空间构建与优化 Article

潘佳, Dinesh Manocha

《工程（英文）》 2015年第1卷第1期页码 46-57 doi: 10.15302/J-ENG-2015009

摘要：得出的碰撞查询结果将用来计算配置空间的近似表达，可快速聚合至准确的配置空间；同时还提出了基于并行图形处理器（GPU）的算法，以便加速配置空间优化与搜索计算的性能情况。笔者特别设计出了基于GPU的并行k最近邻算法与并行碰撞检测算法，并使用这些算法来加快运动规划。

关键词：配置空间运动规划图形处理器（GPU）并行算法

HTML PDF 收藏

MyWAL：一种基于精简输入输出堆栈的键值存储系统性能优化方案 Research Article

方娟,林胜,杨会静,徐艺翔,苏醒

《信息与电子工程前沿（英文）》 2023年第24卷第7期页码 994-1006 doi: 10.1631/FITEE.2200449

摘要：当多个处理器（CPU）核心和集成图形处理器（GPU）共享片外主存时，CPU和GPU应用程序会竞争关键内存资源，导致严重的资源竞争，并对系统整体性能产生负面影响。本文描述了CPU-GPU异构多核架构下共享内存资源的竞争情况，提出一种基于感知和预测的批处理共享内存请求调度策略。该策略通过感知请求缓冲区中CPU和GPU内存请求情况，估计GPU延迟容忍度，并通过批量处理CPU或GPU内存请求减少CPU和GPU之间的相互干扰。

关键词： CPU-GPU异构；多核；共享内存；访存调度

HTML PDF 收藏

Optimizing non-coalesced memory access for irregular applications with GPU computing

Ran Zheng, Yuan-dong Liu, Hai Jin,zhraner@hust.edu.cn,1531364016@qq.com,hjin@hust.edu.cn

《信息与电子工程前沿（英文）》 2020年第21卷第9期页码 1267-1412 doi: 10.1631/FITEE.1900262

摘要： (GPGPUs) can be used to improve computing performance considerably for regular applications. However, irregular memory access exists in many applications, and the benefits of graphics processing units (GPUs) are less substantial for irregular applications. In recent years, several studies have presented some solutions to remove static irregular memory access. However, eliminating dynamic irregular memory access with software remains a serious challenge. A pure software solution without hardware extensions or offline profiling is proposed to eliminate dynamic irregular memory access, especially for indirect memory access. and index redirection are suggested to reduce the number of memory transactions, thereby improving the performance of GPU kernels. To improve the efficiency of , an operation to reorder data is offloaded to a GPU to reduce overhead and thus transfer data. Through concurrently executing the compute unified device architecture (CUDA) streams of and the data processing kernel, the overhead of can be reduced. After these optimizations, the volume of memory transactions can be reduced by 16.7%–50% compared with CUSPARSE-based benchmarks, and the performance of irregular kernels can be improved by 9.64%–34.9% using an NVIDIA Tesla P4 GPU.

HTML PDF 收藏

基于GPU的密度峰值并行聚类算法 Article

Ke-shi GE, Hua-you SU, Dong-sheng LI, Xi-cheng LU

《信息与电子工程前沿（英文）》 2017年第18卷第7期页码 915-927 doi: 10.1631/FITEE.1601786

摘要：在本文中，我们提出了一种基于GPU （graphics processing unit）的高效并行密度峰值算法。我们分析密度峰值聚类算法的原理来研究其计算瓶颈，并评估其并行的潜力。根据分析，我们提出了CUDA-DP （compute unified device architecture-DP），一种针对GPU架构的高效并行密度峰值聚类算法，并用CUDA实现了这种并行方法。更进一步，为了利用GPU的合并访问机制，我们将CUDA-DP程序的数据结构从AOS （array of structures）重构为SOA （structure of arrays）。

关键词： GPU；密度峰值；聚类；并行计算

HTML PDF 收藏

基于图块的局部加权表决标记融合分割算法 Article

Kai ZHU, Gang LIU, Long ZHAO, Wan ZHANG

《信息与电子工程前沿（英文）》 2017年第18卷第5期页码 680-688 doi: 10.1631/FITEE.1500457

摘要：结合局部加权表决策略和贝叶斯推论，本文提出了一种新的基于图块的分割算法。首先在执行局部加权表决策略中将灰度先验概率和标记先验概率作为两个关键的指标，然后在图块水平上计算这两种先验概率。最后，利用Dice score作为评估分割精度的标准，将该算法分割的结果与其他一些方法进行了比较，如多数表决、局部加权表决、基于图块的多数表决以及广泛运用于整个大脑分割的工具FreeSurfer。

关键词：标记融合；局部加权表决；基于图块；背景分析

HTML PDF 收藏

交互式体积光照绘制中基于GPU的单绘制遍多切片算法 Research Articles

罗德宁,林毅,张建伟

《信息与电子工程前沿（英文）》 2021年第22卷第8期页码 1092-1103 doi: 10.1631/FITEE.2000214

摘要：然而，交互式体绘制的计算开销异常高，当数据量和算法复杂度增加时，问题的可解性受到不利影响。本文提出一种基于GPU的可扩展单绘制遍多切片（multi-slice per pass，MSPP）体绘制算法，该算法可以快速生成全局体阴影，并基于传递函数实现半透明效果，以改善体数据的形状和深度感知。

关键词：体绘制；体积光照；体数据；单绘制遍多切片

HTML PDF 收藏

Improving performance portability for GPU-specific OpenCL kernels onmulti-core/many-coreCPUs by analysis-based

Mei WEN,Da-fei HUANG,Chang-qing XUN,Dong CHEN

《信息与电子工程前沿（英文）》 2015年第16卷第11期页码 899-916 doi: 10.1631/FITEE.1500032

摘要： OpenCL is an open heterogeneous programming framework. Although OpenCL programs are functionally portable, they do not provide performance portability, so code transformation often plays an irreplaceable role. When adapting GPU-specific OpenCL kernels to run on multi-core/many-core CPUs, coarsening the thread granularity is necessary and thus has been extensively used. However, locality concerns exposed in GPU-specific OpenCL code are usually inherited without analysis, which may give side-effects on the CPU performance. Typically, the use of OpenCL’s local memory on multi-core/many-core CPUs may lead to an opposite performance effect, because local-memory arrays no longer match well with the hardware and the associated synchronizations are costly. To solve this dilemma, we actively analyze the memory access patterns using array-access descriptors derived from GPU-specific kernels, which can thus be adapted for CPUs by (1) removing all the unwanted local-memory arrays together with the obsolete barrier statements and (2) optimizing the coalesced kernel code with vectorization and locality re-exploitation. Moreover, we have developed an automated tool chain that makes this transformation of GPU-specific OpenCL kernels into a CPU-friendly form, which is accompanied with a scheduler that forms a new OpenCL runtime. Experiments show that the automated transformation can improve OpenCL kernel performance on a multi-core CPU by an average factor of 3.24. Satisfactory performance improvements are also achieved on Intel’s many-integrated-core coprocessor. The resultant performance on both architectures is better than or comparable with the corresponding OpenMP performance.

关键词： OpenCL Performance portability Multi-core/many-core CPU Analysis-based transformation

HTML PDF 收藏

联合局部学习和组稀疏回归的无监督特征选择 Regular Papers

Yue WU, Can WANG, Yue-qing ZHANG, Jia-jun BU

《信息与电子工程前沿（英文）》 2019年第20卷第4期页码 538-553 doi: 10.1631/FITEE.1700804

摘要：为解决这一问题，本文提出联合局部学习和组稀疏回归的无监督特征选择算法。将基于局部学习聚类方法与组稀疏回归算法有机整合，选出有效反映数据流形分布同时保持组稀疏结构的特征。对多个实际数据集（图像、声音和网页）的实验证明了该算法的有效性。

关键词：无监督；局部学习；组稀疏回归；特征选择

HTML PDF 收藏

《信息与电子工程前沿（英文）》 2021年第22卷第9期页码 1234-1246 doi: 10.1631/FITEE.2000426

摘要：构建一个应对过程非平稳性的自适应模型非常必要。本文针对非平稳过程，设计了一种基于含有隐变量贝叶斯网络的质量相关局部加权软测量方法。所提软测量方法试图通过质量相关信息为非平稳过程寻找到一般方法，且详细解释了局部相似度和窗口置信度的概念。通过一个数值算例和脱丁烷塔的应用验证了所提方法的性能。

关键词：软测量；有监督贝叶斯网络；隐变量；局部加权建模；质量预测

HTML PDF 收藏

一种局部二次嵌入学习算法及其在软测量中的应用 Article

包垚垚, 朱远明, 钱峰

《工程（英文）》 2022年第18卷第11期页码 186-196 doi: 10.1016/j.eng.2022.04.025

摘要：

鉴于元学习在众多领域取得的巨大成就，本文针对数据回归问题提出了融合度量学习和神经网络（NN）的局部二次嵌入学习（LQEL）算法。首先，通过优化输入输出空间里样本间度量的全局一致性来改进马氏度量（Mahalanobis metric）学习算法；同时，通过引入松弛约束进一步证明了改进的度量学习问题等价于一个凸规划问题。然后，基于局部二次插值假设原理，引入了两个轻量级的神经网络，其一用于学习局部二次模型中的系数矩阵，另一个则用于对从不同局部近邻获得的预测结果进行权重分配。

关键词：局部二次嵌入度量学习回归机软测量

HTML PDF 收藏

CPU-GPU异构系统感知和预测的批处理内存调度策略 Research Article

吴子梁1,陈为1,马昱欣2,徐彤1,严凡1,吕檑1,钱中昊1,夏佳志3

《信息与电子工程前沿（英文）》 2023年第24卷第7期页码 1007-1027 doi: 10.1631/FITEE.2200409

摘要：尽管特征工程领域的最新进展为更加广泛的自动数据变换提供了可能，其结果却缺少可解释性，导致变换后的模式无法与原始数据特征建立联系。我们通过回顾既往文献总结可行的数据变换空间，通过开展预实验总结变换可解释性的度量。我们的推荐算法能够计算最优的数据变换，这种变换能够在维持可解释性的同时揭示数据的模式信息。真实场景下的使用案例与用户实验验证了我们方法的有效性。

关键词：数据变换；数据变换推荐；自动可视化；可解释性

HTML PDF 收藏

标题作者时间类型操作

CWLP：一种在GPU中协同的线程束调度和局部性保护的高速缓存分配策略

Yang ZHANG, Zuo-cheng XING, Cang LIU, Chuan TANG

期刊论文

多处理器系统中的数据局部性及其优化技术研究

杨学军,戴华东,夏军

期刊论文

FTRP：基于进程复制和预取的高性能计算容错框架

Wei HU, Guang-ming LIU, Yan-huang JIANG

期刊论文