Search | Engineering

订阅投稿

首页工程期刊工程焦点工程成就工程前沿关于我们 English

资源类型

期刊论文 62

年份

2023 14

2022 15

2021 10

2020 4

2019 4

2018 1

2017 7

2016 1

2015 1

2010 1

2007 2

2004 1

1999 1

展开︾

关键词

人工智能 3

计算机视觉 3

神经假体 2

脉冲神经网络 2

长短期记忆网络 2

GPS轨迹 1

Spark 1

UniDrop 1

Vidar相机 1

k-最近邻分类 1

三维视觉知识；三维参数模型；心脏病理诊断；数据增强 1

中医；药材推荐；知识图谱；图注意力网络 1

主动视觉 1

主成分分析 1

主观意图 1

乘客热点预测 1

人-机协同；混合增强智能；认知计算；直觉推理；因果模型；认知映射；视觉场景理解；自主驾驶汽车 1

人与机器人交互；机器人提升疗法；社会交互式机器人；机器人介导干预 1

展开︾

检索范围：

排序：展示方式：

EDVAM：用于虚拟博物馆视觉注意建模的三维眼动数据集 Research Article

周赟湛1,冯天2,帅世辉3,厉向东4,孙凌云5,杜本麟2

《信息与电子工程前沿（英文）》 2022年第23卷第1期页码 101-112 doi: 10.1631/FITEE.2000318

摘要：视觉注意预测能帮助建立适应性虚拟博物馆环境，提供上下文感知和交互式用户体验。目前，利用眼动数据探究视觉注意机制的研究仍限于二维场景。研究者尚未能从时间和空间的角度出发，在三维虚拟场景里研究这一问题。为此，我们构建了第一个用于虚拟博物馆视觉注意建模的三维眼动数据集，命名为EDVAM。我们还建立了一个深度学习模型，通过历史眼动轨迹预测用户未来的视觉注意区域，用于测试EDVAM。这项研究能为虚拟博物馆的视觉注意建模和上下文感知交互提供参考。

关键词：视觉注意；虚拟博物馆；眼动数据集；注视检测；深度学习

HTML PDF 收藏

视觉知识的五个基本问题 Perspectives

潘云鹤

《信息与电子工程前沿（英文）》 2021年第22卷第5期页码 615-766 doi: 10.1631/FITEE.2040000

摘要：认知心理学早已指出，人类知识记忆中的重要部分是视觉知识，被用来进行形象思维。因此，基于视觉的人工智能（AI）是AI绕不开的课题，且具有重要意义。本文继《论视觉知识》一文，讨论与之相关的5个基本问题：（1）视觉知识表达；（2）视觉识别；（3）视觉形象思维模拟；（4）视觉知识的学习；（5）多重知识表达。视觉知识的独特优点是具有形象的综合生成能力，时空演化能力和形象显示能力。这些正是字符知识和深度神经网络所缺乏的。AI与计算机辅助设计/图形学/视觉的技术联合将在创造、预测和人机融合等方面对AI新发展提供重要的基础动力。视觉知识和多重知识表达的研究是发展新的视觉智能的关键，也是促进AI 2.0取得重要突破的关键理论与技术。这是一块荒芜、寒湿而肥沃的“北大荒”，也是一块充满希望值得多学科合作勇探的“无人区”。

关键词：视觉知识表达；视觉识别；视觉形象思维模拟；视觉知识学习；多重知识表达

HTML PDF 收藏

面向视觉概念构建的三维形状空间学习：挑战与研究进展 Perspective

童欣

《信息与电子工程前沿（英文）》 2022年第23卷第9期页码 1290-1297 doi: 10.1631/FITEE.2200318

摘要：人类可以熟练的对真实世界中物体按照形状或者功能进行分类，并在思维中建立每类物体的视觉概念和周围真实世界的视觉知识（Pan, 2019）。Pan（2021）指出建立这些视觉概念和视觉知识的计算表达是发展下一代人工智能的一个关键步骤。学习同一视觉概念下所有物体的三维形状空间是实现视觉概念计算表达的一个关键步骤。

关键词：视觉概念；视觉知识；三维几何学习；三维形状空间；三维结构

HTML PDF 收藏

基于定量属性的单目标视觉跟踪算法评价体系研究 Article

Wen-jing KANG, Chang LIU, Gong-liang LIU

《信息与电子工程前沿（英文）》 2020年第21卷第3期页码 405-421 doi: 10.1631/FITEE.1900245

摘要：视觉跟踪是计算机视觉领域热门研究课题之一。近年来，很多先进跟踪算法和性能评价基准相继发布，并取得巨大成功。首先，归纳整理了12个反映图像序列不同特性的帧间视觉属性，并首次定量给出其归一化公式。

关键词：视觉跟踪；性能评价；视觉属性；计算机视觉

HTML PDF 收藏

基于图卷积注意力网络的视频摘要方法 Research Articles

李平1,2,唐超1,徐向华1

《信息与电子工程前沿（英文）》 2021年第22卷第6期页码 902-913 doi: 10.1631/FITEE.2000429

摘要：提出一种基于图卷积注意力网络（graph convolutional attention network, GCAN）的视频摘要方法。具体而言，GCAN使用空洞时序卷积对局部线索和时序自注意力建模，能有效利用各视频帧的全局线索；同时利用多层图卷积网络学习图嵌入，反映视频帧样本的本征结构。

关键词：时序学习；自注意力机制；图卷积网络；上下文融合；视频摘要

HTML PDF 收藏

面向视觉常识推理的有向视觉连接 Research Articles

韩亚洪1,2,武阿明1,朱霖潮3,杨易3

《信息与电子工程前沿（英文）》 2021年第22卷第5期页码 615-766 doi: 10.1631/FITEE.2000722

摘要：为推动认知层面视觉内容理解的研究，即基于视觉细节的深入理解做出精确推理，视觉常识推理的概念被提出。相比仅需模型正确回答问题的传统视觉问答，视觉常识推理不仅需要模型正确地回答问题，还需给出相应解释。通过使用问题和答案的语义来情景化视觉神经元从而动态重组神经元连接，以及借助方向信息增强推理能力，所提方法能有效实现视觉常识推理。具体地，首先开发一个GraphVLAD模块来捕捉能够充分表达视觉内容相关性的视觉神经元连接。然后提出一个情景化模型来融合视觉和文本表示。

关键词：视觉常识推理；有向连接网络；视觉神经元连接；情景化连接；有向连接

HTML PDF 收藏

视觉知识：智能创意初探 Perspectives

庄越挺,汤斯亮

《信息与电子工程前沿（英文）》 2021年第22卷第5期页码 615-766 doi: 10.1631/FITEE.2100116

摘要：首先，列举形象思维推理的相关研究；然后，重点介绍一种特殊的视觉知识表示形式，即视觉场景图；最后，详细介绍视觉场景图构造问题与潜在应用。所有证据表明，视觉知识和视觉思维不仅可以改善当前人工智能任务的性能，而且可以用于机器创造力的实践。

关键词：思维科学；形象思维推理；视觉知识表达；视觉场景图

HTML PDF 收藏

视觉检测技术及应用

叶声华,邾继贵,王仲,杨学友

《中国工程科学》 1999年第1卷第1期页码 49-52

摘要：

视觉检测技术，尤其是基于三角法的主动和被动视觉检测技术具有非接触、速度快、柔性好等特点，是一种先进的检测手段，适合现代制造业的需要。文章论述了视觉检测技术原理，讨论了已经研制的多个实际视觉检测系统，从不同角度展示了视觉检测技术在现代制造业中广阔的应用前景。

关键词：主动视觉被动视觉检测系统现代制造

HTML PDF 收藏

基于人工智能技术的儿童ADHD辅助诊断系统 Research

张雁翼1,孔鸣2,赵天琦2,洪文琛2,谢迪3,王春茂3,杨荣旺1,李荣1,朱强2

《信息与电子工程前沿（英文）》 2021年第22卷第3期页码 400-414 doi: 10.1631/FITEE.1900729

摘要：传统的儿童注意缺陷多动障碍（ADHD）诊断主要基于由父母/老师填写的调查问卷和医生的临床观察，不仅效率不高，而且诊断准确率很大程度上取决于医生的经验水平。通过集成智能分析模块，相机模组将采集受试儿童完成执行功能测试时的眼部注意力、面部表情、3D身体姿态和其他测试信息。然后，提出一种多模态深度学习模型，用于对所采集视频中儿童的异常行为片段进行分类。

关键词：注意缺陷多动障碍（ADHD）；辅助诊断；计算机视觉；深度学习；BERT

HTML PDF 收藏

NGAT：基于广度和深度探索注意力机制的半监督图表示学习 Research Articles

胡荐苛,张引

《信息与电子工程前沿（英文）》 2022年第23卷第3期页码 409-421 doi: 10.1631/FITEE.2000657

摘要：为缓解过度平滑，本文提出一种嵌套的图注意网络，即基于双重注意力机制的多尺度特征融合模型NGAT，该网络可以半监督形式工作。除广度探索，k层NGAT运用注意力机制引导的分层聚合策略，选择性地利用来自k阶邻域的信息特征，即深度探索。

关键词：图学习；半监督学习；节点分类；注意力机制

HTML PDF 收藏

基于注意机制编码解码模型的答案选择方法 Article

Yuan-ping NIE, Yi HAN, Jiu-ming HUANG, Bo JIAO, Ai-ping LI

《信息与电子工程前沿（英文）》 2017年第18卷第4期页码 535-544 doi: 10.1631/FITEE.1601232

摘要：本文提出了一种基于注意机制的深度神经网络模型来解决问答系统中的答案选择任务。该模型采用了基于双向LSTM的编码解码模型，编码解码模型是一个被证明再机器翻译领域取得了突出的成绩。我们还在模型中应用了注意力机制来提升模型的效果。本文在一个公开数据集上验证我们实验的有效性，同时通过结合该模型显著提高了我们的问答系统的性能在TREC liveQA 2015的任务中。

关键词：问答技术、答案选择、注意机制、深度学习

HTML PDF 收藏

论视觉知识 Perspective

Yun-he PAN

《信息与电子工程前沿（英文）》 2019年第20卷第8期页码 1021-1025 doi: 10.1631/FITEE.1910001

摘要：提出“视觉知识”概念。视觉知识是知识表达的一种新形式. 它与迄今为止人工智能（AI）所用知识表达方法不同. 其中视觉概念具有典型（prototype）与范畴结构、层次结构与动作结构等要素.视觉概念能构成视觉命题，包括场景结构与动态结构，视觉命题能构成视觉叙事。指出重构计算机图形学成果可实现视觉知识表达及其推理与操作，重构计算机视觉成果可实现视觉知识学习。实现视觉知识表达、推理、学习和应用技术将是AI 2.0取得突破的重要方向之一。

关键词： None

HTML PDF 收藏

一种端到端语音合成中的高效解码自注意力网络 Research Article

赵伟1,2,许力1,2

《信息与电子工程前沿（英文）》 2022年第23卷第7期页码 1127-1138 doi: 10.1631/FITEE.2100501

摘要：自注意力网络由于其并行结构和强大的序列建模能力，被广泛应用于语音合成（TTS）领域。然而，当使用自回归解码方法进行端到端语音合成时，由于序列长度的二次复杂性，其推理速度相对较慢。为解决该问题，提出一种高效解码自注意力网络（EDSA）作为替代。通过一个动态规划解码过程，有效加速TTS模型推理，使其具有线性计算复杂度。

关键词：高效解码；端到端；自注意力网络；语音合成

HTML PDF 收藏

室内导航系统视觉标记性能分析 Article

Gaetano C. LA DELFA,Salvatore MONTELEONE,Vincenzo CATANIA,Juan F. DE PAZ,Javier BAJO

《信息与电子工程前沿（英文）》 2016年第17卷第8期页码 730-740 doi: 10.1631/FITEE.1500324

摘要：近年来，得益于智能手机相机性能的大幅提升，无标记点和有标记点的计算机视觉方法得到开发。在之前的研究中，我们提出了一种利用低功耗蓝牙和嵌入地面的2D视觉标记系统进行室内定位导航的技术。在本文中，我们对3种可服务于实时应用的2D视觉标记（Vuforia，ArUco标记和AprilTag）进行了定性的性能评估。本文重点研究了附于地表瓷砖的3种视觉标记在特定情况下的表现，提出了最优视觉标记的甄选原则，为我们提出的室内定位导航技术提供技术支撑。

关键词：室内定位；视觉标记；计算机视觉

HTML PDF 收藏

户外空中双机械手抓取设计和视觉伺服 Article

Pablo Ramon-Soria, Begoña C. Arrue, Anibal Ollero

《工程（英文）》 2020年第6卷第1期页码 77-88 doi: 10.1016/j.eng.2019.11.003

摘要：

本文介绍了一种配备有RGB-D摄像机的使用带有双机械手的无人飞行器（unmanned aerial vehicle, UAV）抓取已知物体的系统。空中操纵仍然是一项极具挑战性的任务。本文主要从三个方面对这一任务进行了评价：目标检测与姿态估计、抓取设计、飞行中的抓取动作。人工神经网络（artificial neural network, ANN）首先被用来获得有关物体位置的线索。接下来，使用对齐算法获取对象的六维（six-dimensional, 6D）姿态，并使用扩展的卡尔曼滤波器进行滤波。然后，使用物体的三维（three-dimensional, 3D）模型来估计空中机械手可实现良好抓取的排列清单。检测算法的结果（即对象的姿态）用于更新手臂朝向对象的轨迹。如果由于无人机的振荡而无法达到目标姿态，则算法将切换到下一个可行的抓取。本文介绍了总体方法，给出了每个模块的仿真实验结果和实际实验结果，并提供了视频演示结果。

关键词：空中操纵，抓取设计，视觉伺服

HTML PDF 收藏

标题作者时间类型操作

EDVAM：用于虚拟博物馆视觉注意建模的三维眼动数据集

周赟湛1,冯天2,帅世辉3,厉向东4,孙凌云5,杜本麟2

期刊论文

视觉知识的五个基本问题

潘云鹤

期刊论文

面向视觉概念构建的三维形状空间学习：挑战与研究进展

童欣

期刊论文