资源类型

期刊论文 569

会议视频 38

会议信息 24

年份

2023 64

2022 92

2021 68

2020 64

2019 56

2018 34

2017 41

2016 15

2015 5

2014 11

2013 4

2012 7

2011 9

2010 6

2009 13

2008 10

2007 23

2006 19

2005 16

2004 20

展开 ︾

关键词

数值模拟 28

机器学习 27

人工智能 15

深度学习 15

2020 10

模式识别 10

信息技术 7

2019 4

工程管理 4

思维科学 4

目标识别 4

计算机模拟 4

COVID-19 3

MATLAB 3

图像处理 3

大数据 3

能源 3

计算机视觉 3

ACM 2

展开 ︾

检索范围:

排序: 展示方式:

视觉知识的五个基本问题 Perspectives

潘云鹤

《信息与电子工程前沿(英文)》 2021年 第22卷 第5期   页码 615-766 doi: 10.1631/FITEE.2040000

摘要: 认知心理学早已指出,人类知识记忆中的重要部分是视觉知识,被用来进行形象思维。因此,基于视觉的人工智能(AI)是AI绕不开的课题,且具有重要意义。本文继《论视觉知识》一文,讨论与之相关的5个基本问题:(1)视觉知识表达;(2)视觉识别;(3)视觉形象思维模拟;(4)视觉知识学习;(5)多重知识表达视觉知识的独特优点是具有形象的综合生成能力,时空演化能力和形象显示能力。这些正是字符知识和深度神经网络所缺乏的。AI与计算机辅助设计/图形学/视觉的技术联合将在创造、预测和人机融合等方面对AI新发展提供重要的基础动力。视觉知识多重知识表达的研究是发展新的视觉智能的关键,也是促进AI 2.0取得重要突破的关键理论与技术。这是一块荒芜、寒湿而肥沃的“北大荒”,也是一块充满希望值得多学科合作勇探的“无人区”。

关键词: 视觉知识表达视觉识别视觉形象思维模拟视觉知识学习多重知识表达    

视觉知识:智能创意初探 Perspectives

庄越挺,汤斯亮

《信息与电子工程前沿(英文)》 2021年 第22卷 第5期   页码 615-766 doi: 10.1631/FITEE.2100116

摘要: 本文从思维科学的角度探讨人工智能创造力的问题。首先,列举形象思维推理的相关研究;然后,重点介绍一种特殊的视觉知识表示形式,即视觉场景图;最后,详细介绍视觉场景图构造问题与潜在应用。所有证据表明,视觉知识视觉思维不仅可以改善当前人工智能任务的性能,而且可以用于机器创造力的实践。

关键词: 思维科学;形象思维推理;视觉知识表达视觉场景图    

面向视觉概念构建的三维形状空间学习:挑战与研究进展 Perspective

童欣

《信息与电子工程前沿(英文)》 2022年 第23卷 第9期   页码 1290-1297 doi: 10.1631/FITEE.2200318

摘要: 人类可以熟练的对真实世界中物体按照形状或者功能进行分类,并在思维中建立每类物体的视觉概念和周围真实世界的视觉知识(Pan, 2019)。Pan(2021)指出建立这些视觉概念和视觉知识的计算表达是发展下一代人工智能的一个关键步骤。学习同一视觉概念下所有物体的三维形状空间是实现视觉概念计算表达的一个关键步骤。本文提出三维形状空间学习中面临的关键技术挑战,并围绕这些技术挑战回顾了这一领域的研究进展,最后讨论了三维形状空间学习领域的研究趋势和未来发展方向。

关键词: 视觉概念;视觉知识;三维几何学习;三维形状空间;三维结构    

视觉知识 Perspective

Yun-he PAN

《信息与电子工程前沿(英文)》 2019年 第20卷 第8期   页码 1021-1025 doi: 10.1631/FITEE.1910001

摘要: 提出“视觉知识”概念。视觉知识知识表达的一种新形式. 它与迄今为止人工智能(AI)所用知识表达方法不同. 其中视觉概念具有典型(prototype)与范畴结构、层次结构与动作结构等要素.视觉概念能构成视觉命题,包括场景结构与动态结构,视觉命题能构成视觉叙事。指出重构计算机图形学成果可实现视觉知识表达及其推理与操作,重构计算机视觉成果可实现视觉知识学习。实现视觉知识表达、推理、学习和应用技术将是AI 2.0取得突破的重要方向之一。

关键词: None    

AI 的多重知识表达

潘云鹤

《工程(英文)》 2020年 第6卷 第3期   页码 216-217 doi: 10.1016/j.eng.2019.12.011

大数据人工智能下的多重知识表达:框架、应用及案例研究 Perspective

杨易,庄越挺,潘云鹤

《信息与电子工程前沿(英文)》 2021年 第22卷 第12期   页码 1551-1684 doi: 10.1631/FITEE.2100463

摘要: 提出一种多重知识表示框架,探讨了其对推动大数据人工智能技术在各个领域中发展的重要意义及深远影响。传统知识表达和现代基于深度学习知识表达通常着眼于利用特定变换方式,将输入转换为符号编码或者向量。例如,知识图谱关注于描述各个概念之间的语义联系,而深度神经网络更像是感知原始信号输入的工具。多重知识表达是一种更为先进的人工智能表征框架,具备更完整的智能功能,比如原始信号感知、特征提取及向量化、知识符号化和逻辑推断。多重知识表达有如下两点优势:(1)与现有以深度学习为主导的人工智能技术相比,具有更强的解释性以及更好的泛化能力;(2)将多重知识表达集成于现有人工智能技术,有利于各种表征(例如原始信号感知以及符号化编码我们希望多重知识表达相关研究以及应用能够驱动新一代人工智能蓬勃发展。

关键词: 多重知识表达;人工智能;大数据    

基于三维参数模型重建的心脏病理视觉识别 Research Article

肖金肖1,李岩松1,田沄1,徐冬溶2,3,李鹏辉1,赵世凤1,潘云鹤3

《信息与电子工程前沿(英文)》 2022年 第23卷 第9期   页码 1324-1337 doi: 10.1631/FITEE.2200102

摘要: 心脏图像的视觉识别对于心脏病理诊断和治疗具有重要意义。由于可用标注数据集有限,传统方法通常基于三维心脏图像的二维切片对病理分类特征进行提取,难以确保心脏解剖结构的整体一致性。然后,基于三维统计形状模型及其视觉知识约束对心脏数据进行增强。最后,提取不同时相的三维心脏模型的形状和运动特征,对心脏病理进行分类。

关键词: 三维视觉知识;三维参数模型;心脏病理诊断;数据增强    

基于场景自适应概念学习的无监督目标检测 Research Articles

浦世亮1,赵暐1,陈伟杰1,杨世才1,谢迪1,潘云鹤2

《信息与电子工程前沿(英文)》 2021年 第22卷 第5期   页码 615-766 doi: 10.1631/FITEE.2000567

摘要: 目标检测是机器视觉领域最热门的研究方向之一,在学术界已取得令人瞩目的成果,在工业界也存在许多有价值的应用。为克服上述问题,受视觉知识理论启发,提出一种场景自适应进化的无监督视频目标检测算法,该算法可利用目标群体概念,降低场景变化带来的不利影响。首先通过预训练检测模型从无标注数据中提取大量候选目标,然后对候选目标聚类,构建目标概念的视觉知识字典,其中各个聚类中心代表一种目标原型。

关键词: 视觉知识;无监督视频目标检测;场景自适应学习    

基于定量属性的单目标视觉跟踪算法评价体系研究 Article

Wen-jing KANG, Chang LIU, Gong-liang LIU

《信息与电子工程前沿(英文)》 2020年 第21卷 第3期   页码 405-421 doi: 10.1631/FITEE.1900245

摘要: 视觉跟踪是计算机视觉领域热门研究课题之一。近年来,很多先进跟踪算法和性能评价基准相继发布,并取得巨大成功。首先,归纳整理了12个反映图像序列不同特性的帧间视觉属性,并首次定量给出其归一化公式。测试结果表明,在目标尺寸快速或剧烈变化时,跟踪器大多表现不佳,即使基于深度学习的先进跟踪器也未能很好解决这一问题。

关键词: 视觉跟踪;性能评价;视觉属性;计算机视觉    

面向视觉常识推理的有向视觉连接 Research Articles

韩亚洪1,2,武阿明1,朱霖潮3,杨易3

《信息与电子工程前沿(英文)》 2021年 第22卷 第5期   页码 615-766 doi: 10.1631/FITEE.2000722

摘要: 为推动认知层面视觉内容理解的研究,即基于视觉细节的深入理解做出精确推理,视觉常识推理的概念被提出。相比仅需模型正确回答问题的传统视觉问答,视觉常识推理不仅需要模型正确地回答问题,还需给出相应解释。通过使用问题和答案的语义来情景化视觉神经元从而动态重组神经元连接,以及借助方向信息增强推理能力,所提方法能有效实现视觉常识推理。具体地,首先开发一个GraphVLAD模块来捕捉能够充分表达视觉内容相关性的视觉神经元连接。然后提出一个情景化模型来融合视觉和文本表示。

关键词: 视觉常识推理;有向连接网络;视觉神经元连接;情景化连接;有向连接    

视觉检测技术及应用

叶声华,邾继贵,王仲,杨学友

《中国工程科学》 1999年 第1卷 第1期   页码 49-52

摘要:

视觉检测技术,尤其是基于三角法的主动和被动视觉检测技术具有非接触、速度快、柔性好等特点,是一种先进的检测手段,适合现代制造业的需要。文章论述了视觉检测技术原理,讨论了已经研制的多个实际视觉检测系统,从不同角度展示了视觉检测技术在现代制造业中广阔的应用前景。

关键词: 主动视觉     被动视觉     检测系统     现代制造    

深度学习中的视觉可解释性 Review

Quan-shi ZHANG, Song-chun ZHU

《信息与电子工程前沿(英文)》 2018年 第19卷 第1期   页码 27-39 doi: 10.1631/FITEE.1700808

摘要: 总结了近年来在理解神经网络内部特征表达和训练一个具有中层表达可解释性的深度神经网络上的相关研究工作。虽然深度神经网络在众多人工智能任务中已有杰出表现,但神经网络中层表达的可解释性依然是该领域发展的重大瓶颈。目前,深度神经网络以低解释性的黑箱表达为代价,获取了强大的分类能力。我们认为提高神经网络中层特征表达的可解释性,可以帮助人们打破众多深度学习的发展瓶颈,比如,小数据训练,语义层面上的人机交互式训练,以及基于内在特征语义定向精准修复网络中层特征表达缺陷等难题。本文着眼于卷积神经网络,调研了:(1)网络表达可视化方法;(2)网络表达的诊断方法;(3)自动解构解释卷积神经网络的方法;(4)学习中层特征表达可解释的神经网络的方法; (5)基于网络可解释性的中层对端的深度学习算法

关键词: 人工智能;深度学习;可解释性模型    

基于计算机视觉的民用基础设施的检查与监测研究进展 Review

Billie F. Spencer Jr.,Vedhus Hoskere,Yasutaka Narazaki

《工程(英文)》 2019年 第5卷 第2期   页码 199-222 doi: 10.1016/j.eng.2018.11.030

摘要:

计算机视觉技术与远程摄像机和无人机(UAVs)的采集相结合,为民用基础设施状况评估提供了前景良好的非接触式解决方案。这种系统的最终目标是自动且稳健地将图像或视频数据转换为可操作的信息。本文概述了将计算机视觉技术应用于民用基础设施状态评估的最新进展。特别介绍了计算机视觉、机器学习和结构工程领域的相关研究。评估工作分为两类:检查应用和监测应用。检查应用包括识别环境,如结构构件,表征局部和全部的可见损坏,以及检测参考图像的变化。监测应用包括应变和位移的静态测量,以及模态分析的位移动态测量。最后,文章指出了为实现基于自动化视觉的民用基础设施和监测目标而持续存在的一些关键挑战,以及为解决这些挑战而正在进行的工作。

关键词: 结构检查和监测     人工智能     计算机视觉     机器学习     光流    

室内导航系统视觉标记性能分析 Article

Gaetano C. LA DELFA,Salvatore MONTELEONE,Vincenzo CATANIA,Juan F. DE PAZ,Javier BAJO

《信息与电子工程前沿(英文)》 2016年 第17卷 第8期   页码 730-740 doi: 10.1631/FITEE.1500324

摘要: 近年来,得益于智能手机相机性能的大幅提升,无标记点和有标记点的计算机视觉方法得到开发。在之前的研究中,我们提出了一种利用低功耗蓝牙和嵌入地面的2D视觉标记系统进行室内定位导航的技术。在本文中,我们对3种可服务于实时应用的2D视觉标记(Vuforia,ArUco标记和AprilTag)进行了定性的性能评估。本文重点研究了附于地表瓷砖的3种视觉标记在特定情况下的表现,提出了最优视觉标记的甄选原则,为我们提出的室内定位导航技术提供技术支撑。

关键词: 室内定位;视觉标记;计算机视觉    

户外空中双机械手抓取设计和视觉伺服 Article

Pablo Ramon-Soria, Begoña C. Arrue, Anibal Ollero

《工程(英文)》 2020年 第6卷 第1期   页码 77-88 doi: 10.1016/j.eng.2019.11.003

摘要:

本文介绍了一种配备有RGB-D摄像机的使用带有双机械手的无人飞行器(unmanned aerial vehicle, UAV)抓取已知物体的系统。空中操纵仍然是一项极具挑战性的任务。本文主要从三个方面对这一任务进行了评价:目标检测与姿态估计、抓取设计、飞行中的抓取动作。人工神经网络(artificial neural network, ANN)首先被用来获得有关物体位置的线索。接下来,使用对齐算法获取对象的六维(six-dimensional, 6D)姿态,并使用扩展的卡尔曼滤波器进行滤波。然后,使用物体的三维(three-dimensional, 3D)模型来估计空中机械手可实现良好抓取的排列清单。检测算法的结果(即对象的姿态)用于更新手臂朝向对象的轨迹。如果由于无人机的振荡而无法达到目标姿态,则算法将切换到下一个可行的抓取。本文介绍了总体方法,给出了每个模块的仿真实验结果和实际实验结果,并提供了视频演示结果。

关键词: 空中操纵,抓取设计,视觉伺服    

标题 作者 时间 类型 操作

视觉知识的五个基本问题

潘云鹤

期刊论文

视觉知识:智能创意初探

庄越挺,汤斯亮

期刊论文

面向视觉概念构建的三维形状空间学习:挑战与研究进展

童欣

期刊论文

视觉知识

Yun-he PAN

期刊论文

AI 的多重知识表达

潘云鹤

期刊论文

大数据人工智能下的多重知识表达:框架、应用及案例研究

杨易,庄越挺,潘云鹤

期刊论文

基于三维参数模型重建的心脏病理视觉识别

肖金肖1,李岩松1,田沄1,徐冬溶2,3,李鹏辉1,赵世凤1,潘云鹤3

期刊论文

基于场景自适应概念学习的无监督目标检测

浦世亮1,赵暐1,陈伟杰1,杨世才1,谢迪1,潘云鹤2

期刊论文

基于定量属性的单目标视觉跟踪算法评价体系研究

Wen-jing KANG, Chang LIU, Gong-liang LIU

期刊论文

面向视觉常识推理的有向视觉连接

韩亚洪1,2,武阿明1,朱霖潮3,杨易3

期刊论文

视觉检测技术及应用

叶声华,邾继贵,王仲,杨学友

期刊论文

深度学习中的视觉可解释性

Quan-shi ZHANG, Song-chun ZHU

期刊论文

基于计算机视觉的民用基础设施的检查与监测研究进展

Billie F. Spencer Jr.,Vedhus Hoskere,Yasutaka Narazaki

期刊论文

室内导航系统视觉标记性能分析

Gaetano C. LA DELFA,Salvatore MONTELEONE,Vincenzo CATANIA,Juan F. DE PAZ,Javier BAJO

期刊论文

户外空中双机械手抓取设计和视觉伺服

Pablo Ramon-Soria, Begoña C. Arrue, Anibal Ollero

期刊论文