资源类型

期刊论文 226

年份

2024 1

2023 33

2022 24

2021 19

2020 20

2019 25

2018 15

2017 16

2016 13

2015 5

2014 3

2013 5

2012 3

2011 3

2010 5

2009 1

2008 7

2007 4

2006 5

2005 1

展开 ︾

关键词

大数据 8

数据挖掘 7

机器学习 5

人工智能 4

区块链 3

分布式系统 2

工业大数据 2

数据集成 2

数据驱动方法 2

智能制造 2

材料设计 2

环境一号卫星 2

结构健康监测 2

雾计算 2

预测 2

ACMR 1

BDS/GPS双系统定轨 1

BDS码偏差 1

BP算法 1

展开 ︾

检索范围:

排序: 展示方式:

基于流形学习的离群点检测方法

徐雪松,宋东明,张谞,许满武,刘凤玉

《中国工程科学》 2009年 第11卷 第2期   页码 82-87

摘要:

为了提高高维数据集合离群数据挖掘效率,提出了一种基于流形学习的离群点检测算法。根据LLE算法的思想寻找样本数据的内在嵌入分布,并通过邻域数选取和降维后数据点之 间的距离调整,提高了数据集中离群点发现效率,同时利用离群点权值判别式进行权值数据判定,根据权值 的大小标识出数据集中的离群点,仿真实验的结果表明了该方法能够有效地发现高维数据集中的离群点。与此同时,该算法具有参数估计简单、参数影响不大等优点,该算法为离群点检测问题的机器学习提供了一 条新的途径。

关键词: 流形学习     离群点检测     高维数据     维数约减     离群数据    

基于非线性数据变换的离群点检测算法

徐雪松,张谞,宋东明,张宏,刘凤玉

《中国工程科学》 2008年 第10卷 第9期   页码 74-78

摘要:

为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群点检测算法,首先将非线性问题转化为高维特征空间中的线性问题,然后利用非线性数据变换进行维数约减,对所得数据对象每个投影分量逐个判断数据点是否是离群点,通过实验证明该算法不仅可用于线性可分数据集的离群点检测,而且可用于线性不可分数据集的离群点检测,表明了算法的优越性

关键词: 维数消减     核函数     主成分     离群数据    

基于复杂类型数据的发现特征子空间模型(DFSSM)的研究

杨炳儒,唐菁

《中国工程科学》 2003年 第5卷 第1期   页码 56-61

摘要: 首先,根据复杂类型数据(包括Web数据、多媒体数据、空间数据、时间序列数据等)所具有的非线性动力学性质和特征,采用模式(定义为Hilbert空间中的矢量)来定量地表征复杂类型数据的多变性及具有的不确定状态和行为,并用模式的变化来刻画其整体知识发现过程的发展和演变规律;其次,以知识发现系统内在机理的研究为基础,构造了复杂类型数据知识发现系统的总体结构模型——发现特征子空间模型DFSSM;最后,用基于Web的文本挖掘系统和基于图像信息(气象云图)的知识发现系统作为实例进行了验证,结果表明DFSSM方法对于非结构化的文本数据及图像数据类型的知识发现过程具有指导性作用。因此,该结构模型具有较好的实用性与普适性,有望拓展到其他复杂类型数据的知识发现过程中。

关键词: 复杂类型数据     数据挖掘     文本挖掘    

数据存储技术综述 Review

Aisha SIDDIQA, Ahmad KARIM, Abdullah GANI

《信息与电子工程前沿(英文)》 2017年 第18卷 第8期   页码 1040-1070 doi: 10.1631/FITEE.1500441

摘要: 对于容量快速增长、日趋多元化的大数据,业界亟需开发可行性更好的存储工具。为满足大数据存储需求,存储机制已经形成从传统数据管理系统到NoSQL技术的结构化转移。然而,目前可用的大数据存储技术无法为持续增长的异构数据提供一致、可扩展和可用的解决方案。在科学实验、医疗保健、社交网络和电子商务等实际应用中,存储是大数据分析的第一步。截至目前,亚马逊、谷歌和阿帕奇等公司形成了大数据存储方案的行业标准,但尚未有关于大数据存储技术性能和容量提升的深入调查和文献报告。本文旨在对目前可用于大数据的最先进的存储技术进行全面调查,提供了一个明确的大数据存储技术分类方法,以帮助数据分析师和研究人员了解和选择更适合其需求的存储机制。我们使用布鲁尔的CAP定理比较和分析了现有存储方法,评估了不同存储架构的性能,讨论了存储技术的意义、应用及其对其他类别数据的支持。

关键词: 数据;大数据存储;NoSQL数据库;分布式数据库;CAP定理;可扩展性;一致性-分区弹性;可用性-分区弹性    

立足数据共享促进国家对地观测数据中心顺利建设

郭建宁,陆书宁,赵祥

《中国工程科学》 2008年 第10卷 第6期   页码 70-75

摘要:

文章分析了国外对地观测数据处理中心的发展趋势,指出了我国对地观测数据管理中存在的问题与差距,提出了我国对地观测数据中心的建设方案:建立数据处理中心并提供深层次服务;建立数据共享机制,促进数据共享与服务;资源优化与整合。为了促进陆地观测数据共享与应用,必须建立国家陆地观测数据中心,建立的数据中心包括数据处理、归档、分发与服务。国家对地观测数据中心必将改善对地观测数据共享与应用,满足对地观测数据的需求。

关键词: 遥感卫星     对地观测     数据共享     数据中心    

数据生态系统——数据

Zi-Kui Liu

《工程(英文)》 2020年 第6卷 第6期   页码 604-608 doi: 10.1016/j.eng.2020.04.009

基于数据互联服务的隧道新奥法施工构想与初探 Article

杜博文, 杜彦良, 徐飞, 贺鹏

《工程(英文)》 2018年 第4卷 第1期   页码 123-130 doi: 10.1016/j.eng.2017.07.002

摘要: 针对上述问题,本文提出了一种基于互联网大数据支持环境下的隧道施工数据服务系统,通过对已施工案例中各检测器结果进行标记,建立同场景下施工相关参数的关联,利用工程案例的积累不断补充和完善,实现相似环境下的参数提取,为同类场景下施工方案设计、施工资源的合理分配提供数据支撑,为后续工程设计、施工提供依据。

关键词: 新奥法     数据环境     数据服务     隧道施工    

面向数据权利、数据定价和隐私计算的数据驱动学习 Review

徐基珉, 洪暖欣, 许哲宁, 赵洲, 吴超, 况琨, 王嘉平, 朱明杰, 周靖人, 任奎, 杨小虎, 卢策吾, 裴健, 沈向洋

《工程(英文)》 2023年 第25卷 第6期   页码 66-76 doi: 10.1016/j.eng.2022.12.008

摘要:

近年来,数据已成为数字经济中最重要的生产要素之一。与传统生产要素不同,数据的数字化性质使其难以合同和交易。因此,建立一个高效和标准的数据交易市场体系将有利于降低成本,提高行业各方的生产力。尽管许多研究致力于数据法规和其他数据交易问题,如隐私和定价,但很少有工作对机器学习和数据科学领域的这些研究进行全面回顾。为了提供对这个主题的完整和最新的理解,本文涵盖了数据交易过程中的三个关键问题:数据权利、数据定价和隐私计算。通过厘清这些主题之间的关系,本文提供了一个数据生态系统的全貌,其中数据由个人、研究机构和政府等数据主体生成,而数据处理者出于创新或运营目的获取数据,并通过适当的定价机制根据数据主体各自的所有权分配收益。为了使人工智能(AI)能够长期有益于人类社会的发展,人工智能算法需要通过数据保护法规(即隐私保护法规)进行评估,以帮助构建日常生活中值得信赖的人工智能系统。

关键词: 数据科学     人工智能     数据权利     数据定价     隐私计算    

Fog-IBDIS——基于雾计算的制造系统大数据集成方法 Article

汪俊亮, 郑鹏, 吕佑龙, 鲍劲松, 张洁

《工程(英文)》 2019年 第5卷 第4期   页码 662-670 doi: 10.1016/j.eng.2018.12.013

摘要:

在工业领域,如何在多源工业数据的协作分析中保障源数据的私密性与安全性至关重要。本文提出了一种基于雾计算的工业大数据集成与共享方法(Fog-IBDIS),采用云端与边缘端协作的方式,实现工业数据的分布式本地处理,在多源数据的分析中保障源数据的私密性与安全性。首先,在云端设计了任务流图,将多源数据分析过程分解成多个子任务;其次,设计了子任务管理、编译和运行控制、数据集成传输、基本算法库和管理组件五个模块,实现子任务的本地边缘端处理;最后,本文以大型客机制造过程为例,对Fog-IBDIS的运行过程进行了验证,其通过边缘与云端的协作方式,将多来源数据分析任务分解至本地执行,通过中间结果的传输串联实现工业大数据的分析,可保障原始数据的私密性与安全性。

关键词: 雾计算     工业大数据     多源数据     数据集成    

面向金融场景的下一代数据库测试基准研究

荆一楠 ,张寒冰,李智鑫 ,王晓阳 ,吴杰,柴洪峰

《中国工程科学》 2022年 第24卷 第4期   页码 121-132 doi: 10.15302/J-SSCAE-2022.04.014

摘要: 随着金融数据应用服务的 快速发展,银行数据库所涉及的数据类型、业务场景更加多样化,用户很难在种类繁多的数据库产品和数据服务解决方案中 做出最优选择。例如,针对社交网络中的数据分析任务,使用以Neo4j为代表的图数据库能够比传统关系型数据库更好地表征数据关系;而针对海量数据分析需求,选用分布式数据库更能有效应对大数据和高并发的请求处理。目前大多数测试基准都是通过设置与真实数据相似的数据规模、数据结构、数据分布和数据相关性等生成尽可能贴近真实数据的测试数据集 []。面向键值数据与列簇式存储的测试基准

键值数据库与列簇式数据库是NoSQL数据库中较为常见的两类数据库,主要用于加速系统中数据查找效率。测试数据生成问题

现有的测试基准一般通过模拟真实数据中的数据结构、数据规模、数据分布、数据相关性等因素来生成测试数据,为数据库产品的性能测试提供数据支撑。

关键词: 金融业     银行     金融数据     数据    测试基准    

标准参考数据的科学内涵及发展战略研究

方向,于连超,任思源,熊行创⁠

《中国工程科学》 2023年 第25卷 第3期   页码 230-238 doi: 10.15302/J-SSCAE-2023.07.021

摘要:

标准参考数据是一类高质量科学数据,兼具计量科学特征和技术标准属性,是国家重要的科技基础和战略资源。我国标准参考数据的研究与建设基本处于空白状态,大幅落后于国际先进水平,造成科学研究和生产的系统性风险。本文详细阐明标准参考数据的科学内涵、外延特征及其战略价值,深度分析美国标准参考数据的发展脉络、管理体系、国际影响及其实践应用,在此基础上梳理我国标准参考数据发展现状,重点指出其中存在的概念不清晰、顶层设计不足、数据资源积累匮乏、管理体系缺失等关键问题,并系统地设计了我国标准参考数据建设路径。研究建议,建立健全标准参考数据政策制度体系;强化研究与建设经费保障;加强宣传教育,加快人才培养;汇集多方力量,加大国际合作。

关键词: 科学数据;计量溯源;标准化;标准参考数据    

智能过程制造中的数据解析与机器学习——大数据时代的最新进展与展望 Perspective

尚超、 Fengqi You

《工程(英文)》 2019年 第5卷 第6期   页码 1010-1016 doi: 10.1016/j.eng.2019.01.019

摘要: 蓬勃发展的大数据时代对流程工业产生了巨大的影 响,为实现智能制造提供了前所未有的机遇。这种新的生产方式不仅要求机器能够帮助人类减轻 繁重的体力劳动,还要能有效地承担智力劳动,甚至能够实现自主创新。在本文中,我们回顾了数据分析和机器学习在工业生 产过程监控、控制和优化方面的最新进展,着重分析机器学习模型的可解释性和功能性。通过分 析实际需求与研究现状之间的差距,为未来的研究方向给出了建议。

关键词: 数据     机器学习     智能制造     过程系统工程    

挖掘变化知识的可拓数据挖掘研究

陈文伟

《中国工程科学》 2006年 第8卷 第11期   页码 70-73

摘要: 明确了可拓数据挖掘概念以及可拓推理新概念。证明了可拓数据挖掘两个定理和可拓推理公式。提出的从挖掘静态知识的数据挖掘扩展到挖掘变化知识的可拓数据挖掘,为数据挖掘开辟了新的研究方向,并通过实例进行了说明。

关键词: 可拓信息     可拓知识     可拓数据挖掘     可拓推理    

一种基于制造大数据的产品工艺自适应设计方法

魏巍,陈政,袁君

《中国工程科学》 2020年 第22卷 第4期   页码 42-49 doi: 10.15302/J-SSCAE-2020.04.017

摘要: 本文旨在面向企业数据与业务深度融合的应用需求,提出一种基于制造大数据挖掘的产品工艺自适应设计应用方法,用于解决企业中制造数据利用率不足等问题。以企业制造数据为起点,提出了“数据 + 知识 + 决策”的产品工艺自适应设计模式,总结了该模式的制造数据挖掘与利用流程,涵盖多源异构数据融合、数据清洗与预处理、数据变换与降维、数据挖掘、数据可视化和设计决策6个过程。研究表明,制造大数据蕴含丰富的知识与模式,可以指导产品设计决策,支持实现不同制造环境下的产品工艺自适应设计;建议进一步推动大数据与第五代移动通信技术等新兴技术的结合,增加对大数据平台、算法设计平台研发的投入,激发制造大数据与产品工艺设计的更大交融。

关键词: 产品工艺,自适应设计,制造大数据数据挖掘,知识发现    

多处理器系统中的数据局部性及其优化技术研究

杨学军,戴华东,夏军

《中国工程科学》 2002年 第4卷 第5期   页码 44-52

摘要:

数据局部性是多处理器系统中的重要研究方向之一。结合该领域目前国内外研究现状和我们近一阶段的研究进展,讨论了多处理器系统中的数据局部性及其优化问题。在静态和动态局部性优化技术方面,分别探讨了基于投影分层的数据变换框架和基于瞬时访问信息的动态页迁移策略,并展开了系列相关的讨论。另外,针对利用数据局部性时必须解决的一个关键问题——存储一致性问题,进行了深入的研究,提出了以操作系统为中心的线程存储一致性模型。

关键词: 计算机     多处理器系统     数据局部性     局部性度量模型     数据变换框架     页迁移     线程一致性模型    

标题 作者 时间 类型 操作

基于流形学习的离群点检测方法

徐雪松,宋东明,张谞,许满武,刘凤玉

期刊论文

基于非线性数据变换的离群点检测算法

徐雪松,张谞,宋东明,张宏,刘凤玉

期刊论文

基于复杂类型数据的发现特征子空间模型(DFSSM)的研究

杨炳儒,唐菁

期刊论文

数据存储技术综述

Aisha SIDDIQA, Ahmad KARIM, Abdullah GANI

期刊论文

立足数据共享促进国家对地观测数据中心顺利建设

郭建宁,陆书宁,赵祥

期刊论文

数据生态系统——数据

Zi-Kui Liu

期刊论文

基于数据互联服务的隧道新奥法施工构想与初探

杜博文, 杜彦良, 徐飞, 贺鹏

期刊论文

面向数据权利、数据定价和隐私计算的数据驱动学习

徐基珉, 洪暖欣, 许哲宁, 赵洲, 吴超, 况琨, 王嘉平, 朱明杰, 周靖人, 任奎, 杨小虎, 卢策吾, 裴健, 沈向洋

期刊论文

Fog-IBDIS——基于雾计算的制造系统大数据集成方法

汪俊亮, 郑鹏, 吕佑龙, 鲍劲松, 张洁

期刊论文

面向金融场景的下一代数据库测试基准研究

荆一楠 ,张寒冰,李智鑫 ,王晓阳 ,吴杰,柴洪峰

期刊论文

标准参考数据的科学内涵及发展战略研究

方向,于连超,任思源,熊行创⁠

期刊论文

智能过程制造中的数据解析与机器学习——大数据时代的最新进展与展望

尚超、 Fengqi You

期刊论文

挖掘变化知识的可拓数据挖掘研究

陈文伟

期刊论文

一种基于制造大数据的产品工艺自适应设计方法

魏巍,陈政,袁君

期刊论文

多处理器系统中的数据局部性及其优化技术研究

杨学军,戴华东,夏军

期刊论文