Search | Engineering

订阅投稿

首页工程期刊工程焦点工程成就工程前沿关于我们 English

资源类型

期刊论文 128

年份

2024 1

2023 18

2022 13

2021 11

2020 11

2019 9

2018 10

2017 12

2016 4

2015 1

2014 1

2013 1

2012 4

2011 1

2010 1

2009 2

2008 5

2007 2

2006 5

2005 2

展开︾

关键词

数据挖掘 7

合成生物学 3

快子 3

OFDM 2

乳液 2

人工智能 2

文本挖掘 2

颠覆性技术 2

饲料工业 2

1)模型 1

3D支架平台 1

3D生物打印 1

5G；交叉振子；双极化天线；终端天线；超宽带 1

AR模型 1

DNA信息存储 1

DNA活字存储系统 1

GDMS 1

GM(1 1

GVG农情采样系统 1

展开︾

检索范围：

排序：展示方式：

基于分布式表示语义组合的查询子主题挖掘 None

Wei SONG, Ying LIU, Li-zhen LIU, Han-shi WANG

《信息与电子工程前沿（英文）》 2018年第19卷第11期页码 1409-1419 doi: 10.1631/FITEE.1601476

摘要：推断查询意图对于信息检索具有重要意义。查询子主题挖掘旨在找到可能的子主题，用于表示给定查询的潜在意图。由于查询较短，子主题挖掘具有挑战性。学习词或句子分布式表示推动和影响了很多领域的发展。然而，没有清晰的结论表明该分布式表示是否有助于应对查询子主题挖掘面临的挑战。提出并比较利用分布式表示的语义组合进行查询子主题挖掘。探索了语义组合策略和数据类型对查询表示的影响。Testbeds and Community for Information Access Research，NTCIR）提供的公开数据集上的实验结果表明，与传统语义表示相比，分布式语义表示能获得更优查询子主题挖掘性能

关键词：查询子主题挖掘；查询意图；分布式表示；语义组合

HTML PDF 收藏

基于同类用户的个性化查询词自动推荐方法 Regular Papers-Research Articles

Dan-yang JIANG, Hong-hui CHEN

《信息与电子工程前沿（英文）》 2019年第20卷第9期页码 1246-1258 doi: 10.1631/FITEE.1800010

摘要：查询词自动推荐（query auto-completion，QAC）通过预测查询词前缀对应的完整补全查询词帮助用户构造查询词。大多互联网搜索引擎利用用户的行为信息为用户提供个性化的查询词自动推荐列表。首先，通过主题模型得到用户的主题兴趣，建立每个用户的兴趣肖像，然后将兴趣肖像相似的用户聚集起来建立同类用户群。由于传统主题模型不能自动识别同类用户，提出两个同类用户主题模型，将主题建模与同类用户识别包含在同一个模型框架内。根据不同的同类用户识别方法，提供4个不同的基于同类用户的个性化QAC方法。所提个性化QAC方法通过同类用户的上下文信息和查询词的频率对补全的查询词排序。在公开的AOL查询词数据集上进行大量实验，并与不采用同类用户上下文信息的方法进行排序性能对比。

关键词：查询词自动推荐；基于同类用户的信息检索；主题模型

HTML PDF 收藏

基于复杂类型数据的发现特征子空间模型(DFSSM)的研究

杨炳儒,唐菁

《中国工程科学》 2003年第5卷第1期页码 56-61

摘要：来定量地表征复杂类型数据的多变性及具有的不确定状态和行为，并用模式的变化来刻画其整体知识发现过程的发展和演变规律；其次，以知识发现系统内在机理的研究为基础，构造了复杂类型数据知识发现系统的总体结构模型——发现特征子空间模型DFSSM；最后，用基于Web的文本挖掘系统和基于图像信息（气象云图）的知识发现系统作为实例进行了验证，结果表明DFSSM方法对于非结构化的文本数据及图像数据类型的知识发现过程具有指导性作用。

关键词：复杂类型数据数据挖掘文本挖掘

HTML PDF 收藏

基于本体和模拟退火算法的暴雨灾害主题爬虫策略 Research Article

刘景发1,2,李帆3,丁若尧1,2,刘子昂4

《信息与电子工程前沿（英文）》 2022年第23卷第8期页码 1189-1204 doi: 10.1631/FITEE.2100360

摘要：目前，主题爬虫是从海量异构网络中获取有效领域知识的重要方法。目前大多数主题爬虫技术难以获得高质量爬行结果。主要难点包括主题基准模型的建立、超链接主题相关性的评估和爬行策略的设计。本文采用领域本体为特定主题构建主题基准模型，并提出一种新的基于局部本体和全局本体的多重筛选策略（MFSLG）。为提高待访问超链接主题相关性计算精度，提出一种基于网页文本和链接结构的综合优先度评估方法（CPEM），同时，采用模拟退火（SA）算法避免主题爬虫陷入局部最优搜索。策略（FCOSA_LG），以从网络中获取与暴雨灾害主题相关的网页。实验结果表明，针对不同性能指标，所提爬虫策略优于其他主题爬虫策略。

关键词：主题爬虫；本体；优先度评估；模拟退火；暴雨灾害

HTML PDF 收藏

基于r-子团最小覆盖的图结构数据高效关键字搜索 Article

Asieh GHANBARPOUR, Khashayar NIKNAFS, Hassan NADERI

《信息与电子工程前沿（英文）》 2020年第21卷第3期页码 448-464 doi: 10.1631/FITEE.1800133

摘要：对图结构数据的查询，关键字搜索是结构化查询语言的一种替代方式。关键字查询的结果是图结构数据上一个连接的结构，其覆盖所有或部分关键字。文本覆盖率和结构紧凑性是评价关键字查询结果是否相关的两个主要属性。本文针对关键字查询结果提出基于r-子团最小覆盖（minimal covered r-clique, MCCr）的概念，作为现有定义的扩展模型，并给出高效算法以检测给定查询的MCCr。这些算法的优势在于不仅可以检索出某个关键字查询的全部非重复MCCr，还可以分布式方式执行。此外，提出这些算法的近似版本，以多项式时间复杂度检索最高的k个近似MCCr。

关键词：关键字搜索；图挖掘；信息检索；数据库；子团

HTML PDF 收藏

面向语义的精简化多关系频繁模式发现方法

杨炳儒,张伟,钱榕

《中国工程科学》 2008年第10卷第9期页码 47-53

摘要：有别于主流基于归纳逻辑程序设计技术的方法，提出了基于合取查询包含关系的面向语义的精简化多关系频繁模式发现方法，具有理论与技术基础的新颖性，解决了两种语义冗余问题。

关键词：多关系数据挖掘频繁模式发现合取查询精简化模式

HTML PDF 收藏

基于最大重要度优先查询的动态剪枝算法

Kun JIANG,Yue-xiang YANG

《信息与电子工程前沿（英文）》 2016年第17卷第1期页码 1-14 doi: 10.1631/FITEE.1500190

摘要：

已经研究了反向索引遍历技术来解决Web搜索引擎的查询处理性能挑战，但是仍然有很多改进的余地。我们提出了另一种新颖的穷举索引遍历方案，称为最大分数优先（LSF）检索，其中首先在具有最大上限分数的重要查询词的发布列表中选择候选者，然后对其余查询词的贡献进行全面评分。该方案可以有效地减少现有的一次性词汇（TAAT）的内存消耗和现有的一次性文档（DAAT）检索的候选选择成本，但以重新访问其余查询词语的发布列表为代价。为了进一步减少需要重新审查的发布数量，我们提出了基于LSF的有效的排名安全动态修剪技术，包括两个重要的优化方法，分别称为列表省略（LSF_LO）和部分计分（LSF_PS），它们充分利用了查询字词的重要性最终，TREC GOV2集合的实验结果表明，我们的新索引遍历方法在WAND基线上将查询延迟减少了近27％，并且与MaxScore基线相比，产生了更好的结果，而返回的结果与详尽评估相同。 >

关键词：倒排索引；索引遍历；查询延迟；最大重要度优先查询；动态剪枝

HTML PDF 收藏

基于文本挖掘的“中国制造”地区行动计划分析

孔德婧董放李昭甫屈贤明

《中国工程科学》 2017年第19卷第3期页码 149-158 doi: 10.15302/J-SSCAE-2017.03.021

摘要：

对各省市自治区“中国制造”地区行动计划重点发展领域的一致性与重点发展子领域的差异性开展分析，是全面了解各省市自治区行动计划的基础本文提出了一种基于文本挖掘包括中文分词、特征筛选、相似度计算的政策文件分析方法，根据该方法所得的结果对各省市自治区行动计划的一致性和差异性进行了分析。

关键词：地区行动计划文本挖掘相似度计算

HTML PDF 收藏

挖掘变化知识的可拓数据挖掘研究

陈文伟

《中国工程科学》 2006年第8卷第11期页码 70-73

摘要：明确了可拓数据挖掘概念以及可拓推理新概念。证明了可拓数据挖掘两个定理和可拓推理公式。提出的从挖掘静态知识的数据挖掘扩展到挖掘变化知识的可拓数据挖掘，为数据挖掘开辟了新的研究方向，并通过实例进行了说明。

关键词：可拓信息可拓知识可拓数据挖掘可拓推理

HTML PDF 收藏

基于内容和引用的科研文献的主题发现和演化 Article

Hou-kui ZHOU, Hui-min YU, Roland HU

《信息与电子工程前沿（英文）》 2017年第18卷第10期页码 1511-1524 doi: 10.1631/FITEE.1601125

摘要：科研文献数据库中的重要主题随时间的演化的方式已经越来越受到全球研究者的关注。在一个科研论文数据集中，任何一篇论文可以被认为是由组成论文本身的词和论文引用的文献所组成的。在本文中，我们提出了一种名为“Citation-content-LDA (latent Dirichlet allocation)”的主题发现方法，该方法在一个概率生成模型中同时生成文献的引用关系和文献本身的词Citation-content-LDA模型利用了一种两层结构的主题模型，即利用引用信息生成父主题和利用文本信息生成子主题。模型参数通过吉布斯采样算法来估计。我们还提出了一个主题演化算法，该算法包括主题分割和主题间依赖关系计算两个步骤。，证明了我们提出的算法能有效的发现重要的主题和反映重要研究主题的主题演化情况。

关键词：主题提取；主题演化；评价方法

HTML PDF 收藏

基于自适应在线双词主题模型的应用程序评论新兴主题识别 Research Article

周芄1,王勇1,2,高翠芸3,杨非4

《信息与电子工程前沿（英文）》 2022年第23卷第5期页码 678-691 doi: 10.1631/FITEE.2100465

摘要：应用程序评论中的新兴主题突出了用户在一定时期内关注的主题（如软件漏洞）。准确、及时地识别新兴主题能帮助开发者更有效地更新应用程序。已有文献基于主题模型或聚类方法识别应用程序评论中的新兴主题。然而，由于评论文本长度较短，提供的信息有限，新兴主题识别准确率较低。为解决该问题，提出一种改进的新兴主题识别方法（IETI）。首先采用自然语言处理技术减少评论文本中的噪音数据，然后使用自适应在线双词主题模型识别评论中的新兴主题。最后利用新兴主题中相关的短语和句子解释新兴主题的含义。采用官方更新日志作为新兴主题的评估标准，选择6个常见的应用程序对IETI进行评估。实验结果表明，IETI在识别新兴主题方面优于传统方法，短语标签F1值增量为0.126，句子标签F1值增量为0.061。

关键词：应用程序评论；新兴主题识别；主题模型；自然语言处理

HTML PDF 收藏

免疫进化机制及其在时序模式挖掘中的应用研究

杨炳儒,秦奕青,宋泽锋

《中国工程科学》 2008年第10卷第4期页码 84-89

摘要：

针对目前动态数据挖掘中存在的问题，提出基于数据增量的动态挖掘进程概念；在动态挖掘进程和生物免疫进化过程的相似性基础上，提出了知识发现中的免疫进化机制的基本内涵；给出了基于免疫进化机制的时序模式挖掘算法及其实验分析，以验证理论的正确性和有效性。

关键词：动态数据挖掘免疫算法动态挖掘进程免疫进化机制时序模式挖掘

HTML PDF 收藏

关联规则挖掘算法综述

毕建欣,张岐山

《中国工程科学》 2005年第7卷第4期页码 88-94

摘要：

介绍了关联规则挖掘算法的基本原理，并按照挖掘中涉及到的变量数目（维数）、数据的抽象层次和处理变量的类别（布尔型和数值型），依次对关联规则挖掘算法的研究进行综述，并对一些典型的算法进行分析和比较，最后展望了关联规则挖掘算法的研究方向

关键词：数据挖掘关联规则算法综述

HTML PDF 收藏

基于机器学习的抄袭源检索的查询生成方法 Article

Lei-lei KONG, Zhi-mao LU, Hao-liang QI, Zhong-yuan HAN

《信息与电子工程前沿（英文）》 2017年第18卷第10期页码 1556-1572 doi: 10.1631/FITEE.1601344

摘要：使用从可疑文档提取的查询来检索抄袭源已成为抄袭源检索的标准方法。从可疑文档生成查询是源检索最重要的步骤。当前研究主要使用了基于启发式的查询生成方法。然而，每个启发式方法都有其优点，不同方法生成的查询可以获得不同的源检索结果，没有一种方法生成的查询的源检索性能可以在所有的文本片段上具有统计有效性地优于其他方法。这使得基于启发式的源检索查询生成方法的性能改善主要依赖专家经验。因此，很难开发一种可以克服现有启发式方法的新方法。本文提出使用统计机器学习方法解决源检索的查询生成问题，将源检索的查询生成形式化到一个排序学习的框架下，从备选查询中选择有利于提高源检索性能的查询，力争在每个可疑文档片段上获得最优的源检索性能。据我们所知，这是第一项应用机器学习方法解决源检索查询生成问题的工作。为了解决排序学习训练用例的缺失，提出了基于现有源检索语料构建查询生成语料的方法。

关键词：抄袭检测；源检索；查询生成；机器学习；排序学习

HTML PDF 收藏

可拓学在数据挖掘中的应用初探

李立希,李铧汶,杨春燕

《中国工程科学》 2004年第6卷第7期页码 53-59

摘要：

可拓学在数据挖掘中的应用是多方面的，其特点是挖掘“不行变行”的规律。可拓方法丰富了数据挖掘的内容，为多值型关联规则的建立提供了新的工具。提出的可拓数据挖掘模式，有利于利用现存数据更好地为决策服务。

关键词：可拓学可拓集合可拓方法数据挖掘