期刊首页 优先出版 当期阅读 过刊浏览 作者中心 关于期刊 English

《信息与电子工程前沿(英文)》 >> 2016年 第17卷 第1期 doi: 10.1631/FITEE.1500190

基于最大重要度优先查询的动态剪枝算法

College of Computer, National University of Defense Technology, Changsha 410073, China

收稿日期: 2015-06-06 录用日期: 2016-01-05 发布日期: 2016-01-11

下一篇 上一篇

摘要

已经研究了反向索引遍历技术来解决Web搜索引擎的查询处理性能挑战,但是仍然有很多改进的余地。在本文中,我们将重点放在文档排序索引的倒排索引遍历和称为动态修剪的优化技术上,该技术可以有效地减少所需的硬件计算资源。我们提出了另一种新颖的穷举索引遍历方案,称为最大分数优先(LSF)检索,其中首先在具有最大上限分数的重要查询词的发布列表中选择候选者,然后对其余查询词的贡献进行全面评分。该方案可以有效地减少现有的一次性词汇(TAAT)的内存消耗和现有的一次性文档(DAAT)检索的候选选择成本,但以重新访问其余查询词语的发布列表为代价。初步分析和实施表明,LSF和两个众所周知的基准之间的性能相当。为了进一步减少需要重新审查的发布数量,我们提出了基于LSF的有效的排名安全动态修剪技术,包括两个重要的优化方法,分别称为列表省略(LSF_LO)和部分计分(LSF_PS),它们充分利用了查询字词的重要性。最终,TREC GOV2集合的实验结果表明,我们的新索引遍历方法在WAND基线上将查询延迟减少了近27%,并且与MaxScore基线相比,产生了更好的结果,而返回的结果与详尽评估相同。 >

相关研究