• 中国核心期刊(遴选)数据库收录期刊
  • 中文科技期刊数据库收录期刊
  • 中国学术期刊(光盘版)收录期刊
  • 中国人民大学报刊资料数据库收录期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中国台湾华艺数据库收录期刊

情报探索

• 研究生园地 •    

基于Hadoop的信息检索系统研究

孙永超   

  1. (上海大学图书情报档案系 上海 200444)
  • 出版日期:2016-08-19 发布日期:2016-08-19
  • 作者简介:孙永超(1990—),男,2015级硕士研究生。

  • Online:2016-08-19 Published:2016-08-19

摘要: [目的/意义] 探讨分布式信息检索系统设计,解决大数据背景下传统信息检索系统效率低下而不能满足检索需求的问题。[方法/过程]从Hadoop框架着手,探讨基于Hadoop的分布式信息检索系统,提出改进构想,并通过实验验证其可行性。[结果/结论]提出对输入数据流采用预处理方式替代批处理方式的构想,实验验证了该构想的可行性。Hadoop框架已成功应用于多个领域,但是其中的MapReduce算法及算法效率优化有待研究。

关键词: Hadoop, Mapreduce, 分布式处理, 信息检索, 键值对