• 中国核心期刊(遴选)数据库收录期刊
  • 中文科技期刊数据库收录期刊
  • 中国学术期刊(光盘版)收录期刊
  • 中国人民大学报刊资料数据库收录期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中国台湾华艺数据库收录期刊

情报探索

• 综述述评 •    

微博文本挖掘研究综述*

余容 李光强 尹健   

  1. (中南大学地球科学与信息物理学院 湖南长沙  410012)
  • 出版日期:2017-05-22 发布日期:2017-05-22
  • 作者简介:余容(1990—),女,2014级硕士研究生。
  • 基金资助:
    *本文系长沙市科技计划项目“面向城市公共安全的网络众源信息分析系统开发”(项目编号:K1508028-11)研究成果之一。

  • Online:2017-05-22 Published:2017-05-22

摘要:

[目的/意义]梳理国内外微博文本挖掘的研究现状,展望未来的研究方向。[方法/过程]介绍微博文本挖掘的背景和意义,从微博的数据获取、文本语义挖掘方法及应用研究3个方面,对比微博数据获取的不同方式,分析文本预处理过程和文本处理的若干方法,总结当前微博数据的应用现状。[结果/结论]微博数据获取技术主要有基于API、基于网络爬虫和基于网络数据流3种方式;微博文本挖掘涉及文本分类和聚类、话题检测、情感分析等方法;微博数据在舆情分析、商业营销及社会服务等方面已经得到广泛应用。

关键词: 文本挖掘, 分类和聚类, 话题检测, 情感分析