• 中国核心期刊(遴选)数据库收录期刊
  • 中文科技期刊数据库收录期刊
  • 中国学术期刊(光盘版)收录期刊
  • 中国人民大学报刊资料数据库收录期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中国台湾华艺数据库收录期刊

情报探索 ›› 2020, Vol. 1 ›› Issue (11): 1-.

• 综述述评 •    

基于文本聚类的主题发现方法研究综述*

李璐萍1,2赵小兵1,2   

  1. 1.中央民族大学信息工程学院北京100081  2.中央民族大学国家语言资源监测与研究少数民族语言中心北京100081
  • 出版日期:2020-11-18 发布日期:2020-11-19
  • 通讯作者: 李璐萍(1997—),女,2019级硕士研究生,主要研究方向为信息与教育技术;赵小兵(1967—),女,博士,教授、博士生导师,主要研究方向为自然语言处理和计算语言学,发表论文109篇。
  • 基金资助:
    *本文系国家语委重点项目“蒙汉文本机器翻译关键技术”(项目编号:ZD1135-39)研究成果之一。

  • Online:2020-11-18 Published:2020-11-19

摘要: 目的/意义]对基于文本聚类的主题发现研究成果进行了梳理,旨在为今后学者开展该领域的相关研究提供参考和借鉴。[方法/过程]重点阐述和分析了基于共词分析法、基于改进的划分聚类算法和层次聚类算法以及其他基于聚类方法的主题发现技术,并对目前主题发现领域的最新方法和发展趋势进行了分析和展望。[结果/结论]目前基于文本聚类的主题发现领域下的理论研究较为成熟但整体还处于探索阶段,未来应继续深化技术和方法上的创新研究。

关键词: 主题发现, 文本聚类, 聚类算法