• 中国核心期刊(遴选)数据库收录期刊
  • 中文科技期刊数据库收录期刊
  • 中国学术期刊(光盘版)收录期刊
  • 中国人民大学报刊资料数据库收录期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中国台湾华艺数据库收录期刊

情报探索

• 工作研究 •    

共词方法在三国人物关系分析中的应用研究

王一博 俞敬松 赵常煜   

  1. 王一博1 俞敬松1 赵常煜2
    (1.北京大学软件与微电子学院 北京 102600)(2.北京大学信息管理系 北京 100871)
  • 出版日期:2017-07-27 发布日期:2017-07-27
  • 作者简介:王一博(1992—),男,2016级硕士研究生,研究方向为文本信息处理、Web挖掘。

  • Online:2017-07-27 Published:2017-07-27

摘要: [目的/意义]研究中文信息处理技术、共词分析方法用于分析小说人物关系可行性及其方法。[方法/过程]以《三国演义》为研究对象,提出对小说人物关系进行研究的一般框架,包括数据源的选取、数据处理、词频统计、矩阵生成、结果可视化以及结果分析与解读。利用命名实体识别、共词分析、聚类分析、社会网络分析等研究方法,对小说中的人物进行抽取和统计,构造人物共现关系矩阵并得到可视化结果。[结果/结论]研究结果显示,小说中的核心人物主要有6个,分别是诸葛亮、刘备、关羽、张飞、赵云、曹操。魏、蜀、吴的著名人物形象常常共同出现,其中蜀汉人物间的关系要比曹魏和孙吴间的人物联系更为紧密。6个核心人物不仅两两间有着紧密的联系,而且与其他人物也有紧密的关联性。

关键词: 三国演义, 共词分析, 聚类分析, 战略坐标图, 核心-边缘结构