• 中国核心期刊(遴选)数据库收录期刊
  • 中文科技期刊数据库收录期刊
  • 中国学术期刊(光盘版)收录期刊
  • 中国人民大学报刊资料数据库收录期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中国台湾华艺数据库收录期刊

情报探索

• 理论探索 •    

面向公共安全领域的词典构建 及其舆情事件识别研究*

王连喜1,2   

  1. 1.广东外语外贸大学非通用语种智能处理重点实验室广东广州510006   2.广东外语外贸大学信息科学与技术学院广东广州510006
  • 出版日期:2020-03-16 发布日期:2020-03-17
  • 通讯作者: 王连喜(1985—),男,博士,副研究员,硕士生导师,研究方向为涉华网络舆情分析、数据挖掘。
  • 基金资助:
    *本文系国家社会科学基金青年项目“东盟涉华舆情的观点挖掘及信息聚合研究”(项目编号:17CTQ045)成果之一。

  • Online:2020-03-16 Published:2020-03-17

摘要: [目的/意义]旨在提出一种基于领域词典的突发公共安全领域舆情事件自动识别方法,有效识别公共安全领域的热点舆情事件,预防危机舆情事件,提高政府公信力。[方法/过程]首先以中国应急服务网中的公共安全事件语料为数据来源,提取并筛选公共安全领域的高频词汇;然后结合人工干预方式选择部分高频且与领域高度相关的种子词;随后以互信息方法计算种子词与语料中的其他词汇共现概率(点互信息),同时以与种子词具有较高点互信息的词汇作为领域候选词,并结合人工审核方式对候选词汇进行调整。最后在对待识别语料进行文本表示的基础上,将其与词典中的领域词汇进行匹配,并以语料中出现的公共安全领域词汇的数量和权重来判断待识别语料是否为突发公共安全舆情事件。[结果/结论]在标注语料上的实验结果表明,与经典的NaiveBayes方法相比,提出的方法能够有效提高公共安全领域热点舆情事件的识别准确率。

关键词: 领域词典, 热点舆情, 突发公共安全事件, 事件识别