• 中国核心期刊(遴选)数据库收录期刊
  • 中文科技期刊数据库收录期刊
  • 中国学术期刊(光盘版)收录期刊
  • 中国人民大学报刊资料数据库收录期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中国台湾华艺数据库收录期刊

情报探索

• 理论探索 •    

利用概念化的少样本短文本分类研究

沈炜域 刘奇飞   

  1. (中国人民公安大学信息技术与网络安全学院 北京 100038)
  • 出版日期:2018-12-27 发布日期:2018-12-27
  • 作者简介:沈炜域(1993—),男,2016级硕士研究生,主要研究方向为文本挖掘、内容安全;刘奇飞(1994—),男,2016级硕士研究生,主要研究方向为信息安全、大数据。

  • Online:2018-12-27 Published:2018-12-27

摘要: [目的/意义]旨在为用户和管理者的短文本分类管理提供参考。[方法/过程]利用开放知识库完成词粒度的概念化,将CWE预训练得到的词嵌入与实例的概念化表示拼接合成文本表示,并利用相似度的计算预测待标注短文本的类别。[结果/结论]结果表明了在少样本的情况下,该方法分类效果优于实验涉及的其他文本分类模型。

关键词: 少样本学习, 词嵌入, 概念化, 文本分类