• 中国核心期刊(遴选)数据库收录期刊
  • 中文科技期刊数据库收录期刊
  • 中国学术期刊(光盘版)收录期刊
  • 中国人民大学报刊资料数据库收录期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中国台湾华艺数据库收录期刊

情报探索

• 工作研究 •    

基于主题模型的技术预见文本分析*

吕皓 周晓纪   

  1. (中国航天系统科学与工程研究院 北京 100048)
  • 出版日期:2018-10-23 发布日期:2018-10-23
  • 作者简介:吕皓(1993—),男,2015级硕士研究生;周晓纪(1974—),女,研究员。
  • 基金资助:
    *本文系中国工程院重大咨询项目“中国工程科技2035发展战略研究”(项目编号:2015-ZD-14)和中国工程院、国家自然科学基金委员会联合基金资助项目 “2035 发展战略技术预见方法研究”(项目编号:NSFC-L1524024)成果之一。

  • Online:2018-10-23 Published:2018-10-23

摘要: [目的/意义]通过主题模型分析和文本降维的方法,为“中国工程科技2035技术预见”提供备选技术方向的分析研究方案。[方法/过程]利用隐含狄利克雷分布(LDA)对中国工程科技2035的11个不同领域进行话题分析,同时通过T-分布邻域嵌入算法对技术项文本进行降维处理,将对应的技术项文本投影到二维平面上。[结果/结论]LDA模型可用于提取主题,确定技术项在主题上的概率分布,实现技术预见下技术项目的话题分布挖掘。文本形式数据的降维使用T-SNE法更为妥当。T-SNE方法的技术项可视化分析方法能够支撑专家对技术项(特别是交叉领域的技术项)所属领域进行分析,实现对不同领域技术方向的直观平面展示,有助于各领域整体把握所属领域的技术方向以及相关领域的技术方向。

关键词: 技术预见, 文本挖掘, 主题模型, 可视化