• 中国核心期刊(遴选)数据库收录期刊
  • 中文科技期刊数据库收录期刊
  • 中国学术期刊(光盘版)收录期刊
  • 中国人民大学报刊资料数据库收录期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中国台湾华艺数据库收录期刊

情报探索 ›› 2024, Vol. 1 ›› Issue (2): 1-.

• 理论探索 •    

基于隐含空间模型降维和LDA 模型的学科主题识别研究*

  

  1. (1. 上海大学文化遗产与信息管理学院 上海 200444)

    (2. 南京农业大学信息管理学院 江苏南京 210003)

  • 出版日期:2024-02-15 发布日期:2024-04-12
  • 作者简介:王婧(2000—),女,2021 级硕士研究生,研究方向为信息服务、信息资源管理;武帅(1994—),男,工程师,2022 级博士研究生,通讯作者,研究方向为文本挖掘、信息资源管理。
  • 基金资助:

    *本文系贵州省科技计划项目“基于大数据及图像识别的水族文献及濒危水书抢救性整理研究”(项目编号:[2020]1Y279);贵州财经大学2021 年度校级项目“AI 大数据赋能的贵州濒危水书和水族古籍识别与抢救研究”(项目编号:2021KYQN03)成果之一。

  • Online:2024-02-15 Published:2024-04-12

摘要:

[目的/意义]现有学科研究主题的梳理多为领域专家的定性分析和学科学者的文献梳理,一定程度会由于研究思维的局限性和获取知识的片面性造成学科研究主题误判,为有效避免漏判误判现象的发生,提出识别模型。[ 方法/ 过程] 首先,运用传统LDA 模型分析主题特征词;其次,结合上下文语义信息进行中文分词,形成学科主题词库;最后,结合隐含位置聚类算法发现潜在社区,提高主题识别效果。[ 结果/ 结论] 提出的方法一定程度上优化了主题挖掘算法在识别短文本主题的效果,消除主观意愿。由计算机自行分类并实现科学研究前沿主题的预测,揭示前沿领域的研究热点,为致力于研究前沿学科的新兴学者提供参考价值。

关键词:

学科主题识别, LDA 主题挖掘, 图书情报与档案管理学科词库, 隐含位置聚类模型, 共词网络