• 中国核心期刊(遴选)数据库收录期刊
  • 中文科技期刊数据库收录期刊
  • 中国学术期刊(光盘版)收录期刊
  • 中国人民大学报刊资料数据库收录期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中国台湾华艺数据库收录期刊

情报探索

• 理论探索 •    

基于专家主页的专家信息抽取方法研究*

曹洪飞 顾复 张今等   

  1. 浙江大学工业与系统工程系浙江杭州310027
  • 出版日期:2019-12-30 发布日期:2019-12-30
  • 通讯作者: 曹洪飞(1993—),男,2016级硕士研究生,研究方向为知识管理、数据挖掘;顾复(1985—),男,博士,研究方向为制造业信息化,知识图谱、绿色创新;张今(1995—),男,2017级博士生,研究方向为知识管理、数据挖掘。
  • 基金资助:
    *本文系国家重点研发计划课题“科技资源分享模型与开放分享理论”(项目编号:2017YFB1400302)研究成果之一。

  • Online:2019-12-30 Published:2019-12-30

摘要: [目的/意义]旨在为企业建立自己的专家信息库提供参考。[方法/过程]构建一个统一的专家信息元数据框架,对专家信息进行了规范化描述;对专家主页的网页标题、网页URL和网页内容等进行了分析,并从中提取特征进行专家主页的识别;构建一个自适应多种主页类型的Bi-LSTM-CRF专家信息抽取模型,并对模型性能进行了实验分析。[结果/结论]基于专家主页的专家信息抽取方法能够利用机器学习技术从海量的Web页面中有效识别专家主页,并且通过改进的信息抽取模型从专家主页中自动抽取企业所需要的专家信息。本文提出的方法是有效的。

关键词: 专家资源, 元数据框架, 专家主页识别, 专家信息抽取