学科背景知识在医学文本特征抽取中的应用
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金项目“基于语义的医学领域前沿知识发现及演化机制研究”(项目编号:71303259);中央级公益性科研院所基本科研业务费“面向医学科技评价的多源异构数据处理机制研究”(项目编号:2016ZX33 0027)。


Application of Disciplinary Background Knowledge in Medical Text Feature Extraction
Author:
Affiliation:

Fund Project:

  • 摘要
  • 图/表
  • 访问统计
  • 参考文献
  • 相似文献
  • 引证文献
  • 资源附件
  • 文章评论
    摘要:

    分析目前科技文献文本特征抽取方法研究现状,将基于背景知识的TF-IDF方法应用到医学文本特征抽取中,在4个医学领域中进行试验对比,结果表明该方法在抽取词汇数量较少时可以显著提高抽取效果,在对文本集合中通用词的过滤及重要特征词的识别方面明显优于使用通用IDF的TF-IDF方法。

    Abstract:

    The paper analyzes the conditions of research on the current scientific literature text feature extraction methods, applies the TF-IDF method based on background knowledge in the medical text feature extraction, and conducts experimental comparison in four medical fields. The result indicates that this method can obviously improve the extraction effect when there are few vocabularies to be extracted, and is obviously superior to the IDF based TF-IDF method in the aspects of filtration of commonly-used words in the text set and identification of important feature words.

    参考文献
    相似文献
    引证文献
引用本文

赵迎光,范少萍,安新颖.学科背景知识在医学文本特征抽取中的应用[J].医学信息学杂志,2017,38(4):50-54,81

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2016-12-23
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2017-05-06
  • 出版日期:

扫码关注

官方微信