精准医学文本语料库构建研究
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家重点研发计划"精准医学文本知识网络构建"子课题"精准医学文本语料库构建"(项目编号:2016YFC0901902-2);国家自然科学基金项目"面向精准医学的基因-疾病-药物语义关义抽取研究"(项目编号:71704188);中央级基本科研业务费项目"临床医学高层次人才科研能力评价研究"(项目编号:2018TX63002)。


Study on the Building of Precision Medicine Text Corpus
Author:
Affiliation:

Fund Project:

  • 摘要
  • 图/表
  • 访问统计
  • 参考文献
  • 相似文献
  • 引证文献
  • 资源附件
  • 文章评论
    摘要:

    利用BRAT标注工具及人工标注方法,根据初步制定的文本语料标注规范,按照语料选择、语料预处理、语料标注、标注校对、一致性检验的流程开展语料标注工作,构建包含2 000篇文本语料的精准医学文本语料库,为相关实体与关系抽取算法研究以及精准医学知识网络构建提供有效的资源支持。

    Abstract:

    Using BRAT annotation tool and manual annotation method, according to the preliminary text corpus annotation specifications, the corpus annotation is carried out in accordance with the procedures of corpus selection, corpus preprocessing, corpus annotation, annotation proofreading, and consistency check. The precision medicine text corpus containing 2 000 text corpora has been built, providing effective resources support for the study of related entity and relation extraction algorithm and the building of precision medicine knowledge network.

    参考文献
    相似文献
    引证文献
引用本文

周永称,范少萍,晏归来,等.精准医学文本语料库构建研究[J].医学信息学杂志,2019,40(12):41-47

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2019-07-26
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2020-01-19
  • 出版日期:

扫码关注

官方微信