精准医学文本语料库构建研究
投稿时间:2019-07-26    点此下载全文
引用本文:周永称,范少萍,晏归来,等.精准医学文本语料库构建研究[J].医学信息学杂志,2019,40(12):41-47
摘要点击次数:
全文下载次数:
作者单位
周永称 中国医学科学院/北京协和医学院医学信息研究所 北京 100020 
范少萍 中国医学科学院/北京协和医学院医学信息研究所 北京 100020 
晏归来 中国医学科学院/北京协和医学院医学信息研究所 北京 100020 
安新颖 中国医学科学院/北京协和医学院医学信息研究所 北京 100020 
基金项目:国家重点研发计划"精准医学文本知识网络构建"子课题"精准医学文本语料库构建"(项目编号:2016YFC0901902-2);国家自然科学基金项目"面向精准医学的基因-疾病-药物语义关义抽取研究"(项目编号:71704188);中央级基本科研业务费项目"临床医学高层次人才科研能力评价研究"(项目编号:2018TX63002)。
中文摘要:利用BRAT标注工具及人工标注方法,根据初步制定的文本语料标注规范,按照语料选择、语料预处理、语料标注、标注校对、一致性检验的流程开展语料标注工作,构建包含2 000篇文本语料的精准医学文本语料库,为相关实体与关系抽取算法研究以及精准医学知识网络构建提供有效的资源支持。
中文关键词:文本语料库  精准医学  语料库构建
 
Study on the Building of Precision Medicine Text Corpus
Abstract:Using BRAT annotation tool and manual annotation method, according to the preliminary text corpus annotation specifications, the corpus annotation is carried out in accordance with the procedures of corpus selection, corpus preprocessing, corpus annotation, annotation proofreading, and consistency check. The precision medicine text corpus containing 2 000 text corpora has been built, providing effective resources support for the study of related entity and relation extraction algorithm and the building of precision medicine knowledge network.
keywords:text corpus  precision medicine  corpus building
查看全文  查看/发表评论  下载PDF阅读器

京公网安备 11010502037823号

美女meinvmeinvmeinvmeinvmeinv