国外生物医学文本语料库分类及特点研究
投稿时间:2018-09-13    点此下载全文
引用本文:晏归来,安新颖,范少萍,等.国外生物医学文本语料库分类及特点研究[J].医学信息学杂志,2018,39(10):74-80
摘要点击次数:
全文下载次数:
作者单位
晏归来 中国医学科学院/北京协和医学院医学信息研究所 北京 100020 
安新颖 中国医学科学院/北京协和医学院医学信息研究所 北京 100020 
范少萍 中国医学科学院/北京协和医学院医学信息研究所 北京 100020 
周永称 中国医学科学院/北京协和医学院医学信息研究所 北京 100020 
基金项目:国家重点研发计划“精准医学文本知识网络构建”子课题“精准医学文本语料库构建”(项目编号:2016YFC0901902-2)。
中文摘要:通过梳理国外31个生物医学文本语料库标注内容,根据语料库标注实体类型,参照UMLS语义类型将其划分为6大类。总结语料库在语义类型、数据源等方面特点,阐述生物医学文本语料库构建流程及关键步骤,以期为我国生物医学文本语料库相关研究奠定基础。
中文关键词:生物医学文本语料库  语义类型  语义关系
 
Study on the Categories and Characteristics of Overseas Biomedical Text Corpuses
Abstract:The paper divides the corpus into six categories by analyzing annotated contents of the 31 overseas biomedical text corpuses and referring to UMLS semantic type according to the annotated entity types of the corpuses. It summarizes characteristics of the corpus in the aspects like semantic type and data source,expatiates on the building process and major steps of biomedical text corpus in the hope of laying down the foundation based on which related studies on China's biomedical text corpuses will be carried out.
keywords:biomedical text corpus  semantic type  semantic relations
查看全文  查看/发表评论  下载PDF阅读器

京公网安备 11010502037823号

美女meinvmeinvmeinvmeinvmeinv