双语癌症平行语料库构建
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

中国医学科学院医学与健康科技创新工程服务“一带一路”战略先导科研专项“卫生信息服务研究”(项目编号:2017-I2M-B&R-10);国家重点研发计划“精准医学本体和语义网络构建”(项目编号:2016YFC0901901)


The Building of Bilingual Parallel Corpus of Cancer
Author:
Affiliation:

Fund Project:

  • 摘要
  • 图/表
  • 访问统计
  • 参考文献
  • 相似文献
  • 引证文献
  • 资源附件
  • 文章评论
    摘要:

    介绍美国国家癌症研究所提供的英文版癌症综合信息库以及国内外有关平行语料库构建相关研究、技术、流程等。通过研究源数据结构,进行数据分析与处理,设计双语语料对齐策略,完成癌症领域中英双语平行语料库构建并就相关设计机制及语料质量进行讨论。

    Abstract:

    The paper introduces the English version of Physician Data Query(PDQ) provided by U.S. National Cancer Institute and study, technologies, processes, etc. of the building of relevant bilingual parallel corpus at home and abroad. By studying the structure of source data, it conducts data analysis and processing, designs alignment of bilingual corpus, and explicates ways to build bilingual parallel corpus of cancer in English and Chinese. It discusses relevant design mechanisms and the quality of the corpus.

    参考文献
    相似文献
    引证文献
引用本文

马鹤桐,任建松,王序文,等.双语癌症平行语料库构建[J].医学信息学杂志,2019,40(9):77-82

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2018-12-09
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2019-11-08
  • 出版日期:

扫码关注

官方微信