融合相似度算法与预训练模型的中文电子病历实体映射方法研究
作者:
作者单位:

(中国医学科学院/北京协和医学院医学信息研究所/图书馆 北京 100020)

作者简介:

通讯作者:

中图分类号:

R-058

基金项目:

科技创新2030——“新一代人工智能”重大专项课题“中文医学术语体系构建”(项目编号:2020AAA0104901)。


Study on Chinese Electronic Medical Record Entity Mapping Method by Fusing Similarity Algorithms and Pre-trained Models
Author:
Affiliation:

Institute of Medical Information & Library, Chinese Academy of Medical Sciences & Peking Union Medical College, Beijing 100020, China

Fund Project:

  • 摘要
  • 图/表
  • 访问统计
  • 参考文献
  • 相似文献
  • 引证文献
  • 资源附件
  • 文章评论
    摘要:

    采用自标注中文电子病历标准数据集,融合相似度算法与预训练模型并分别应用于实体映射的候选实体生成和实体消歧阶段,对不同相似度算法和预训练模型的性能进行比较分析。提出基于别名间相似性改进药物类实体映射效果的方法,结合Jaccard相似度算法与BERT预训练模型,高效实现海量中文电子病历实体映射任务。

    Abstract:

    The self-annotated Chinese electronic medical record(EMR) standard datasetisused, the similarity algorithms and pre-trained models are fused and applied to the candidate entity generation and entity disambiguation stages of entity mapping, and the performance of different similarity algorithms and pre-trained models is compared and analyzed. A method is proposed to improve the mapping effect of drug class entities based on alias similarity, and the Jaccard similarity algorithm and BERT pre-trained model are combined to efficiently realize the task of mapping the entities of massive Chinese EMRs.

    参考文献
    相似文献
    引证文献
引用本文

冯凤翔,任慧玲,李晓瑛,等.融合相似度算法与预训练模型的中文电子病历实体映射方法研究[J].医学信息学杂志,2023,44(5):45-50

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:2023-02-20
  • 录用日期:
  • 在线发布日期: 2023-06-13
  • 出版日期:

扫码关注

官方微信