摘要: 目的/意义 构建涵盖循证医学知识和电子病历数据的通用医学知识图谱,以提升图谱的应用效能。方法/过程 梳理多源异构数据情况,融合国内外知名知识图谱,设计图谱schema。利用RoBERTa预训练模型进行词嵌入,从医学文献、网络文献、教科书、医学数据库和电子病历等数据源中提取命名实体和关系,采用基于规则的SWIQA框架和基于随机抽样的人工审核策略评价图谱质量。结果/结论 共确定128个本体和1 108种关系,并以三元组形式存储于数据库中。经评估,图谱语义准确性达93.8%。所构建的通用医学知识图谱不仅涵盖循证医学知识,还包括临床真实世界产生的专家经验,为医学人工智能应用的进一步发展提供了有力支撑。