知识驱动的混合检索增强生成方法在罕见病领域的应用研究
作者:
作者单位:

(北京协和医学院/中国医学科学院医学信息研究所/图书馆北京 100020)

作者简介:

张姁,硕士研究生,发表论文2篇;通信作者:胡佳慧,副研究员。  基金项目:中国医学科学院医学与健康科技创新工程项目(项目编号:2021-I2M-1-056);中央高水平医院临床科研专项(项目编号:2022-PUMCH-A-084)。

通讯作者:

中图分类号:

基金项目:

中国医学科学院医学与健康科技创新工程项目(项目编号:2021-I2M-1-056);中央高水平医院临床科研专项(项目编号:2022-PUMCH-A-084)。


Study on the Application of Knowledge-driven Hybrid Retrieval-augmented Generation in the Field of Rare Diseases
Author:
Affiliation:

(Institute of Medical Information/Medical Library, Chinese Academy of Medical Sciences & Peking Union Medical College, Beijing 100020, China)

Fund Project:

  • 摘要
  • 图/表
  • 访问统计
  • 参考文献
  • 相似文献
  • 引证文献
  • 资源附件
  • 文章评论
    摘要:

    目的/意义 探索知识驱动的混合检索增强生成方法,以解决大语言模型在医学垂直领域事实准确性不足与可靠度低的问题。 方法/过程 构建以罕见病为代表的医学领域知识库,综合运用基于关键词匹配的稀疏检索与基于语义相似度的稠密向量检索,并采用倒数排序融合算法对双重检索结果进行优化排序,通过混合检索增强生成为大语言模型提供最优上下文。 结果/结论 该方法的准确率、召回率等指标均优于单一检索与其他检索策略,并在多个大语言模型对比中具有良好的鲁棒性,有助于提升医学知识服务的智能化水平。

    Abstract:

    Purpose/Significance To explore a medical knowledge-driven hybrid retrieval-augmented generation method (Med-HyRAG), so as to address the issues of insufficient factual accuracy and low reliability of large language model (LLM) in the medical vertical domain. Method/Process A medical knowledge base focused on rare diseases is constructed. The keyword matching-based sparse retrieval and semantic similarity-based dense vector retrieval are comprehensively applied, and the reciprocal ranking fusion algorithm is employed to optimize and rank the dual retrieval results, thereby providing an optimal context for LLM through hybrid retrieval-augmented generation. Result/Conclusion The indicators such as accuracy, recall of this method are superior to those of single retrieval and other retrieval strategies, and it has good robustness in the comparison of several LLMs. This study contributes to advancing the intelligence of medical knowledge services.

    参考文献
    相似文献
    引证文献
引用本文

张姁,方安,娄培,等.知识驱动的混合检索增强生成方法在罕见病领域的应用研究[J].医学信息学杂志,2026,47(2):80-86

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:2025-10-15
  • 录用日期:
  • 在线发布日期: 2026-03-16
  • 出版日期:

扫码关注

官方微信