生成式人工智能医学语料库:数据风险、合规义务及应对方案
作者:
作者单位:

(1.中国医学科学院医学信息研究所/图书馆 北京 100020;2.北京科技大学 北京 100083)

作者简介:

王蕾,副研究员,发表论文16篇;通信作者:方安,研究馆员。〔基金项目〕 中央级公益性科研院所基本科研业务费(项目编号:2024-ZHCH630-01);中国医学科学院医学与健康科技创新工程项目(项目编号:2021-I2M-1-057);中国医学科学院/北京协和医学院医学信息研究所/图书馆青年人才培养专项(项目编号:2024YT08)。

通讯作者:

中图分类号:

R-058 〔文献标识码〕A

基金项目:

中央级公益性科研院所基本科研业务费(项目编号:2024-ZHCH630-01);中国医学科学院医学与健康科技创新工程项目(项目编号:2021-I2M-1-057);中国医学科学院/北京协和医学院医学信息研究所/图书馆青年人才培养专项(项目编号:2024YT08)。


Data Risks, Compliance Obligations and Countermeasures for Medical Corpora in Generative Artificial Intelligence
Author:
Affiliation:

(1.Institute of Medical Information/Library, Chinese Academy of Medical Sciences & Peking Union Medical College, Beijing 100020, China;2.University of Science and Technology Beijing, Beijing 100083, China)

Fund Project:

  • 摘要
  • 图/表
  • 访问统计
  • 参考文献
  • 相似文献
  • 引证文献
  • 资源附件
  • 文章评论
    摘要:

    目的/意义 探讨我国生成式人工智能医学语料库的合规义务及风险应对方案,进一步推动该领域语料库合规建设。方法/过程 根据生成式人工智能语料库数据生命周期,按阶段梳理服务提供者的合规义务,并针对隐私泄露、训练数据偏倚、知识产权风险提出应对方案。结果/结论 应以合法性为基准,遵守目的限制与最小必要性原则、数据主体权利保障原则、数据安全与风险防控原则,采用自动化辅助手段,应对生成式人工智能医学语料库构建与管理面临的各类风险。

    Abstract:

    Purpose/Significance To explore the compliance obligations and risk mitigation strategies relevant to medical corpora in generative artificial intelligence (GenAI) in China, and to promote the compliance construction of corpora in this field. Method/Process Based on the data lifecycle of corpora in GenAI, the compliance obligations of service providers are sorted out by step. Targeted solutions are proposed to address three major risks:privacy leakage, training dataset bias, and intellectual property risks. Result/Conclusion It should be emphasized legality as the foundation, following key principles such as purpose limitation and data minimization, data rights protection, data security and risk prevention and control. Automated auxiliary means should be adopted to address various risks faced in the construction and management of medical corpora in GenAI.

    参考文献
    相似文献
    引证文献
引用本文

王蕾,刘苗,王茜,等.生成式人工智能医学语料库:数据风险、合规义务及应对方案[J].医学信息学杂志,2026,47(1):9-15

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:2025-12-19
  • 录用日期:
  • 在线发布日期: 2026-02-26
  • 出版日期:

扫码关注

官方微信