DOI:10.3969/j.issn.1673-6036.2026.02.016
刘锦, 王兰兰, 李洪东, 王博, 钱育蓉
| 【作者机构】 | 新疆大学软件学院; 中南大学计算机学院; 新疆大学计算机科学与技术学院 |
| 【分 类 号】 | |
| 【基 金】 | 新疆维吾尔自治区研究生教育创新计划重点项目(项目编号:XJ2024GY01) 新疆大学专业学位研究生教学案例库重点建设项目(项目编号:XJDX2024YALK19) 中南大学研究生教学案例库建设项目(项目编号:2023ALK014)。 |
医学信息教育
在智慧医疗与人工智能深度融合的背景下,医学与工程学科的交叉创新正推动诊疗模式向精准化、智能化发展[1]。近年来,大模型技术取得突破,其多模态信息处理与语义推理能力为构建高仿真医疗教学场景提供了新路径[2-4]。大模型能够解析医疗非结构化文本、影像及多源异构数据,支持临床决策模拟与个性化诊疗推演,为医工交叉教学案例开发奠定技术基础[5]。以ChatGPT为代表的大语言模型已在医学教育中展现广泛应用前景,可用于虚拟病例构建、临床思维训练与个性化反馈,有效提升教学资源与案例设计效率[6-9]。但相关研究[10-12]亦指出其在准确性、真实性与伦理合规方面仍存在风险与安全隐忧,尚未形成与临床实践深度融合的教学闭环。与此同时,作为人工智能核心技术的机器学习教学仍以算法导向为主,尽管其在医学影像分析、电子病历挖掘与疾病预测中已取得进展,但现有教学案例多依赖理想化数据,难以体现医疗数据复杂性与医学知识体系的系统融合,导致学生难以胜任真实临床任务[13-15]。基于此,本研究设计构建大模型驱动的医工交叉诊疗全流程案例库,依托真实脱敏多模态医疗数据,覆盖预检、诊断、治疗及随访等关键环节,引入大语言模型与视觉大模型提升语义理解、多模态融合与决策仿真能力,构建面向智慧医疗教学的系统化案例体系。
机器学习案例教学是衔接理论与应用的重要方式,主要包括通用型与领域专用型两类。通用案例库以鸢尾花分类、手写数字识别等经典任务为代表,侧重算法原理与建模流程训练,但其数据高度规范化、场景抽象化,难以反映真实行业应用的复杂性与约束[16-17]。在医疗领域,已有医学影像分割、电子病历挖掘等教学案例[18],但多聚焦单一技术,缺乏针对诊疗全流程的系统设计[19],且未充分体现多模态数据融合与医学知识体系。
在医工交叉教学方面,现有案例库多依赖公开或模拟数据,难以真实还原临床情境。高质量案例库建设面临医疗数据结构复杂、隐私保护限制以及医工多学科协作成本高等挑战。尽管部分高校通过设立智能医学工程专业或校企合作推进医工融合教学[20-21],但课程体系仍较为碎片化,真实临床支撑不足,学生往往停留在算法工具掌握层面,难以形成可落地的临床应用能力。
近年来,以大语言模型和视觉大模型为典型代表的生成式人工智能为教育模式创新提供了新路径,其具有较强的语义理解与生成能力,已应用于个性化学习、智能答疑与虚拟教学[22-23],以及医学教育中的试题生成、虚拟病例构建与临床思维训练[24-25]。然而,现有研究多集中于文本模态,缺乏对影像与数值等多模态融合的系统探索,尚未形成覆盖诊疗全流程的跨学科案例体系。与超星、雨课堂等以知识传递为主的平台不同,基于大模型的医工交叉案例库强调语义理解、决策推演与智能反馈的深度融合,见表1,以真实临床数据和多模态智能处理为基础,使教学由“算法演示”转向“临床思维实践”。基于此,本研究提出构建大模型驱动的诊疗全流程案例库,强化多模态推理与临床决策仿真能力,推动医工交叉教学的系统化与智能化发展。
表1 不同教学平台及案例库对比分析
以临床需求为核心导向,遵循“数据-算法-知识”融合理念,构建案例库,覆盖从初诊至随访完整诊疗流程,通过真实医疗场景培养学生的多模态数据处理能力与临床决策思维。构建原则包括:一是临床真实性,基于脱敏真实数据与标准化诊疗路径,确保教学内容贴近临床实践;二是跨学科融合,系统整合医学知识与算法模型;三是全流程贯通,覆盖诊疗链条关键任务,实现理论与实践衔接;四是伦理与数据合规,案例数据均来源于经伦理审批的公开数据库或合法授权渠道,并进行严格去标识化处理,仅用于教学与科研,保障数据安全与隐私。
案例库采用4层架构,见图1。数据层整合电子病历、影像、检验与随访等多模态数据。算法层先进行数据清洗与标准化,再构建面向医疗任务的模型库,涵盖传统机器学习与深度学习方法,支持分类、预测与检测等任务。大模型服务层引入大语言模型,实现文本理解、报告生成、智能问答与决策推演,推动教学由“操作模拟”向“思维模拟”转变。应用层面向教学与科研,提供智能辅导、虚拟患者与智能评估等模块,支持项目驱动与跨学科协作。案例库适用于“医学人工智能”“智慧医疗导论”“机器学习与数据挖掘”等课程,也可作为科研训练和校企合作的实验平台。
图1 诊疗全流程医工交叉案例库核心架构
案例库以典型诊疗流程为主线,构建任务-知识映射体系。入院与初诊阶段涵盖主诉分类与风险预警,精确诊断阶段包括影像与病理分析、多模态诊断,治疗与用药阶段聚焦药物推荐与方案优化,出院与随访阶段涉及复发预测与疗效评估。通过全流程分解与知识点映射,引导学生理解“临床问题-数据特征-算法模型-决策结果”的逻辑链条,培养跨学科思维能力。
与传统静态案例库不同,本研究以大模型作为案例库运行与教学交互的核心驱动,通过统一建模病历文本、医学影像与结构化数据,实现诊疗全流程案例的动态生成与组织,并支持对诊疗思路和模型决策依据的过程性呈现,从而增强教学的交互性与反思性。
案例库面向医学工程、计算机及医学相关专业高年级本科生和研究生,适用于医学人工智能与智慧医疗方向教学。案例库课程以提升医学生人工智能应用能力和工科生医学理解能力为目标,以疾病诊疗流程为主线,围绕临床关键任务组织教学内容,将医学知识与算法任务有机整合,形成连贯教学单元,见图2。教学单元围绕数据清理、特征工程、模型训练与评估等关键内容,结合真实脱敏医疗数据,引导学生在完整临床链条中理解机器学习的实际价值。
图2 诊疗全流程医工交叉案例库课程设计
采用案例教学与真实医疗项目相结合的模式,通过“教学-练习-应用”,使学生在解决真实问题的过程中形成跨学科思维,提升技术实现能力与医学业务认知。学生在教师指导下参与影像标注、模型构建与算法优化,将理论转化为实践成果。教学结合翻转课堂、案例研讨与工作坊,并邀请医工领域专家讲授前沿应用。课程强化校企与科研协作,鼓励学生参与真实项目开发与验证。在项目迭代和智能助教支持下,学生在真实数据与情境中构建复合知识体系,提升智慧医疗领域的创新与实践能力。
基于诊疗全流程案例库,构建以大模型为基座的医工交叉教学平台,覆盖预检、诊断、治疗及随访等环节,形成“数据感知-智能处理-决策支持-教学反馈”闭环体系。大模型支持多模态数据解析、临床推理、决策推演与个性化教学反馈,通过融合多模态医疗数据与智能建模方法,实现精准诊疗仿真,为医教融合提供支撑。
核心数据来源为真实世界临床数据库MIMICIV,包括海量结构化与时序性数据,同时引入乳腺X线影像(CBIS-DDSM)和胃腺癌病理影像(TCGA-STAD)等公开数据集,形成多模态学习环境。通过大型语言模型自动解析病历文本,利用视觉基础模型精准提取影像特征,并使用语义嵌入技术实现文本与影像的动态对齐与融合,形成“数据-模型-决策”完整教学闭环,在保障数据隐私的前提下增强模型的通用性与可解释性。
5.3.1 数据预处理与特征工程 基于MIMIC-IV数据集,限定成人ICU入科场景,在入科后固定观察窗(首24h)内跨表提取入院信息、生命体征与实验室指标,并计算SOFA评分,将SOFA≥10定义为高风险,标注“重症”标签。通过分层抽样选取约7 000例真实教学样本。数据质量控制以规则驱动为主,包括单位统一、值域与生理合理性校验、重复与缺失处理,并辅以大语言模型支持的半自动异常识别与填补。特征选择聚焦SOFA及关键生理指标(如血乳酸、平均动脉压),并输出特征重要性与可解释性报告(该报告仅用于教学分析而非因果推断)。
5.3.2 模型选择与评价 为验证不同算法在入院病情严重度预测中的表现,选用5类模型进行对比实验。多层感知机(multi-layer perceptron,MLP)结构简单、效率高;长短期记忆网络(long shortterm memory network,LSTM)适用于时序建模;双向长短期记忆网络(bidirectional LSTM,Bi-LSTM)同时利用前向与后向时序信息,增强对复杂时序依赖关系的刻画能力;Transformer在长序列中表现稳定;TabTransformer融合表格与深度特征,整体性能最佳。采用交叉验证评估,指标包括准确率、AUC与F1分数。
5.3.3 实验结果与分析 实验数据集中重症占35%,共含40项特征。TabTransformer的准确率、AUC与F1分别为0.91、0.94和0.91,表现最优,见表2。表明Transformer系列在性能与可解释性之间取得了较好平衡。特征贡献分析表明,血乳酸等指标对病情预测具有重要作用。相关实验过程及结果有助于学生理解模型输出背后的临床逻辑。
表2 不同模型入院病情严重度预测性能
5.3.4 大模型驱动的决策推演 针对大模型“幻觉”风险,引入“可追溯数据输入+规则约束+人机协同审核+多模型对照验证”的多层治理机制,大模型结论仅用于教学推演。将模型预测结果嵌入教学闭环,系统自动生成结构化临床建议,学生可通过与大语言模型交互理解预测依据,并将结果传递至后续教学模块,实现诊疗全流程知识贯通。
采用项目驱动、跨学科协作与翻转课堂相结合的模式,将案例库融入预检、诊断、治疗、随访诊疗全流程教学,引导学生理解模型在诊疗流程中的应用环节与边界。课程采用从基础到深化的任务递进,以“入院病情严重度预测”为基础任务,强化时序建模与临床指标解读能力;以“基于图神经网络的乳腺癌病理图像诊断”为深化任务,重点训练学生在病理图像建模、图结构构建与模型解释方面的能力。示范案例核心属性与数据资源,见表3。案例描述应确保任务目标清晰、成果可评估。
表3 诊疗全流程医工交叉案例库示范案例信息
课程以连续案例单元构建学习路径,前期强化算法与数据流程,后期聚焦临床问题与多模态融合。学生完成入院病情严重度预测与病理图像分析任务,形成可解释性报告与复用代码。采用前测-后测评估教学效果,并通过学术研讨与技术实训活动引导成果向临床应用转化。
为验证案例库教学效果,本研究于2024—2025学年在研究生课程“机器学习”中引入诊疗全流程案例库教学,以32名研究生(计算机专业18人、医学相关专业14人)为对象开展前后测评,并进行对比分析。测评涵盖临床思维逻辑(案例问答)、多模态数据处理(编程题)、模型构建与解释(项目报告)3项核心能力,满分均为100分,采用配对样本t 检验分析。结果显示3项能力均显著提升(P<0.01),表明案例库教学有效促进了“临床逻辑-数据理解-模型解释”综合能力的发展,见表4。课程结束后,学生以跨学科小组完成项目,9个小组(56.3%)形成可演示原型,2个小组成果申报校级创新创业项目。
表4 教学前后学生能力测评成绩对比
学生产出包括模型脚本、数据流程与可解释性报告等可复用资源。课程满意度调查问卷结果显示,93.8%的学生认为案例库有助于理解机器学习的临床应用,90.6%的学生认可大模型智能助教的支持作用,87.5%的学生认为小组合作提升了沟通与协作能力。访谈结果进一步验证了该教学模式在促进知识迁移与跨学科能力转化方面的有效性。
大模型提升了教学的智能化与个性化水平,其交互与生成能力支持虚拟病例构建、报告生成与实时反馈,促进循证临床思维形成。但仍存在“幻觉”输出、隐私合规与过度依赖等风险。为此,教学中建立“人机共审+多层校验”机制,并将模型解释与误差分析纳入考核,以保障教学质量与规范性。
针对人工智能教学与临床需求脱节的问题,本研究构建了以诊疗全流程为主线、以大模型为支撑的医工交叉案例库,实现了临床知识、算法方法与教学场景的系统融合。实践表明,该案例库显著提升了学生在多模态数据处理、模型构建与临床推理等方面的能力,并形成可推广的课程与技术成果。未来将进一步拓展病种与教学场景,完善数据安全与生成治理机制,推动医工交叉教育向精准化与应用化发展。
作者贡献:刘锦负责案例库设计与构建、论文撰写;王兰兰、李洪东、王博负责案例设计、论文修订;钱育蓉负责论文审核。
利益声明:所有作者均声明不存在利益冲突。
1 刘娟,胡雪莲,朱美蓉,等.AIGC支持下教学动画中虚拟教师的应用效果研究[J].计算机工程,2025,51(8):341-353.
2 韩文娟,于双元.教育大模型辅助计算机教育数字化改革的机遇与挑战[J].软件导刊,2025,24(11):1-8.
3 丁宁,宋雨欣,单泽田,等.基于检索增强生成(RAG)技术的医学教学辅助智能问答系统的构建探索[J].中国医学教育技术,2025,39(1):1-5.
4 ZHANG W,CAI M,LEE H J,et al.AI in medical education:global situation,effects and challenges[J].Education and information technologies,2024,29(4):4611-4633.
5 陈湘,邓然,吴川清.生成式人工智能大型语言模型在医学教育实践的探讨[J].临床急诊杂志,2024,25(6):310-314.
6 KNOPP M I,WARM E J,WEBER D,et al.AI-enabled medical education:threads of change,promising futures,and risky realities across four potential future worlds[J].JMIR medical education,2023,9(1):e50373.
7 SCHERR R,HALASEH F F,SPINA A,et al.ChatGPT interactive medical simulations for early clinical education:case study[J].JMIR medical education,2023(9):e49877.
8 JOSEPH C,RAYMOND R,SUMANTH D,et al.Transforming medical education:assessing the integration of ChatGPT into faculty workflows at a caribbean medical school[J].Cureus,2023,15(7):e41399.
9 MACALHAES A,CORREIA C R.Incorporating ChatGPT in medical informatics education:mixed methods study on student perceptions and experiential integration proposals[J].JMIR medical education,2024(10):e51151.
10 MALIK S.ChatGPT utility in healthcare education,research,and practice:systematic review on the promising perspectives and valid concerns[J].Healthcare,2023,11(6):887.
11 SRIDHARAN K,SEQUEIRA R P.Artificial intelligence and medical education:application in classroom instruction and student assessment using a pharmacology &therapeutics case study[J].JMIR medical education,2024,24(1):431.
12 袁欢欢,全世悦,林祎,等.当医学课程考核遇上生成式人工智能:价值、挑战与未来展望[J].中国医学教育技术,2023,37(3):254-259.
13 廖宁,陈怡然,杨倩,等.以“三平台、三结合”行业实践为引领的教学创新研究——以机器学习课程为例[J].科教导刊,2023(14):22-24.
14 瞿星,杨金铭,陈滔,等.ChatGPT对医学教育模式改变的思考[J].四川大学学报(医学版),2023,54(5):937-940.
15 王小梨,冯影,吴润杰.电子信息专业硕士研究生机器学习课程交叉应用案例库建设研究[J].现代信息科技,2024,8(12):193-198.
16 黄兰.“专创融合”视域下生物医学工程专业科研育人模式探索[J].佳木斯职业学院学报,2024,40(7):198-200.
17 陈依桐,陈建,朱鲁闯,等.项目制驱动的医工融合工程实践课程体系研究与实践[J].实验科学与技术,2024,22(4):41-46.
18 曹建荣,李成栋,孙雪梅,等.深度学习课程实践教学案例库建设[J].计算机教育,2024(7):124-128.
19 赵卫东.面向课程群的递进式教学案例库一体化设计[J].计算机教育,2023(5):160-164.
20 方赵嵩,郑志敏,冯锡文,等.基于医工交叉的人工环境方向人才培养探究[J].制冷,2024,43(4):72-76.
21 康红艳,周钢,刘美丽,等.面向医工交叉人才培养的基础医学实验教学改革[J].实验室研究与探索,2024,43(7):183-186,205.
22 黄明芳,侯青涵,张韦.生成式人工智能在医学教育领域的应用现状与未来趋势[J].医学与社会,2025,38(1):29-34,47.
23 江哲涵,奉世聪,王维民.人工智能生成内容在医学教育中的应用、挑战与展望[J].中国教育信息化,2024,30(8):29-40.
24 赵欣,柳云.生成式人工智能赋能医学人文教育的伦理审视[J].临床荟萃,2024,39(1):65-69.
25 齐凤林,沈佳杰,王茂异,等.人工智能在高校信息化中的应用研究综述[J].计算机工程,2025,51(4):1-14.
Study on a Large M odel Driven M edical-engineering Integration Case Library for the Fu ll Diagnosis and Treatm ent Process
X