DOI:10.3969/j.issn.1673-6036.2025.06.015
中图分类号:G252.7;|G642;|R-4
龚宇新, 李俊豪, 向菲, 张兰
【作者机构】 | 华中科技大学同济医学院医药卫生管理学院 |
【分 类 号】 | G252.7;G642;R-4 |
【基 金】 |
•医学信息教育•
人工智能生成内容(artificial intelligence generated content,AIGC)技术正重构人类知识生产范式。以Transformer架构为基础的系统(如ChatGPT、DeepSeek)通过自监督学习实现语义空间深度建模,推动人机交互从“指令执行”向“认知协同”演进[1-2]。在此背景下,医学教育数字化转型加快[3-6]。近年来国家出台系列政策推动教育数字化与人工智能(artificial intelligence,AI)赋能教育发展,旨在促进教与学深度融合,提升全民数字素养[7-9]。医学文献检索课程教学连接基础理论与临床实践,其教学设计影响医学生深度学习效果和信息素养能力[10]。因此,探索AIGC技术与医学文献检索教学相结合,提升教学效果和学生能力,成为医学教育领域的重要课题。本研究聚焦“AIGC+医学文献检索”课程优化设计,深入探讨AIGC在帮助医学生掌握复杂检索技巧、提升检索效率,以及培养批判性思维、增强伦理意识方面的潜力,以期为医学信息教育者提供参考,推动医学文献检索课程创新发展。
2.1.1 提升医学文献检索效率 目前医学文献检索课程通常以数据库操作训练和信息素养培育为核心,学生在选择检索词、构建复杂检索式时往往感到比较困难。AIGC卓越的语义理解和内容生成能力,为解决此类难题提供了新思路[11]。将AIGC融入医学文献检索课程教学与实践,使其通过理解用户自然语言输入,识别检索意图,辅助构建检索式,减轻学生学习负担,提高文献检索效率,实现从检索意图识别到结果优化的全流程赋能[12-13]。
2.1.2 培养学生批判性思维与伦理意识 AIGC技术的广泛应用引发了医学数据隐私保护、学术诚信以及生成内容可靠性等伦理问题[14]。使用者需具有批判性思维与伦理意识,避免患者信息泄漏和学术不端行为。因此本课程教学设计核心目标也包括优化现有医学文献检索课程,提升学生综合素养,确保其在未来医学研究和实践中严格遵循伦理准则,合规使用医学数据,防止发生患者信息泄漏和学术不端行为。
2.2.1 重点 不同AIGC工具功能各异,学生须深入了解其差异,才能在实际研究中选择最合适的工具。例如,通用型智能检索系统(如ChatGPT)的自然语言理解能力强,能快速生成检索式并构建文献综述框架,但其医学知识库更新可能滞后;医学专用型检索平台如PubMedGPT则直接对接PubMed数据库,能自动提取对象-干预-对照-预后(problem/patient-intervention-comparison-outcome,PICO)框架要素,并进行循证护理JBI证据分级,但其跨库检索能力较弱[15-16]。AIGC可能产生“幻觉”,即生成不准确或虚假信息[17-18],如误编临床试验数据或虚构文献来源,应着重培养学生具备强大的溯源检测与证据评估能力,以便能够科学审查文献来源、研究方法和结果,辨别信息真伪和质量。因此本课程优化设计的重点在于强化学生AIGC工具适配性训练,帮助其依据实际需求选择合适工具,同时提升信息真实性验证能力,保障医学研究的科学性和临床决策的准确性。
2.2.2 难点 首先,学生知识背景差异大,部分学生因临床术语掌握不足,在构建检索策略时存在困难,影响学习效果。其次,引入AIGC工具能为学生提供重要帮助,但如果过度依赖工具则会削弱学生的自主检索与批判性思维能力,使其在面对复杂信息时缺乏独立分析和解决问题的能力[19]。最后,医学文献检索领域尚未建立针对AI辅助检索的标准化评估体系,学生难以判断AIGC工具辅助检索结果的可靠性,教师也难以衡量学习成效。因此本课程优化设计的难点在于寻求技术赋能与思维培养间的平衡,应构建“AIGC+人工”双轨教学理念,将AIGC技术作为辅助工具,与学生自主学习、教师引导教学相结合,提升医学生的信息素养和自主学习能力,助力其在复杂信息环境中开展研究与实践。
基于本课程设计核心目标及重难点,合理设计教学环节,见表1。通过理论讲授、案例实操、反思讨论、分类学习与拓展4个环节,为学生构建递进式学习闭环,从而全面提升其综合信息素养。
表1 教学环节设计及学时分配
教学环节学时具体内容理论讲授1AIGC与医学文献检索协同策略讲解案例实操3心血管疾病药物治疗方案检索案例(1学时);医学研究热点追踪与分析案例(1学时);其他主题案例(依实际教学安排)(1学时)反思讨论2“AI辅助检索是否会导致思维惰性”等辩论(1学时);案例实操问题反思讨论(1学时)分类学习与拓展2分类学习任务与拓展活动,提交学习报告
为了系统推动AIGC与医学文献检索课程深度融合,构建“理论讲授-案例实操-反思讨论”3段式教学模式,见图1。在理论讲授环节,教师讲解AIGC技术的基本原理、PICO框架及医学数据库检索规则,并通过实际演示,展示如何利用AIGC工具生成检索式、优化数据库检索结果。在案例实操环节,教师引导学生利用AIGC工具进行文献检索,帮助学生掌握检索技能,并实现对检索结果的精确优化。在反思讨论环节,组织学生进行小组辩论,探讨AIGC辅助检索的优势与局限,进一步强化学生的伦理意识和批判性思维。
图1 3段式教学模式
根据医学文献检索的核心需求,将AIGC工具划分为3大类并明确其教学定位,见表2。一是通用型智能检索系统,定位为信息发现助手,用于帮助学生将模糊的临床问题转化为初步检索词,并辅助筛选和归纳相关文献,进行文献综述框架构建。教学中应注意其医学知识库更新滞后,建议结合UpToDate等资源补充最新临床证据。二是医学专用型检索平台,作为专业知识引擎,用于强化临床问题转化训练。这类工具可深度整合医学知识体系,能自动识别问题中的PICO要素并对检索到的证据进行分级。但其通常专注于特定数据库。教学中应强调其专业优势,同时配合使用Scopus等跨库检索工具弥补覆盖范围的不足。三是智能治理型系统,定位为数据治理中枢,用于多源证据整合与伦理审查能力训练。其能够支持跨库语义关联检索,通过伦理风险评估矩阵优化检索策略。针对其技术复杂度高的特点,提供应用程序编程接口(application programming interface,API)操作指南与伦理决策树工具,降低使用难度。
表2 AIGC工具分类
工具类型代表工具核心优势教学应用场景局限性与对策通用型 ChatGPT-4、DeepSeek自然语言理解能力强检索式生成、文献综述框架构建局限性:医学知识库更新滞后。对策:结合UpToDate补充医学专用型PubMedGPT、MedGPT直接对接PubMed数据库临床问题转化、证据分级推荐局限性:跨库检索能力弱。对策:配合Sco-pus使用智能治理型Dimensions、TrustworthyAI多源数据整合+伦理风险评估研究热点追踪、数据合规性审查局限性:技术复杂度高。对策:提供API操作指南与伦理决策树工具
设计基于具体临床场景和科研任务的教学活动,展示AIGC工具与传统数据库的协同应用。通过真实案例实操演练,帮助学生直观理解AIGC技术的优势与局限,提高检索效率,培养信息分析能力、批判性思维和学术规范意识,实现技能训练与思维培养双重目标。
3.3.1 临床治疗方案检索 教师可设计基于真实临床场景的文献检索任务,例如,要求学生为高血压合并轻微心力衰竭患者制订最优药物治疗方案。学生先利用AIGC工具构建初步检索策略,获取相关文献线索,重点关注近5年权威医学期刊发表的临床研究和专家共识。随后,在万方医学网、中国知网等数据库中验证AIGC推荐文献的全面性和可靠性,补充检索符合要求的中文文献。最后,对比AIGC与人工检索结果的差异,分析原因,整合关键证据,形成个性化药物治疗推荐,以小组报告形式呈现。通过该案例教学,培养学生将复杂临床问题转化为精准检索需求的能力,提升其多渠道检索文献并整合关键信息的技能,强化其对心血管疾病治疗方案的理解与应用。
3.3.2 医学研究热点追踪与分析 教师可设计追踪医学研究热点的任务,例如,设定肿瘤免疫治疗为研究主题,要求学生系统追踪该领域最新研究动态。学生先借助AIGC工具快速获取研究热点方向及综述框架建议。随后,在Web of Science、PubMed等国际数据库中检索高影响力研究论文,梳理该领域发展脉络。要求学生独立分析文献,撰写肿瘤免疫治疗研究进展分析报告,并在课堂展示交流。该案例教学有助于培养学生追踪医学研究热点的能力,学会借助AIGC工具快速把握研究领域概况,并通过深入分析文献提升批判性思维和学术写作能力。
在医学研究热点追踪与分析案例完成后,设置主题辩论“AIGC 辅助检索:效率提升vs.思维异化——医学文献检索的伦理边界何在”,模拟学术伦理委员会评审场景。具体流程,见表3。
表3 伦理辩论流程设计
流程任务分组按“正方-反方-评审团”划分角色;正方主张AIGC 是“认知延伸工具”,应认可其辅助成果;反方主张过度依赖导致“检索能力退化”,需坚持人工核验评审学生评审团依据《赫尔辛基宣言》第29条[20]和《科研诚信新加坡宣言》进行评分[21];教师重点分析“AIGC贡献度阈值设定”“人机协同署名规范”等争议焦点[22]教学效果预评估通过李克特量表对比辩论前后学生对AIGC伦理认知的变化
医学文献检索课程面向不同专业的医学生(如法医、生物工程、临床医学、护理学、药学等)。为满足不同知识背景学生需求,设计“初级-中级-高级”3级分类教学框架,见表4,为学生提供精准教学支持。
表4 “初级-中级-高级”3级分类教学框架
学习水平任务目标AIGC工具任务示例能力培养重点初级AIGC辅助关键词扩展与基础检索ChatGPT(基础检索式生成)输入“高血压药物治疗”生成扩展检索词(如“ACEI类药物”“β受体阻滞剂”)检索词扩展能力、基础检索技能中级AIGC分析文献关联性与主题聚类PubMedGPT(PICO要素提取)输入“嵌合抗原受体T细胞疗法治疗白血病的安全性”,提取PICO要素并生成JBI证据分级报告文献关联分析能力、系统性思维高级结合临床案例设计个性化检索方案Dimensions、TrustworthyAI(跨库整合+伦理审查)针对“肿瘤免疫联合治疗”生成跨库检索策略,并进行《健康保险携带和责任法案》合规性审查临床问题转化能力、批判性评估与伦理决策
初级学习水平学生对医学文献检索和临床术语了解有限,能力培养重点在于引导其学会运用AIGC工具辅助检索词扩展。学生检索疾病相关文献时,常只能想到简单、常见检索词。教师可引导其在ChatGPT中输入关键词,获取更多相关检索词,扩大检索范围。中级学习水平学生已具有一定检索基础和临床术语知识,可要求其利用AIGC分析文献间关联性。例如,学生检索到一批心血管疾病文献后,使用AIGC工具分析文献间联系,找出研究主题演变趋势及不同研究间相互印证或分歧之处。对于高级学习水平学生,要求其结合临床案例设计个性化检索方案。例如,给定复杂临床病例,综合运用所学知识,包括AIGC工具和传统数据库检索技巧,设计满足临床诊断、治疗等需求的检索方案,培养解决实际问题的能力。
为全面、客观评估学生在医学文献检索课程中使用AIGC工具的学习效果,结合过程性记录与成果性评估,构建包含工具使用、学术规范、思维能力3个维度的考核体系,采用优、良、及格、不及格4档标准,具体考核指标体系,见表5。
表5 3维能力考核指标体系
考核维度(权重) 能力层级考核标准评分范围(分)智能工具应用能力(40%)AEtool>75%,且查全率>80%,查准率>90%90~100 BEtool >50%,且查全率>50%,查准率>70%75~89 CEtool>30%,且查全率>30%,查准率>50%60~74 DEtool≤30%,查全率≤30%或查准率≤50%0~59 学术规范素养(30%)A引用正确率>95%,且识别≥3项任务相关伦理风险90~100 B引用正确率>85%,且识别≥2项任务相关伦理风险75~89 C引用正确率>70%,且识别≥1项任务相关伦理风险60~74 D引用正确率≤70%,未识别任务显性风险,或者存在数据滥用/剽窃行为0~59 批判性思维能力(30%)A构建证据网络节点数≥5层,且提出创新性研究假设90~100 B构建证据网络节点数≥3层,且完成矛盾证据分析75~89 C构建证据网络节点数≥1层,且识别文献质量缺陷60~74 D无证据网络构建,完全依赖AIGC0~59
智能工具应用能力维度聚焦于学生对AIGC工具与传统数据库协同检索的掌握程度。通过检索效率指数(Etool)进行量化评估。Etool即AIGC工具使用时间(TAIGC)与问题解决总时间(Tproblem)的比值。同时结合查全率和查准率进行综合赋分。如果某单项指标未达对应层级(如Etool达B级但查全率仅达C级),则按最低达标项判定最终等级。
(1)
学术规范素养考察学生在医学数据处理与文献引用中的伦理意识及规范遵循情况。通过收集学生作业、报告等中的文献引用、数据使用情况,并记录其在课堂讨论中的伦理观点发言进行评估。采用双盲交叉评审机制,依据《赫尔辛基宣言》及COPE指南制定量表评审判定等级。
批判性思维能力评估学生在医学信息处理中的批判性思维水平。通过收集学生检索任务中的思维过程记录等进行评估。分析学生构建的证据网络复杂度等指标判定等级。
综合评估学生3个维度的表现,通过加权计算得出综合得分。综合得分标准为:优秀(≥90分)、良(75—89分)、及格(60—74分)、不及格(<60分)。评估结果为学生提供针对性反馈,同时为后续教学内容设计与能力培养路径提供数据支撑,助力学生信息素养与学术能力的系统性提升。
本研究聚焦“AIGC + 医学文献检索”课程的数字化转型,致力于通过构建3段式教学模式(即理论讲授、案例实操与反思讨论)及分类定位AIGC工具的教学功能,设计针对性实践场景,全面提升学生的信息处理能力,培养其批判性思维与伦理意识,为医学文献检索课程的数字化转型提供了新思路。然而,本研究在实践验证层面仍存在局限,例如,课程实施后学生能力提升的持续性效果尚未通过长期追踪或分层对照实验验证,AIGC工具与传统数据库协同检索的效能增益(如查全率与查准率的动态变化)缺乏量化数据支撑。此外,跨院校、跨专业场景下的技术适配性差异有待进一步实证研究。未来可进一步推动“AIGC×医学文献检索”课程设计,促进AIGC与医学文献检索课程深度融合,具体包括以下3个方面。一是构建长效评估机制,设计涵盖长期效果追踪的量化评估体系,通过学生学习轨迹分析验证框架可持续性;二是深化AIGC技术融合实践,在多中心场景中验证AIGC工具适配性,建立查全率、查准率动态监测模型,为技术迭代提供数据依据;三是加强校际与国际交流合作,共享资源与经验,培养适应时代需求的复合型医学人才。通过上述举措,“AIGC×医学文献检索”课程设计可进一步推动精准医疗时代医学学科发展,助力医学教育迈向新高度。
作者贡献:龚宇新、李俊豪负责论文撰写与修订;向菲负责研究设计;张兰负责提供指导。
利益声明:所有作者均声明不存在利益冲突。
1 姜婷婷,许艳闰,傅诗婷,等.人智交互体验研究:为人本人工智能发展注入新动力[J].图书情报知识,2022,39(4):43-55.
2 黄炜烨,陈希亮,赖俊.面向人机协作的智能体训练方法研究综述[J/OL].计算机科学,1-26[2025-03-01].http://kns.cnki.net/kcms/detail/50.1075.TP. 20250227.1035.020.html.
3 CAR J,ONG Q C,FOX T E,et al. The digital health competencies in medical education framework:an international consensus statement based on a Delphi study[J]. JAMA network open,2025,8(1):1-17.
4 LIU X,ONG Q C,CAR J,et al. Organizational leaders’ views on digital health competencies in medical education:qualitative semistructured interview study[J]. JMIR medical education,2025,11(2):e43774.
5 CHAN K S,ZARY N.Applications and challenges of implementing artificial intelligence in medical education:integrative review[J].JMIR medical education,2019,5(1):e13930.
6 LI R,WU T. Evolution of artificial intelligence in medical education from 2000 to 2024:bibliometric analysis[J]. Interactive journal of medical research,2025,14(1):e63775.
7 教育部发布4项行动助推人工智能赋能教育[EB/OL].[2025-03-05]. http://www.moe.gov.cn/jyb_xwfb/xw_zt/moe_357/2024/2024_zt05/mtbd/202403/t202403 29_1123025.html.
8 王繁,刘永强,周天华.人工智能引领高等教育数字化创新发展[J].中国高等教育,2024(Z1):9-12.
9 高奇琦,严文锋.知识革命还是教育异化?ChatGPT与教育的未来[J].新疆师范大学学报(哲学社会科学版),2023,44(5):102-112.
10 蒋德凤,曹红兵.面向核心素养的信息检索课自主化教学研究[J].图书馆界,2021(3):20-25.
11 LIM W M,GUNASEKARA A,PALLANT J L,et al. Generative AI and the future of education:ragnarök or reformation?A paradoxical perspective from management educators[J]. The international journal of management education,2023,21(2):100790.
12 丁文婧.生成式人工智能融入医学信息检索教学的实践研究[J].图书馆学研究,2024(12):12-20.
13 董焕晴,曹高辉,庹沛.生成式AI工具用户信息搜寻行为形成路径——以数字素养与人工智能素养为视角[J/OL].图书馆论坛,1-9[2025-03-12].http://kns.cnki.net/kcms/detail/44.1306.G2.20241129.0846.002.html.
14 江莉.AI医疗之“术”与“道”:基于道家思想的伦理反思[J].中国医学伦理学,2025,38(2):201-206.
15 RICHARDSON W S,WILSON M C,NISHIKAWA J,et al. The well-built clinical question:a key to evidence-based decisions[J].ACP journal club,1995,123(3):12-13.
16 PEARSON A,WIECHULA R,COURT A,et al.The JBI model of evidence-based healthcare[J].International journal of evidence‐based healthcare,2010,3(8):207-215.
17 喻国明,金丽萍,刘佳颖.大语言模型下机器的幻觉与人机信任构建机制探讨[J].未来传播,2025,32(2):2-10,128.
18 JI Z,LEE N,FRIESKE R,et al.Survey of hallucination in natural language generation[J].ACM computing surveys,2023,55(12):38.
19 平衡人工智能使用与批判性思维技能[EB/OL].[2025-02-11]. https://www.cssn.cn/wx/xslh/2025 02/t20250211_5843929.shtml.
20 HELSINKI W M A D O.World medical association declaration of Helsinki:ethical principles for medical research involving human subjects[J].HIV clinical trials,2000,2(4):92-95.
21 STENECK N,MAYER T,ANDERSON M.The Singapore statement on research integrity[J].Accountability in research-policies &quality assurance,2010,55(27/28):3230-3230.
22 Recommendations for the conduct,reporting,editing,and publication of scholarly work in medical journals[EB/OL].[2025-02-11].https://www.icmje.org/icmje-recommendations.pdf.
X