DOI:10.3969/j.issn.1673-6036.2025.07.003
中图分类号:R-05
张杏1, 段永璇1,2,3
【作者机构】 | 1山东第一医科大学(山东省医学科学院)医疗保障学院; 2山东省医药卫生科技信息研究所; 3山东第一医科大学(山东省医学科学院)现代教育技术中心 |
【分 类 号】 | R-05 |
【基 金】 | 山东省医药卫生科技发展计划项目(项目编号:2019WSA18004) 中国高校产学研创新基金——新一代信息技术创新项目(项目编号:2023IT213)。 |
大数据时代,医学研究的快速发展依赖于科学数据的支撑,尤其在临床实验、疾病研究和药物开发等领域,高质量医学科学数据是推动科研进步的重要力量。医学高校作为医学人才培养和科研的重要基地,其科学数据管理能力建设直接影响医学科研创新进程。医学高校科学数据管理服务主要依托图书馆、信息中心、附属医院或学校统筹建设的各类数据管理平台开展。其中图书馆是信息管理与知识传播的枢纽,提供科学数据管理咨询、情报服务及数据素养教育等服务[1];信息中心是推动科学数据开放共享的重要载体,为数据汇集、管理、开放共享和保存提供基础设施[2];附属医院通过建立临床科研数据平台,提供更精准的医疗数据处理和分析服务;校级平台则更关注多维度数据整合,提供科研、教学等多层面数据服务能力。其基于各自服务视角,从信息咨询、平台建设、数据处理、多维服务等方面,共同构成医学高校科学数据管理服务体系[3]。国内高校在科学数据管理的服务模式和技术手段方面仍处于发展阶段。随着数据密集型科研范式的推进,以及数据共享机制和隐私保护策略的不断完善,医学高校的科学数据管理能力将持续提升,其重要作用将进一步凸显,最终成为推动医学科学研究与创新的关键支撑力量[4]。
本研究聚焦医学高校科学数据管理服务,参照软科“2025中国大学排名”[5],选取主榜中前50所医药/中医药类大学和10所并入综合类大学的独立医学院作为研究对象。访问各高校/医学院的图书馆、信息中心、校级平台及附属医院数据平台网站,分析涉及科学数据管理服务的信息。
18所医学高校图书馆(30%)在官方网站导航栏设置“科学数据管理服务”相关内容,各图书馆对科学数据管理的理解存在差异,多侧重于学科支撑或读者培训导向的服务模式,见表1。
表1 医学高校图书馆科学数据管理服务导航栏统计
序号导航栏目名称数量(个)占比(%)1读者服务 1626.672学科服务 915.003服务 1016.674服务指南 58.335科研服务 35.006科研支持 35.007咨询服务 23.338服务项目 23.339科技查新 11.6710参考咨询 11.6711教学培训 11.6712研究支持 11.6713教学科研服务11.6714资源与服务 11.6715信息服务 11.6716知识服务 11.6717学科支持 11.6718科研数据管理11.67
信息中心主要负责学校业务数据管理服务,以及数据安全管理等规章制度制定。部分信息中心搭建数据平台或提供云服务,为研究人员提供数据交换、治理与存储服务。其中北京大学计算中心、徐州医科大学信息化处、山东第二医科大学网络信息中心通过网盘提供服务,四川大学信息中心、重庆医科大学信息中心、安徽中医药大学信息化管理处通过计算平台提供服务;浙江中医药大学信息技术中心、山东第一医科大学网络信息中心、沈阳药科大学信息中心通过数据中心提供服务。
校级平台通过汇聚高校优势团队资源,整合学校教学数据及附属医院临床数据开展平台建设,提升科学数据管理的整合能力与专业的服务能力。医药/中医药类大学中,数据平台建设主要集中在排名前20位的高校,综合类大学医学院均开展平台建设,见图1。
图1 医学高校提供科学数据管理服务的平台类别及数量
为提升临床科研效能,附属医院的科学数据管理服务以临床数据的集成共享及智能化应用为主。各高校附属医院数据平台建设情况,见图2。
图2 附属医院提供科学数据管理服务的平台类别及数量
通过调研分析,对医学高校提供的科学数据管理服务内容进行概括归纳,形成以数据准备、数据应用和数据保障3个环节为主体的服务框架,并细分为6个阶段[6],见表2。
表2 医学高校科学数据管理服务框架
环节阶段具体服务内容数据准备数据检索与收集学科服务、数据库访问;个性化服务;医学数据收集服务数据存储与挖掘云存储服务;数据标准化处理;数据挖掘数据应用数据分析与培训数据分析工具支持;数据统计分析技术培训;定期讲座与研讨会数据开放与共享数据共享与交流;数据开放数据保障数据归档与保存数据长期保存数据隐私与安全数据安全管理制度
数据检索与收集是医学高校开展研究创新及临床决策支持的基础环节,主要包括从不同来源获取数据,并运用合适技术手段汇聚信息。图书馆是数据检索与收集服务的提供主体,主要服务包括科技查新与查收查引服务,近60%提供学科服务及原文传递,专注学科个性化定制与深度文献挖掘服务。此外,中国医学科学院图书馆与南方医科大学图书馆整合多数据库资源,提供一站式检索服务。
数据存储与挖掘关乎研究效率、创新成果产出及科研决策精准性。多数高校利用附属医院海量数据资源搭建平台,如专病数据平台、临床数据库、中医药资源平台和具备精准数据挖掘功能的平台等,见表3。
表3 我国医学高校科学数据存储与挖掘服务平台及数据中心
所属机构平台/数据中心名称 核心功能与应用方向首都医科大学健康医疗大数据国家研究院实现专科专病的数据存储哈尔滨医科大学生物医学大数据中心开展生物医学数据分析与应用研究上海中医药大学中医药标准数字化管理平台存储标准化、结构化的中医药数据资源上海中医药大学中医方证研究与新药开发决策服务平台[7]提供多轴向、多层次的数据深度挖掘吉林大学白求恩医学部医学物理数据库存储核医学领域相关数据广州中医药大学第一附属医院中医药临床科研一体化大数据平台挖掘中医疾病发展规律,形成中医药数据库中南大学湘雅医学院湘雅医学大数据系统融合多家医院100亿条医疗数据
续表3
所属机构平台/数据中心名称 核心功能与应用方向中国医学科学院阜外医院心血管疾病临床科研数据中心存储超过300家医院心血管专科数据重庆医科大学附属儿童医院临床科研大数据平台包含10余个专病数据库,提供智能检索、科研工具等应用滨州医学院附属医院临床数据中心支持异构数据整合及标准化处理北京大学第一医院健康医疗大数据平台支持异构数据的标准化与结构化吉林大学第一医院真实世界数据应用平台整合各种临床数据、生物样本库和基因检测数据广州医科大学附属脑科医院临床数据中心建立11个临床数据域,实现数据集成与共享广州中医药大学中医药科学数据中心整合存储中医药数据南京医科大学大数据多维分析与软件挖掘管理平台支持医学数据深度挖掘与多维分析河北医科大学临床数据平台提供精准数据挖掘服务复旦大学上海医学院医学科研数据中心支持多模态生物医学数据挖掘和应用华中科技大学同济医学院医用人工智能大数据平台支持多源数据挖掘与深度学习
数据分析有助于解读和利用数据,推动决策与科研发现。高校及附属医院借助数据平台提供强大的科学数据分析功能,涵盖分析整合、统计决策、技术支撑、学科与资源4个方面,见表4。数据培训能够提升研究人员数据素养,保障各阶段数据有效处理与应用。45%的医学高校图书馆在官方网站标明开设文献检索课程,30%通过微课等方式提供数据库培训服务,部分图书馆定期举办培训讲座。
表4 我国医学高校科学数据分析与培训服务平台及数据中心
所属机构平台/数据中心名称核心功能与应用方向中国医学科学院比较医学大数据平台[8]支持实验动物与比较医学大数据分析,提供生物信息学工具上海交通大学医学院生物信息分析平台提供生物信息可视化分析服务西安交通大学医学部卫生信息大数据管理与分析中心提供纵向多维数据融合及医学科研数据统计分析功能武汉大学医学部医学结构生物学研究中心具备成像分析、细胞与组织分析、分离纯化与相互作用分析功能复旦大学上海医学院循证医学中心支持基因组学、流行病学等领域的数据存储和分析哈尔滨医科大学医学统计与数据研究中心在流行病学领域提供医学统计分析和数据处理服务天津医科大学PubMed引文及数据分析系统提供论文引用可视化与多维度数据统计功能
科学数据的开放共享能促进科研合作、加速知识传播、提高研究效率与透明度,对促进科研创新和实现公共利益最大化具有重要意义[9]。医学高校科学数据开放与共享服务平台及机构,见表5。
表5 我国医学高校科学数据开放与共享服务平台及数据中心
所属机构平台/数据中心名称核心功能与应用方向南方医科大学文献公共服务平台[10]提供一站式文献检索、全文下载和学科分析服务福建医科大学科研管理系统支持校内科研数据的开放共享中国医学科学院国家人口健康科学数据中心存储超2 000万条健康数据资源,开放共享人口健康、临床医学等数据广州医科大学附属第一医院国家呼吸医学大数据中心提供跨地域、多中心的呼吸疾病生物资源共享数据中山大学中山医学院生物医学样本库提供健康队列、特定疾病队列资源及样本信息共享平台上海中医药大学中医方证研究与新药开发决策服务平台支持方证关联分析并提供专项数据定制服务
系统整理、存储数据可确保研究成果可验证、可追溯和长期可用。中国医学科学院建设的国家人口健康科学数据中心通过CoreTrustSeal全球核心可信存储库国际认证[11],保障数据长期保存与归档;哈尔滨医科大学图书馆和山东第一医科大学网络信息中心采用云存储模式,通过本地和云端同步备份系统,确保系统故障或数据丢失时能迅速恢复;河北医科大学高性能计算平台具备超融合存储及数据备份系统,满足科学数据长期存储需求。
隐私与安全确保数据从采集到销毁过程的机密性、完整性与合规性,防止数据泄漏和滥用,维护研究完整性和可信度。60所医学高校中,20所公开校内数据安全制度规定;国家人口健康科学数据中心提出数据分级管理制度,将健康医疗科学数据划分为5个等级,明确分级对象颗粒度,对数据文件定级,支持不同级别数据访问控制,更有针对性地保护科学数据安全[12]。
医学高校在科学数据管理服务方面已形成覆盖数据全生命周期的多层次服务。通过整合资源构建一站式检索平台,提供数据检索基础服务,开发专题推送、学科分析等个性化服务;建设数据存储与挖掘平台,保证数据高效管理与价值提取;提供分析工具、课程培训等,提升科研人员专业技能;建设校内外共享平台推动数据互通;以技术支持及制度建设保障数据安全。整体来看,医学高校数据服务呈现专业化、平台化趋势,服务覆盖范围与制度建设日趋完善。
医学高校排名与其提供科学数据管理服务项目数量的关系,见图3。
图3 医学高校排名与其提供科学数据管理服务项目数量的关系
红色虚线为高校排名与服务项目数量关系的线性趋势,高校排名与数据管理服务项目的数量呈正相关。大部分高校提供的科学数据管理服务缺乏贯穿科研生命周期的全流程支持,数据治理、学科分析等服务尚未普及;部分高校缺乏专业数据管理人才,兼具学科专业背景和数据治理能力的复合型人才匮乏,难以满足数据清洗、可视化分析等高阶需求,数据服务质量有待提高;与科研团队的协作机制尚未形成,缺乏对科学数据管理的理解和支持能力。
医学数据常分散于多个课题组、合作单位及院系的不同平台中。由于缺乏统一的数据标准体系,这些平台通常由不同开发团队分散建设,系统架构、数据类型和格式不同,平台间难以兼容互通,形成严重的“数据孤岛”现象。这不仅造成数据质量参差不齐、复现性差,阻碍数据的有效共享与进一步利用,更极大地限制了跨团队、跨学科和跨项目的科研合作。
调查发现,35%的医学高校在信息中心官方网站公布了数据安全规章制度,部分高校缺乏数据常态化管理,数据安全策略较基础,可能增加数据泄漏风险,阻碍数据开放与共享[13]。此外,科研数据共享平台和政策不完善,限制数据有效交流与合作,部分高校开放数据政策模糊,导致研究人员对数据开放态度保守,数据重复生成现象普遍,数据质量较低。
数据管理服务是提升高校科研质量与效率的基础[14]。科学数据管理服务相对滞后的医学高校亟须开展相关能力建设:服务层次方面,向数据治理等深度服务延伸,开发涵盖数据采集、清洗、存储、分析、共享的全流程服务模块;人才培育方面,建立“数据素养+学科知识”的复合型培养机制[1],提升相关人员数据驾驭能力,强化医学专业领域数据管理人才储备;服务模式创新方面,加强嵌入式协作,设立科研数据专员岗位、制定标准化服务流程,明确职责边界,利用数据分析工具和知识库资源,为科研人员提供全维度数据支撑[15]。
采用云服务模式降低平台硬件投入成本[16],着重配置数据存储、基础检索和权限管理等核心功能,确保高校具备基本数据管理能力[17]。以校级数据平台为核心枢纽,集中存储管理不同学科、不同研究项目数据,打破课题组院系间数据壁垒,制定阶梯式数据开放策略,实施分级授权访问。制定数据管理规范制度,明确元数据结构、数据格式等标准,建立数据质量评估体系,通过自动化校验工具对入库数据的完整性、一致性、可溯源性进行动态监测。
制定数据安全管理制度,明确数据采集、存储及使用等各环节责任主体与操作规范[18]。明确数据分级开放管理,将数据分为公开级、受限级和封闭级,制定差异化管理规则。建立常态化安全评估机制,突出对生物样本库等核心资源的防护。成立跨学科数据治理团队,通过数据标注等元数据管理方式提升数据可发现性和可复用性。强化伦理审查委员会职能,建立数据流动审查机制,定期组织数据安全与合规培训,实现数据安全防护与开放共享的有机统一。
医学研究正步入数据密集型时代,临床诊疗、基因组学等多源异构数据呈指数级增长,其价值挖掘高度依赖规范化管理。科学数据管理服务是医学高校支撑科研创新、保障数据安全、促进成果转化的基础。本文总结归纳了医学高校科学数据管理服务的主要内容,并针对其建设与发展提出相应建议。本研究样本仅聚焦医学高校(含独立医学院),未覆盖综合类大学的服务体系,缺乏对学校间差异的深度分析;未来将拓展样本至综合类大学并深化校际比较,以优化服务策略。
作者贡献:张杏负责研究设计、资料分析、论文撰写;段永璇负责提供指导、论文修订。
利益声明:所有作者均声明不存在利益冲突。
1 马丽丽,李罗娜,胡梅梅,等.学科化服务需求导向的图书馆科学数据管理供给与服务模式研究[J].晋图学刊,2025(3):1-8.
2 王瑞丹,高孟绪,石蕾,等.对大数据背景下科学数据开放共享的研究与思考[J].中国科技资源导刊,2020,52(1):1-5,26.
3 蒋甜,许哲平,陈学娟,等.科学数据中心和高校图书馆科学数据服务实践研究[J].中国科技资源导刊,2023,55(4):52-61.
4 周荣伟,李建标.高校科学数据服务平台使用现状及对策分析[J].产业与科技论坛,2021,20(15):265-266.
5 软科.2025中国大学排名[EB/OL].[2025-04-20].https://www.shanghairanking.cn/rankings/bcur/202521.
6 叶冬梅,牛卫东.国外高校图书馆医学科学数据管理服务调研与启示[J].图书馆学研究,2020(5):67-74.
7 南方医科大学.图书馆打造线上培训新模式[EB/OL].[2025-01-10].https://www.smu.edu.cn/info/1140/10158.htm.
8 吴玥,魏强,张连峰,等.比较医学大数据平台的建立[J]. 中国比较医学杂志,2022,32(12):57-65.
9 卢祖丹.科研数据开放共享的经济逻辑与制度安排[J].科学学研究,2022,40(9):1661-1667,1690.
10 南方医科大学科技成果转化平台.文献公共服务平台[EB/OL].[2025-01-10].https://ttc.smu.edu.cn/Service/94cdb2ff-8778-47e5-bae0-0c6f9c44efc5.
11 国家人口健康科学数据中心仓储PHDA获得CoreTrustSeal全球核心可信存储库国际认证[J].医学信息学杂志,2021,42(7):94.
12 吴思竹,钱庆,周伟,等.面向人口健康领域科研项目数据汇交的数据仓储设计与实现[J].数据分析与知识发现,2020,4(12):1-13.
13 韩晓晓,刘迅,崇雨田,等.临床研究中慢性病患者数据隐私和安全保护的伦理共识[J].现代医院,2021,21(6):898-902,906.
14 朱红梅,张耀蕾.数智时代高校图书馆服务能力建设:愿景、挑战及对策[J].湖北民族大学学报(哲学社会科学版),2025,43(1):161-168.
15 贡元菲.挪威高校图书馆科研数据管理实践与启示[J].图书馆工作与研究,2024(11):50-59.
16 王丹丹,武金格.健康医疗数据开放利用的监管策略研究——基于OpenNeuro平台的分析[J].图书情报工作,2025,69(1):58-67.
17 王丹丹,任婧媛.国外主要社会科学数据管理平台建设研究及启示[J].图书情报工作,2023,67(3):131-139.
18 吉萍,祝丹娜,谢杨晓虹,等.健康医疗数据的科研共享应用思考[J].医学与哲学,2022,43(1):5-8.
X