前结构化电子病历及其数据管理体系设计与实现

陈婕卿, 周翔

【作者机构】 中国医学科学院北京协和医院
【分 类 号】 R197.323
【基    金】 北京协和医院协和人才培育支持计划D 类项目(项目编号:UHB12072)。
全文 文内图表 参考文献 出版信息
前结构化电子病历及其数据管理体系设计与实现

前结构化电子病历及其数据管理体系设计与实现

陈婕卿 周 翔

(中国医学科学院北京协和医院 北京 100730)

〔摘要〕 目的/意义 建设前结构化电子病历数据管理体系,并探讨其对智慧医院建设水平和医院医疗、教学、科研、管理效能提升的影响。方法/过程 基于现行电子病历系统管理模式,设计多层次前结构化电子病历数据管理体系和“写-存-转-用”关键技术路径,通过统一专病模板、统一字典标准和统一建设路径,实现电子病历数据的高效管理和利用。结果/结论 规范化病历模板和数据管理体系有效赋能医院医疗、教学、科研、管理,提升了病历书写标准化水平和数据利用效率,为智慧医院建设提供了高质量的病历数据基础。

〔关键词〕 前结构化电子病历;智慧医院;智慧管理

1 引言

2018年国家卫生健康委员会发布《电子病历系统应用水平分级评价管理办法(试行)及评价标准(试行)》[1],明确了电子病历系统应用水平分级评价的标准,为医院信息化建设提供了重要依据。电子病历记载着患者关键诊疗信息,是智慧医院建设的核心基础[2],其规范化建设与高效应用是实现医疗数据价值、提升医疗服务质量和推动医院数字化转型的关键,对优化医疗资源配置、提高医疗决策科学性及促进医学科学研究发展等具有重要意义。前结构化电子病历 (以下简称前结构化病历) 通过优化书写结构,采用标准化、结构化形式存储,提升数据的准确性和完整性,为医疗决策提供支持,推动智慧医院建设[3-4]。但是其在实施过程中面临诸多挑战,如技术实现复杂性高、医生接受度低等,仍需多方共同努力不断探索和完善其应用模式和技术路径。本文从需求分析、技术方案和功能实现等方面详细阐述前结构化病历及其数据管理体系的建设经验,旨在推动其在智慧医院中的应用。

2 建设需求

2.1 数据治理需求

当前医疗数据质量参差不齐、标准化水平较低,主要是由于病历数据的存储格式、术语体系及编码规则存在显著差异[5-8],而且既往纸质病历数字化质量不一、隐私保护带来访问壁垒、跨系统数据整合技术尚不完善。传统电子病历书写规范性不足,后结构化处理结果良莠不齐,也削弱了病历数据的可挖掘性与可用性。因此,亟须建立统一的数据元标准与语义框架,形成系统的数据治理规范,以实现病历数据的规范化管理,为后续共享与分析奠定基础。

2.2 病历质控需求

病历质控是病历管理的重要环节,传统质控一般由符合资格要求的临床专家进行回顾性病历阅读,结合临床经验判断电子病历中的诊疗决策准确性和病历内涵科学性。随着人工智能技术的普及,建设规范的病历录入模板、标准化的字段约束和逻辑校验规则,可实现病历录入的实时质控提示,从源头保障病历的完整性与一致性,提高病历质控效率。

2.3 数据利用需求

在真实世界研究中,覆盖患者全生命周期的高质量数据对统计建模至关重要[9-11],这要求信息系统在数据采集端就实现语义层面的统一,具体包括以下几方面需求。一是在数据生产环节完成标准化映射与动态编码,以支持后续无需二次清洗的即时入组与细粒度分析[12-15]。二是内置可扩展的医学术语字典和知识表示框架,使症状、体征、检验、影像和干预等多元异构数据在同一语义空间自动关联,为知识图谱的持续演化和算法训练提供可解释性素材。三是面向研究设计模块化数据湖架构,实现从实时采集、增量治理到合规共享的全链路管控,降低传统分散存储带来的集成成本和隐私风险。四是嵌入可配置的决策逻辑规则,并通过临床决策支持系统即时反馈给医生。

3 方案设计

3.1 整体架构设计

前结构化病历数据管理体系基于现有电子病历系统架构,采用多层次数据管理模式,见图1。数据层作为底层基础,负责存储各类原始数据,包括病历数据、诊疗数据和监控数据等。支撑层是整个体系的技术核心,包含技术中台、业务中台和数据中台。其中技术中台通过存储引擎和计算引擎实现数据的高效存储、处理和分析。数据中台主要为数据存储、管理和调用提供技术支撑,其核心功能包括数据标准化管理、数据质量管理等,确保数据可靠性、一致性和安全性。数据中台通过数据资源库为上层应用提供标准化数据支持。应用层聚焦数据的实际利用,通过数据驱动的方式提升医院临床、科研、管理及教学质量。由此在临床方面可实现辅助决策、专病因子检测等功能,提高医疗质量;在科研领域,支持专病库管理和专病数据挖掘,助力创新;在管理上优化医院运营模式,提高基于病历的医保控费能力;在教学中,提供专病教学模板,借助病历模板实现临床经验的传递,提升教学质量。整体架构设计体现数据驱动的核心理念,通过分层管理构建集数据存储、处理、分析和应用于一体的完整体系。

图1 前结构化病历数据管理体系

3.2 核心建设原则(图2)

图2 前结构化电子病历核心建设原则及建设路径

3.2.1 统一专病模板 统一专病模板是前结构化病历建设的基础。结合权威临床指南、教材中的医学知识和历史病历数据,设计专病前结构化病历模板,并由临床教授团队审阅以逐步完善。模板涵盖疾病的主要症状、体征、实验室检查结果及治疗方案等关键信息,并确保模板的标准化和一致性。例如,针对狼疮肾炎等复杂疾病,模板要明确多系统受累的临床表现及实验室检查指标,确保病历书写内容的完整性和规范性。

3.2.2 统一字典标准 统一字典标准是确保数据一致性和准确性的关键。结合国家或行业标准、教材、临床指南等权威资料,建设前结构化病历字典库,涵盖18大类、80小类医疗术语,包括症状、体征、操作、临床所见等,并对术语进行严格定义和分类,见表1。例如,在“症状”字段的标准化字典结构中,应明确其描述的具体医学内涵,如“血尿”症状,在症状字典中将其明确为:新鲜尿液离心后沉渣镜检每高倍镜视野红细胞>3个。另外,进行关键词消歧处理,不能在症状字典中同时出现含义相近的表达,如:“发烧”“发热”两种症状表述仅取其一,避免相似表达混淆。

表1 专病前结构化病历模板中“症状”字段的标准化字典结构(部分)

书写名称 变量类别 对应症状 医学内涵 备注 水肿 文本 水肿 组织间隙过量积液 允许扩充描述, 前置定语 血尿 文本 血尿 新鲜尿液离心后沉渣镜检, 每高倍镜视野红细胞>3 个 主诉: 提示 “发现” 蛋白尿 文本 蛋白尿 尿蛋白排泄>150mgd 或尿蛋白肌酐比 ( protein-to- creati- nine ratio, PCR) >15mg / mmol 主诉: 提示 “发现”, 严格意义上非症 状, 为客观辅助检查结果 尿急 文本 尿路刺激征 一有尿意须立即排尿, 常由于无法控制而尿失禁 尿痛 文本 尿路刺激征 排尿时因病变部位受到刺激而产生的尿道、 耻骨上区及 会阴部不适感 少尿 文本 少尿 24 小时尿量<400mL 或每小时尿量≤17mL 无尿 文本 无尿 24 小时尿量<100mL 或 12 小时完全无尿

3.2.3 统一建设路径 前结构化病历建设包括“写-存-转-用”4个关键环节。一是模板书写,医生按照统一专病模板和字典标准书写病历,确保内容的规范性和完整性。书写过程中应结合历史数据回顾,明确疾病选择和词典引用优先级。二是病历存储,通过数据湖支持多种类型数据的结构化存储,包括文本、数值等,确保数据完整性和一致性。三是数据转换,实现数据共享和互操作。异构系统间数据交互须建立动态语义映射机制和解析机制,并通过中间件技术实现异构系统接口标准化,同时制定规范的数据交换协议,确保数据语义一致性与可解析性。四是数据利用,病历数据可广泛应用于医疗、教学、科研、管理多个维度,涉及临床决策支持、科研数据分析、教学资源管理和绩效考核等领域。例如,临床医生可利用病历数据辅助诊断和治疗决策,同时减少重复病历信息录入;科研人员可利用病历数据快速构建专病库;教师可将前结构化病历作为教学案例;管理部门可通过病历监控医疗质量,优化医疗资源配置。

3.3 技术层面创新

3.3.1 字段构建方法创新 采用知识图谱引导和行为数据协同双重策略构建结构化字段。基于电子病历的知识图谱融合临床指南的多维语义网络,将《国际疾病分类第十次修订本(ICD-10)》、药品知识库等数据通过本体映射建立关联规则,见图3,其中知识库实时更新,以确保符合最新临床指南要求。行为数据协同,是指通过分析200万条医生病历书写记录和本体使用习惯,建立个性化字段优化模型,并按使用频率由高至低对引用的症状字典进行排序展示。

图3 知识图谱驱动结构化字段定义

3.3.2 病历质控方法创新 通过多粒度缺陷定位、知识协同双重策略的整改策略实现技术突破。系统采用“字段-语义-逻辑”三重定位模型:基于结构化元数据精准识别字段级缺陷(如标记结构化单元中的负数为异常生命体征值),运用医疗双向编码器表征(bidirectional encoder representations from transformers,BERT)模型解析自由文本捕捉语义单元问题(如现病史的时序信息缺失),并构建跨模块关系图谱发现逻辑矛盾(如病历中的麻醉方式与手术记录冲突),推动病历质量管理从被动纠错转向主动预防。

4 应用情况

截至2025年6月,医院已建立 53 份专科专病前结构化病历模板并投入临床应用,涉及狼疮肾炎、淋巴瘤、子宫肌瘤等专病的住院病历(分入院、病程、出院、手术4类),以及儿童屈光不正、心肌炎等专病的门诊病历(分初诊、复诊两类),实现了病历书写的标准化和规范化管理。前结构化病历通过设定清晰的数据框架与标准字段,引导医生在诊疗过程中实时、规范地录入信息。专病前结构化病历的数据价值主要体现在医疗、教学、科研、管理4个维度,满足数据治理、病历质控和数据利用的需求,为智慧医院建设奠定了良好的基础。医疗维度,前结构化病历规范了病历书写格式、标化了病历中的体征数据有效值范围等,相比手工录入降低了错误率,提高了病历的准确性和可靠性。此外,病历数据的结构化存储和自动引用功能(例如在复诊患者的病历模板中,可将初诊病历中的病史自动引用至指定的结构化单元中)减轻了医生的书写负担,确保了病历信息的及时性和完整性,为临床决策提供高质量的数据支持。教学维度,前结构化病历数据的标准化和完整性,使其成为高质量教学案例来源和病历书写范本。此外,病历数据的结构化存储和语义一致性,为医学生提供了更直观的学习体验,可促进医学新生的临床病历书写结构化思维培养。科研维度,前结构化病历为科研人员提供了高质量的专病数据支持。基于前结构化病历可快速构建专病库,并进行分析和研究。例如基本外科结直肠癌专病前结构化病历模板的应用,在提高病历书写效率和质量的同时,为结直肠癌临床研究和数据分析提供了结构化数据资源,科研人员用于数据清洗的时间减少40%,科研成果产出周期平均缩短2个月。管理维度,前结构化病历为医疗质量管理和绩效考核提供精准的数据支持,有助于医院运营管理决策。

5 挑战与对策

5.1 数据安全保护问题

数据安全与隐私保护方面的风险随应用场景扩展而增加[16-17],应兼顾医疗数据开放共享与患者隐私保护。例如,构建基于区块链的分布式存储架构,实现数据确权与访问痕迹追踪;采用联邦学习技术开展模型训练,确保原始数据不出域;建立分类分级的隐私保护体系,对敏感字段进行差分隐私处理。此外,还应完善伦理审查机制,明确数据使用边界与责任主体。

5.2 临床接受程度问题

一线医生对前结构化病历的录入模式适应性不同,影响数据质量。可实施分层培训策略:针对资深医生开发智能语音录入工具,保留自然语言书写习惯;对基层医生强化结构化字段的逻辑关联培训,利用临床路径引导规范录入。同时,将病历数据质量纳入考核,通过实时的质控反馈提高书写质量。

6 结语

前结构化病历建设通过统一专病模板、统一字典标准和统一建设路径,可提升病历书写规范性、诊疗决策精准度及医疗资源利用效率,为患者全周期健康管理提供数据支撑。所形成的标准化术语集、质控规则及接口协议,具备跨区域、跨机构推广价值,可助力医疗机构间的数据流通与协同利用。

未来,大语言模型等新技术与电子病历的深度融合将推动前结构化电子病历向更高阶发展。一方面,大语言模型可通过病历内容纠错、逻辑自检等功能强化病案质控能力[18- 19];另一方面,基于多模态数据训练的临床决策模型,可深度挖掘结构化电子病历的潜在价值,为个性化诊疗、风险预警提供实时支持[20-21]。同时,应构建人工智能应用的伦理审查机制与安全防护体系,解决责任归属、数据安全等核心问题。后续研究将通过技术创新与数据生态协同,推动医疗信息化和电子病历管理向“数据驱动、智慧赋能”的新阶段演进。

作者贡献:陈婕卿负责项目实施、论文撰写;周翔负责提供技术指导、论文修订。

利益声明:所有作者均声明不存在利益冲突。

参考文献

1 电子病历系统应用水平分级评价管理办法(试行)及评价标准(试行)[EB/OL].[2025-04-03].https://www.gov.cn/xinwen/2018-12/09/content_5347261.htm.

2 舒婷.智慧医院在公立医院高质量发展中的角色与定位[J].中国卫生信息管理杂志,2022,19(1):5.

3 LIN J,YUAN S,DONG B,et al.Establishment of a simple pediatric lower respiratory tract infections database based on the structured electronic medical records[J].Front pediatr,2022,10(6):917994.

4 王浩,俞东青,张兴平,等.基于真实世界的膝骨性关节炎门诊结构化电子病历模板设计与制作[J].世界科学技术:中医药现代化,2019,21(5):5.

5 袁靖,卜天,秦晓蕾,等.医院病案数字化转型与应用实践[J].中国数字医学,2021,16(9):4.

6 高红,管仲军.“三医协同”数字化转型:场景呈现与优化路径[J].中国行政管理,2025(1):1-5.

7 舒婷,赵韡,刘海一.2020年我国医院电子病历系统应用水平分析[J].中国卫生质量管理,2022,29(1):4.

8 姜若,侯冷晨,胡龙军,等.基于37家上海市级医院的医疗质量安全信息监管平台构建与应用[J].中国卫生质量管理,2024,31(6):1-4.

9 刘雨欣,侯宜坦,左后娟,等.医保真实世界数据质量评估研究——以谈判药品“纳入支付范围的药品费用”为例[J].中国医疗保险,2025(1):34-41.

10 刘爽,冯时,郭昊,等.医疗大数据应用于真实世界研究现状及展望[J].医学信息学杂志,2020,41(3):5.

11 冯雨萱,何恬睿,沈力,等.医疗大数据质量评价及管理研究综述[J].医学信息学杂志,2024,45(8):1-7.

12 杨柳,李小龙,李善平,等.电子病历数据质量评估指标体系构建研究[J].医学信息学杂志,2023,44(10):28-32.

13 赵佳奇,王晓锋,樊羽羽,等.电子病历数据质量及对策研究[J].医学信息学杂志,2021(6):32-36.

14 张丽鑫,孙海霞,唐明坤,等.真实世界电子病历数据评价研究综述[J].医学信息学杂志,2022,43(1):43.

15 吴欢,车贺宾,王万玲,等.基于循证医学和电子病历数据的通用医学知识图谱构建[J].医学信息学杂志,2025,46(2):22-28.

16 徐帆,舒婷.我国医疗机构智慧管理建设现状调查与分析[J].中国卫生信息管理杂志,2024,21(2):177-182.

17 舒婷,徐帆,李红霞,等.我国医联体内医疗机构信息化建设现状调研[J].中国卫生质量管理,2022,29(12):1-5.

18 姜胜耀,李寅驰,薛万东,等.基于大模型的多阶段出院小结质控方法研究[J].中国卫生信息管理杂志,2023,20(6):888-896.

19 吴宏,胡军,陈尔真,等.基于大语言模型的医疗质量控制应用系统构建[J].医学信息学杂志,2025,46(2):8-13.

20 LEVRA A G,GATTI M,MENE R,et al.A large language model-based clinical decision support system for syncope recognition in the emergency department:a framework for clinical workflow integration[J].European journal of internal medicine,2025,131(1):113-120.

21 邓伟伟,余天炜,陈寒,等.基于多模态数据挖掘的网络医生答复采纳预测研究[J].医学信息学杂志,2024,45(2):44-51.

Design and Implementation of Pre-structured Electronic Medical Records and the Data Management System

CHEN JieqingZHOU Xiang

Peking Union Medical College HospitalChinese Academy of Medical SciencesBeijing 100730,China

AbstractPurpose/Significance To establish a pre-structured electronic medical record (EMR) data management system,and to discuss its impact on the construction level of smart hospitals and the improvement of the hospitals’ medical,teaching,scientific research and management efficiency. Method/Process Based on the existing management model of EMR systems,a multi-level data management model for pre-structured EMR and the key technical path of “writing-storage-transfer-utilization” are designed. By unifying disease-specific templates,dictionary standards and construction paths,efficient management and utilization of EMR data can be achieved. Result/Conclusion The implementation of standardized medical record templates and data management systems effectively empower hospital medical care,teaching,research,and management,enhancing the standardization level of medical record writing and the utilization efficiency of data,and laying a high-quality medical record data foundation for the construction of smart hospitals.

Keywordspre-structured electronic medical records (EMR);smart hospital;smart management

〔中图分类号〕R-058

〔文献标识码〕A

〔DOI〕10.3969/j.issn.1673-6036.2025.09.013

〔修回日期〕 2025-08-05

〔作者简介〕 陈婕卿,助理研究员,发表论文10余篇;通信作者:周翔,主任医师。

〔基金项目〕 北京协和医院协和人才培育支持计划D 类项目(项目编号:UHB12072)。

X