中文电子病历数据元抽取方法

doi:10.3969/j.issn.1673-6036.2024.08.013

首页 > 过刊浏览>2024年第45卷第8期 >中文电子病历数据元抽取方法

中文电子病历数据元抽取方法
DOI:
                        10.3969/j.issn.1673-6036.2024.08.013
                    
作者:
                        
                        
                    
作者单位:(1.河南省图书馆 郑州 450052;2.郑州大学信息管理学院 郑州 450001)
作者简介:郭维嘉,助理馆员,发表论文9篇；通信作者:郭少友,教授。〔基金项目〕 国家社会科学基金一般项目(项目编号:20BTQ063)。
通讯作者:
中图分类号:R-058
基金项目:国家社会科学基金一般项目(项目编号:20BTQ063)。

A Method for Extracting Data Elements from Chinese Electronic Medical Records

Author:

Affiliation:

(1.Henan Provincial Library, Zhengzhou 450052, China; 2.School of Information Management, Zhengzhou University, Zhengzhou 450001, China)

Fund Project:

摘要

图/表

访问统计

参考文献

相似文献

引证文献

资源附件

文章评论

摘要:

目的/意义提出基于国家标准的电子病历数据元抽取方法,以实现电子病历数据的细粒度共享。方法/过程利用ALBERT、BiLSTM和CRF模型对电子病历进行序列标注,并根据标注结果生成一组候选数据元；针对每个候选数据元,采集其上下文信息并形成一个增强的键向量；计算该向量与标准向量之间的相似度,据此判断候选数据元是否有效。结果/结论该方法F1值为90.32%,效果较好。

Abstract:

Purpose/Significance A method is proposed for extracting data elements from electronic medical records (EMR) based on national standards, helping to achieve fine-grained sharing of EMR data. Method/Process The ALBERT, BILSTM and CRF models are used to perform sequence labeling on EMR, and a set of candidate data elements based on labeling results are generated. For any candidate data elements, the contextual information is collected to form an enhanced key vector. Then the similarity between the vector and the standard vector is calculated to determine whether the candidate data element is valid. Result/Conclusion The F1 value is 90.32%, indicating the proposed method has a good performance.

参考文献

相似文献

引证文献

引用本文

郭维嘉,郭少友.中文电子病历数据元抽取方法[J].医学信息学杂志,2024,45(8):78-83

复制

文章指标

点击次数:
下载次数:
HTML阅读次数:
引用次数:

历史

收稿日期:
最后修改日期:2024-03-12
录用日期:
在线发布日期: 2024-09-10
出版日期:

首页

期刊介绍

在线期刊

投稿指南

出版政策

专家中心

学术交流

引用本文

分享

文章指标

历史

友情链接