基于机器学习的2型糖尿病合并高血压影响因素分析模型对比与解释性分析
作者:
作者单位:

(1.河北大学公共卫生学院 保定 071000;2.沧州市中心医院医院管理研究所 沧州 061000;3.河北工业大学经济管理学院 天津 300131;4.北京理工大学医学技术学院 北京 100081;5.中国医学科学院国家人口健康科学数据中心 北京 100730)

作者简介:

芮晨,博士,高级经济师,发表论文16篇;

通讯作者:

中图分类号:

R-058

基金项目:

国家科技重大项目(项目编号:2023ZD0509702)。


Comparative and Explanatory Analysis of Influencing Factor Models for Type 2 Diabetes Mellitus Complicated with Hypertension Based on Machine Learning
Author:
Affiliation:

(1.School of Public Health, Hebei University, Baoding 071000,China;2.Institute of Hospital Management, Cangzhou Central Hospital, Cangzhou 061000,China;3.School of Economics and Management, Hebei University of Technology, Tianjin 300131, China;4.School of Medical Technology, Beijing Institute of Technology, Beijing 100081,China; 5.National Population Health Data Center, Chinese Academy of Medical Sciences, Beijing 100730,China)

Fund Project:

  • 摘要
  • 图/表
  • 访问统计
  • 参考文献
  • 相似文献
  • 引证文献
  • 资源附件
  • 文章评论
    摘要:

    目的/意义 识别2型糖尿病合并高血压的关键影响因素,为高危人群风险预测和个性化干预提供依据。方法/过程 抽取2020—2022年内分泌科3 839例住院患者数据,构建随机森林、支持向量机、极端梯度增强和自然梯度提升4种共病影响因素分析模型,并进行对比分析。以2023年1 000例住院患者数据为验证集,结合SHAP分析与年龄分层亚组验证模型性能。结果/结论 NGBoost模型在2型糖尿病合并高血压预测任务中性能最优,SHAP分析揭示吸烟、并发症数量、甲状腺疾病等为关键因素,且该模型在4个年龄亚组稳定性良好。

    Abstract:

    Purpose/Significance To identify the key influencing factors of type 2 diabetes mellitus (T2DM) with hypertension, and to provide a basis for risk prediction and personalized intervention in high-risk populations. Method/Process Data of 3 839 inpatients from the department of endocrinology from 2020 to 2022 are extracted. Four analysis models of comorbidity influencing factors, namely random forest, support vector machine (SVM), extreme gradient boosting (XGBoost), and natural gradient boosting (NGBoost), are constructed and compared. The data of 1 000 inpatients in 2023 are used as the validation set. The model performance is verified by combining SHAP analysis and age-stratified subgroup validation. Result/Conclusion The NGBoost model shows the optimal performance in predicting T2DM with hypertension. SHAP analysis reveals that smoking, number of complications and thyroid diseases are key influencing factors. Additionally, the model exhibits good stability across four age subgroups.

    参考文献
    相似文献
    引证文献
引用本文

芮晨,刘浩然,张盈盈,等.基于机器学习的2型糖尿病合并高血压影响因素分析模型对比与解释性分析[J].医学信息学杂志,2025,46(11):42-49

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:2025-11-03
  • 录用日期:
  • 在线发布日期: 2025-12-15
  • 出版日期:

扫码关注

官方微信