基于WGCNA和机器学习的帕金森病免疫关键基因筛选研究

李嘉星, 鲍娟, 余弦

【作者机构】 湖北医药学院公共卫生与健康学院
【分 类 号】
【基    金】
全文 文内图表 参考文献 出版信息
基于WGCNA和机器学习的帕金森病免疫关键基因筛选研究

基于WGCNA和机器学习的帕金森病免疫关键基因筛选研究

李嘉星 鲍 娟 余 弦

(湖北医药学院公共卫生与健康学院 十堰 442000)

〔摘要〕 目的/意义 整合生物信息学和机器学习方法,识别帕金森病(Parkinson’s disease,PD)免疫关键基因,揭示免疫细胞浸润特征及其作用机制。方法/过程 基于GEO数据库PD患者表达数据,结合差异表达分析、加权基因共表达网络分析及ImmPort数据库免疫基因集筛选候选基因。采用4种机器学习算法交叉验证筛选关键基因,构建逻辑回归模型;通过内部及外部验证集评估模型性能;运用ssGSEA分析免疫细胞浸润特征。结果/结论 鉴定出两个关键基因FGF13和IL17RB可作为PD潜在诊断标志物,为阐明PD免疫发病机制提供新思路。

〔关键词〕 帕金森病;加权基因共表达网络分析;免疫细胞;关键基因

1 引言

帕金森病(Parkinson’s disease,PD)是全球第2大神经退行性疾病,其病理特征是黑质多巴胺能神经元进行性退化和α-突触核蛋白异常聚集。PD发病机制复杂,涉及线粒体功能障碍、氧化应激和神经炎症等多种因素[1-3]。越来越多的证据显示免疫功能障碍在PD发病过程中具有重要作用[4]。临床证据显示,自身免疫性疾病患者PD患病风险增加33%,而免疫抑制剂治疗可降低PD患病风险,提示免疫失调与PD密切相关[5-6]。然而,PD免疫相关基因的鉴定及其在疾病进程中的作用机制尚不明确。本研究整合生物信息学和机器学习方法,筛选PD免疫相关关键基因并探讨其免疫浸润特征,为阐明PD免疫病理机制提供新思路。

2 材料与方法

2.1 数据收集和预处理

从公共基因表达数据库(gene expression omnibus,GEO)中检索帕金森病相关数据集,以芯片平台相同且样本来源为人类死后脑组织为筛选标准,纳入4个符合条件的数据集(GSE20163、GSE20164、GSE8397、GSE20168)作为内部数据集,包含52例PD患者和44例正常对照样本[7],见表1。鉴于芯片数据高维、小样本特性,采用完整数据集构建机器学习模型,以提高稳定性和统计效能。为验证模型的泛化性能,整合GSE20295和GSE20292数据集构建外部验证集合集,共纳入51例PD患者和71例正常对照样本。提取表达数据进行标准化和归一化矫正,当多个探针对应同一基因时,取其平均值作为该基因的表达值。使用R软件包“sva”中的ComBat函数消除数据集间的批次效应。从ImmPort数据库中下载1 793个免疫相关基因。该数据库是由美国国立卫生研究院国家过敏和传染病研究所支持的免疫学数据和分析门户。

表1 GEO芯片数据信息

注:各数据集的芯片平台均为GPL96。

2.2 差异表达基因筛选及富集分析

使用R软件包“Limma”进行差异表达分析,在内部数据集中识别PD患者与正常对照样本间的差异表达基因(differentially expressed genes,DEGs),将调整后P<0.05和|log2 FC|>0.5作为筛选阈值[8]。使用R软件包“clusterProfiler”对DEGs进行基因本体论(gene ontology,GO)、京都基因和基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)富集分析[9]。富集分析的显著性阈值为调整后P<0.05。

2.3 加权基因共表达网络分析

使用R软件“WGCNA”包对内部数据集进行加权基因共表达网络分析(weighted gene coexpression network analysis,WGCNA),以识别帕金森病关键基因模块[10]。首先进行数据预处理和质量控制,使用goodSamplesGenes函数过滤不合格基因,通过样本聚类检测并移除异常样本。其次筛选最佳软阈值,使数据最佳逼近无标度网络分布。基于基因间Pearson相关系数构建邻接矩阵,并转换为拓扑重叠矩阵,以量化基因网络连通性。采用层次聚类结合动态树切割算法识别共表达模块,设定最小模块基因数为50。计算模块特征基因(module eigengene,ME),设相关性阈值为0.25,合并高度相关模块。最后计算ME与临床表型的相关性,绘制模块-表型关联热图,选择与表型最相关的模块进行分析。

2.4 免疫候选基因鉴定及功能富集分析

将DEGs与1 793个免疫相关基因取交集,鉴定免疫相关差异表达基因(immune-related DEGs,IR-DEGs)。进一步将WGCNA筛选的模块基因与IR-DEGs取交集,获得PD免疫候选基因,对其进行GO和KEGG富集分析,以调整后P<0.05为显著性阈值,并绘制弦图。

2.5 机器学习模型构建及关键基因筛选

采用4种机器学习算法进行交叉验证,包括最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)、随机森林(random forest,RF)、支持向量机递归特征消除(support vector machine-recursive feature elimination,SVM-RFE)和Boruta算法,对候选基因进行特征筛选。LASSO分析使用“glmnet”软件包,通过10折交叉验证确定最优正则化强度参数λ,筛选对目标变量影响最大的特征基因。RF算法通过“randomForest”包,筛选排名前10位的基因作为潜在关键特征。SVM-RFE通过“e1071”软件包进行5折交叉验证获取最佳变量。将Boruta算法最大迭代轮数设置为500,剔除与分类结果不相关或不确定的基因。将4种算法筛选结果取交集,并将交集基因定义为PD免疫关键基因。

2.6 免疫关键基因功能特征分析

利用GeneMANIA数据库生成PD免疫关键基因的互作网络。对关键基因进行基因集富集分析(gene set enrichment analysis,GSEA)。先根据该基因的中位表达水平将样本分为高表达组和低表达组,再使用R软件包“clusterProfiler”执行GSEA,筛选调整后P<0.05的显著富集通路,根据标准化富集分数的绝对值对通路进行排序。

2.7 列线图构建与评估

基于筛选的关键基因,拟合逻辑回归模型预测PD患病风险,通过绘制Nomogram图、受试者工作特征(receiver operating characteristic,ROC)曲线图和校准曲线图,评估模型在内部数据集上的预测性能与校准性能,并在外部验证集上验证其泛化能力与关键基因的跨队列可重复性。

2.8 免疫浸润分析

采用单样本基因集富集分析(single sample gene set enrichment analysis,ssGSEA)算法计算28种免疫细胞类型在各样本中的富集评分,量化免疫细胞浸润水平。使用Wilcoxon秩和检验比较PD组与正常对照组间免疫细胞浸润差异,筛选差异浸润的免疫细胞类型。随后,通过Spearman相关性分析评估关键基因表达水平与免疫细胞浸润评分间的相关性,识别与关键基因显著相关的免疫细胞类型(P<0.05)。

3 结果

3.1 差异表达基因筛选及富集分析结果

合并后的内部数据集包含96例样本。经差异表达分析,鉴定出397个DEGs,其中85个上调基因和312个下调基因。对DEGs进行富集分析,GO分析显示DEGs主要集中在突触囊泡运输和循环,以及ATP酶耦联转运体活性,见图1;KEGG分析中突触囊泡循环通路最显著,多巴胺能、血清素能等神经递质系统均受影响,见图2,此外还发现多个病原体感染通路富集。

图1 差异表达基因GO分析

图2 差异表达基因前15个显著富集的信号通路

3.2 加权基因共表达网络分析结果

采用WGCNA对样本进行聚类分析,剔除离群样本,筛选软阈值,构建共表达网络。当软阈值β=8时,构建的网络既满足无尺度特性,也满足平均连接程度不至于较小而缺乏足够信息(R2=0.855)。设置最小模块基因数为50,采用动态剪切树算法识别共表达模块,合并相关性大于0.75的模块,最终获得14个共表达模块。基于Pearson相关分析,计算各基因模块特征值与PD表型之间的相关性,turquoise模块与PD表型呈现最强正相关性(r=0.56,P=2.73×10-9),见图3。

图3 基因模块与样本表型相关性热图

3.3 免疫候选基因的鉴定及功能富集分析结果

将DEGs与ImmPort免疫基因集取交集得到IRDEGs,再与WGCNA鉴定的turquoise模块基因取交集,获得24个PD相关免疫候选基因。GO分析表明,这24个候选基因主要富集于细胞分泌和生长因子活性等功能,提示其可能通过调控生长因子活性和分泌过程参与免疫调节。KEGG分析表明,这些基因显著富集于B/T细胞受体信号、MAPK和AGERAGE等免疫相关通路,提示其在免疫应答的多个层面发挥作用。

3.4 机器学习筛选关键基因结果

基于24个候选基因,采用4种机器学习算法交叉验证进行特征选择:LASSO识别出6个具有非零回归系数的关键基因,见图4a—图4c;SVM-RFE采用递归特征消除策略,最终确定2个最优特征基因,见图4c—图4d;RF筛选出排名前10位的基因作为潜在的关键特征,见图4e;Boruta筛选出17个confirmed基因,见图4f。对4种算法的结果取交集,最终确定2个关键基因:FGF13和IL17RB。

图4 关键基因的筛选

3.5 免疫相关关键基因功能特征分析结果

利用GSEA探索FGF13和IL17RB的相关功能通路,发现其与突触囊泡循环、多巴胺能突触、氧化磷酸化、帕金森病和金黄色葡萄球菌感染通路等相关,见图5,这些途径与DEGs功能分析的结果具有一致性。

图5 FGF13和IL17RB的GSEA前10位富集通路

3.6 列线图构建与评估结果

与对照组相比,两个关键基因在内部数据集的PD患者中呈现显著差异表达:FGF13表达下调,IL17RB表达上调。ROC分析显示,FGF13(AUC=0.92)和IL17RB(AUC=0.81)均具有较高的诊断效能,见图6a,基于二者构建的预测PD患病风险的列线图模型AUC值达0.947,见图6b—6e,提示其具有较高的临床应用潜力。为验证关键基因及模型诊断效能的泛化能力,在外部验证集合集中进行独立验证。结果显示,FGF13和IL17RB的AUC值分别为0.79和0.73,其列线图模型AUC值为0.843,提示关键基因具有一定的稳健性,见图7。

图6 列线图的构建与评估

图7 外部验证集(GSE20295和GSE20292合集)中关键基因的诊断效能

3.7 免疫浸润分析结果

采用ssGSEA算法评估28种免疫细胞类型在PD患者和对照组中的免疫细胞浸润差异,见图8a。结果显示效应记忆CD8 T细胞、自然杀伤细胞和浆细胞样树突状细胞等免疫细胞在PD组表达较高,而未成熟树突状细胞表达较低。进一步分析2个关键基因与15种显著差异免疫细胞类型之间的相关性,见图8b。FGF13与自然杀伤细胞、中央记忆CD4/CD8 T细胞等呈显著负相关,而与效应记忆CD4 T细胞、未成熟树突状细胞呈显著正相关。IL17RB与大部分免疫细胞呈正相关或弱相关,仅与效应记忆CD4 T细胞等少数细胞类型呈显著相关性。其中,FGF13表现出更广泛的免疫调控特征。

图8 免疫浸润分析

注:*表示P<0.05,**表示P<0.01,***表示P<0.001。

4 讨论

4.1 PD免疫病理与关键基因筛选策略

PD是常见的老年神经系统变性疾病[11],其并非单纯的运动障碍疾病,而是伴随神经炎症与免疫功能紊乱的多系统疾病,患者存在循环促炎因子升高、免疫细胞激活及血脑屏障破坏等特征[12]。因此,解析PD免疫相关关键基因及免疫浸润模式,对挖掘潜在治疗靶点与诊断标志物具有重要意义。本研究基于GEO数据集,结合ImmPort免疫数据库,采用差异表达分析和加权基因共表达网络,分析筛选免疫相关候选基因,进一步通过4种机器学习算法鉴定出PD免疫关键基因FGF13与IL17RB,并利用ROC曲线及外部数据集验证其诊断效能,揭示了PD特异性免疫浸润特征。

4.2 差异表达基因的功能特征与PD病理关联

为明确PD与正常样本的表达差异,筛选出397个DEGs并进行富集分析。GO分析显示,DEGs主要富集于突触囊泡运输和循环、APT酶耦联转运体活性,这些功能与PD的核心病理过程密切相关。突触囊泡内吞障碍早于多巴胺能神经元丢失,是PD发病早期事件之一[13];ATP酶耦联转运体活性的富集反映线粒体功能异常及囊泡循环障碍[14]。KEGG通路富集分析表明,除突触囊泡循环通路外,DEGs还显著富集于多巴胺能、血清素能及GABA能神经递质系统相关通路[15-16],进一步支持PD的多系统疾病属性。此外,病原体感染通路的富集,提示神经-免疫交互作用可能参与PD病理,这与“感染增加PD发病风险”的研究结论相符[17-18]

4.3 免疫相关差异基因的筛选与功能解析

通过WGCNA筛选的关键模块基因分别与1 793个免疫相关基因及DEGs取交集,获得24个IRDEGs。功能富集显示,IR-DEGs主要参与细胞分泌调控,且富集于B/T细胞受体、MAPK等免疫信号通路。PD患者CD8 T细胞减少且炎症基因上调[19],抑制MAPK信号可缓解PD的氧化应激与神经炎症[20],进一步支持上述通路的重要性。同时,IR-DEGs在分子水平参与免疫信号转导,有研究[21]发现,靶向CCL2-CCR2趋化因子轴可阻断PD外周炎症细胞浸润,提示分泌系统与PD免疫病理的潜在相关性。

4.4 免疫关键基因的诊断效能与作用机制

整合机器学习算法对IR-DEGs进行特征选择,最终确定FGF13与IL17RB为PD免疫关键基因。本研究未额外划分训练集与测试集,而是通过内部数据集的多折交叉验证策略完成特征筛选和模型训练,以提高模型稳定性,并通过GSE20295和GSE20292合集验证模型泛化能力。两种策略结合可有效评估关键基因的诊断价值。

其中,FGF13通过结合IB2和电压门控钠通道调节神经元兴奋性,并通过稳定微管参与神经元极化与迁移[22]。一方面,FGF13缺失导致线粒体功能障碍、ATP生成减少,激活胶质细胞介导的神经炎症。另一方面,FGF13缺失会引发钠通道异常与神经元兴奋性改变[23]。该假说得到多方面验证:FGF13在PD患者和小鼠模型的黑质纹状体中表达显著降低[24],在6-OHDA诱导的PD大鼠模型中,海马区Nav1.1等亚型表达异常,而使用钠通道阻滞剂可改善认知功能[25]。此外,GSEA分析显示FGF13富集于PD通路、氧化磷酸化及金黄色葡萄球菌感染通路,提示其通过突触功能调节、线粒体代谢及神经免疫多重机制参与PD病理。

IL17RB作为IL-17受体家族成员,此前相关研究多聚焦于肿瘤领域,在神经系统疾病中研究较少。最新研究显示,IL17RB+ B细胞可特征性高表达趋化因子CCL17/CCL22[26],而CCL17/CCL22通过CCR4调节免疫细胞向中枢迁移[27-28],提示IL17RB可能通过调控B细胞趋化因子参与塑造PD神经免疫微环境。同时,IL17RB通过IL-17E/IL-17RA通路调节脑区间信号传导[29],且在阿尔茨海默病中为失调中枢基因[30],表明其可能直接参与神经元功能调控。GSEA分析进一步显示,IL17RB高表达组中氧化磷酸化、蛋白酶体、突触囊泡循环及多巴胺能突触通路显著负富集,提示IL17RB可能通过影响线粒体功能、蛋白质稳态及突触功能参与PD进程。

4.5 免疫细胞浸润特征及其生物学意义

免疫浸润分析揭示PD患者与对照样本脑组织中有15种免疫细胞的浸润水平存在显著差异。PD患者NK细胞、中性粒细胞等固有免疫细胞激活,中央记忆T细胞、B细胞等适应性免疫增强。其中,浆细胞样树突状细胞、未成熟树突状细胞、NK细胞及CD4 TEM均与两个关键基因相关,提示其与PD的发生发展密切相关。具体而言,NK细胞浸润水平与FGF13负相关、与IL17RB正相关,表明其可能在PD免疫失衡中发挥重要作用。未成熟树突状细胞维持免疫耐受[31],且未成熟树突状细胞更易通过血脑屏障参与早期炎症[32],因此其减少可能影响免疫耐受调控,从而参与PD免疫病理过程。CD4 TEM作为抗原刺激后形成的免疫细胞亚群,在PD慢性炎症中具有重要意义。已有研究表明,α-突触核蛋白过表达可诱导其浸润大脑并分泌IFNγ[33];PD患者外周血中CD4 TEM增加与运动症状评分正相关[34],上述证据均支持CD4 TEM在PD免疫病理中的潜在作用。

5 结语

本研究通过多维度分析,鉴定出PD免疫关键基因FGF13、IL17RB及4种差异免疫细胞类型(NK细胞、浆细胞样树突状细胞、未成熟树突状细胞、CD4 TEM),为理解PD免疫机制提供新视角,也为精准医学应用奠定基础。但研究存在局限性:数据集均来自公共数据库,样本量较小且以脑组织为主;机制解析停留在生物信息学预测,有待细胞/动物实验验证关键基因对免疫浸润与神经元的作用。未来应扩大多中心、多类型样本量,结合单细胞测序明确关键基因的细胞特异性表达,同时通过实验验证其调控机制,为PD诊治提供更可靠的依据。

作者贡献:李嘉星负责研究设计、数据处理与分析、论文撰写;鲍娟负责论文审核与修订;余弦负责协助数据收集与处理。

利益声明:所有作者均声明不存在利益冲突。

参考文献:

1 YANG Y,WANG Y,WANG C,et al.Identification of hub genes of Parkinson’s disease through bioinformatics analysis[J].Frontiers in neuroscience,2022,16(11):974838.

2 ZHANG Y,KIRYU H.Identification of oxidative stressrelated genes differentially expressed in Alzheimer’s disease and construction of a hub gene-based diagnostic model[J].Scientific reports,2023,13(1):6817.

3 ZONG Y,YANG Y,ZHAO J,et al.Identification of key mitochondria-related genes and their relevance to the immune system linking Parkinson’s disease and primary Sjögren’s syndrome through integrated bioinformatics analyses[J].Computers in biology and medicine,2024,175(6):108511.

4 ABDI I Y,GHANEM S S,El-AGNAF O M.Immunerelated biomarkers for Parkinson’s disease[J].Neurobiology of disease,2022,170(8):105771.

5 LI X,SUNDQUIST J,SUNDQUIST K.Subsequent risks of Parkinson disease in patients with autoimmune and related disorders:a nationwide epidemiological study from Sweden[J].Neurodegenerative diseases,2012,10(1-4):277-284.

6 PAAKINAHO A,KOPONEN M,TIIHONEN M,et al.Disease-modifying antirheumatic drugs and risk of Parkinson disease:nested case-control study of people with rheumatoid arthriti[s J].Neurology,2022,98(12):e1273.

7 ClOUGH E,BARRETT T.The gene expression omnibus database[J].Methods in molecular biology,2016,1418:93-110.

8 RITCHIE M E,PHIPSON B,WU D,et al.Limma powers differential expression analyses for RNA-sequencing and microarray studies[J] .Nucleic acids research,2015,43(7):e 47.

9 WU T,HU E,XU S,et al.ClusterProfiler 4.0:a universal enrichment tool for interpreting omics data[J].The innovation,2021,2(3):100141.

10 LANGFELDER P,HORVATH S.WGCNA:an R package for weighted correlation network analysis[J].BMC bioinformatics,2008,9(1):559.

11 PRZEDBORSKI S.The two-century journey of Parkinson disease research[J].Nature reviews neuroscience,2017,18(4):251-259.

12 TANSEY M G,WALLINGS R L,HOUSER M C,et al.Inflammation and immune dysfunction in Parkinson disease[J].Nature reviews immunology,2022,22(11):657-673.

13 ZOU L,TIAN Y,ZHANG Z.Dysfunction of synaptic vesicle endocytosis in Parkinson’s disease[J].Frontiers in integrative neuroscience,2021,15(5):619160.

14 SONG P,PENG W,SAUVE V,et al.Parkinson’s disease-linked parkin mutation disrupts recycling of synaptic vesicles in human dopaminergic neurons[J].Neuron,2023,111(23):3775-3788.

15 NOBIS L,MAIO M R,SALEH Y,et al.Role of serotonin in modulation of decision-making in Parkinson’s disease[J].Journal of psychopharmacology,2023,37(4):420-431.

16 AL-KURAISHY H M,AL-GAREEB A I,ALBUHADILY A K,et al.Sleep disorders cause Parkinson’s disease or the reverse is true:good GABA good night[J].CNS neuroscience &therapeutics,2024,30(3):e14521.

17 ZHENG J,SHI W,YANG Q,et al.Hospital-treated infectious diseases,infection burden and risk of Parkinson disease:an observational and mendelian randomization study[J].Brain,behavior,and immunity,2024,120(8):352-359.

18 SMEYNE R J,NOYCE A J,BYRNE M,et al.Infection and risk of Parkinson’s disease[J].Journal of Parkinson’s disease,2021,11(1):31-43.

19 BHATIA D,GROZDANOV V,RUF W P,et al.T-cell dysregulation is associated with disease severity in Parkinson’s disease[J].Journal of neuroinflammation,2021,18(1):250.

20 ZHANG X,WANG Y,LV J.STAT4 targets KISS1 to inhibit the oxidative damage,inflammation and neuronal apoptosis in experimental PD models by inactivating the MAPK pathway[J].Neurochemistry international,2024,175(5):105683.

21 ZHANG C,SHAO W,YUAN H,et al.Engineered extracellular vesicle-based nanoformulations that coordinate neuroinflammation and immune homeostasis,enhancing Parkinson’s disease therapy[J].ACS nano,2024,18(34):23014-23031.

22 RIVAS L J,URIBE R A.Fibroblast growth factor(FGF)13[J].Differentiation,2024,140(11/12):100814.

23 WANG Q,YANG J,WANG H,et al.Fibroblast growth factor 13 stabilizes microtubules to promote Na+ channel function in nociceptive DRG neurons and modulates inflammatory pain[J].Journal of advanced research,2020,31(S3):97-111.

24 SONG N,WANG X,HA L,et al.Neuronal FGF13 inhibits mitochondria-derived damage signals to prevent neuroinflammation and neurodegeneration in a mouse model of Parkinson’s disease[J].Advanced science,2025,12(28):2503579.

25 WANG Z,LIN Y,LIU W,et al.Voltage-gated sodium channels are involved in cognitive impairments in Parkinson’s disease-like rats[J].Neuroscience,2019,418(10):231-243.

26 ABDU S,XIA J,YUAN H,et al.IL-25 enhances B cell responses in type 2 inflammation through IL-17RB receptor[J].Allergy,2025,80(4):965-975.

27 SCHEU S,ALI S,RULAND C,et al.The C-C chemokines CCL17 and CCL22 and their receptor CCR4 in CNS autoimmunity[J].International journal of molecular sciences,2017,18(11):2306.

28 LEE Y,LEE S,CHANG S C,et al.Significant roles of neuroinflammation in Parkinson’s disease:therapeutic targets for PD prevention[J].Archives of pharmacal research,2019,42(5):416-425.

29 LEE Y,ISHIKAWA T,LEE H,et al.Brain-wide mapping of immune receptors uncovers a neuromodulatory role of IL-17E and the receptor IL-17RB[J].Cell,2025,188(8):2203-2217.

30 MITRA S,BP K,C R S,et al.Alzheimer’s disease rewires gene coexpression networks coupling different brain regions[J].NPJ systems biology and applications,2024,10(1):50.

31 KOUTSILIERI E,LUTZ M B,SCHELLER C.Autoimmunity,dendritic cells and relevance for Parkinson’s disease[J].Journal of neural transmission,2012,120(1):75-81.

32 ARJMANDI A,LIU K,DOROVINI-ZIS K.Dendritic cell adhesion to cerebral endothelium:role of endothelial cell adhesion molecules and their ligands[J].Journal of neuropathology &experimental neurology,2009,68(3):300-313.

33 W ILLIAMS G P,SCHONHOFF A M,JURKUVENAITE A,et al.CD4 T cells mediate brain inflammation and neurodegeneration in a mouse model of Parkinson’s disease[J].Brain,2021,144(7):2047-2059.

34 SAUNDERS J A H,ESTES K A,KOSLOSKI L M,et al.CD4+regulatory and effector/memory T cell subsets profile motor dysfunction in Parkinson’s disease[J].Journal of neuroimmune pharmacology,2012,7(4):927-938.

Identification of Immune-related Key Genes in Parkinson’s Disease Based on WGCNA and M achine Learning

LI JiaxingBAO JuanYU Xian
School of Public Health and Health SciencesHubei University of MedicineShiyan 442000China

〔Abstract〕 Purpose/Significance To integrate bioinformatics and machine learning approaches to identify immune-related key genes in Parkinson’s disease(PD),and to characterize immune cell infiltration patterns and their potential roles in PD pathogenesis.Method/Process Based on the expression data of PD patients from the GEO database,candidate genes are screened through differential expression analysis,weighted gene co-expression network analysis(WGCNA)and immune gene sets from the ImmPort database.Four machine learning algorithms with cross-validation are applied to screen key genes and construct a logistic regression model.The model performance is evaluated using internal and external validation datasets.Single-sample gene set enrichment analysis is performed to characterize immune cell infiltration profiles.Result/Conclusion Two key genes(FGF13 and IL17RB)are identified,which may serve as potential diagnostic biomarkers for PD,providing new insights for clarifying the immune-related pathogenesis of PD.

〔Keywords〕 Parkinson’s disease(PD);weighted gene co-expression network analysis(WGCNA);immune cell;key gene

〔中图分类号〕 R-058

〔文献标识码〕 A

〔DOI〕 10.3969/j.issn.1673-6036.2026.02.010

〔修回日期〕 2025-12-27

〔作者简介〕 李嘉星,硕士研究生;通信作者:鲍娟,教授。

X