基于DTM的药物重定位领域研究主题与学科交叉跨维度分析

邰杨芳, 陈天麒, 安鹏伟, 吴娟

【作者机构】 山西医科大学管理学院
【分 类 号】 G353.1;R9
【基    金】 山西省高等学校一般性教学改革创新项目(项目编号:J20230538) 山西省高等学校一般性教学改革创新项目(项目编号:J20240522) 山西省研究生创新项目(项目编号:2023SJ169)。
全文 文内图表 参考文献 出版信息
基于DTM的药物重定位领域研究主题与学科交叉跨维度分析*

基于DTM的药物重定位领域研究主题与学科交叉跨维度分析*

邰杨芳 陈天麒 安鹏伟 吴 娟

(山西医科大学管理学院 太原 030001)

〔摘要〕 目的/意义 对药物重定位领域文献进行主题挖掘,揭示其学科交叉、研究主题现状及发展脉络。方法/过程 首先,基于Web of Science学科分类体系确定文献支持学科,通过学科共现聚类分析形成药物重定位研究支持学科群。其次,界定学科交叉文献并划分发展阶段,采用KeyBERT+DTM模型挖掘研究主题。再次,构建“主题-支持学科群”关联网络,分析学科群对领域研究的支持度及主题侧重。最后,基于持续性和差异性分析学科交叉主题的演进态势。结果/结论 药物重定位研究形成以4大学科群为核心、9个跨学科主题为增长极的复合型知识关联网络。研究主题随时间呈非线性发展并趋于均衡。

〔关键词〕 药物重定位;学科交叉;主题挖掘;关联网络;演化分析

1 引言

学科交叉强调打破传统学科界限,结合多学科知识、方法与理论,解决单一学科难以应对的重大问题[1]。药物重定位,又称药物知识发现,运用计算机、生物学、信息学等多学科知识、方法和技术[2],探索已获批药物的新用途,实现老药新用[3]。因药物已上市且安全可靠,其新用途研究可节省大量时间和经济成本[4],药物重定位成为近年备受多学科关注、极具价值的研究方向,相关成果增长显著。现有研究在学科交叉方面尚存在以下问题待解答:学科交叉情况如何,主要研究主题及对应支持学科群有哪些,各主题随时间如何演变等。回答这些问题有助于把握领域全景与演化规律,支撑科研方向规划与跨学科合作。

为此,本研究基于药物重定位文献数据,分析该领域的学科交叉特征(核心主题/支撑学科群),探索研究主题演化路径,揭示主题与学科的动态关联机制。

2 数据与方法

2.1 数据来源

基于Web of Science(WOS)数据库,采用主题检索途径,以drug repositioning、drug repurposing、drug redirecting、drug rediscovery、new indications of drugs、new functions of drugs和drug rescue为检索词,经逻辑OR组合检索后导出全字段数据(检索时间为2023年12月5日)。执行数据清洗流程(排除非研究型文献及无关记录),最终获得有效文献38 433篇。

2.2 研究方法

2.2.1 支持学科群分析 基于38 433篇文献的参考文献来源期刊数据,通过WOS学科分类体系[5]进行期刊-学科映射,识别文献的知识来源学科,即药物重定位研究的支持学科;构建支持学科共现矩阵并采用VOSviewer软件对其聚类,解析药物重定位支持学科群。

2.2.2 学科交叉研究主题分析 采用布里渊指数[6]筛选学科交叉文献(文献布里渊指数>全部文献的均值),结合生命周期理论[7]按发表时间划分药物重定位研究的发展阶段。采用KeyBERT+动态主题模型(dynamic topic model,DTM)挖掘摘要文本隐含的主题。KeyBERT模型用于提取摘要中的关键短语和关键词[8],得到的词汇单元能更准确地表达主题含义[9]。DTM模型[10]在隐含狄利克雷分布(latent Dirichlet allocation,LDA)模型[11]中引入时间维度,将文本分为时间切片,追踪主题分布与词汇分布的演变[12],揭示药物重定位研究的学科交叉主题动态。主题挖掘时,采用主题内部词语的一致性指标确定最优主题数以保障建模质量,分值越高,主题解释性越强[13]

2.2.3 主题-支持学科群关联分析 统计每个主题下每篇文献的支持学科数量,计算其在各支持学科群中学科总数的占比,通过VOSviewer软件进行可视化,得到主题-支持学科群关联网络,呈现药物重定位研究中学科群对主题的支撑情况。

2.2.4 主题演化分析 基于DTM模型得到文档-主题矩阵,分析不同主题在药物重定位研究不同发展阶段支持文档量的变化,包括同一主题不同发展阶段支持文档的占比变化和不同发展阶段各主题的权重分布变化,分析研究主题随时间的变化规律,可揭示领域研究发展动态[14]

3 结果与讨论

3.1 药物重定位领域研究的支持学科分析

药物重定位支持学科共现网络聚类结果,见图1。节点(学科)大小反映频次,边粗细表征学科交叉强度[15]。同色节点属同一个类团,最终聚类形成4个支持学科群。基于各学科群包含的学科成员,分析高频学科并对4大学科群命名,见表1。

表1 药物重定位研究领域支持学科群及简要介绍

序号高频学科成员学科群名称及简介1多学科材料科学(multidisciplinary materials science);工程学,生物医学(engineering,biomedical);食品科学与技术(food science & technology);纳米科学与技术(nanoscience & nanotechnology);生物材料与科学(materials science & biomaterial);计算机科学,多学科交叉应用(computer science,interdiscipli-nary applications);公众,环境和职业健康(public,environmental & occupational health);精神病学(psychiatry);卫生保健科学与服务(health care sciences & service);医学信息学(medical informatics)交叉科学与卫生健康学科群(红色节点):涉及诸多交叉科学,基于卫生健康视角研究药物的性质、材料等2心脏和心血管系统(cardiac & cardiovascular system);药理学与药学(pharmacology & pharmacy);医学,研究与实验(medicine, research & experimental);全科医学和内科(medicine,general & internal);内分泌与代谢(endocrinology & metabolism);神经科学(neurosciences);肿瘤学(oncology);毒理学(toxi-cology);血液学(hematology);临床神经学(clinical neurology)基础与临床医学学科群(绿色节点):以基础和临床医学为核心,结合疾病机制、病理与临床用药,为药物重定位研究提供医学知识支持3生物化学与分子生物学(biochemistry & molecular biology);生物技术与应用微生物学(biotechnology & applied microbiology);细胞生物学(cell biology);药用化学(medicinal chemistry);交叉化学(multi-disciplinary chemistry);有机化学(organic chemistry,);遗传学与遗传(genetics & heredity);免疫学(immunology);微生物学(microbiology);菌物学(mycology);寄生虫学(pararsitology)生命科学与药用化学学科群(蓝色节点):结合生命科学,以更加微观的视角探索药物化学性质,探索药物重定位4数学与计算生物学(mathematical & computational biology);生物学(biology);生化研究方法(biochem-ical research methods);生物物理学(biophysics)生物及其衍生学科群(黄色节点):通过对药物在生命体中的作用、代谢机制的研究寻找药物新靶点

图1 药物重定位领域支持学科网络聚类图谱

3.2 药物重定位领域学科交叉主题分析

3.2.1 药物重定位领域学科交叉研究的发展阶段 均值反映数据集中心趋势,适合区分高/低交叉性文献,本文基于布里渊指数均值(1.9315)筛选出21 563篇学科交叉文献。药物重定位领域学科交叉研究年发文量,见图2。据此将药物重定位领域学科交叉研究划分为3个阶段。萌芽期(2009—2016年):发文量低,增长率波动显著。成长期(2017—2020年):文献量稳定攀升。暴发期(2021—2023年):绝对发文量达峰值,增速放缓但增量最大。

图2 药物重定位领域学科交叉研究年发文量及年增长率

3.2.2 药物重定位领域学科交叉研究主题 不同主题数对应的一致性得分曲线,见图3。

图3 不同主题数对应的一致性得分曲线

当主题数为9、10时一致性得分较高。测试表明:主题数为9时区分度显著,而主题数为10时存在特征词重叠导致区分模糊,因此选定最佳主题数为9。采用DTM模型对词组切分后的文本数据进行主题挖掘。选择在每个主题上权重分布(取各阶段的平均值)最高的10个词组作为该主题的特征词,据此命名主题并解析核心内容,见表2。

表2 学科交叉主题信息

编号主题特征词主题名称及含义Topic0长期治疗(long term treatment)、蛋白质相互作用(protein-protein interaction)、新机遇(new opportunities)、开发新药(develop new drugs)、药物剂量(drug dose)、蛋白质印迹(western blotting)、蛋白质(protein)、交叉验证(fold cross validation)、囊性纤维化(cystic fibrosis)、结合位点(binding site)蛋白质互作与药物优化:研究蛋白质互作网络,识别药物治疗新靶点Topic1严重急性呼吸综合征(respiratory syndrome coronavirus)、细胞系(cell lines)、细胞死亡(cell death)、耐药性(drug resistance)、活性氧(reactive oxygen species)、血-脑脊液屏障(blood brain barrier)、诱导多能干细胞(pluripotent stem cells)、开发新药(develop new drugs)、药物投递(drug delivery)、活性部位(active site)突发公共卫生事件药物研究:药物重定位在应对突发公共卫生事件时作用突出,可以快速寻找药物新靶点Topic2流式细胞术(flow cytometry)、食品药品监督管理局(food and drug administration)、分子动态模拟(molecular dynamics simulations)、新药(new drug)、蛋白质偶联(protein cou-pled)、细胞活性(cell viability)、自由能(free energy)、识别新基因(identify novel gene)、上皮间质转化(epithelial mesenchymal transition)、COVID-19 细胞研究与药物开发:整合流式细胞术与分子动态模拟技术,多维度解析细胞活性与药物-靶标结合效能Topic3阿尔茨海默病(Alzheimer’s disease)、干细胞(stem cells)、药物投递(drug delivery)、药物靶点(drug targets)、革兰氏阴性杆菌(gram-negative bacilli)、实时聚合酶链反应(real time PCR)、食品药品监督管理局(food and drug administration)、间充质干细胞(mesenchymal stem)、糖尿病(diabetes mellitus)、新机遇(new opportunities)神经与代谢性疾病的药物靶点探索:神经与代谢性疾病靶点(如阿尔茨海默病、糖尿病)研究中,间充质干细胞成为治疗新突破口Topic4急性呼吸系统疾病(acute respiratory diseases)、COVID-19、阿尔茨海默病(Alzheimer’s disease)、药物重定位(drug reposition)、活性氧(reactive oxygen species)、体内外(vitro vivo)、基于结构(structure based)、发现新用法(find new uses)、小分子(small mole-cule)、寻找新靶点(search new target)小分子新靶点探索与药物研究:挖掘小分子药物的多适应证治疗潜力,重塑疾病治疗范式Topic5新见解(new insights)、氧化应激(oxidative stress)、传统中药(traditional Chinese medi-cine)、诱导多能干细胞(induced pluripotent stem cells)、一氧化氮(nitric oxide)、候选药物(drug candidates)、阿尔茨海默病(Alzheimer’s disease)、干细胞(stem cell)、蛋白质水平(protein levels)、伤口愈合(wound healing)传统中药的创新研究:中医药强调整体观,往往“一药多用”“一病多治”,与药物重定位的方向一致Topic6活性氧(reactive oxygen species)、新见解(new insights)、肝细胞癌(hepatocellular carci-noma)、分子动态模拟(molecular dynamics simulations)、当前可用(currently available)、确定新策略(identify new strategies)、广谱活性(broad spectrum activity)、药物设计(drug design)、主要原因(major cause)、分子对接(molecular docking)肝细胞癌的药物创新:聚焦活性氧调控机制,结合分子动态模拟和对接技术,为药物设计提供新见解Topic7药物重定位(drug repurpostion)、野生型(wild type)、周期阻滞(cycle arrest)、新机遇(new opportunities)、蛋白质印迹(western blotting)、广泛使用(widely used)、实时聚合酶链反应(real time PCR)、调查研究(study investigated)、虚拟筛选(virtual screening)、分子动态模拟(molecular dynamics simulations)生物技术在药物领域的应用研究:生物技术革新带来药物研发与药物重定位新机遇,缩短新药研发周期Topic8食品药品监督管理局(food and drug administration)、再利用(repurposing existing)、开发新药(develop new drugs)、小分子(small molecule)、耐药性(drug resistance)、机器学习(machine learning)、虚拟筛选(virtual screening)、细胞系(cell lines)、新一代(new generation)、人脐静脉内皮细胞(huvecs,human umbilical vein endothelial cells)机器学习在药物领域的应用研究:机器学习引领药物研发与重定位新纪元,如基于虚拟筛选技术实现大规模化合物库中活性分子的精准定位

3.3 学科交叉主题与支持学科群关联分析

学科交叉主题(绿色节点)与支持学科群(红色节点)关联网络,见图4。连线表征学科群对主题的支持关系,红色节点大小反映学科的总支持强度。

图4 主题-支持学科群关联网络

3.3.1 关联网络中的支持学科群分析 各学科群主题支持强度层级:基础与临床医学学科群(节点最大)为药物重定位研究提供核心基础支撑;生命科学与药用化学学科群(节点大小次之)为领域研究核心驱动力;交叉科学与卫生健康学科群广泛参与主题支持,属潜力学科群;生物及其衍生学科群(节点最小)关联稀疏,为新兴学科交叉群。

3.3.2 学科群的支持主题分析 (1)基础与临床医学学科群支持主题。基础医学解析人体生理病理机制,为药物发现提供理论依据[16],临床医学通过临床转化验证药物安全性与疗效[17]。二者协同构建“机制解析-临床验证”双向路径,可显著提升公共卫生事件(Topic1)中突发传染病的防控效能,深化阿尔茨海默病、糖尿病(Topic3)等慢性病靶向干预。中药创新研究(Topic5)结合基因组学技术重构传统药效物质基础,生物技术临床转化(Topic7)通过基因编辑/细胞治疗重构疾病治疗范式,体现基础与临床医学协同推动药物重定位研究全链条发展。(2)生命科学与药用化学学科群支持主题。生命科学为靶点发现、高通量筛选和药效评价[18]提供生物学基础,药用化学通过化学原理解析药物构效关系及材料优化。支持研究聚焦3个层面:小分子新靶点探索(Topic4)实现基于药物重定位的靶标网络重构;细胞水平研究(Topic2)建立细胞微环境下的药物靶点探索模式;肝细胞癌药物创新研究(Topic6)探索细胞层面药物治疗。(3)交叉科学与卫生健康学科群支持主题。整合纳米、信息、化学等技术,提升药物重定位研究效率,促进形成完整的疾病预防-诊疗体系[19]。典型应用包括:突发公共卫生事件(Topic1)、全球常见恶性肿瘤肝细胞癌(Topic6)治疗药物研究和基于机器学习的药物研发(Topic8)。该学科交叉范式突破传统研究边界,形成“技术驱动-临床验证”的多维度药物重定位研究方案。(4)生物及其衍生学科群支持主题。生物及其衍生学科群为药物研发与重定位研究提供药物新靶点、药物筛选技术和对作用机制等方面的深入理解[20]。基于蛋白质(Topic0)、细胞(Topic2)、小分子(Topic4)层面的药物重定位研究,形成生物科学主导的药物研发范式。

3.4 药物重定位学科交叉主题演化分析

药物重定位学科交叉主题演化双轴映射,见图5。横轴标识主题分布,左轴柱状图量化主题发展持续性(支持文档占比),右轴曲线追踪不同阶段各主题的占比变化。

图5 药物重定位学科交叉主题演化双轴映射

3.4.1 研究主题的跨阶段发展变化分析 前文图5柱状图量化主题跨阶段分布比率(各阶段支持文档占该主题总文档比例),揭示主题演进持续性。(1)萌芽期到成长期的主题发展特征。依据萌芽期到成长期研究主题支持文档占比变化,主题发展类型分为3种。短暂衰退型:Topic4支持文档数量下降近30%,因计算机技术革新推动药物重定位研究方法迭代。相对停滞型:Topic0、Topic5文献量略降。计算生物学和人工智能技术升级促使Topic0向新主题(Topic7、Topic8)演化。Topic5受药物质量控制标准提升(如《中华人民共和国药典(2020年版)》[21])影响,研究成果减少。稳定增长型:突发公共卫生事件(Topic1)使针对相关传染病的药物研究成为热点;生物学进步推动细胞层面药物靶点研究(Topic2)发展;人口老龄化及生活方式改变,使神经与代谢性疾病(Topic3)、肝细胞癌(Topic6)药物重定位需求上升;生物技术飞速发展,促进其在药物研究领域(Topic7)广泛应用。人工智能、机器学习深入发展驱动药物研发(Topic8)效率提升[22]。(2)成长期到暴发期的主题发展特征。多数主题(除Topic8)文献量显著增长,主要因药物重定位具有“成本低、时间短、风险小”优势,驱动多学科力量涌入。Topic8前期增速过快出现小幅回落,但整体体量仍居高位。总体上,各研究主题呈现3阶段非线性发展特征:相关领域的技术迭代使传统方法衰退,学科交叉形成过渡态主题(发展相对停滞),然而公共卫生事件、人口结构变迁与人工智能等因素又促使领域研究量稳定增长。

3.4.2 研究主题的阶段内权重分布差异分析 前文图5中3色曲线映射3阶段学科交叉主题(权重)演进差异。(1)萌芽期。各主题权重分布差异较大。传统研究思路对应Topic 4(小分子新靶点探索与药物研究)和Topic 0(蛋白质互作与药物优化)占主导。Topic 8(机器学习在药物领域的应用研究)因技术渗透不足尚未形成规模,权重最低。(2)成长期。主题发展呈分化态势:多数领域(Topic 0—Topic 3、Topic 5—Topic7)稳定发展,得益于药物重定位有临床前、药效学和毒性等数据支持,可快速推进临床研究,持续吸引研发投入。Topic 8因人工智能等第四次工业革命技术推动实现跨越式增长,跃居首位;Topic 4受限于传统研究方法瓶颈,占比显著下滑。(3)暴发期。各主题呈现均衡格局,占比差距较小(10%~12%),研究体系稳定,内容多元化。综上所述,各主题权重分布3阶段呈“差异分化非均衡跃迁均衡发展”态势。

4 结语

当前药物重定位领域已形成4大支持学科群与9个学科交叉主题协同驱动的研究架构,各学科群在研究范式与主题聚焦维度差异明显。研究主题随时间非线性发展。本研究可为把握学科动态、优化科研布局提供参考。局限性在于数据仅源于WOS单源数据库;学科交叉文献界定仅采用单一指标;因学科数量多,学科群解析深度不足。未来将考虑基于以上角度进行研究优化。

作者贡献:邰杨芳负责研究设计、论文修订;陈天麒负责论文撰写;安鹏伟、吴娟负责数据收集与分析。

利益声明:所有作者均声明不存在利益冲突。

参考文献

1 张雪,张志强.学科交叉研究系统综述[J].图书情报工作,2020,64(14):112-125.

2 李志勇,王均琪,黎彩凤,等.中药新资源的功效与功能定位研究策略[J].中国中药杂志,2021,46(14):3455-3464.

3 谢达菲,李鹏,李非,等.药物重定位的计算分析方法[J].生物化学与生物物理进展,2012,39(11):1029-1036.

4 黄松涛.药物-靶标相互作用的智能分析[D].无锡:江南大学,2022.

5 蔡永莲,彭颢舒.人工智能技术的学科多样性及其与生物医药领域的融合发展[J].上海理工大学学报(社会科学版),2023,45(3):330-336.

6 宋宜嘉,楼雯,赵星.基于布里渊指数的期刊多维度影响力多样性测度[J].图书馆建设,2023(1):118-127.

7 孙宗缘,马秀峰,李奇. 突发公共安全事件网络舆情演化分析——基于文本挖掘与情感分析两个视角[J]. 河北科技图苑,2021,34(5):65-75.

8 谢秀芳,王茜,陈挺,等.神经科学领域前沿发展态势研究:基于ESI研究前沿的深度挖掘分析[J].世界科技研究与发展,2023,45(1):63-76.

9 李牧南,王业信.基于LDA-KeyBERT模型的技术预见:以工业互联网为例[J].创新科技,2023,23(7):53-65.

10 BLEI D M,LAFFFFERTY J D. Dynamic topic models[C].New York:The 23rd International Conference on Machine Learning,2006.

11 BLEI D M,NG A Y,JORDAN M.Latent Dirichlet allocation[J].Journal of machine learningresearch,2003,3(4/5):993-1022.

12 邱均平,胡博,徐中阳,等. 基于DTM模型的国内外话语权研究主题挖掘及比较分析[J]. 情报理论与实践,2023,46(2):24-34.

13 吴瑞鹏,李勇男,刘帅,等.基于DTM的美国人工智能战略热点主题及演化分析[J].情报杂志,2023,42(12):134-143.

14 王静宜,徐敏,祝振媛,等.情报分析中的方法应用研究[J].情报理论与实践,2020,43(1):33-41.

15 贾倩,张辉,串丽敏,等.基于专利网络分析的作物生物育种核心技术研究[J].世界科技研究与发展,2025,47(2):198-214.

16 田晶,田鹤,于利,等.基础医学专业研究生“学科交叉,协同育人”创新能力培养模式的改革与实践[J].卫生职业教育,2025,43(1):4-7.

17 相前,杨伟.ChatGPT在临床医学教育中的融合与革新:机遇、挑战与策略[J].卫生职业教育,2025,43(1):1-4.

18 徐飞.安徽大学生命科学学院教授陈学敏聚焦酶分子运作机制助力癌症靶向药物设计[J].中国高新科技,2023(24):15-16.

19 洪秋棉,张昀.全球健康学本科人才培养模式探索与实践[J].秦智,2023(11):133-135.

20 汤佳宁,孙洋.计算生物学在药学研究中的应用[J].药学学报,2024,59(8):2192-2198.

21 王连心,杨硕,魏瑞丽,等.口服中成药临床应用药物警戒指南[J].中国中药杂志,2024,49(16):4273-4278.

22 彭超,胡永祥,陈龙飞,等.基于机器学习和大数据挖掘的药物重定位算法综述[J].药学进展,2020,44(1):4-9.

Research Topic and Interdisciplinary Cross-dimensional Analysis of Drug Repositioning Based on DTM

TAI YangfangCHEN TianqiAN PengweiWU Juan

School of ManagementShanxi Medical UniversityTaiyuan 030001,China

AbstractPurpose/Significance To conduct topic mining of literatures in the field of drug repositioning,and to reveal its interdisciplinary statas,research topic status and development venation. Method/Process Firstly,the literature support disciplines are determined based on the Web of Science subject classification system,and the drug repositioning research support discipline groups are formed through the co-occurrence cluster analysis of disciplines. Secondly,the interdisciplinary literatures are defined,and the development stages are divided. The KeyBERT+DTM model is used to mine research topics. Thirdly,the “topic-support subject group” association network is constructed to analyze the support degree and topic focus of the subject groups for the research in the field. Finally,the evolution trend of interdisciplinary topics is analyzed based on continuity and difference.Result/Conclusion The research on drug repositioning has formed a compound knowledge association network with 4 discipline groups as the core and 9 interdisciplinary topics as the growth poles. The research topic develops nonlinearly over time and tends to be balanced.

Keywordsdrug repositioning;interdisciplinary;topic mining;association network;evolution analysis

〔中图分类号〕R-058

〔文献标识码〕A

〔DOI〕10.3969/j.issn.1673-6036.2025.06.008

〔修回日期〕 2025-02-20

〔作者简介〕 邰杨芳,博士,副教授,发表论文92篇。

〔基金项目〕 山西省高等学校一般性教学改革创新项目(项目编号:J20230538);山西省高等学校一般性教学改革创新项目(项目编号:J20240522);山西省研究生创新项目(项目编号:2023SJ169)。

X