数智时代中医古籍活化的知识重构路径与模型构建研究

张艳明, 李力恒, 刘红雨, 李秋元, 满鑫宇, 李巍巍

【作者机构】 黑龙江中医药大学
【分 类 号】 R2-03;TP18
【基    金】 黑龙江省中医药经典普及化专项课题(项目编号:ZYW2024-128) 黑龙江中医药大学教育教学研究重点项目(项目编号:XJJZD2022001) 黑龙江省博士后科研启动基金(项目编号:LBH-Q18115)。
全文 文内图表 参考文献 出版信息
数智时代中医古籍活化的知识重构路径与模型构建研究

数智时代中医古籍活化的知识重构路径与模型构建研究

张艳明 李力恒 刘红雨 李秋元 满鑫宇 李巍巍

(黑龙江中医药大学 哈尔滨 150040)

〔摘要〕 目的/意义 利用数智时代新兴技术充分挖掘中医古籍知识,使中医古籍蕴含的内容“活起来”。方法/过程 阐述数智时代中医古籍活化的内涵,探讨中医古籍活化知识重构路径与模型,最后从理论维、技术维、用户维3个维度阐释中医古籍活化发展策略。结果/结论 在数智时代,中医古籍活化知识重构路径与模型的构建,能够有效推动中医古籍数字资源的转化应用,充分挖掘中医古籍的价值,从而更好地传承和发展中医药传统文化。

〔关键词〕 中医古籍活化;知识重构路径;人工智能

1 引言

中医古籍是中医药知识传承与创新的重要载体,其种类繁多、知识内涵广博。目前图像和电子文本形式的中医古籍资源在一定程度上能够满足读者需求,但服务质量和效果不尽如人意。2022年《关于推进新时代古籍工作的意见》[1]中明确提出“积极开展古籍文本结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级”。早期对中医古籍数字化的研究主要聚焦于建立中医古籍知识数据库,如叶未央等[2]探讨构建中医古籍文献数据库的问题和技术策略。近年来学者主要着眼于利用人工智能技术挖掘中医古籍文献信息。如黄舒淳等[3]研究基于聚类分析和关联规则技术挖掘冠心病气虚血瘀症的用药规律,李贺等[4]探讨基于本体的简帛医药知识组织研究。尽管中医古籍数字化领域研究已取得一定成果,但尚存在以下两方面问题。一是中医古籍多以图像和电子文本等非结构化形式存在,数据粒度较粗,难以形成知识网络,中医古籍的价值未得到充分挖掘。二是中医古籍晦涩难懂,专业壁垒较高,且多为线性阅读形式,难以实现沉浸式场景体验。因此应利用数智时代的新理论和新技术,充分挖掘和利用蕴藏在中医古籍中的知识和信息,通过虚拟现实技术实现沉浸式阅读,使中医古籍所蕴含的内容真正“活起来”,以更好地传承和发展中医药传统文化。

本文以实现中医古籍活化为目标,阐述数智时代中医古籍活化的内涵,构建数智时代中医古籍活化知识重构路径,以期实现中医古籍从“活下来”向“活起来”转变。构建中医古籍活化模型,以期实现阅读方式从线性到多维交互的转变。

2 数智时代中医古籍活化的内涵

活化(activation)一词来源于自然科学领域,21世纪以来被广泛应用于古籍、文化遗产和文物等领域的实践和研究,出现了“中医古籍活化”“文化遗传活化”和“中华文物活化”等概念[5]

数智时代中医古籍活化是指,在数字化中医古籍的基础上,利用数智时代的先进技术对中医古籍内容的再挖掘、再组织和再表达[6],见图1。中医古籍的数字化是指利用图像扫描、自然语言处理和光学字符识别(optical character recognition,OCR)等技术将中医古籍实体文献转变成数字格式,从而实现文字、图像、声音的存储、检索和传播,实现从“藏”到“用”的过程。但是中医古籍的数字化资源颗粒度较粗,难以形成知识网络,中医古籍的价值未能得到充分挖掘。中医古籍活化是在数字化资源的基础上,利用数智时代的大数据、标引、知识图谱、关联挖掘等技术[7],将中医古籍知识所包含的信息进行分解和重组,充分挖掘中医古籍价值,将不同知识领域的中医古籍知识关联起来,形成中医药知识网络[8],实现中医古籍的知识化。再在中医古籍知识化的基础上,利用虚拟现实、三维建模、元宇宙等技术,充分调动读者视觉、听觉等感官感受,使其沉浸式阅读,实现中医古籍的智慧化,即从“用”到“活”的过程。

图1 数智时代中医古籍活化的内涵

数智时代中医古籍活化是一项系统性工程,其核心要素包括活化主体、目标对象、活化内容和活化技术。活化主体主要指文化事业单位、高校科研机构、文化产业机构、政府相关部门和普通社会民众,其在资源、政策、人才、资金、技术等方面相辅相成、优势互补。目标对象主要有专业研究人员和普通民众两类,其既是中医古籍活化成果的创造者,也是使用者。活化内容包括中医古籍文本、中医古籍知识库和中医古籍服务过程3类。活化技术主要包括数字化技术、知识元标引技术、知识图谱与可视化技术、新媒体技术等。

3 数智时代中医古籍活化知识重构路径

数智时代中医古籍活化打破中医古籍知识碎片化、封闭性和孤立性的知识模式,其知识重构路径主要包括“化面为点”和“化点为面”两个过程,见图2。“化面为点”指对中医古籍内容深度识别和标引,由中医古籍册、古籍篇章等划分为知识元;再“化点为面”,通过挖掘、合并、重组等,将碎片化的知识元转化成知识体,实现跨越不同领域、不同题材的知识重组,从而形成完整的中医药知识体系。

图2 数智时代中医古籍活化知识重构路径

“化面为点”从中医药知识组织体系出发,将中医古籍内容颗粒化,将多媒介、多版本、多模态的中医古籍资源从语义层面进行深度识别和标引,将中医古籍册、古籍篇章中的概念实体和具体知识单元进行细粒度识别和表示,划分成知识元。其中,知识元是能够被标记、存储、使用和管理的最小知识个体,是表达一个完整概念的不可再分解的最小知识单位[9]。参照《中国中医药学主题词表》和中医药学语言系统等中医药经典权威资料,将中医古籍知识元划分为疾病、症状、中药、方剂等类型,其中部分知识元的主要属性,见表1。“化面为点”是后续知识挖掘和重组的基础,使孤立、碎片化的中医古籍资源成为综合性中医古籍知识库的有机组成部分。

表1 中医古籍知识元属性示例

类型属性症状知识元名称、表现、病因、病机中药知识元药性、药味、归经、功效、用法用量方剂知识元剂型、治法、服法、制法、功效

“化点为面”借助关联挖掘、知识元解析、语义分析、机器学习等人工智能技术,根据中医古籍中的疾病、症状、中药、方剂等属性特点和应用场景,按照中医药知识体系、分类和知识之间的关系进行关联、聚合和重组,将中医古籍中的人、时、事、地、史、典故等要素结合起来,应用到具体场景中,由碎片化知识元转变成知识体,最后借助智能计算、大数据等技术建立中医古籍知识图谱,实现跨越不同领域、不同题材的知识重组,从而形成高质量、个性化、立体化的中医药知识网络。

数智时代中医古籍活化的知识重构路径打破了原有中医古籍的线性阅读和展现形式,打通多个中医古籍领域,形成多维关联的中医古籍网状结构,为新知识和新场景的创造提供了非线性复合空间,实现了时空融合和领域融合。数智时代中医古籍活化的知识重构路径在内容方面实现中医古籍资源的“整理-存储-组织加工-开发利用-传承活化”,在效果方面实现中医古籍资源的“数字化-知识化-智慧化”,实现了中医古籍价值的再创造。

4 数智时代中医古籍活化模型构建

数智时代中医古籍活化在载体媒介、内容组织和表现形式等方面实现内容创新和价值再造。构建数智时代中医古籍活化模型,见图3,包括载体层、内容层和应用层。载体层是中医古籍活化的物理基础,内容层是核心,应用层是目的和归宿。三者在逻辑上紧密相连、相辅相成,共同构成了中医古籍活化的完整价值体系。

图3 数智时代中医古籍活化模型

4.1 载体层

载体层主要实现中医古籍从封闭式数字媒介到网络式数字媒介的创新。在数字化中医古籍资源的基础上,通过开放式网络管理模式,将不同知识领域、知识分类、组织结构的中医古籍资源进行数据规范化和统一化,进而相融合,实现中医古籍基础数据的共享和重用,强化中医古籍资源协同管理。例如,中医古籍综合数据库、中华医典、国医典藏等专门数据库,以及肾病、肺病、冠心病等专题病症数据库,这些数据库对原始的中医古籍数据进行规范统一和共生融合,提升了中医古籍资源的流通能力,为中医古籍数字资源的保护和传播提供了有力支撑。

4.2 内容层

内容层主要将中医古籍从孤立文本转变为知识网络,过程分为基础知识体系搭建、内容颗粒化、内容标引、知识网络构建4个阶段。一是中医古籍基础知识体系搭建,梳理核心知识。甄选《黄帝内经》《伤寒论》等权威中医古籍作为基础知识体系的来源,提取并归纳基础概念,如阴阳、五行、脏腑、经络等,形成清晰的知识框架。二是内容颗粒化,深度解读和理解中医古籍的细节和精髓,将中医古籍内容分解为基础理论、诊断方法、治疗技术、药物药性等维度。在每个维度下进一步切分出具体的知识元[10]。例如,将基础理论拆分为阴阳学说、五行理论等小颗粒,并为每个知识元设定明确的定义、解释和应用场景,确保其独立且完整,为后续知识标引和重组奠定基础。三是内容标引,通过语义分析、知识元解析等人工智能技术为每个知识元或概念赋予精确标签,如对药物功效、方剂组成、主治病症等逐一标引,并给每个知识元命名,以明确其内容主旨。四是知识网络构建,对各知识元之间的关系进行梳理、关联和重组,依据其内在逻辑与关联构建节点之间的连接,形成初步的中医药知识网络。利用图数据库技术将这些节点与连接转化为可视化的知识图谱,再进一步挖掘图谱中的深层关系与知识路径[11-12],为中医药研究、教育与临床决策提供强有力支持。

4.3 应用层

应用层主要实现中医古籍从线性阅读到多维交互的模式转变。传统的中医古籍阅读模式是线性的、单一的,读者主要通过视觉器官感知和理解其中的内容。而借助人工智能、虚拟现实、增强现实、大数据等技术,可将多模态、多领域的中医古籍文本、视频、音频、图像等关联起来[13],对中医古籍中记载的重要病症、治法、方剂等进行数据化、三维建模和虚拟仿真,构建不同疾病背景下的数字化应用场景,实现智能化、可视化、网络化、集成化的沉浸式中医古籍阅读。

沉浸式中医古籍阅读将晦涩难懂的内容转化为虚实相生、实时映射的医学场景。读者可以通过视觉、听觉、味觉、触觉、物体知觉、空间和时间感知等多感官渠道认知和理解中医古籍内容,全身心沉浸在中医古籍虚拟场景中。例如,可以利用虚拟现实技术将古代名医医案的2D文献转换成3D场景空间,使读者切身体会到患者的脉象、舌象、面部特征、皮肤特征、症状等信息;可以构建3D经脉与穴位模型,帮助读者“透视”人体,观察错综复杂的经络网络及各穴位的精确位置;还可以利用交互技术还原古代药物炮制场景,使读者身临其境地参与药物炮制全过程。

沉浸式中医古籍阅读打破时空界限,激发读者对传统中医文化的兴趣,降低中医古籍阅读难度,给读者带来交互性、立体化、沉浸式的全新体验,真正让中医古籍“活起来”。同时,通过沉浸式中医古籍阅读,促进读者“深知”和“生慧”。“深知”即实现读者的“知识习得-知识构想-知识归纳-知识创造”深度学习过程。“生慧”即从学科智慧、思维智慧、文化智慧3个方面实现读者更为高阶的“智慧生长”。

5 数智时代中医古籍活化发展策略

围绕数智时代中医古籍活化的知识重构路径和模型,结合中医古籍的研究内容和研究特色,从理论、技术、用户3个维度阐释中医古籍活化发展策略,其中理论维是中医古籍活化的基础,技术维是关键,用户维是目标,三者相互依存、相互促进,共同推进中医古籍的活化与传承。

5.1 理论维:发展中医古籍活化理论

坚实的理论基础是中医古籍活化工作的重要指导和支撑,应不断加强基础理论和方法研究,推动中医古籍活化进程。虽然已有学者对知识构建、文化遗传、数据共享、评价体系等理论进行研究,但仍稍落后于实践,可能导致中医古籍活化工作建设目标和范围界定不明确[14]。另外,中医古籍活化工作可融合现代医学、生物学、信息科学等学科知识,从文化学、哲学等角度分析中医古籍理论内涵,为中医古籍活化工作开辟新的发展路径。

5.2 技术维:突破中医古籍活化核心技术

中医古籍活化核心技术主要包括本体创建技术、知识组织技术和知识发现技术。对于中医古籍本体创建技术,关键在于采用数据驱动的方法自动创建与中医古籍相关的本体,从而构建层次清晰的大规模中医知识体系框架。对于中医古籍知识组织技术,关键在于人工标注规则的制定、概念术语的分类和大量中医古籍数据的预处理[15]。对于中医古籍知识发现技术,其挑战在于基于知识图谱深入挖掘中医古籍中潜在的隐含知识,实现中医古籍知识网络化和可视化[16]

5.3 用户维:分析不同用户中医古籍活化需求

数智时代中医古籍活化用户主要包括专业研究人员和普通公众两类。对于专业研究人员,应加强对中医古籍知识的深度挖掘与可视化分析,建设智慧化中医古籍数据挖掘与整理平台,为其提供更精准、便捷的中医古籍数据资源。对于普通公众,应充分调研其阅读偏好和常用信息获取方式,在保持中医古籍主体内容不变的同时促进文本的通俗演绎,增强中医古籍的吸引力,并针对不同受众群体推送相应的产品。

6 结语

本文以实现中医古籍活化为目标,阐述数智时代中医古籍活化的内涵,在中医古籍从“藏”到“用”的基础上实现“用”到“活”,构建以“化面为点”和“化点为面”为主体内容的中医古籍活化知识重构路径,并从载体层、内容层和应用层3个层面构建数智时代中医古籍活化模型,最后从理论维、技术维、用户维3个维度阐释中医古籍活化发展策略。未来中医古籍领域应结合人工智能、大数据、多模态融合等技术,进一步凝练和创新先进成果,实现深度开发与利用,促进中医药理论和临床全面跨越式发展。

作者贡献:张艳明负责论文撰写;李力恒、刘红雨负责研究设计;李秋元、满鑫宇负责模型构建;李巍巍负责论文修订。

利益声明:所有作者均声明不存在利益冲突。

参考文献

1 关于推进新时代古籍工作的意见[EB/OL].[2024-04-12].https://www.gov.cn/zhengce/2022-04/11/content_5684555.htm.

2 叶未央,周生辉.基于FAIR原则的中医药古籍数字化出版[J].出版发行研究,2021(2):49-54.

3 黄舒淳,杨漾,张秋雁,等. 基于中医古籍挖掘冠心病气虚血瘀症的用药规律[J]. 湖南中医杂志,2023,39(2):32-37.

4 李贺,祝琳琳,刘嘉宇,等. 基于本体的简帛医药知识组织研究[J]. 图书情报工作,2022,66(22):16-27.

5 李莎莎. 古籍活化的现状、问题与对策初探[J]. 出版发行研究,2022(12):35-40.

6 雷珏莹,侯西龙,王晓光. 数智时代古籍数字化再造的逻辑与进路[J]. 数字人文研究,2022,2(2):46-56.

7 李盼飞,张楚楚,李海燕. 科技赋能中医古籍精华传承与创新应用[J]. 中医杂志,2023,64(15):1519-1524.

8 卢克治. 基于中医古籍的知识图谱构建与应用[D].北京:北京交通大学,2020.

9 王凤兰. 基于知识元的中医古籍文献研究述评[J]. 南京中医药大学学报,2022,38(12):1170-1174.

10 陈健,杨凤,任巧生,等.基于知识元理论的中风病古籍医案知识表示与古今双模知识图谱构建研究[J].中国中医药信息杂志,2024,31(11):24-32.

11 于宗良,王泽平,张晓囡,等.基于数据挖掘陈可冀院士治疗高血压病用药规律及机制研究[J].中国中西医结合杂志,2024,44(4):469-474.

12 乔春梅. 基于数据挖掘分析清代治疗不寐的用药规律研究[D]. 武汉:湖北中医药大学,2022.

13 傅宝珍.知识服务背景下古籍VR阅读推广研究[J].图书馆工作与研究,2022(1):108-115.

14 黄璐琦. 对中医药发展规律及特点的传承与创新认识[J]. 中医杂志,2022,63(17):1601-1606.

15 盛威,卢彦杰,刘伟,等. 基于深度学习的中医古籍缺失文本修复研究[J]. 中华医学图书情报杂志,2022,31(8):1-7.

16 陈力. 数字人文视域下的古籍数字化与古典知识库建设问题[J]. 中国图书馆学报,2022,48(2):36-46.

Study on the Knowledge Reconstruction Path and Model Construction for the Activation of Traditional Chinese Medicine Ancient Books in the Digital Intelligence Era

ZHANG YanmingLI LihengLIU HongyuLI QiuyuanMAN XinyuLI Weiwei

Heilongjiang University of Chinese MedicineHarbin 150040,China

AbstractPurpose/Significance Utilizing emerging technologies in the digital intelligence era to fully explore the knowledge of traditional Chinese medicine (TCM) ancient books and bring the content contained in them to life. Method/Process The connotation of the activation of TCM ancient books in the digital intelligence era is expounded. The knowledge reconstruction path and model for the activation of TCM ancient books are discussed. The development strategies to the activation of TCM ancient books are explained from three dimensions:theoretical dimension,technical dimension,and user dimension. Result/Conclusion In the digital intelligence era,the construction of knowledge reconstruction path and model for the activation of TCM ancient books can effectively promote the transformation and application of digital resources of TCM ancient books,fully explore the value of TCM ancient medical books,and thus better inherit and develop the traditional culture of TCM.

Keywordsactivation of traditional Chinese medicine ancient books;knowledge reconstruction path;artificial intelligence

〔修回日期〕 2025-03-13

〔作者简介〕 张艳明,讲师,发表论文20余篇;通信作者:李力恒,博士,教授。

〔基金项目〕 黑龙江省中医药经典普及化专项课题(项目编号:ZYW2024-128);黑龙江中医药大学教育教学研究重点项目(项目编号:XJJZD2022001);黑龙江省博士后科研启动基金(项目编号:LBH-Q18115)。

〔中图分类号〕R-058

〔文献标识码〕A

〔DOI〕10.3969/j.issn.1673-6036.2025.07.016

X