TRDU-Net:基于两阶段多任务策略的颈动脉斑块钙化组织分割模型

近年来，心血管疾病的发病率和死亡率持续上升，其致死人数约占我国城乡总死亡人数的50%。其中，急性脑血管事件，尤其是出血性脑卒中和缺血性脑卒中，是主要致死原因之一[1]。这些事件常与颈动脉的动脉粥样硬化斑块稳定性密切相关。动脉粥样硬化斑块的不稳定性可能引发急性脑血管事件，斑块破裂或表面侵蚀会导致血栓形成，进而阻塞供血动脉，造成脑组织缺血性损伤。因此，准确评估颈动脉动脉粥样硬化斑块的稳定性，对于及时预防和干预病情恶化至关重要[2]。

目前可以通过影像学检查方法，如灰阶超声、超声造影、CT血管造影(computed tomography angiography，CTA)、磁共振成像(magnetic resonance imaging，MRI)等，评估斑块的形态、成分分布及潜在破裂风险。动脉内膜剥脱术后的病理检查是斑块稳定性的“金标准”，但无法实现术前实时评估。因此，亟须开发一种无创、实时、精准的评估方法，以降低急性脑血管事件的发生风险[3-4]。常规超声(如灰阶超声和超声造影)检查中，斑块稳定性通常依赖于形态学指标的观察，但在预测斑块破裂风险时，斑块内部成分对稳定性评估具有重要作用。目前的评估方法依赖于医生的主观经验，且受到设备分辨率等因素的限制。因此，提高内部成分分析的精确度已成为研究重点。可以利用深度学习辅助评估超声图像，以提高评估的速度和准确率。Hu X等[5]提出RMFG_Net网络，通过引入Transformer模块增强模型对视频序列中连续帧的分析，改进斑块边界的分割。Biswas M等[6]提出两阶段模型，通过卷积神经网络和全卷积网络精细分割斑块区域，有效提取关键的血管边界。Vila M D M等[7]采用DenseNets进行血管组织的细致划分，为颈动脉斑块稳定性评估提供辅助。但上述方法仍存在局限性，如Biswas M等[6]的两阶段模型在分割管腔内膜、中膜和外膜边界时表现良好，在处理异常复杂的病变或图像质量较差时准确性可能下降，影响颈动脉内膜中层厚度和斑块面积的识别精度。因此，本研究提出以U-Net为主干网络的两阶段多任务分割模型，结合残差网络和空洞卷积网络，以提高对颈动脉斑块及其内部钙化组织的分割精度，为颈动脉斑块自动化检测与评估提供更可靠的技术支持。

2 模型与方法

2.1 基线模型

U-Net是由Ronneberger O等[8]于2015年提出的卷积神经网络架构，其采用对称结构，左侧为下采样路径，右侧为上采样路径，分别构成编码器和解码器。编码器通过逐层压缩抽象图像，提取深层特征；解码器则通过恢复图像大小和维度，重建图像特征。二者通过跳跃连接进行特征融合，弥补恢复过程中丢失的细节特征。该结构能有效解决医学图像分割中数据稀缺的问题，最大限度利用图像的数据信息。但U-Net模型深度有限，针对更复杂或更细微的特征，学习能力不足。在池化和上采样操作过程中，即便通过跳跃连接进行补充，仍会永久丢失部分图像特征[9]。

2.2 分段式多任务流程

分段式网络将任务细分为不同的小任务或阶段，可以对不同阶段或任务进行特殊的模型设计，小任务的整合或叠加使模型表现更优。例如，肖慧等[10]搭建SM-YOLO模型，采用两阶段模式进行颈动脉斑块检测，第1阶段使用YOLOX标定所有可疑斑块，构成候选斑块组，第2阶段提取相应的纹理特征和边缘特征，对候选斑块组中的所有斑块进行分析后，结合支持向量机分类器实现分类，有效避免斑块漏检，同时高效地完成位置确认。Gan H等[11]提出多任务学习框架，基于U-Net++算法将网络划分为分割和分类两个任务，在下采样阶段进行权重共享，使用区域加权图进行分割任务与分类任务的特征映射，通过滑动窗口法将分类任务的结果作为分割的损失，评估分割任务模型，提高其对颈动脉斑块的识别精度。Xie M等[12]将两个U-Net串联，每个U-Net均采用双解码结构对血管以及颈动脉斑块进行分割，前一个U-Net输出的血管分割图作为后一个U-Net的输入，在十折交叉实验中，两阶段双解码器结构使分割斑块的准确率提升了2个百分点。

3 TRDU-Net模型结构

3.1 总体设计

针对基线模型U-Net深度不足和易丢失信息等问题，本研究提出结合残差网络和空洞卷积网络的两阶段多任务模型——TRDU-Net。首先，采用双残差卷积块替换U-Net中的常规卷积块，以增强对边界的学习能力。其次，引入空洞卷积桥以提取更深层次的特征，提升模型的学习能力。最后，通过增加区域注意力机制，优化分割流程，减少复杂背景对分割精度的影响。总体结构，见图1。对初始数据进行预处理和数据增强，生成输入数据，先后经过第1阶段和第2阶段，分别完成颈动脉斑块及其钙化组织的分割任务，两阶段均使用RDU-Net模型。通过两阶段分割策略，模型能够有效捕捉斑块及其钙化组织的复杂特征，提高分割的准确性和鲁棒性。

双残差卷积块结构，见图2。x为上一次计算得到的特征图，先通过一次3×3卷积W1对特征图进行线性变换，再通过ReLU函数进行激活，与输入进行相加得到中间特征图，最后经过3×3卷积W2对特征图进行线性变换并通过函数激活，将输入特征图、中间特征图和计算得到的特征图进行相加得到结果特征图x0。该结构在对卷积W1和卷积W2进行学习时，主要针对输入特征图和结果差异部分，增强对边界学习的能力。

空洞卷积桥由空洞卷积金字塔构成，见图3。经过5层卷积块进行平行卷积，通过不同的空洞率对在底部的特征图进行特征提取，将不同尺度的特征图进行维度堆叠并融合成一个尺度特征图，通过引入Sigmod函数，该特征图被转化为表征空间位置特征重要性的概率权重矩阵，作用于双残差卷积桥的输出特征图，提高模型对特征的辨识能力，减少非特征区域对特征学习的干扰。

3.2 两阶段多任务分割流程

本研究使用的实验数据中，斑块内钙化组织的面积占全部图像的比例不足5%，且背景复杂，直接对钙化组织进行分割具有较高难度。因此设计分阶段的分割流程。第1阶段对颈动脉斑块进行分割，第2阶段通过增强模型对颈动脉斑块区域的注意力，实现对斑块内钙化组织的更精确分割。通过在第2阶段引入斑块的位置信息，使模型能够更有效地捕捉斑块内部的特征信息，从而在背景复杂的情况下提高分割的准确性和鲁棒性。

3.3 RDU-Net结构

本研究构建的RDU-Net结构，见图4。输入图像大小为512×512。基于3层由双残差卷积块和下采样组成的编码器结构，图像特征被逐层压缩并传递至模型底部，此时采用双桥结构进行更深层次的特征学习。再基于3层上采样和双残差卷积块构成的解码器结构，逐步恢复特征图。解码阶段，模型通过跳跃连接将编码器中相同层次的低采样特征图与解码器中的特征图进行融合，从而弥补采样过程中丢失的信息，确保模型在细节恢复方面具有更好的表现。双残差卷积块及单卷积块结构，见图5。

单卷积块的结构为1个卷积层(Conv)、1个批归一化层(BN)和1个ReLU激活层，卷积核大小为3×3，填充为1，步长为1。在双残差卷积块中，虚线中为进行残差处理时改变原输入特征图大小的skip块，卷积核为1×1且不进行填充，双残差卷积块通过两次卷积操作引入残差连接，从而在2个卷积层之间实现更细致的特征学习。

双桥结构，见图6。其中一个桥结构为双残差卷积结构，另一个结构为空洞卷积金字塔结构，在金字塔中使用膨胀率为6、12、18、24的卷积块进行卷积，卷积核为3×3、填充大小与膨胀率对应，步长为1。跳跃连接模块中的卷积层，以及Sigmod激活函数前的卷积层，其卷积核均为1×1，且不进行填充，用于特征压缩与融合。空洞桥最后通过Sigmod激活函数将空洞金字塔学习到的更高层次特征转换成比例，与双残差桥输出的特征图相乘，使更高层次对应的特征得到加强，作为注意力模块使用。

4 数据集

4.1 数据预处理

4.1.1 数据来源选择健康雄性新西兰兔20只，3月龄以上，体重2.5～3.0kg，所有兔接受腹主动脉球囊损伤术，并进行高脂饲料喂养，共计10个月。成功建立10只动脉粥样硬化模型兔，并在腹主动脉血管内超声检查下，确定形成31个斑块组织。

4.1.2 超声检查所有目标斑块接受高频超声检查。体外超声采用GE Logiq E9 R6型号设备，配备ML6-15探头。检查时连续保存8秒钟的图像，并进行重复操作1次，以确保数据的可靠性。所有数据均为脱机分析，共获得15 386帧原始超声图像数据。

4.1.3 组织学染色在麻醉状态下，将实验兔处死，取出腹主动脉进行组织学分析。组织样本经过固定、脱水、石蜡包埋及切片处理后，分别进行HE染色及相关分子免疫组化染色，通过光学显微镜和电子显微镜观察和分析。

4.1.4 图像配准将术中获取的腹主动脉斑块标本制作成尺寸为4mm×4mm的组织块。通过精确匹配血管直径、斑块厚度和形状，筛选出与超声图像对应的组织学标本。根据免疫组化染色结果，结合解剖切片的病理组织成分，手动标记超声图像中的钙化成分，实现无标记超声图像与对应组织样本的精确匹配，共筛选出440份钙化成分超声图像。

4.1.5 图像预处理为减少设备本身及外部因素对图像质量的影响，对采集到的超声图像进行预处理。先对图像中的无关信息进行裁剪，并将图像尺寸调整为512×512，以匹配网络模型的输入要求。再对缩放后的图像进行滤波处理，以消除噪声、提高图像清晰度，并强化部分组织边界的对比效果，见图7。

4.2 数据增强

充分的数据量是提升模型性能的基础。医学数据具有一定的特殊性和保密性，数据量有限，因此在原有数据集的基础上进行数据增强。将图像亮度调整至(0.8，1.2)范围内，进行随机角度为(-30°，30°)的旋转操作，并以50%的概率进行水平翻转或垂直翻转，数据增强图片示例，见图8。这些增强方法有效提高了模型对多样化数据的适应性。

5 实验结果

5.1 实验环境及参数设置

实验在Linux平台完成，使用PyTorch1.11.0搭建模型，使用NVIDIA GeForce RTX 3090 GPU进行训练。损失函数是评估模型预测输出与真实值之间差异程度的函数，量化了模型预测错误的程度，模型通过不断调整内部参数来最小化损失函数的值，从而提高数据拟合效果和模型的泛化能力。根据模型任务，将多分类改为二分类问题，选择适用于二分类问题的二元交叉熵损失(binary cross-entropy loss，BCELoss)作为基础损失，考虑到像素的不平衡性，增加DiceLoss对模型进行评估，两种损失的加权共同衡量模型的预测结果。其中N代表样本数量，yi代表真实值，pi代表预测值，Pi和Gi分别表示预测结果和真实标签在第i个像素上的值。

实验参数设置，见表1。使用Adam优化器进行反向传播优化。通过动态调整更新频率，每次进行梯度下降时适应性地改变参数更新幅度，实现快速收敛。为防止模型过拟合，采用权重衰减进行L2正则化。同时，使用余弦退火算法周期性调整学习率，进一步提高模型的训练效率和性能。

5.2 评价指标

采用一组广泛使用的指标衡量分割性能，包括Dice系数、Jaccard系数和F1分数。Dice系数是集合相似度度量指标，通常用于计算两个样本的相似度，值域为[0，1]，分割的最好结果是1，最差结果为0。其中pred为预测结果，gt为真实标签，将预测结果按照大于0.5为1，小于0.5为0转为二值分类形式，分别计算预测正确的像素个数和总像素个数。Jaccard系数又称交并比(intersection over union，IoU)，用于比较样本集的相似性，定义为两个集合交集大小与并集大小间的比例。

由于所分割部分在图片中所占的面积非常小，模型预测的正负类别不平衡，单纯使用精确度(precision)和召回率(recall)进行评价会使模型性能量化出现偏差，因此使用两者调和平均数F1分数进行量化。精确度是对模型预测准确程度的量化，代表预测为正类别的像素数量占实际为正类别的像素数量的比例。召回率指模型正确识别出的正例占所有实际正例的比例，是对模型预测可信程度的衡量。其中，TP为真正例的数量，FP为假正例的数量，FN为假负例的数量。

5.3 对比实验结果

为了全面体现模型分割性能的提升，使用相同的数据和实验参数在U-Net、DeepLabV3[13]、DeepLabV3+[14]、ResU-Net[15]、ResU-Net++[16]等模型上进行对比实验，见表2。TRDU-Net模型的分割精度最高，在目标任务中的分割性能较一些通用模型有所提升。

分割结果的对比实验，见图9。在斑块内组织成分的形态和大小方面，ResU-Net++和TRDU-Net的分割结果更接近于真实标签的形态。其余模型分割结果的大小存在偏差，边界不够清晰，且在ResU-Net、DeeplabV3和DeeplabV3+中还出现了斑块区域外的错误预测。相比之下，TRDU-Net的分割性能具有明显优势。

5.4 消融实验结果

设计消融实验验证TRDU-Net相关改进所带来的分割性能提升。对斑块内组织成分分割的阶段进行消融实验，使用没有添加任何模块的U-Net作为基线模型，分别在基线模型上使用双残差卷积块的RU-Net网络模型、添加空洞桥结构的RDU-Net网络模型以及两阶段的TRDU-Net进行训练以测试4个模型的分割性能。第2阶段消融实验结果，见表3。基线模型的分割能力对分割任务来说远远不够，两个指标参数分别为14.62%与8.27%，由于斑块内组织成分太小，无法准确学习到相应特征。增加残差卷积块之后的RU-Net对分割任务可以进行更好的学习，其两个指标参数分别为52.36%与39.57%，相较于基线模型得到很大提升。添加空洞卷积金字塔结构后的RDU-Net两个指标分别上升13.52个百分点与15.00个百分点，空洞桥进行的多维度特征融合可增加对组织斑块内特征的学习。最后使用第1阶段的分割结果对第2阶段分割进行加强，使第2阶段的训练集中在颈动脉斑块的内部，得到不错的提升效果。消融实验表明，本研究所提出的模型在完成颈动脉斑块以及斑块内部组织成分的分割任务方面具有显著优势。4种不同消融实验模型在颈动脉斑块和斑块内组织分割中的结果，见图10。实验结果清晰地证明了各改进模块对分割性能的贡献和效果。

6 结语

基于分割任务需求及所使用数据图像的特征，本研究提出TRDU-Net网络模型，用于实现对颈动脉斑块及其内部钙化组织的精确分割。该模型基于在医学分割领域广泛应用的U-Net网络，构建两阶段多任务分割网络。该网络将残差思想融入模型，通过使用双残差卷积块，提高模型对细微部分的学习能力。同时，在模型底部引入空洞桥结构，在不增加模型深度的前提下，增强了其对深层次特征的提取能力。此外，双阶段结构充分利用斑块信息，显著提高了钙化组织分割时的精度。消融实验和对比实验发现，TRDU-Net展现了出色的分割性能。未来计划增加训练数据量，进一步提升模型精度，并扩展分割范围至斑块内部的其他组织，如纤维帽、脂质、出血等，以构建更加完整的分割流程模型。

作者贡献：林建海负责源数据处理、算法设计与调试、论文撰写；戴雨豪负责算法设计与调试、论文撰写；潘春蕾负责图像标注；王莹负责图像标注、论文撰写；高东平负责提供指导。

利益声明：所有作者均声明不存在利益冲突。

1 中国心血管健康与疾病报告编写组.中国心血管健康与疾病报告2022概要[J].中国循环杂志，2023，38(6)：583-612.

2 ADAY A W，BECKMAN J A. Medical management of asymptomatic carotid artery stenosis[J].Progress in cardiovascular diseases，2017，59(6)：585-590.

3 张红珍，杨少玲.人工智能技术在颈动脉斑块超声检查中的应用进展[J].右江医学，2023，51(3)：193-198.

4 赵聪聪，李烨，张乐，等.超声评估颈动脉斑块易损性的研究进展[J].中南医学科学杂志，2024，52(3)：492-495.

5 HU X，CAO Y，HU W，et al. Refined feature-based multi-frame and multi-scale fusing gate network for accurate segmentation of plaques in ultrasound videos[J].Computers in biology and medicine，2023，163(9)：107091.

6 BISWAS M，SABA L，CHAKRABARTTY S，et al. Two-stage artificial intelligence model for jointly measurement of atherosclerotic wall thickness and plaque burden in carotid ultrasound：a screening tool for cardiovascular/stroke risk assessment[J].Computers in biology and medicine，2020，123(8)：103847.

7 VILA M D M，REMESEIRO B，GRAU M，et al. Semantic segmentation with DenseNets for carotid artery ultrasound plaque segmentation and CIMT estimation[J]. Artificial intelligence in medicine，2020，103(3)：101784.

8 RONNEBERGER O，FISCHER P，BROX T. U-Net：convolutional networks for biomedical image segmentation[C]. Munich：International Conference on Medical Image Computing and Computer-assisted Intervention，2015.

9 马巧梅，梁昊然，郎雅琨.融合残差模块的U-Net肺结节检测算法[J].计算机工程与设计，2021，42(4)：1058-1064.

10 肖慧，方威扬，林铭俊，等.基于两阶段分析的多尺度颈动脉斑块检测方法[J].南方医科大学学报，2024，44(2)：387-396.

11 GAN H，ZHOU R，OU Y，et al. A region and category confidence-based multi-task Network for carotid ultrasound image segmentation and classification[EB/OL].[2024-07-02]. https：//arxiv.org/abs/2307.00583.

12 XIE M，LI Y，XUE Y，et al. Two-stage and dual-decoder convolutional U-Net ensembles for reliable vessel and plaque segmentation in carotid ultrasound images[C]. Miami：2020 19th IEEE International Conference on Machine Learning and Applications (ICMLA)，2020.

13 CHEN L C. Rethinking atrous convolution for semantic image segmentation[EB/OL].[2024-12-05]. https：//arxiv.org/abs/1706.05587v3.

14 CHEN L C，ZHU Y，PAPANDREOU G，et al. Encoder-decoder with atrous separable convolution for semantic image segmentation[C]. Munich ：The European Conference on Computer vision (ECCV)，2018.

15 ZHANG Z，LIU Q，WANG Y. Road extraction by deep residual U-Net[J]. IEEE geoscience and remote sensing letters，2018，15(5)：749-753.

16 JHA D，SMEDSRUD P H，RIEGLER M A，et al. ResuNet++：an advanced architecture for medical image segmentation[C]. San Diego：2019 IEEE International Symposium on Multimedia (ISM)，2019.

【作者机构】	¹中国医学科学院/北京协和医学院医学信息研究所； ²中国医学科学院北京协和医院超声医学科
【分类号】	R318;TP391.41;TP18
【基金】	国家社会科学基金重大项目(项目编号：19ZDA041) 中央高水平医院临床科研业务费资助项目(项目编号：2022-PUMCH-A-089)。

TRDU-Net：基于两阶段多任务策略的颈动脉斑块钙化组织分割模型

目录

文内图表