Nan Fang Yi Ke Da Xue Xue Bao. 2019 Jan 20; 39(1): 69–75.
PMCID: PMC6765571

Language: Chinese | English


A DenseNet-based diagnosis algorithm for automated diagnosis using clinical ECG data

赖 杰伟

南方医科大学生物医学工程学院,广东 广州 510515, School of Biomedical Engineering, Southern Medical University, Guangzhou 510515, China 广东省医学图像处理重点实验室,广东 广州 510515, Guangdong Provincial Key Laboratory of Medical Image Processing, Southern Medical University, Guangzhou 510515, China

陈 韵岱

中国人民解放军总医院心血管内科,北京 100853, Department of Cardiology, Chinese PLA General Hospital, Beijing 100853, China

韩 宝石

中国人民解放军总医院心血管内科,北京 100853, Department of Cardiology, Chinese PLA General Hospital, Beijing 100853, China

季 磊

中国人民解放军总医院心血管内科,北京 100853, Department of Cardiology, Chinese PLA General Hospital, Beijing 100853, China

石 亚君

中国人民解放军总医院心血管内科,北京 100853, Department of Cardiology, Chinese PLA General Hospital, Beijing 100853, China

黄 志聪

心韵恒安医疗科技(北京)有限公司,北京 100094, Cardiocloud Medical Technology (Beijing) Co., Ltd., Beijing 100094, China

阳 维

南方医科大学生物医学工程学院,广东 广州 510515, School of Biomedical Engineering, Southern Medical University, Guangzhou 510515, China 广东省医学图像处理重点实验室,广东 广州 510515, Guangdong Provincial Key Laboratory of Medical Image Processing, Southern Medical University, Guangzhou 510515, China

冯 前进

南方医科大学生物医学工程学院,广东 广州 510515, School of Biomedical Engineering, Southern Medical University, Guangzhou 510515, China 广东省医学图像处理重点实验室,广东 广州 510515, Guangdong Provincial Key Laboratory of Medical Image Processing, Southern Medical University, Guangzhou 510515, China 中国人民解放军总医院心血管内科,北京 100853, Department of Cardiology, Chinese PLA General Hospital, Beijing 100853, China 心韵恒安医疗科技(北京)有限公司,北京 100094, Cardiocloud Medical Technology (Beijing) Co., Ltd., Beijing 100094, China Transition layer110 × 2501×1 conv10 × 501×13 average pool, stride 5Dense block210 × 50 Transition layer210 × 501×1 conv10 × 101×13 average pool, stride 5Dense block310 × 10 Transition layer310 × 101×1 conv10 × 21×13 average pool, stride 5Dense block410 × 2 Classification layer1 × 1Global max pool or LSTM FC, softmax

一行即为一帧。帧与帧之间并无空间上的直接相关,因此整个网络中的卷积层与池化层实质都是一维的,最后一个Dense Block中的Feature map仍是10行;但同一数据所有的帧都来自同一样本,因此帧与帧之间是有时间关联的。在网络最后的特征向量化时,本文采用的特征融合方式有两种:(1)一种是全局池化方式,这个过程是将每个Feature map池化为一个值,Feature map的数量即为特征向量的长度。我们将常规的全局平均池化替换为全局最大池化,以增强网络对异常响应的敏感度。当数据其中一帧在池化数值较大时即可认为数据有病变或是异常,从而比平均池化更大程度地影响到整个数据的分类判别;(2)另一种是用LSTM层代替全局最大池化层。LSTM是循环神经网络中最常用的一种,用于处理时间序列或自然语言。循环层结构作为网络输出层的一部分可以处理数据的时间持续关系;卷积结构能够提取数据的结构特征,二者相结合具有一定的优势。

1.4.2. 深度可分离卷积


现有的应用最广泛的分类卷积网络如残差网络ResNet [ 19 ] 与密集连接网络DenseNet [ 20 ] ,基本框架都是从一个卷积核较大(7×7)、步长为2的初始卷积层开始的,用以提取一些较大尺度的局部信息。以往的心电算法所用的数据集多为单通道或双通道,很少有符合医用标准的12导联多通道心电数据集,本文使用深度可分离卷积结构作为网络的初始层,能更有效地提取不同通道间的特征。深度可分离卷积结构应用于MobileNet [ 22 ] ,是为了减少网络的参数量和计算量而设计的卷积结构,主要用于移动设备使用的轻量级网络。Xception的论文 [ 21 ] 中提出,对于常规卷积而言,卷积核可以看做一个三维的滤波器,三个维度分别为通道、特征图的宽和高,这就实现了通道相关性和空间相关性的联合映射。Inception模块的背后存在这样的一种假设:卷积层通道间的相关性和空间相关性是可以退耦合的,将它们分开映射,能达到更好的效果。深度可分离卷积应用了分组卷积的思想,在卷积时将每个通道作为一组分别计算,这样得出的特征图各个通道之间是没有相关性的,只有空间上的关联;然后使用1×1的卷积层做通道维度的变化,完成通道数上的维度变换。

图 4 所示即为本文深度可分离卷积结构。图中所示的输入与输出分别为 图 3 初始卷积层前后数据张量的一个横截面,即一帧数据的卷积过程示意图。常规深度可分离卷积将每个通道作为一组,每组仅使用一个滤波器对此组数据做卷积,然后使用1×1卷积层;与其不同的是,心电数据共有12个导联通道,本文将每个通道作为一组,对每组数据都用64个宽为25的卷积核分别做卷积,均生成64张Feature Map,并将结果图在通道轴向上叠加,此时Feature Map的数目为768。然后连接一个核大小为1×1的卷积层对叠加数据进行降维,再将Feature Map的数目降为64。卷积的整个过程可以用以下公式表述:

An external file that holds a picture, illustration, etc. Object name is nfykdxxb-39-1-69-4.jpg


Depth-wise separable convolutions.

equation M6

其中, y 为卷积层的输出,帧数为10,通道数为64,输入样本 equation M7 f i 为深度可分离卷积中conv-bn-relu三个操作的复合函数,其中 i ∈(1, 12),不同通道训练得到的卷积核各不相同。F为核大小为1×1的瓶颈层函数,使叠加起来的通道维度再次降为64。

2. 结果

2.1. 数据

本文实验数据由北京心韵恒安医疗科技有限公司采集,共16 846份。数据均是12导联,采样率为500 Hz,数据长度从10~20 s不等。诊断标签共有以下14个:心电图不正常、窦性心律、窦性心动过速、窦性心律不齐、窦性心动过缓、房性早搏、心房颤动、左心室高电压、导联异常或数据质量差、ST-T改变、室性早搏、T波改变、局限性右束支阻滞、异常Q波。每份心电样本标签均经过了标准化,由5名专业医生进行评估审核流程。


模型整个的训练测试过程都是基于keras框架实现的。权重的初始化方法为均匀分布初始化,参数由[-limit, limit]区间中均匀采样获得,其中limit = equation M8 n 为权重向量的输入单元数;损失函数为交叉熵;最小化损失函数的优化方法为随机梯度下降,批大小为50,学习速率为0.01,动量参数为0.9,权重衰减为10 -6 ,最大训练轮数为300,在训练轮数达到总体的一半和3/4时学习率衰减为原来的1/10。训练时保存测试集准确率最高的网络模型为最终结果。

2.2. 实验

为验证本文方法的有效性,将本文使用的模型(DenseNet)与参考文献[ 16 ]使用的残差网络(ResNet)两种方法作对比。两种方法除网络结构不同之外,不同之处有两个:(1)初始卷积层使用深度可分离卷积或是常规卷积层“。+”意为使用DSC结构“,-”意为使用常规卷积;(2)在最后一个Dense Block之后不同帧的特征融合时使用全局最大池化或者是LSTM层“。+”意为使用LSTM层“,-”意为使用全局最大池化层。对照试验采用的标签有两组,心电图不正常和窦性心律。


3. 讨论

表 2 为对心电图不正常标签的测试集评估结果。本文基于DenseNet使用深度可分离卷积结构对数据的正异常识别准确率可以达到80.13%,灵敏度,特异度和F1分别为80.38%,79.91%和79.35%。



Metrics of the model type, DSC and LSTM

Model DSC LSTM Sensitivity (%) Specificity (%) F1 (%) Accuracy (%)
DenseNet + + 80.38 79.91 79.35 80.13
- 86.45 71.43 79.01 80.35
- + 81.62 74.18 76.28 77.08
- 80.99 74.01 75.91 77.68
ResNet [ 16 ] + + 83.33 75.39 77.79 79.56
- 84.11 75.04 77.93 79.81
- + 81.87 73.67 76.02 77.92
- 79.13 74.35 75.33 76.86

表 3 为不同因素对评估指标影响的显著性比较。在显著性水平α=0.05的情况下,模型类型和LSTM对4个评估指标均无显著影响( P >α)。对于模型类型由于使用的数据集较小,而DenseNet与ResNet的学习能力都很强,二者在当前数据集的测试结果没有显著的差异。但随着数据的不断采集,DenseNet是有一定的势的,因此本文采用密集连接型网络来作为最终模型。对于使用LSTM层还是全局最大池化层对模型的性能无显著差别,这证明了信号分帧方法处理非等长数据的有效性,该方法并未破坏信号的时间相关性。深度可分离卷积结构在四个评估指标中对F1和准度率的影响显著,二者分别提升了2.63±0.61和2.57±0.64。表明深度可分离卷积结构相比常规卷积层作为网络的初始卷积层更适合多导联数据,能够有效地改善网络性能。



Comparison of the statistical significance effects of 3 factors on metrics

P Sensitivity Specificity F1 Accuracy
P 1 (Model) 0.892 0.888 0.461 0.811
P 2 (DSC) 0.105 0.456 0.001 0.000
P 3 (LSTM) 0.634 0.248 0.794 0.998

采用了深度可分离卷积与LSTM层的网络结构在几组试验中表现最好,因此使用此种结构对其余的13个标签分别做分类。 表 4 为这13个标签的测试结果与平均值。Label从2到14分别表示2.1中介绍过的窦性心律到异常Q波等。对这些标签采用的评估指标同样为灵敏度、特异度、F1与准确率,其均值分别为71.59%,94.32%,73.46%和94.90%。



Evaluation for the 14 labels

Label Sen (%) Spe (%) F1 (%) Acc (%) Label Sen (%) Spe (%) F1 (%) Acc (%)
2 95.67 61.47 93.51 89.21 9 62.26 94.38 68.52 92.80
3 78.00 98.89 76.47 98.04 10 69.05 95.49 68.57 96.73
4 72.79 98.00 71.36 97.30 11 70.63 99.83 72.06 99.59
5 65.00 98.06 68.43 96.97 12 70.23 98.94 76.51 92.56
6 61.58 99.49 62.86 97.38 13 65.49 99.57 65.29 94.69
7 80.00 99.58 80.00 99.18 14 62.00 97.67 73.24 98.28
8 69.15 99.14 72.22 95.75 Mean 71.59 94.32 73.46 94.90

近几年绝大部分心电分析的文章都是基于MIT-BIH数据库,和PTB数据库这两个应用广泛、公开、免费的数据库进行研究并评估的。但这两个数据库病人来源较少,对于分类诊断,尤其是当前主流的神经网络而言,数据个数是远远不够的。2008年,文献使用K最近邻算法、多层感知机、线性判别分析、模糊逻辑回归4种方法对MIT-BIH数据集进行心律失常分类,区分正常心拍、室性早搏等5种类型的心拍类型 [ 6 ] 。室性早搏的灵敏度在94.81%~97.99%,其余类别的灵敏度在98.01%~100%,几乎所有类别的特异度都在99%以上;2014年,文献使用交叉小波变换于PTB数据集区分正异常心拍,准确度、灵敏度和特异度分别为97.6%,97.3%和98.8% [ 27 ] ;2017年,文献使用二维卷积网络对PTB数据库进行心肌梗塞(GAMI)和健康控制(HC)的分类,其准确度、灵敏度和特异度分别为96.00%,95.40%和97.37% [ 17 ] 。总体来说,这两个数据库数据较少,一些较为简单的算法就可以达到很高的精度,不是很适用于大数据驱动的神经网络模型评估。

基于非公共数据集的心电分析研究相对较少。2015年,文献使用卷积网络对大约15万条心电记录做正异常分类,其准确度、灵敏度和特异度分别为83.66%,83.84%和83.43% [ 15 ] ;2017年,文献使用残差网络对14种心电事件进行分类,数据共65 000多条,从近30 000人次采集而得到。其平均PPV,灵敏度,F1分别为80.0%,78.4%和77.6% [ 16 ] 。数据集的不统一使得算法的横向比较不太准确,因此本文复现了文献[ 16 ]使用的残差网络进行比较, 表 2 指标表明本文方法略优于此方法。

4. 结论




