The .gov means it’s official. Federal government websites often end in .gov or .mil. Before sharing sensitive information, make sure you’re on a federal government site. The https:// ensures that you are connecting to the official website and that any information you provide is encrypted and transmitted securely. As a library, NLM provides access to scientific literature. Inclusion in an NLM database does not imply endorsement of, or agreement with, the contents by NLM or the National Institutes of Health.
Learn more: PMC Disclaimer
Sheng Wu Yi Xue Gong Cheng Xue Za Zhi. 2023 Feb 25; 40(1): 110–117.
PMCID: PMC9989751

Language: Chinese | English

基于小样本功能磁共振数据的偏头痛时序特征分类研究

Research on migraine time-series features classification based on small-sample functional magnetic resonance imaging data

昂 孙

四川大学 电气工程学院(成都 610065), College of Electrical Engineering, Sichuan University, Chengdu 610065, P. R. China

Find articles by 昂 孙

宁 陈

四川大学 电气工程学院(成都 610065), College of Electrical Engineering, Sichuan University, Chengdu 610065, P. R. China

Find articles by 宁 陈

俐 何

四川大学 电气工程学院(成都 610065), College of Electrical Engineering, Sichuan University, Chengdu 610065, P. R. China

Find articles by 俐 何

俊然 张

四川大学 电气工程学院(成都 610065), College of Electrical Engineering, Sichuan University, Chengdu 610065, P. R. China 四川大学 电气工程学院(成都 610065), College of Electrical Engineering, Sichuan University, Chengdu 610065, P. R. China 四川大学华西医院 神经内科(成都 610041), Department of Neurology, West China Hospital of Sichuan University, Chengdu 610041, P. R. China

corresponding author Corresponding author.
何俐,Email:heli2003new@126.com 张俊然,Email: moc.621@narnujgnahz

对于每个受试者的成分图空间分布未知的情况下,可利用盲源分离方法求取,记 A k 为分离矩阵,它的列表示相应成分图的时间序列, k 表示迭代次数,其计算公式如式(2)所示:

Group ICA的成分估计过程需要进行跨个体的独立成分的融合,才能反映出一组rs-fMRI数据的整体特性。分离矩阵 A k 需要在多个受试者中逐次迭代,直至算法收敛,从而得到各受试者一致的成分映射。

由于Group ICA需要遵守数据表示子空间上的正交性约束,这可能导致独立源数量受限于信号维度。针对这一不足,DictLearning可以通过构建一个原子或子空间的字典,为观察到的样本提供有效的稀疏表示,并有可能推导出稀疏信号的先验未知统计量 [ 21 - 22 ] 。同时,相关神经科学研究表明大脑神经活动中存在稀疏响应 [ 11 ] ,稀疏表示方法的内在性质可能与大脑神经活动的稀疏响应相契合。

在DictLearning方法中,给定rs-fMRI信号矩阵 Y ,维度为 T × M ,其中 T 是rs-fMRI时间序列点的总数, M 是受试者大脑中体素的总数。 Y 中的rs-fMRI信号被建模为学习到的基础字典 D ,模型矩阵形式如式(3)所示:

其中 A 保存稀疏表示的系数矩阵。具体来说, D 中每个字典原子的信号代表特定脑网络的功能活动,而系数矩阵 A 中的向量代表对应脑网络的空间分布。字典 D 可用于划分ROIs,并提取相应的时间序列。

1.3. 特征融合与数据扩增

Group ICA方法参照惯例在此提取了20个独立成分,每个成分涉及1~5个脑区,共计将大脑划分为58个ROIs。同样,DictLearning方法依据字典提取了20个原子,每个原子涉及2~8个脑区,共计将大脑划分为96个ROIs。两种方法在脑区划分中各有其优势和特点,本文结合了两种方法获得的154个ROIs并计算了各个ROIs的平均时间序列,生成维度为 ( x , y , z )=(64, 170, 154) 的特征矩阵。其中 x 是样本数, y 是时间点, z 是ROIs数。接着,对每个ROIs时间序列应用了从-1~1的线性归一化。

对于每个受试者170个时间点(即340 s)的初始时间序列可被平均拆分成5段长度为34个时间点的子序列,每段代表68 s的成像时间。如 图1 所示,序列裁剪扩充后每一段68 s的子序列都可以作为模型的输入数据,这使模型数据集扩充到初始的5倍,总共达到320个输入序列。重构后的特征矩阵维度为 (320, 34, 154),这将作为接下来BiLSTM分类网络的输入。

1.4. BiLSTM网络分类

本研究为了进一步学习每个时间序列内部的前后时序信息来刻画周期性大脑状态变化,在对rs-fMRI时间序列裁剪扩充的基础上采用了BiLSTM网络。如 图1 所示,输入序列 equation M3 经过LSTM层,学习前向和后向信息,为每个时间点返回相应的值 equation M4 。接着使用带有S型生长曲线(sigmoid)激活函数的密集层和带有softmax激活函数的第二个密集层作为二元分类器。模型使用二元交叉熵损失函数和具有默认参数值的自适应矩估计优化器进行训练。为了避免过拟合,本研究在所有隐藏层中引入随机失活(dropout)机制,随机失活50%神经元,在LSTM层中加入了正则化项L 1 和L 2 。实验设定了300次迭代训练,提前停止条件为验证损失连续在30次训练中小于0.01。此外,本研究通过将数据分为8份来执行交叉验证方法,以便受试者比例在所有测试中都大致相同。

2. 结果

为了评估性能,实验中进行了8折交叉验证,计算了灵敏度、特异性和分类精度。如 表2 所示,Group ICA结合DictLearning的方法的敏感性、特异性和准确性均优于单一Group ICA或单一DictLearning。同时,本文绘制了受试者工作特性(receiver operating characteristic,ROC)曲线并计算了曲线下面积(area under curve,AUC),如 图2 所示。其中,曲线的横坐标为假阳性率(false positive rate,FPR),纵坐标为真阳性率(true positive rate,TPR)。ROC曲线所覆盖的区域面积AUC可以用来定量评价偏头痛患者组和健康对照组分类的准确性,ROC曲线越靠近平面的左上角,AUC的值越高,表明分类器分类效果越好。

表 2

Classification results of different time-series extraction methods

不同时间序列提取方法的分类结果

提取方法 ROIs 分类精度(%) 灵敏度(%) 特异性(%) 平均AUC
AAL 116 89.38 90.56 87.86 0.90
Group ICA 58 89.69 86.66 93.57 0.91
DictLearning 96 92.50 93.33 91.43 0.94
Group ICA+DictLearning 154 96.94 94.44 97.86 0.98

Operating characteristic curves of subjects

受试者工作特征曲线

本文方法的平均AUC达到了0.98,并且显著优于传统的AAL固定图谱、单一Group ICA提取图谱和单一DictLearning提取图谱的结果。AAL的效果最差,这可能是由于样本特性与模板不适配,时间序列中存在噪声造成的。相比之下,本文方法结合了两种数据驱动的ROIs划分方法,可以根据数据特性学习内在的大脑状态转换。在8折交叉验证(ROC fold1~ROC fold8)下,每一折的AUC都在0.98~1.00范围内,并且在几种方法中数值波动最小,表现出对时间序列噪声良好的鲁棒性。

表3 所示,使用Group ICA结合DictLearning提取特征后,分类网络和输出单元数量的不同影响了分类精度。结果表明BiLSTM显著优于单向的LSTM,并且具有32个隐藏节点的BiLSTM准确率为96.94%,达到了最高的分类精度。

表 3

Comparison results of LSTM and BiLSTM classification networks

LSTM与BiLSTM分类网络结果对比

分类网络类型 不同数量输出单元的准确率
8 16 32 64 128 154
LSTM 86.88% 91.25% 93.75% 91.25% 91.25% 91.56%
BiLSTM 95.90% 93.13% 96.94% 92.50% 92.19% 93.75%

3. 讨论

3.1. 特征提取方式的对比分析

考虑到临床预测模型对部署难易度和计算效率的客观要求,本研究确立了以一维时间序列为核心的分析模式。传统rs-fMRI数据的时间序列分析,是通过皮尔逊相关等功能连接性度量来构建脑功能连接网络,以生成鉴别性特征用于后续分类。但这些特征构建方法以及相应的分类器没能充分考虑时间依赖性 [ 7 ] ,可能会影响模型解码性能。本研究前期在偏头痛患者的数据上做了预实验,通过皮尔逊相关构建了功能连接矩阵作为分类特征。与本文方法的最高分类精度准确率达96.94%相比,以功能连接矩阵作为分类特征准确率可达88%,则不算理想。Dvornek等 [ 14 ] 也在自闭症患者数据上使用时间序列特征与功能连接度量方法做了对比,时间序列特征同样展现了较优的分类性能。

在选择大脑ROIs图谱以提取时间序列过程中,本研究结合了两种数据驱动方法来划分ROIs,充分利用了体素间的空间联系,从而降低群体差异带来的影响。常用的固定脑图谱模板可能由于对大脑的划分精细度不同,或构建的群体基础不同,而对小样本数据的分析结果有较大的影响。如 表2 所示,Group ICA(58 ROIs)和DictLearning(96 ROIs)的指标均优于固定图谱AAL(116 ROIs),即使它们的脑区划分精细度并没有AAL高。这源于Group ICA具有良好的控制群体模型,可以分解出大脑信号中的背景噪声;而DictLearning则可以提取到自然稀疏的脑区划分,捕捉到数据的内在特征。Group ICA加DictLearning的方式结合了两种方法的优点,以结合方法来划分区域提取时序特征可以达到更好的分类精度。

3.2. 不同模型框架的影响

LSTM是一种特殊类型的递归神经网络,内含的时间循环结构可以较好地刻画具有时间关联的序列数据,并学习到受试者大脑动态的模式信息。考虑到大脑可能会不断地使用上下文信息来指导更高层次的认知功能,而不是在时间序列结束时产生具有严格方向的输出,本文中使用了BiLSTM和LSTM进行了对比分析。

表3 所示,在相同隐藏节点设置下,BiLSTM准确率一直优于LSTM,表明了双向信息更有利于表征大脑信号。此外,隐藏节点的数量可能直接影响LSTM、BiLSTM网络的学习能力。本文比较了具有不同数量(8、16、32、64、128、154)隐藏节点输出单元模型的性能。在单层模型中,具有32个隐藏节点的BiLSTM达到了最高的分类精度。具有8个或16个隐藏节点的模型其性能有所降低,很可能是相应的隐藏节点输出单元太有限,无法存储足够的序列信息。具有64个以上隐藏节点的模型性能也略有下降,其原因可能是过拟合。如 图3 所示,在154个节点的参数设置下,训练准确度和验证准确度两条曲线整体波动较大,相距较远,说明模型的方差较大,模型有过拟合趋势。

Variation curves of training accuracy

训练验证准确率变化曲线

3.3. 局限与展望

本文提出的方法在对偏头痛患者的分类识别问题上取得了较好的实验结果,但仍需注意到研究中存在的一些局限性。首先,本研究在基于深度学习的框架中只包含了64名受试者,扩充后为320个样本,数据集依然很小。其次,尽管本研究成功提取了时序特征来提高分类器的性能,但还没有结合BOLD信号的特性来分析偏头痛患者的脑功能变化特征。

在针对偏头痛患者的神经影像学研究中,单个医院较难获得大量样本。研究界最近的趋势是提高神经影像数据的共享水平,这一趋势将会改善未来研究样本集的可及性,多中心样本的获取将有助于确定本文方法是否可以适用于更大的数据样本。此外,有研究指出偏头痛发作可能是对脑能量代谢和氧化应激失衡的反应 [ 23 ] ,进一步探求反映大脑能量代谢状态的时间序列特征与偏头痛疾病机制之间的关联模式或许可以成为更有价值的研究方向。在之后的工作中,基于本文提出的轻量化诊断模型和时序特征可以进一步探索相关疾病的神经鉴别机制,从而开展更具临床应用价值的研究。

4. 总结

本研究直接使用rs-fMRI数据的时间序列信号作为特征输入,并进行模型架构设计来实现偏头痛患者组和健康对照组的高精度分类。除此之外,本研究还使用了一系列的优化策略来避免小数据集的脑影像噪声和潜在过度拟合,包括Group ICA和DictLearning相结合的时间序列脑区划分、基于裁剪的数据扩增、L 1 和L 2 正则化、dropout机制和交叉验证等。相较于传统模型,本文提出的模型充分考虑了时变特性和模型的预测效率,能快速有效地从rs-fMRI数据中捕获与特征状态相关的大脑动态变化,研究结果表明其在偏头痛分类诊断任务中的可行性和优越性,并可改进后用于其他脑部疾病的分类诊断,具有潜在的临床应用价值。

重要声明

利益冲突声明:本文全体作者均声明不存在利益冲突。

作者贡献声明:孙昂主要负责实验流程、数据记录与分析、论文编写以及算法程序设计;陈宁、何俐主要负责项目主持、协调沟通、理论指导和论文审阅;张俊然主要负责提供实验指导,数据分析指导,论文审阅修订。

伦理声明:本研究通过了四川大学华西医院医学伦理委员会的审批。

Funding Statement

国家自然科学基金项目(81500959); 四川大学华西医院1.3.5卓越学科项目(ZYJC21041); 成都市科技计划项目(2021-YF05-D0916-SN); 德阳科技局“揭榜挂帅”项目(2021JBJZ007)

Funding Statement

National Natural Science Foundation of China; West China Hospital of Sichuan University; Chengdu Science and Technology Bureau; Deyang Science and Technology Bureau

References

1. Ferrari M D, Goadsby P J, Burstein R, et al Migraine. Nature Reviews Disease Primers. 2022; 8 (1):2. doi: 10.1038/s41572-021-00328-4. [ PubMed ] [ CrossRef ] [ Google Scholar ]
2. 黄冠, 尹芳艳, 蒲红 偏头痛静息态功能MRI研究进展 放射学实践 2018; 33 (4):433–437. doi: 10.13609/j.cnki.1000-0313.2018.04.022. [ CrossRef ] [ Google Scholar ]
3. Lim M, Jassar H, Kim D J, et al Differential alteration of fMRI signal variability in the ascending trigeminal somatosensory and pain modulatory pathways in migraine. The Journal of Headache and Pain. 2021; 22 (1):4. doi: 10.1186/s10194-020-01210-6. [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
4. Yang H, Zhang J, Liu Q, et al Multimodal MRI-based classification of migraine: using deep learning convolutional neural network. Biomedical Engineering Online. 2018; 17 (1):138. doi: 10.1186/s12938-018-0587-0. [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
5. 李翔, 魏本征, 吴宏赟, 等 无先兆偏头痛3D-CNN辅助诊断算法 计算机工程与应用 2022; 58 (4):169–176. doi: 10.3778/j.issn.1002-8331.2008-0222. [ CrossRef ] [ Google Scholar ]
6. 陈小怡, 周静, 柯鹏飞, 等 神经精神疾病自动分类与预测研究进展 中国生物医学工程学报 2021; 40 (6):752–763. doi: 10.3969/j.issn.0258-8021.2021.06.12. [ CrossRef ] [ Google Scholar ]
7. Vidaurre D, Smith S M, Woolrich M W Brain network dynamics are hierarchically organized in time. Proc Natl Acad Sci U S A. 2017; 114 (48):12827–12832. doi: 10.1073/pnas.1705120114. [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
8. Ma G, He L, Lu C T, et al Spatio-temporal tensor analysis for whole-brain fMRI classification// Proceedings of the 2016 SIAM International Conference on Data Mining. Miami: Society for Industrial and Applied Mathematics. 2016:819–827. [ Google Scholar ]
9. Li W, Lin X, Chen X Detecting Alzheimer's disease based on 4D fMRI: an exploration under deep learning framework. Neurocomputing. 2020; 388 :280–287. doi: 10.1016/j.neucom.2020.01.053. [ CrossRef ] [ Google Scholar ]
10. Tošić I, Frossard P Dictionary learning. IEEE Signal Processing Magazine. 2011; 28 (2):27–38. doi: 10.1109/MSP.2010.939537. [ CrossRef ] [ Google Scholar ]
11. Lv J, Jiang X, Li X, et al Sparse representation of whole-brain fMRI signals for identification of functional networks. Medical Image Analysis. 2015; 20 (1):112–134. doi: 10.1016/j.media.2014.10.011. [ PubMed ] [ CrossRef ] [ Google Scholar ]
12. Deshpande H, Maurel P, Barillot C Classification of multiple sclerosis lesions using adaptive dictionary learning. Computerized Medical Imaging and Graphics. 2015; 46 :2–10. doi: 10.1016/j.compmedimag.2015.05.003. [ PubMed ] [ CrossRef ] [ Google Scholar ]
13. 张雅雯, 王志海, 刘海洋, 等 基于多尺度残差FCN的时间序列分类算法 软件学报 2022; 33 (2):555–570. doi: 10.13328/j.cnki.jos.006142. [ CrossRef ] [ Google Scholar ]
14. Dvornek N C, Ventola P, Pelphrey K A, et al Identifying autism from resting-state fMRI using long short-term memory networks//International Workshop on Machine Learning in Medical Imaging. Cham: Springer. 2017:362–370. [ PMC free article ] [ PubMed ] [ Google Scholar ]
15. Fan B, Xie L, Yang S, et al A deep bidirectional LSTM approach for video-realistic talking head. Multimedia Tools and Applications. 2016; 75 (9):5287–5309. doi: 10.1007/s11042-015-2944-3. [ CrossRef ] [ Google Scholar ]
16. Park Y H, Shin S A, Kim S, et al Key intrinsic connectivity networks for individual identification with siamese long short-term memory. Frontiers in Neuroscience. 2021; 15 :660187. doi: 10.3389/fnins.2021.660187. [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
17. Arnold M Headache classification committee of the international headache society (IHS) the international classification of headache disorders. Cephalalgia. 2018; 38 (1):1–211. doi: 10.1177/0333102417738202. [ PubMed ] [ CrossRef ] [ Google Scholar ]
18. Calhoun V D, Adali T, Pearlson G D, et al A method for making group inferences from functional MRI data using independent component analysis. Human Brain Mapping. 2001; 14 (3):140–151. doi: 10.1002/hbm.1048. [ PMC free article ] [ PubMed ] [ CrossRef ] [ Google Scholar ]
19. 茂旭, 杨剑, 杨阳. 基于独立成分分析功能连接的抑郁症分类研究. 计算机应用研究, 2018, 35(6): 1641-1644, 1699.
20. Varoquaux G, Sadaghiani S, Pinel P, et al A group model for stable multi-subject ICA on fMRI datasets. Neuroimage. 2010; 51 (1):288–299. doi: 10.1016/j.neuroimage.2010.02.010. [ PubMed ] [ CrossRef ] [ Google Scholar ]
21. Zhao S, Han J, Lv J, et al Supervised dictionary learning for inferring concurrent brain networks. IEEE Transactions on Medical Imaging. 2015; 34 (10):2036–2045. doi: 10.1109/TMI.2015.2418734. [ PubMed ] [ CrossRef ] [ Google Scholar ]
22. Mensch A, Varoquaux G, Thirion B Compressed online dictionary learning for fast resting-state fMRI decomposition//2016 IEEE 13th International Symposium on Biomedical Imaging (ISBI) Prague: IEEE. 2016:1282–1285. [ Google Scholar ]
23. 金海娣, 潘梦雄, 陈媚娇, 等 偏头痛脑能量代谢机制 中国现代神经疾病杂志 2022; 22 (2):73–77. doi: 10.3969/j.issn.1672-6731.2022.02.003. [ CrossRef ] [ Google Scholar ]

Articles from Sheng Wu Yi Xue Gong Cheng Xue Za Zhi = Journal of Biomedical Engineering are provided here courtesy of West China Hospital of Sichuan University