一种阿尔茨海默症影像遗传学数据分析方法

专利查询21天前  18


本发明涉及生物信息,更具体的说,涉及一种基于先验信息引导的阿尔茨海默症影像遗传学数据分析方法。


背景技术:

1、阿尔茨海默症作为一种神经退行性疾病,主要表现为记忆丧失严重、大脑萎缩、人格和行为的改变等。晚期的阿尔茨海默症患者将丧失自理能力,最终危及生命。阿尔茨海默症发病率呈逐年上升趋势,目前尚无有效的治疗方法。

2、影像遗传学数据分析,是指将影像组学数据和遗传学数据进行关联分析,从基因的角度解释大脑的宏观变化,在基因型和表型之间搭起一座桥梁。

3、近年来,众多学者通过典型相关分析方法整合影像遗传学数据。典型相关分析算法能够找到使两种数据达到最大相关性的线性组合,将两者数据的线性组合系数分别称为权重u和v。

4、由于影像遗传学数据特征的高维性,有学者在典型相关分析的基础上加入了对权重u和v的稀疏约束来帮助算法在高维数据中进行特征选择。

5、郝小可等人将稀疏典型相关分析算法扩展为三维后,在另外的维度上嵌入样本的临床信息,提出了一种三向稀疏典型相关分析方法,该方法能够解决现有的双变量方法无法嵌入先验信息的问题。

6、kim等人考虑到各脑区、基因之间的连通性信息,提出了一种基于联合连通性的稀疏典型相关分析方法,将其应用于多模态脑影像和单核苷酸多态性的关联分析中,取得了较好的结果。

7、但是,上述典型相关分析方法没有考虑到各模态数据的自相关性,也没有将这种相关性作为一种先验信息纳入阿尔茨海默症影像遗传学数据分析,这可能会影响算法的关联性能,继而影响对阿尔茨海默症辅助诊断分析的准确性。


技术实现思路

1、本发明的目的是提供一种阿尔茨海默症影像遗传学数据分析方法,解决现有技术中对于阿尔茨海默症影像遗传学数据难以对阿尔茨海默症进行精准辅助诊断分析的问题。

2、为了实现上述目的,本发明提供了一种阿尔茨海默症影像遗传学数据分析方法,包括以下步骤:

3、步骤s1、获取阿尔茨海默症以及对照组样本的结构磁共振成像和基因表达数据;

4、步骤s2、对结构磁共振成像数据进行预处理,提取脑区的灰质体积作为脑区成像特征数据;

5、步骤s3、将所有样本按照一定比例划分为训练集和测试集;

6、步骤s4、对训练集中的基因表达数据进行差异表达分析处理,获得处理后的基因表达数据;

7、步骤s5、基于先验信息引导的稀疏典型相关分析算法,对训练集的处理后的脑区成像特征数据和基因表达数据进行关联分析,获得对应权重;

8、步骤s6、将脑区成像特征数据和基因表达数据按照对应权重进行排序,获取在预设权重值范围内的脑区成像特征数据和基因表达数据,作为生物标志物;

9、步骤s7、基于生物标志物构建阿尔茨海默症的诊断模型,所述诊断模型用于阿尔茨海默症的辅助诊断分析。

10、在一实施例中,所述步骤s1,进一步包括:

11、所述阿尔茨海默症以及对照组样本的结构磁共振成像数据为nii格式的数据;

12、所述阿尔茨海默症以及对照组样本的基因表达数据为无缺失值的表格数据。

13、在一实施例中,所述步骤s2,对结构磁共振成像数据进行预处理,进一步包括:

14、对结构磁共振成像原始数据进行仿射配准至mni标准空间;

15、对训练集的结构磁共振成像数据配准到aal模板,进行特征提取。

16、在一实施例中,所述步骤s3,进一步包括:

17、将所有样本中的80%作为训练集,20%作为测试集;

18、所述训练集用于关联分析和筛选生物标志物,测试集用于测试诊断模型的性能。

19、在一实施例中,所述步骤s4,进一步包括:

20、使用limma算法对基因表达数据进行差异表达分析;

21、保留算法参数p小于预设阈值的差异表达基因的表达量,作为处理后的基因表达数据,用于后续关联分析。

22、在一实施例中,所述步骤s5,进一步包括:

23、在稀疏典型相关分析模型中引入基于自相关的惩罚函数,用于研究脑区和基因之间的相关性,对应的目标函数为:

24、

25、

26、其中,u代表x的范数向量,v代表的y的范数向量;

27、λ1,λ2,β1,β2是正则化参数;

28、给定的数据集x∈rn×p,y∈rn×q分别对应结构磁共振成像数据和基因表达数据,n表示样本数。

29、在一实施例中,所述步骤s5,进一步包括:

30、采用交替凸搜索方法对目标函数求解获得u和v的最优值;

31、所述交替凸搜索方法,进一步包括:

32、步骤s51、初始化u和v;

33、步骤s52、将u固定,求解v,关于v的目标函数对应的表达式如下:

34、

35、

36、步骤s53、将v固定,求解u,关于u的目标函数对应的表达式如下:

37、

38、

39、步骤s54、重复步骤s52和步骤s53,直至满足收敛条件,获得相应权重向量u和v。

40、在一实施例中,所述步骤s6,进一步包括:

41、将脑区成像特征数据和基因表达数据按照对应权重绝对值大小排序,分别获取脑区成像特征数据和基因表达数据的权重绝对值排序最大的前若干个特征,作为生物标志物,用于后续辅助诊断分析。

42、在一实施例中,所述步骤s7,进一步包括:

43、基于脑区成像特征数据和基因表达数据的权重绝对值排序最大的前若干个特征,作为生物标志物,采用逻辑斯特回归算法对构建的诊断模型进行验证。

44、本发明提供的阿尔茨海默症影像遗传学数据分析方法,能够在融合先验信息的基础上在高维的影像遗传学数据中进行有效的关联分析和特征选择,挖掘阿尔茨海默症潜在的生物标志物,进而分析遗传变异与大脑内部形态的关系,对阿尔茨海默症进行辅助诊断。



技术特征:

1.一种阿尔茨海默症影像遗传学数据分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的阿尔茨海默症影像遗传学数据分析方法,其特征在于,所述步骤s1,进一步包括:

3.根据权利要求1所述的阿尔茨海默症影像遗传学数据分析方法,其特征在于,所述步骤s2,对结构磁共振成像数据进行预处理,进一步包括:

4.根据权利要求1所述的阿尔茨海默症影像遗传学数据分析方法,其特征在于,所述步骤s3,进一步包括:

5.根据权利要求1所述的阿尔茨海默症影像遗传学数据分析方法,其特征在于,所述步骤s4,进一步包括:

6.根据权利要求1所述的阿尔茨海默症影像遗传学数据分析方法,其特征在于,所述步骤s5,进一步包括:

7.根据权利要求6所述的阿尔茨海默症影像遗传学数据分析方法,其特征在于,所述步骤s5,进一步包括:

8.根据权利要求1所述的阿尔茨海默症影像遗传学数据分析方法,其特征在于,所述步骤s6,进一步包括:

9.根据权利要求1所述的阿尔茨海默症影像遗传学数据分析方法,其特征在于,所述步骤s7,进一步包括:


技术总结
本发明涉及生物信息技术领域,更具体的说,涉及一种阿尔茨海默症影像遗传学数据分析方法。本方法包括:获取阿尔茨海默症以及对照组样本的结构磁共振成像和基因表达数据;提取脑区的灰质体积作为脑区成像特征数据;划分为训练集和测试集;对基因表达数据进行差异表达分析处理;基于先验信息引导的稀疏典型相关分析算法,对脑区成像特征数据和基因表达数据进行关联分析,获得对应权重;将脑区成像特征数据和基因表达数据按照对应权重进行排序,获取生物标志物;构建阿尔茨海默症的诊断模型,用于辅助诊断分析。本发明可以深入挖掘影像遗传学数据中与阿尔茨海默症相关的具有诊断意义的生物标志物,进而辅助阿尔茨海默症治疗靶点的开发。

技术研发人员:位凯,孔薇,黄涛,李亦学
受保护的技术使用者:中国科学院上海营养与健康研究所
技术研发日:
技术公布日:2024/12/5

最新回复(0)