本公开涉及医学诊断,尤其涉及一种基于深度学习的妊娠期糖尿病风险筛查方法及系统。
背景技术:
1、妊娠期糖尿病(gdm)作为妊娠期间常见的并发症,在影响母亲健康的同时,容易增加后代患长期代谢疾病和心血管疾病的风险。在我国,随着人民群众生活水平的整体提升和孕妇年龄结构、营养水平等的转变,gdm已经成为我国孕妇主要妊娠期并发症,在部分地区尤其是经济发达地区,gdm发病率高达20%以上。未进行有效治疗的gdm往往会并发一系列严重妊娠并发症甚至危及孕妇及胎儿生命。然而,gdm的诊断一直以来有较高难度,由于gdm病程随着妊娠过程不断进展,孕早期gdm孕妇往往并无症状和体征,多数gdm孕妇在孕24周后通过一系列糖耐量试验(俗称糖筛)才被确诊。
2、现有gdm筛查技术只能在妊娠24周后开展,筛查时间较晚,影响后续妊娠期糖尿病的救治。
技术实现思路
1、有鉴于此,本公开的目的在于提出一种基于深度学习的妊娠期糖尿病风险筛查方法、系统、电子设备及存储介质,能够在孕妇的孕中早期检测发生妊娠期糖尿病的风险,检测准确度高。
2、为了实现上述公开目的之一,本公开实施方式提供了一种基于深度学习的妊娠期糖尿病风险筛查方法,所述方法包括:
3、获取血液样本,对所述血液样本进行基因测序,获得基因测序数据;所述血液样本包括正常血液样本和妊娠期糖尿病血液样本;
4、基于所述基因测序数据,对所述基因构建滑动窗口,并统计所述滑动窗口覆盖的目标序列数目,得到覆盖度矩阵;
5、构建基于卷积神经网络的深度学习模型;
6、基于所述覆盖度矩阵及所述深度学习模型,对所述滑动窗口进行贡献度打分,根据贡献度得分得到敏感窗口;
7、获取所述敏感窗口的基因注释,得到高敏感基因组区域;
8、基于所述覆盖度矩阵及所述深度学习模型,以所述覆盖度矩阵作为自变量,扫描所述基因测序覆盖高敏感基因组区域的深度,计算妊娠期糖尿病影响因子。
9、作为本公开一实施方式的进一步改进,所述获得覆盖度矩阵包括:
10、根据所述目标序列数目的覆盖度,得到每个所述血液样本滑动窗口的覆盖度,每个所述血液样本构成输入向量,将所有所述血液样本组合得到所述覆盖度矩阵;
11、其中,所述覆盖度矩阵中,每一行代表一个血液样本,每一列代表一个滑动窗口。
12、作为本公开一实施方式的进一步改进,所述基于卷积神经网络的深度学习模型包括:
13、输入层、第一卷积层、第二卷积层、第一最大池化层、第二最大池化层、自注意力层、第一致密层、第二致密层、输出层;
14、所述输入层用于对所述血液样本进行预处理,并将所述覆盖度矩阵传递到第一卷积层和/或第二卷积层;
15、所述第一卷积层和所述第二卷积层为一维卷积层;所述第一卷积层和/或所述第二卷积层用于对所述血液样本进行特征提取,并产生特征图;
16、所述第一最大池化层和/或所述第二最大池化层用于降低特征图的维度,同时保留所述血液样本中的关键信息;
17、所述自注意力层用于连接所述第二卷积层和所述第一致密层;
18、所述第一致密层和/或所述第二致密层用于将特征图映射到分类标签上,并产生所述血液样本的分类结果;
19、所述输出层用于输出所述血液样本的分类结果。
20、作为本公开一实施方式的进一步改进,所述基于所述覆盖度矩阵及所述深度学习模型,对所述滑动窗口进行贡献度打分,根据贡献度得分得到敏感窗口包括:
21、除去所述血液样本中覆盖度一致的滑动窗口;
22、对每一个滑动窗口计算其在所述正常血液样本和所述妊娠期糖尿病血液样本中的均值,除去均值差距小于目标阈值的滑动窗口;
23、基于所述深度学习模型,对所述正常血液样本和所述妊娠期糖尿病血液样本二分类任务中的滑动窗口进行贡献度打分,按照贡献度得分从高到低对滑动窗口进行排名,选取排名在前目标数量的滑动窗口为敏感窗口。
24、作为本公开一实施方式的进一步改进,所述滑动窗口贡献度打分公式为:
25、
26、其中,m为覆盖度矩阵,v为滑动窗口权重参数,i为第i个滑动窗口,vi为第i个滑动窗口的权重参数,j为血液样本,为经过学习模型后单位样本权重指数,e为自然对数,t为矩阵转制,m为样本数。
27、作为本公开一实施方式的进一步改进,所述计算妊娠期糖尿病影响因子公式为:
28、
29、其中,y为标签,既在样本24周经过金标准是否认定为妊娠期糖尿病,ck,i为输入,即滑动窗口覆盖深度,wk,i为对当前样本、滑动窗口的卷积参数,k为样本编号,k为总样本数,i为第i个滑动窗口,w1为第一层致密层的参数,w2为第二层致密层参数,b1为第一层致密层的偏移参数,b2为第二层致密层的偏移参数,i为总滑动窗口数。
30、作为本公开一实施方式的进一步改进,所述对所述血液样本进行基因测序包括:
31、使用第二代dna测序技术对所述血液样本进行基因测序。
32、为了实现上述公开目的之一,本公开一实施方式提供了一种基于深度学习的妊娠期糖尿病风险筛查的系统,包括:
33、获取单元,用于获取血液样本,对所述血液样本进行基因测序,获得基因测序数据;所述血液样本包括正常血液样本和妊娠期糖尿病血液样本;
34、构建单元,用于基于所述基因测序数据,对所述基因构建滑动窗口,并统计所述滑动窗口覆盖的目标序列数目,得到覆盖度矩阵;
35、所述构建单元还用于构建基于卷积神经网络的深度学习模型;
36、计算单元,用于基于所述覆盖度矩阵及所述深度学习模型,对所述滑动窗口进行贡献度打分,根据贡献度得分得到敏感窗口;
37、所述获取单元还用于获取所述敏感窗口的基因注释,得到高敏感基因组区域;
38、所述计算单元还用于基于所述覆盖度矩阵及所述深度学习模型,以所述覆盖度矩阵作为自变量,扫描所述基因测序覆盖高敏感基因组区域的深度,计算妊娠期糖尿病影响因子。
39、为了实现上述公开目的之一,本公开一实施方式提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上任意一项所述的基于深度学习的妊娠期糖尿病风险筛查方法。
40、为了实现上述公开目的之一,本公开一实施方式提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行上述任一所述的基于深度学习的妊娠期糖尿病风险筛查方法。
41、相对于现有技术,本公开提供的基于深度学习的妊娠期糖尿病风险筛查方法及系统,基于深度学习模型和覆盖度矩阵获得高敏感基因组区域,并扫描基因测序的覆盖高敏感基因组区域的深度,计算妊娠期糖尿病影响因子,通过妊娠期糖尿病影响因子可以在孕妇的孕中早期检测发生妊娠期糖尿病的风险,检测准确度高。
1.一种基于深度学习的妊娠期糖尿病风险筛查方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于深度学习的妊娠期糖尿病风险筛查方法,其特征在于,所述获得覆盖度矩阵包括:
3.根据权利要求1所述的基于深度学习的妊娠期糖尿病风险筛查方法,其特征在于,所述基于卷积神经网络的深度学习模型包括:
4.根据权利要求1所述的基于深度学习的妊娠期糖尿病风险筛查方法,其特征在于,所述基于所述覆盖度矩阵及所述深度学习模型,对所述滑动窗口进行贡献度打分,根据贡献度得分得到敏感窗口包括:
5.根据权利要求1所述的基于深度学习的妊娠期糖尿病风险筛查方法,其特征在于,所述滑动窗口贡献度打分公式为:
6.根据权利要求1所述的基于深度学习的妊娠期糖尿病风险筛查方法,其特征在于,所述计算妊娠期糖尿病影响因子公式为:
7.根据权利要求1所述的基于深度学习的妊娠期糖尿病风险筛查方法,其特征在于,所述对所述血液样本进行基因测序包括:
8.一种基于深度学习的妊娠期糖尿病风险筛查的系统,其特征在于,包括:
9.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至7任意一项所述的基于深度学习的妊娠期糖尿病风险筛查方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行权利要求1至7任一所述的基于深度学习的妊娠期糖尿病风险筛查方法。
