本发明涉及生物育种,具体涉及一种用于多个性状遗传改良的全基因组选择方法。
背景技术:
1、动植物的大多数重要性状都是受微效多基因控制的数量性状,传统的分子标记辅助育种技术(mas)和基因编辑技术(crispr)都只能对大效应的基因有效,而对微效基因很难奏效。meuwissen等在2001年先锋性的提出了全基因组选择理论(genomic selection,gs),为动植物数量性状的遗传改良带来了革命性进展。该技术是目前唯一能对数量性状进行遗传改良的分子育种技术,其特点是周期短、效率高、适应性广,目前已成为许多大型动植物育种公司的主要育种手段。
2、与传统mas技术利用少数几个主效基因进行个体选育不同,全基因组选择技术利用覆盖全基因组的分子标记估算个体的育种值,能最大限度利用遗传效应,因此具有很高的预测准确性。为了能有效地利用全基因组选择选择技术,一些统计模型如genomic bestlinear unbiased prediction(gblup)、bayesa、random forest(rf)等被提出。目前这些统计模型已被成功应用于玉米、小麦和奶牛等的育种中。
3、随着全球气候变化和人类需求品质的提升,培育高产、优质和多抗动植物品种的多性状协同改良已成为当前育种的主要方向,然而现有预测模型缺乏对多性状条件下主效基因与微效基因的区分估算,这必将导致预测准确性下降。
技术实现思路
1、为了解决现有技术存在的上述不足,本发明的目的是提供一种用于多个性状遗传改良的全基因组选择方法,以解决现有预测模型缺乏对多性状条件下主效基因与微效基因的区分估算和预测准确性下降的问题。
2、本发明解决上述技术问题的技术方案如下:提供一种用于多个性状遗传改良的全基因组选择方法,包括以下步骤:
3、(1)统计遗传模型的建立:
4、建立多性状条件下基于主效基因与微效基因的统计遗传模型用于表型预测,假设性状数为n,统计遗传模型如下:
5、
6、其中,y1和yn分别为第1个和第n个性状的表型向量;μ1和μn分别为第1个和第n个性状的均值;f1和fn分别为第1个和第n个性状主效基因的标记矩阵;w1和wn分别为第1个和第n个性状主效基因的标记效应向量;z1和zn分别为第1个和第n个性状微效基因的标记矩阵;u1和un分别为第1个和第n个性状微效基因的标记效应向量;e1和en分别为第1个和第n个性状的残差向量;i为单位矩阵;
7、(2)基于步骤(1)的统计遗传模型,首先定位主效基因,对于第i个性状,其性状表型向量的计算公式如下:
8、yi=μi+fiwi+ziui+ei
9、其中,yi为第i个性状表型向量;μi为第i个性状表型均值;fi为第i个性状主效基因标记矩阵;wi为第i个性状主效基因的标记效应向量,是固定效应;zi为第i个性状微效基因的标记矩阵;ui为第i个性状微效基因的标记效应向量;ei为第i个性状残差向量;
10、然后利用gcta软件定位出主效基因位点;
11、(3)将步骤(2)获得的主效基因位点代入步骤(1)的统计遗传模型,然后构建混合模型方程组用于估算个体全基因组育种值;其中,混合模型方程组如下:
12、
13、其中,为标记效应值,为固定效应值;x为固定效应矩阵;z为微效基因的标记矩阵;t为矩阵转置;g为遗传方差与协方差矩阵;d为残差方差矩阵;y为性状表型向量;
14、
15、其中,y1和yn分别为第1个和第n个性状的表型向量;μ1和μn分别为第1个和第n个性状的均值;f1和fn分别为第1个和第n个性状主效基因的标记矩阵;w1和wn分别为第1个和第n个性状主效基因的标记效应向量;z1和zn分别为第1个和第n个性状微效基因的标记矩阵;u1和un分别为第1个和第n个性状微效基因的标记效应向量;和分别为第1个和第n个性状的残差方差;
16、(4)基于个体全基因组育种值的选择:在得到步骤(3)所述的个体全基因组育种值之后,依据个体全基因组育种值大小排序进行基因组选择。
17、进一步,步骤(1)和步骤(2)中微效基因的标记效应向量均服从的正态分布;其中,gi为第i个性状的遗传关系矩阵;为第i个性状的遗传方差。
18、进一步,gi的计算公式如下:
19、
20、其中,m为标记数;zi为第i个性状微效基因的标记矩阵;t为矩阵转置。
21、进一步,步骤(1)中残差向量服从的正态分布;其中,i为单位矩阵;为第i个性状的残差方差。
22、进一步,步骤(3)中遗传方差与协方差矩阵g和残差方差矩阵d利用最小范数二次无偏估计方法进行计算获得,其计算公式如下:
23、
24、q=v-1-v-1x(xtv-1x)+xtv-1
25、v=g+d
26、其中,tr为矩阵的迹;um为求解变量矩阵;un为背景变量矩阵;y为表型向量;g代表遗传方差与协方差矩阵;d代表残差矩阵;x为固定效应矩阵;t代表矩阵转置;代表遗传方差;q为中间参数;v代表总方差矩阵。
27、进一步,利用最佳线性无偏预测计算步骤(3)中标记效应值和固定效应值其计算公式如下:
28、
29、q=v-1-v-1x(xtv-1x)+xtv-1
30、其中,y为表型向量;x为固定效应矩阵;v为总方差矩阵;z为标记矩阵;t为矩阵转置;为估算的遗传方差;q为中间参数。
31、本发明具有以下有益效果:本发明的全基因组选择方法是基于多个性状下构建统计遗传模型对主效基因与微效基因进行区分估算,采用本发明的全基因组选择方法不仅能获得控制多个性状的主效基因区段,同时也更符合实际育种条件,当性状受主基因和微效基因控制时本发明的全基因组选择方法与现有技术相比具有更高的预测准确性。
1.一种用于多个性状遗传改良的全基因组选择方法,其特征在于,包括以下步骤:
2.根据权利要求所述1的用于多个性状遗传改良的全基因组选择方法,其特征在于,步骤(1)和步骤(2)中所述微效基因的标记效应向量均服从的正态分布;其中,gi为第i个性状的遗传关系矩阵;为第i个性状的遗传方差。
3.根据权利要求所述2的用于多个性状遗传改良的全基因组选择方法,其特征在于,所述gi的计算公式如下:
4.根据权利要求所述1的用于多个性状遗传改良的全基因组选择方法,其特征在于,步骤(1)中所述残差向量服从的正态分布;其中,i为单位矩阵;为第i个性状的残差方差。
5.根据权利要求所述1的用于多个性状遗传改良的全基因组选择方法,其特征在于,步骤(3)中所述遗传方差与协方差矩阵g和残差方差矩阵d利用最小范数二次无偏估计方法进行计算获得,其计算公式如下:
6.根据权利要求1所述的用于多个性状遗传改良的全基因组选择方法,其特征在于,利用最佳线性无偏预测计算步骤(3)中所述标记效应值和固定效应值其计算公式如下:
