本发明涉及生物检测,具体为一种基于甲基化评分和分级的胰腺癌筛查方法。
背景技术:
1、胰腺癌(pancreatic adenocarcinoma,paad)是全球第12位常见癌症,疾病相关死亡率位居恶性肿瘤第四,被称为“癌中之王”。由于胰腺癌早期症状不明显,一般仅表现为轻微的腹痛或血糖控制不佳,不易引起人们的重视,影像学检查对于早期胰腺癌诊断也较为困难。因此,大部分患者在发展到有严重症状时才被确诊,此时胰腺癌往往已发展为中晚期,这极大地影响了患者的预后。
2、糖类抗原-199(ca-199)作为唯一被美国食品药品监督管理局(fda)批准的血清生物标志物,是目前临床中最常用的胰腺癌诊断标志物,但其敏感性(80%,95%可信区间[ci]=72-86%)和特异性(75%,95%ci=68%-80%)并不高。其他的新型血清生物标志物,如黏蛋白5ac(muc5ac)等,它们单独使用或与ca-199联合使用的效果尚待观察。单独使用一种标志物筛查胰腺癌是不全面的,多种标志物联合筛查的工作量又会被放大数倍,在标志物的数量与质量选择中取得一个相对平衡的结果至关重要。当前的研究大部分集中于标志物的联合使用,但并不给出每个标志物在筛查过程中的贡献比例与作用大小,导致假阳性与假阴性的结果时常发生。
3、但是:肿瘤的筛查不同于良性疾病,不是简单的是或否的二分类结果。在筛查的同时我们需要对筛查结果进行分级,根据结果的严重程度不同对高危人群提出差异性的诊疗意见。目前为止还没有看到有已发表的结果或专利在这些方面有所进展。故而提出一种基于甲基化评分和分级的胰腺癌筛查方法来解决上述所提出的问题。
技术实现思路
1、本发明所要解决的技术问题在于针对上述现有技术中的不足,提供了一种基于甲基化评分和分级的胰腺癌筛查方法。
2、为解决上述技术问题,本发明采用的技术方案是:一种基于甲基化评分和分级的胰腺癌筛查方法,包括以下步骤:
3、s1、评分和分级方法;
4、s1.1、准备两组实验例,包括胰腺癌患者和正常对照者,每组实验例各包括33份实验组织和50份实验血浆。预先将所有样本按照8:2的比例随机分为训练队列和验证队列两组;
5、s1.2、在训练队列中对两组实验例同时进行甲基化cpg岛短串联扩增测序,对比分析寻找差异甲基化位点,并统计出差异甲基化位点的结果数据;
6、s1.3、在s1.2差异甲基化位点的结果数据中,根据加和阳性法进一步筛选可用于筛查的基因甲基化位点;
7、s1.4、通过机器学习算法,选择最优的甲基化频率组合和最优的甲基化位点,作为后续疾病诊断与筛查的标志物,并建立疾病评级公式;
8、s1.5、在验证队列中进一步验证s1.3中基因甲基化位点对胰腺癌患者和正常受试者的区分效果;
9、s2、检测试剂盒;
10、检测步骤及具体实施过程主要依据3个检测试剂盒进行,试剂盒a、试剂盒b、试剂盒c;
11、s2.1、样本收集:共收集癌组织与配对正常组织各33例,收集胰腺癌患者和正常对照者血浆各50例;
12、s2.2、dna提取、亚硫酸氢盐转换及文库扩建;
13、s2.3、dna测序文库纯化。
14、优选的,所述s1.2中,经鉴定,共有4615个差异甲基化的cgcgcgg-cpg(双尾mann-whitney u检验,错误发现率<0.05,平均甲基化倍数变化>2)。另外,主成分分析也显示大多数paad癌症患者(33例中有29例)与正常对照者可以区分开。这两个分析步骤由r包“limma”、“tidyverse”和“ggplot2”完成。
15、优选的,所述s1.3中,在上述4615个差异性甲基化位点中,根据加和阳性法进一步筛选可用于筛查的基因甲基化位点。图1中的a图是加和阳性法,所有的测序位点分为fre0-fre10,共6个组别,fre0表示这组基因位点在正常人血浆中的出现频率为0,fre10表示这组基因位点在正常人血浆中的出现频率为10%。左侧的brier score表示判断错误率,值越小表示错误率越小,区分癌症患者与正常人效果越好。结果显示,在fre0组中,由120个位点组成的诊断组合错误率最低;图1中的b图是筛选出的120个基因甲基化位点在癌症组织和正常组织中的表达差异对比。
16、经加和阳性法筛选以下120个甲基化位点的基因组信息:
17、
18、
19、
20、
21、
22、
23、
24、
25、优选的,所述s1.4中包括:运用lasso回归算法选择最优的甲基化频率组合和最优的甲基化位点,将其作为后续疾病诊断与筛查的标志物。通过logistic回归拟合14个优选的甲基化cpg位点,建立胰腺癌甲基化评分与分级公式:risk score=-23.35+2.84*twist2-17229_1_1+1.23*st8sia3-9198_2_3–0.69*slc10a4-19814_1_4+1.74*pde10a-21786_2_1–0.70*otx2-4797_1_9–33.95*fbxl21-20376_1_4+19.06*kcns1-14770_1_3–0.54*17547_1_2+3.60*18198_1_6+10.57*19013_2_3+6.06*19330_5_3+7.24*19348_2_3+16.04*23126_3_5+0.79*lhx5-2647_1_2。
26、优选的,所述s1.5中包括:分别在验证队列中验证和训练队列中观察上述120个基因甲基化位点对胰腺癌患者和正常受试者的区分效果,通过计算阳性个数和曲线下面积(auc)值来评估诊断性能。训练队列中的结果显示(如图2中的a所示),与对照者相比,早期和晚期paad患者的120种标志物阳性计数均显著增加(对照组中位数为0,ⅰ&ⅱ期和iii&iv期分别为37和31,p<0.0001,双尾mann-whitney u检验)。roc曲线分析显示(如图2中的b所示),120个mcgcgcgg-cpg的组合诊断paad的auc值是0.99(95%ci=0.99-1.00),灵敏度、特异度是97%和100%。在训练组中,ca-199的诊断auc值为0.85(95%ci=0.77-0.93),灵敏度、特异度是70%和100%。同样在验证队列中(如图2中的c所示),胰腺癌血浆中120个mcgcgcgg-cpg的阳性个数相比于对照组显著增加(i&ii期和iii&iv期患者的阳性个数中位数值分别为29和34,对照组为0,p<0.001,双尾mann-whitney u检验),这120个mcgcgcgg-cpg诊断组合与ca-199的auc值分别是0.98(95%ci=0.96-1.00)和0.85(95%ci=0.75-0.95),灵敏度和特异度分别是86%,70%,100%,100%(如图2中的d所示)。在合并训练组与验证组之后(如图2中的e、f所示),120个mcgcgcgg-cpg的组合诊断paad的auc值是0.99(95%ci=0.99-1.00),ca-199的诊断auc值为0.85(95%ci=0.77-0.93),灵敏度和特异度则分别是92%,78%,98%,100&。
27、优选的,所述s2.1中包括:首先是样本收集,共收集癌组织与配对正常组织各33例,收集胰腺癌患者和正常对照者血浆各50例。每份重约20mg的组织标本用生理盐水清洗后直接冻存于-80度冰箱中,而血浆样本的离心步骤如下:用含有乙二胺四乙酸(edta)的抗凝管留取10ml外周静脉血,可暂时放置于4℃冰箱中保存,但必须在6小时内完成离心处理,将血细胞和血浆进行分离。以1350g低转速离心血液样本13分钟,由上至下分离出血浆层、白细胞及血小板层、红细胞层,完全吸出血浆层后再次进行1350g离心13分钟,随后再次将除离心沉淀外的血浆吸出后以13500g高速离心5分钟。将分离所得的血浆编号归档并立即冻于-80℃保存。
28、优选的,所述s2.2中包括:组织标本dna提取使用试剂盒a中的1号耗材,血浆游离dna提取使用试剂盒a中的2号耗材,分别按照说明书操作即可;提取的dna需要进行亚硫酸氢盐转换,在转换的过程中,甲基化的胞嘧啶c保持不变,未甲基化的胞嘧啶c转变为尿嘧啶u,这一步使用试剂盒a中的3号耗材;文库扩建按照mcta-seq技术流程进行,总共分为三步,第一步pcr反应使用试剂盒b中的primera与试剂盒c中的ne buffer2、klenow fragment,可以特异性扩增dna中包含有甲基化的cpg区域,第二步pcr建库反应使用试剂盒b中的primerb,进一步选择以cgcgcgg开头的dna片段,第三步pcr建库反应使用试剂盒b中的primer c和primer d,加入测序接头序列。
29、优选的,所述s2.3中包括:dna文库测序前需要进行至少3次纯化,保证杂质dna的含量较低而不占用测序空间。此步骤的扩增pcr反应需要使用试剂盒b中的primer q-p1和primer q-p2,扩增产物使用琼脂糖凝胶电泳取180-250bp范围内的条带(使用试剂盒c中的dl2000 dnamarker与20bp dna ladder提供分子量标准),琼脂糖凝胶回收与dna清洗纯化需要使用试剂盒a中的5号与4号耗材。配置琼脂糖电泳液时必须使用低熔点琼脂糖粉与tae缓冲液,凝胶显色液使用sybr safe dnagel stain。
30、本发明采用上述技术方案,能够带来如下有益效果:
31、1、该一种基于甲基化评分和分级的胰腺癌筛查方法,相对全面且准确地识别胰腺癌患者,此系统包含14个基因甲基化位点,不同的甲基化位点有不同的作用系数,最终的结果由这14个位点与其系数的乘积相加而得,极大减小了假阳性与假阴性结果发生的频率;
32、2、该一种基于甲基化评分和分级的胰腺癌筛查方法,根据筛查结果对受试者进行危险程度分级,筛查结果阴性的受试者可以排除患病风险,筛查结果阳性但分级低的受试者需要随访观察,筛查结果阳性且分级高的受试者需要尽快临床诊断;
33、3、该一种基于甲基化评分和分级的胰腺癌筛查方法,筛查结果数字化,不是简单地给出是或否这样的二分类判断,对是否患胰腺癌的可能性大小给予数字化评定,结果易读且稳定,便于不同时间点的前后对比分析;
34、4、该一种基于甲基化评分和分级的胰腺癌筛查方法,可以推广于其他良恶性疾病的高危筛查中,比如肝癌、胃癌、结直肠腺瘤等,适用疾病谱广,筛查途径多样。
1.一种基于甲基化评分和分级的胰腺癌筛查方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于甲基化评分和分级的胰腺癌筛查方法,其特征在于:所述s1.2中,经鉴定,共有4615个差异甲基化的cgcgcgg-cpg,主成分分析显示多数胰腺癌患者与正常对照者可以区分开。
3.根据权利要求2所述的一种基于甲基化评分和分级的胰腺癌筛查方法,其特征在于:所述s1.3中,具体包括:以正常对照者的血浆测序结果为参考,直接计算每个cpg位点在两组受试者中的不同分布与不同频率判断该甲基化位点是否与疾病诊断关联,经加和阳性法筛选得出120个甲基化位点的甲基化程度可用于胰腺癌的诊断。
4.根据权利要求3所述的一种基于甲基化评分和分级的胰腺癌筛查方法,其特征在于:所述s1.4中,运用最小绝对收敛和选择算子回归方法选择了14个最优的甲基化位点组成疾病评级模型,并建立疾病评分与分级公式。
5.根据权利要求4所述的一种基于甲基化评分和分级的胰腺癌筛查方法,其特征在于:所述s1.5中包括:在验证队列中进一步验证上述120个基因甲基化位点对胰腺癌患者和正常受试者的区分效果,通过计算阳性个数和曲线下面积值来评估区分性能。
6.根据权利要求1所述的一种基于甲基化评分和分级的胰腺癌筛查方法,其特征在于:所述s2.1中包括:每份重约20mg的组织标本用生理盐水清洗后直接冻存于-80℃冰箱中,血液样本要求为至少10ml外周血,必须在6小时内完成离心后将分离的血浆编号归档存于-80℃冰箱。
7.根据权利要求6所述的一种基于甲基化评分和分级的胰腺癌筛查方法,其特征在于:所述s2.2中包括:组织标本dna提取使用试剂盒a中的1号耗材,血浆游离dna提取使用试剂盒a中的2号耗材;提取的dna需要进行亚硫酸氢盐转换,这一步使用试剂盒a中的3号耗材;文库扩建按照mcta-seq技术流程进行,总共分为三步,第一步pcr反应使用试剂盒b中的primera与试剂盒c中的ne buffer2、klenowfragment,第二步pcr反应使用试剂盒b中的primerb,第三步pcr反应使用试剂盒b中的primer c和primer d。
8.根据权利要求7所述的一种基于甲基化评分和分级的胰腺癌筛查方法,其特征在于:所述s2.3中包括:dna文库测序前需要进行至少3次纯化,此步骤的扩增反应需要使用试剂盒b中的primer q-p1和primer q-p2,扩增产物使用琼脂糖凝胶电泳取180-250bp范围内的条带,琼脂糖凝胶回收与dna清洗纯化需要使用试剂盒a中的5号与4号耗材。