做全基因组测序深度提供哪一种检测样本检测更准确

低深度测序在检测单细胞染色体微小变异中的应用探索

陈大洋1 甄贺富2 刘萍2 邱咏2 谢林2 刘弘泰1 陈芳2

生物技术通报影响力:双核心期刊[(2017年中国科技核心期刊目录)][中国科学引攵数据库来源期刊列表(2017—2018 年度)]

测序目的:低深度测序在检测单细胞 CNV方面的可行性

单细胞测序对象:经过比较基因组杂交(array CGH,aCGH)检测嘚5例阳性细胞系

单细胞测序深度:数据量为 0.1 X

测序结果:Rubicon 试剂盒具有较好的均匀性

分析原因:Rubicon 试剂盒先以原始基因组为模板进行复制,经過 12 次循环后再以扩增产物为模板进行扩增可有效降低扩增误差,增加保真性

原文摘要:旨在探讨低深度测序在检测单细胞染色体微小變异中的应用。以经过比较基因组杂交(array CGHaCGH)检测的5例阳性细胞系为研究对象,从中分离的单细胞分别用两种单细胞扩增试剂盒进行扩增采用Hiseq2000测序平台进行全基因组测序深度,然后进行生物信息学分析将检测结果与已被 aCGH 证实的结果进行比较。结果显示5 个单细胞的全基洇组扩增成功,通过低深度测序均获得明确的检测结果在用 GenomePlex? Single Cell WGA Kit 试剂盒的处理中检出区域与 aCGH 检测区域均有 80% 以上的重叠,1 个样本检出了 8 Mb(Megabase)咗右的假阳性 ;在用 PicoPLEX? WGA Kit 试剂盒处理时检出信号与 aCGH 区域也有 80%以上的重叠且无假阳性信号产生证实在数据量为 0.1 X 左右时可以检出单细胞染色体仩 7 Mb 以上的拷贝数变异。

中文名称:Rubicon PicoPLEX单细胞全基因组扩增试剂盒

用途:卵裂球和滋养外胚层细胞的植入前基因筛查(PGS)和需要单细胞扩增的循环肿瘤细胞(CTC)中的CNV检测

从单细胞中扩增DNA构建高重复性的文库现在成为可能!PicoPLEX WGA kit采用技术,设计、优化用于从单细胞中扩增单拷贝基因組DNA便捷的单管操作流程减少了手动操作的失误,缩短了获得结果的时间并降低背景PicoPLEX WGA Kit同样也可用于6 pg至50 pg的纯化gDNA,并兼容微阵列比较基因组雜交(array CGH)分析及PCR

PicoPLEX全基因组扩增技术具有高稳定性和可再现性,已经成为PGS的标准扩增技术

技术要点:利用随机引物引发线性扩增进行全基因组扩增。即先以原始基因组为模板进行复制经过多次循环后,再以扩增产物为模板进行扩增可有效降低扩增误差增加保真性。

kb-1 Mb 的 DNA 爿段的缺失、插入、重复、倒位和复杂多位点的变异

华雅旗下红荣微再主营医疗核酸保存文库扩增等产品,授权代理(上海)Rubicon Genomics单细胞文库擴增试剂

是映射出一个人的独一无二的DNA伱的基因组是独特的身体蓝图。有时,因为新的或遗传基因突变,基因可以导致疾病或增加你的疾病风险通过测序基因组,卫生专业人员可以看到基因中的独特变化。其中的一些很重要一些不怎么重要。一些仍然是未知或不确定的

全基因组测序深度最常用于医学研究,开始哽多应用于临床实践例如,医生或基因顾问可以使用全基因组测序深度一个病人是否有遗传性疾病或一种疾病的风险。

下面的小问题和回答能帮助更好的了解什么是全基因组测序深度


全基因组测序深度是不同的基因测序。它也不同于

全外显子组测序.研究人员喜欢这种方法,洇为它是更快和更便宜

在全基因组测序深度成为一个常规的医疗保健的一部分之前,还需要做更多的工作 许多问题留给了研究人员、衛生专业人员和决策者。

你的基因不能决定一切他们可以告诉你,你得疾病的风险更高。但是,个人选择和你生活的环境仍然起着非常重要嘚作用重要的是要保持一个健康的生活方式,以减少疾病的风险。日益增长的基因环境领域研究侧重于研究你的生活方式和环境如何与基洇互相作用影响你的健康。

今天,全基因组测序深度主要用于研究,但有几家公司可以测序你的DNA这些被称为直接面向消费者的测试。通过醫生提供的测试目前需要花费几千美元然而,许多生物技术公司竞相在1000美元以下,用更快的速度测序基因

如果你选择你的整个基因组测序, 有个训练有素的专家审查你的结果是非常重要和有用的。同时,你应该确保实验室CLIA认证

全基因组测序深度结果可以分为3类:单基因单一性混乱,多因子混乱和药物基因组学概要文件。

单基因疾病(有时也称为孟德尔疾病)是一个基因的DNA突变引起的疾病一个疾病例子是镰状细胞性貧血。

多基因疾病是超过一个基因的DNA突变引起的疾病这通常包括肥胖和糖尿病等疾病,在很大程度上会受到环境的影响

药物基因组学利用个人遗传密码来确定他们将如何应对药物,这样一个医生可以开出正确的药量这是个性化药物的一个例子。

全基因组测序深度并不昰普通的诊断测试血压测试会给你一个简单的“是”或“不”回答关于你的健康。全基因组测序深度,通常会给你一个的可能大部分你從基因组测试得到的信息会告诉你关于你的疾病风险,而不是你是否有疾病或肯定会得到疾病

健康预测:从全基因组测序深度理解疾病风險 天气预报试图预测的天气在一个小时,一天或一个星期内将是什么样。它涉及到知识的模式和统计数据当一个天气预报预测雨在这个周末即将到来,它通常是一个百分比,就像30%概率的雷阵雨然后我们接受这些信息和通过改变我们的计划或携带一把雨伞做好准备。

全基因组測序深度很像天气预报它不能准确预测会发生什么,但是给你一些事情可能发生的几率。这意味着,它会告诉你更多关于你得某种疾病的风險,比如糖尿病而不是你是否患有糖尿病。我们可以利用这些信息去改变我们的生活方式选择,以更加有利于我们的健康

全基因组测序深度可能不是适合所有人,所以重要的是问问自己你是否认为这是适合你。有些人可能不希望了解他们的遗传风险而其他人想要了解他们嘚基因组这里有一些问题要想想如果你考虑全基因组测序深度:


  • 我担心我的隐私的结果吗?
  • 谁会我想分享我的结果呢?与我的雇主或保险公司汾享怎么样呢?
  • 一个人年龄到了多大后可以测试
  • 我的结果对与我共享相似的基因组成的家庭成员来说意味着什么?
  • 有什么我不想知道的任哬关于疾病的风险信息吗?
  • 我想知道一些在未来10年或更长时间也许不会影响我的信息吗?
  • 我想了解一种没有治疗方法的遗传性疾病吗?
  • 我对接受“也许”而不是“是的”或“不”的不确定的结果感觉怎么样?
  • 我的家族历史是什么?我准备接受意想不到的新闻吗?
  • 这些信息会对我的健康意味着什么?我会采取什么样的行动?

因为一个基因测试的结果是复杂的,包括大量的信息你最好去见遗传学顾问或训练有素的卫生专业人员,让他们来解释你的结果和回答你可能有的问题和顾虑

在全基因组测序深度过程中,研究人员收集DNA样本然后确定组成人类基因组的30亿個核苷酸的身份。第一个人类基因组于2003年完成成为1990年开始的人类基因组计划的一部分。今天测序技术效率变得更高,人类基因组可以茬几天内花费低于10,000美元的费用完成第一个人类基因组耗资27亿美元。今天大多数基因检测侧重于一个或几个基因,而不是整个基因组嘫而,随着基因组测序成本的下降更多的人正在寻求这种选择。医生可以查看整个基因组了解疾病的特定治疗方法将如何受到个体独特遗传学的影响。例如医生可以在决定剂量时选择查看与药物代谢有关的基因。在未来全基因组测序深度可以使每个人都能制定个性囮的治疗计划。

  • 创建个性化的疾病治疗计划可能不仅可以基于导致疾病的突变基因还可以基于患者基因组中的其他基因。
  • 对癌细胞进行基因分型并了解哪些基因被错误调节这使得医生可以选择最佳的化疗方案,并可能使患者接受毒性较低的治疗因为该疗法是针对性的。
  • 以前未知的基因可能被确定为导致疾病状态传统的基因检测只关注常见的“麻烦制造者”基因。
  • 可以调节遗传易感性影响的生活方式戓环境变化可以识别并调节
  • 大多数基因在人类基因组中的作用仍然未知或未完全了解。因此目前在人类基因组序列中发现的许多“信息”是不可用的。
  • 大多数医生没有接受过如何解释基因组数据的培训
  • 个人的基因组可能包含他们不想知道的信息。例如患者进行基因組测序以确定最有效的高胆固醇治疗计划。在此过程中研究人员发现了一种无关的等位基因,可确保终末期疾病无法进行有效治疗
  • 基洇组序列中包含的信息量很大。保持这些信息的隐私和安全的政策和安全措施仍然是新的

全基因组测序深度已经成为一种新的方式来诊斷疾病或是用传统的测试无法诊断的疾病。一个神奇的例子是Nic Volker的故事尼克是一个6岁的孩子,患了一种神秘的疾病,导致许多误诊和无效的治療。最终,威斯康辛医学院的研究人员利用全基因组测序深度诊断出一种罕见的遗传性疾病。这一发现救了他一命

本属于基因工程技术领域具体涉及一种基于目标区域捕获测序基因组拷贝数变异的方法。本发明方法中进行了GC动态校正并建立了动态的参考数据集,能够提高基因组拷贝数变异检测的精度和灵敏性提高效率、降低成本,有利于推广和应用

本发明属于基因工程技术领域,具体涉及一种基于目标区域捕获测序基因组拷贝数变异的方法

拷贝数变异(copy number variation,CNV)是基因组结构性差异的常见形式,多项研究已经证明CNV与多种疾病的发生风险、肿瘤预后、靶向药物等密切相关可靠的CNV检测结果可为临床提供重要依据。

amplification,MLPA)、新一代测序技术(NGS)等但是,array-CGH和SNP分型技术的的精度较低MLPA不能对染色体组進行全局分析。传统的NGS平台检测CNV一般基于全基因组测序深度开发要得到高精度的CNV结果需要采用高深度测序,耗费较大

基于目标区域捕獲测序技术能灵活的捕获到基因组上的目的片段,采用高深度测序可得到高精度的CNV结果。但是由于目标区域捕获的测序数据和全基因组測序深度数据相比存在较大的差别,适用于全基因组测序深度检测CNV的方法在目标区域捕获测序数据并不适用准确性没有保证。

针对现技术存在的问题本发明提供一种基于目标区域捕获测序基因组拷贝数变异的方法,目的是提高基因组拷贝数变异检测的精度和灵敏性提高效率、降低成本,有利于推广和应用

实现本发明目的的基于目标区域捕获测序基因组拷贝数变异的方法,按照以下步骤进行:

(1)前期數据处理:在参考基因组上对目标区域进行平均的有重合的切分每个数据窗口切分为100bp到100kb且大小相等,根据测序的深度进行调整保证每兩个相邻窗口之间有10%-50%的重合,计算第j个窗口的GC含量GCj其中j表示窗口j,取值为整数1,2,3...mGCj:表示参考基因组上第j个窗口的GC含量;

(2)数据过滤:茬对每个样本的测序数据进行比对之前,去掉每个样本的原始测序数据中的低质量数据和接头数据;

(3)数据比对:将每个样本过滤后的测序數据比对到参考基因组上;

(4)GC校正:统计每一个窗口唯一比对到的片段个数Rij其中i表示样本i,取整数1,2,3...nRij表示i样本的第j个窗口里唯一比对的片段个数,再对Rij进行GC校正使用局部加权回归算法得到Rij’=LOESS(Rij,GCj)Rij’:表示i样本的第j个窗口用局部加权回归得到预测值,

然后校正的片段个数RCij=Rij-[Rij’-mean(Rij)]其中mean(Rij)表示样本i的所有窗口片段数的平均值,RCij:表示i样本的第j个窗口里进过GC校正之后的片段个数;

(5)数据标准化对RCij进行标准化,标准化后嘚RRij=RCij×D/mean(RCij)mean(RCij)表示样本i所有窗口的RCij的均值,RRij:表示i样本的第j个窗口的经过标准化后的相对片度个数D表示每次测序的平均深度的均值,是一个固萣的常数;

(6)将收集到的正常人样本作为基础数据执行步骤(2)~(5),得到一个参考数据集合Q;

(7)对于待测样本k执行步骤(2)~(5)得到RRkj,对参考数据集Q中嘚每一个样本,计算二者的相关系数CORki=cor(RRkj,RRij)注意只取RRkj中取数值位于10到90的百分位数的窗口j和与之对应的参考样本的窗口进行计算。完成待测样夲与所有参考数据的相关性计算之后选取相关度大于a的参考数据作为参考数据子集Q1,a表示相关度的阈值优选0.95-0.98;

(8)每个窗口的参考数据Yj=sum(Q1),Yj表示j窗口的所有参考样本的RRij的和;

根据以上模型计算出每个窗口j的期望相对片段数目RRj’,以及拷贝数分别为12,3的每个窗口的概率矩阵;

(9)CNV識别:使用隐马尔可夫模型预测每个窗口的状态将(8)得到的概率矩阵作为模型的发射概率矩阵,设定发生拷贝数变异的概率为p(10-4到10-8)考虑到楿邻两个窗口之间的距离为设置转移概率矩阵为:

预测出每个窗口的状态,合并相邻的且状态相同的窗口输出最后的结果。

(10)对于待测样夲去掉检测到CNV的窗口,重新执行(4)得到新的参考数据集合,重复执行(5)、(6)得到新的CNV结果,如此迭代执行直到参考数据集不在发生变化為止,执行(5)、(6)后得到最终的CNV。

其中所述的目标区域为全基因组或者基因组上任意区域。

所述的样本类型包括全血、唾液、尿液、FFPE和ctDNA

與现有技术相比,本发明的特点和有益效果是:

本发明方法中进行了GC动态校正并建立了动态的参考数据集,能够提高基因组拷贝数变异檢测的精度和灵敏性提高效率、降低成本,有利于推广和应用

本发明适用于高通量测序平台测序数据,主要应用于目标区域捕获测序对于全基因组测序深度数据也适用。

本发明具有更高的检测精度更低的计算资源的需求,对于同一批次单个样本或者多个样本皆可以汾析

图1是本发明步骤(1)中对窗口进行划分示意图;

图2是本发明方法的流程图;

图3是实施例待测样本的ratio图。

具体实施方式中以illumina测序平台为例结合实施例对本发明进一步说明。

参照图1-2本实施例收集了5例正常人样本制作初始数据,另外收集1个样本作为测试样本

本实施例的基於目标区域捕获测序基因组拷贝数变异的方法,按照以下步骤进行:

我要回帖

更多关于 全基因组测序深度 的文章

 

随机推荐