GTA基因链做全基因组测序应用有奖励吗

文章来源:企鹅号 - 中国经济网

自基因组学技术问世以来测序与分析一直是基因组学技术中最主要的两个环节。实际上与繁重的测序工作相比,基因组的分析也同样复雜需要耗费大量时间。

然而随着近年来基因组学技术发展突飞猛进,这种状况正在逐步改变

日前,中国农业科学院深圳农业基因组研究所阮珏团队在《自然·方法学》上发表了第三代测序数据组装算法Wtdbg极大提高三代测序数据的分析效率,与今年4月发表在《自然·生物技术》上的Flye算法相比分析速度提升了5倍,并首次将测序数据分析时间降低到少于测序数据产出时间

DNA测序技术成熟于上世纪70年代中后期,1990年人类基因组计划的提出将基因组测序技术逐步由实验室迈入商业化阶段;到2004年人类基因组计划完成时,第二代基因组测序技术已經相对成熟开始大规模商业化应用;2013年,单分子等第三代测序技术出现也预示着测序技术应用更广,测序的成本越低

“如今,完成┅个人的全基因组测序应用是普通家庭都可以负担起费用的‘平常’事情了以三代测序为例,完成个人全基因组测序应用仅需1天时间、費用低于5万元”论文作者、中国农业科学院深圳农业基因组研究所研究员阮珏告诉经济日报记者。

在测序技术日新月异的同时分析技術也在共同成长。以人类基因组组装为例在2014年需要消耗50万个CPU小时,且只能在超大计算机集群上进行因而,以全基因组组装方式对群体進行测序分析已经成为生物医学研究的趋势

关键钥匙:模糊布鲁因图

Wtdbg算法的开发得益于一个新的组装图理论——模糊布鲁因图的提出。模糊布鲁因图借鉴了德布鲁因图的思想将测序数据切分为固定长度的短串,再从短串构建出的图上恢复出全基因组序列

上世纪90年代,德布鲁因图被引入基因组组装领域其以速度优势常用于第二代测序数据的组装分析,但因测序噪音极高从未成功应用在第三代测序数據。

2013年起阮珏和美国哈佛医学院的博士李恒在德布鲁因图基础上,设计出一个新的组装图理论——模糊布鲁因图通过重新对短串进行萣义,它能够容忍高噪音数据并随后对生成组装图和恢复基因组序列做了大量相应的重构,使其兼具高效率和高容错的优点

近年来,苼物信息学领域的科学家们致力于改变这种数据产出速度远高于数据分析速度的尴尬状况不断开发出更高效的组装分析算法。

2013年阮珏與李恒合作开始了测序数据分析方法如组装算法的开发,力求推动测序数据的分析速度更快、分析质量更高2016年,他们的研究结束并将研究成果Wtdbg对所有人免费开放使用。3年来这项成果不仅被几十篇学术论文引用,还被国内多家基因测序分析公司作为主要组装分析工具並且在2019年世界大学生超算竞赛中作为性能测试赛题。

“我们收到大量反馈不仅有助修订算法软件中的漏洞,还带来了新想法和思路算法需要不断在实践中完善,只有通过更多实际应用我们才能更有效调整改进这套算法。目前的算法与2016年相比已经是/s/6L00?refer=cp_1026

  • 腾讯「云+社区」是腾訊内容开放平台帐号(企鹅号)传播渠道之一根据转载发布内容。
  • 如有侵权请联系 yunjia_ 删除。

目前随着高通量测序技术快速發展、测序成本的进一步降低以及组装方法的不断完善,全基因组测序应用研究主要包括3个方面第一种为不参考任何现有序列从头组装測序,是对未知基因组序列的物种进行基因组测序并综合利用不同测序技术和生物信息学工具对研究物种进行序列拼接和修正,进而获嘚该物种的基因组序列图谱

第二种为常见的全基因组重测序,是对已知基因组序列的物种进行个体或群体的测序研究建立一个测序文庫进行单个个体或不同个体混合池测序,发现遗传变异标记进行后续的研究[]。

第三种是在已有参考基因组序列图谱的基础上对不同品種的具有代表性个体建立多个文库进行全基因组从头组装测序,此方法能够进一步的进行参考基因组的修补和发现短序列比对难以发现的遺传变异[]

全基因组重测序因为包含某一物种个体或群体的核DNA的全部遗传信息,与参考基因组比对可以获得非常全面的遗传标记信息如SNP、Indel和CNV等分子标记。

核DNA所包含的父母双亲的遗传信息可以突破线粒体DNA母系遗传和Y染色体父系遗传在物种进化、群体历史动态研究中的限制茬全基因组水平上的高密度的SNP等分子遗传标记也能够较全面的从整体角度对物种受到的自然选择和人工选择导致的遗传变化进行解析。此外近来商业化育种的实施导致某一功能突变基因的正选择或净化选择作用的遗传基础也能通过全基因组重测序方法进行深入的分析研究。此外全基因组重测序还可以突破目前基因分型芯片中品种的偏向性和标记不足的问题,获得的新的遗传变异信息也为进一步制作高密喥芯片提供研究材料

自人类基因组计划完成以来,获得高质量的参考基因组序列图谱成为了不同物种进行功能基因研究的基础[-]随之发展起来的Illumina/Solexa、Roche/454和ABI/SOLiD等几种第二代高通量测序平台更是对现代生物学研究的各个领域中起到了积极的推动作用[, -]。目前测序技术已经由最初的基於双脱氧末端终止法的Sanger测序技术发展到以单分子实时测序(Pacific nanopore)等为特点的第三代测序技术,实现了从低读长到超高读长、从光学检测到电孓传导检测的双重跨越测序技术[]而Illumina/Solexa系统的聚合酶合成法因为具有低成本、单次数据量大、时间短,后续数据分析工作成熟等优势作为苐二代中具有代表性的测序技术广泛应用于动植物的基因组、转录组等方面的测序研究[]。此外以Pacific Nanoprop的MinION测序系列和Helicos公司的Heliscope单分子测序仪为代表的第三代单测序技术在序列读长、测序速度、组装效果方面较第二代测序技术有显著的优势,在参考基因组组装中取得了极大的成功泹因较高的测序错误率和测序成本等问题,目前尚未在重测序领域广泛应用[, -]随着三代测序数据分析算法的、测序准确性的不断提高优化,三代测序技术目前在基因组从头组装和全长转录组分析方面举得了大量的研究成果[-]在全基因组重测序的研究方面,尚未有相关报道泹不久的将来,随着测序费用的降低及准确率的提高其在重测序一定会具有广阔的发展前景。

随着测序技术和分子生物学的进一步发展在越来越多的物种中开展了基因组序列组装重测序研究,产生了海量的测序数据上传到公共数据库并仍在继续增加面对如此巨大的數据量,对当前的数据存储、数据分析挖掘等技术提出了严峻的考验主要面临以下问题:

(1)全基因组测序应用的成本依旧较高,在经濟价值相对较低的物种中很难开展大规模的研究工作。虽然基因分型芯片技术在一定程度上能够补充以上缺点,但其限于常见变异的研究不能对稀有变异进行分析研究。

(2)尽管基因组序列组装不断的接近完成图但依然存在较多的空白,而且基因组中的高重复、复雜区域依旧是基因组组装面临的重要问题为深入研究基因组特征带来一些困难。

(3)第二代测序技术产生的序列读长较短难以跨越高偅复序列区域以及具有碱基偏好性,对复杂区域的研究一直是其短板与参考基因组比对时,短读长序列可能会在基因组中比对到多个位置

(4)第三代测序技术在读长方面较第二代测序技术具有明显的优势,但因其错误率高的特点需要进行大量测序数据进行纠正以及本身的测序费用较高等原因,目前的重测序领域尚未进行大规模应用

(5)在测序数据快速增加的背景下,如何有效地深度挖掘其潜藏的遗傳信息成为目前面临的主要的问题。因此需要不断的进行算法和计算性能的优化。

(6)基因组数据研究是其他功能研究的基础但表型性状的遗传机理十分复杂,如何有效的开展多组学研究也是今后面临的主要问题

面对以上问题,科学家们也一直在不断的进行理论研究和技术应用探索在数据分析方面,各种分析网站和数据库越来越智能化和简约化实现了对算法不断优化、数据冗余的降低以及数据解码效率的提高,虽然目前对数据存取的效率始终面临的主要问题但不久的将来一定会取得突破性进展[]。今后对长度长测序技术的不斷改进和对相应算法的开发研究将是一个研究重点。

对于测序成本问题需要不断的优化现有的测序技术,进一步降低研究成本为充分利用财力、物力、人力资源和潜在的测序数据价值,各国科学家们也在不断的加强国家间的合作研究国际性的合作不仅加快了研究进展,更是增加了学术间的交流进而促进科学的快速发展。此外古DNA保存技术和提取技术的不断进步,也为精确地进行不同物种的群体历史動态研究提供了良好的研究材料

基因组学研究是从正向遗传学的角度来进行基因功能的研究,而生物体的基因与基因、基因与环境的复雜互作关系容易导致假阳性结果。因此为解决基因组测序研究出现的假阳性问题,对物种进行转录组学、代谢组学和蛋白质组学比较进行反向遗传学的功能验证手段,将是全基因组测序应用今后研究工作的重点和方向在家畜上的基因组水平的深入研究也将不断增加峩们对重要经济性状的遗传机制的理解,在育种实践上减少疾病或遗传缺陷的发生为提高产品质量、生产效率及精确快速育种作出重要貢献。此外基因组测序的深入研究也有助于稀有变异的发掘,培育出更优良的专门化畜禽新品种发挥特色物种的各种遗传潜力,具有偅要的不可估量科研价值

基因组学是一门研究生物基因组嘚组成基因组中各基因的精确结构、相互关系及表达调控的科学。在基因组学中科学家们通过新型的基因测序仪分析生物样本(组织、细胞、血液样本等)的基因组信息,并将这些信息用于临床医学诊断、个体化用药指导、疾病发病机理研究、生命调控机制研究等领域

基因测序是一个新兴行业,处于快速发展阶段全球基因测序行业的市场规模巨大。从1990年人类基因组计划(HGP)正式启动以来基因测序應用的壮阔前景开始展现在人类面前。2006年第二代测序仪诞生成本下降百倍,形成“超摩尔定律”之势随着测序成本的显着降低和生物信息分析能力的显着上升,美国等西方发达国家已在这一领域做出前瞻式布局:鼓励高端测序仪的研发和商业化、建立配套的生物信息计算平台、推进基因组领域的科学研发和临床转化

第一部分、测序技术的发展

不论是基因测序(或者说测序)还是基因组测序,都涉及通過测序仪器测定DNA的碱基排列顺序从而解读DNA的遗传密码。迄今为止DNA测序技术和用于基因/基因组测序的测序仪器已历经几代的发展。

第一玳测序技术即Sanger测序技术:1977年,被后人誉为“基因组学之父”的英国生物化学家弗雷德里克-桑格发明了酶测序法(桑格测序法)正式奠萣了测序技术的理论基础,在此9年后ABI公司基于桑格测序法推出了世界上第一台商用测序仪,自此测序技术进入飞速发展的时代;第二代測序技术是当今主流技术主要有Illumina公司的Solexa和HiSeq技术,Life

这三代测序技术各有优缺点应用的领域也不尽相同,因此第一代测序技术仍未被淘汰目前的测序市场是3代测序技术并存的局面。

第二代的基因测序技术目前已经成为市场商用主流三代测序将是未来的大势所趋,但是预計在将来5-10年内二、三代基因测序会共存但二代测序仍将是测序市场商业应用主流。三代测序和二代测序相比较潜在优势明显,但是劣勢也限制了三代测序的商业应用

近年来全球基因测序市场快速增长。从全球的范围来看目前测序市场规模增长最快的是亚洲市场,其Φ中国和印度的市场增长率均超过了20%是全球增长最快的国家。随着东南亚地区生物医药行业持续的快速发展未来中国基因测序市场的增长仍将引领全球。

目前市场上的测序仪基于使用的测序技术也主要分为三代,现阶段临床应用较为广泛的还是第二代测序仪主要生產商主要有Life Technologies(被Thermo Fisher收购)、Illumina和罗氏。

Illumina作为测序行业的龙头企业所占市场份额达70%。最初由四位博士于1998年共同创建总部位于美国加利福尼亚聖地亚哥,主要销售微阵列芯片2006年收购Solexa公司,获得新一代高通量测序技术从而成为目前市场上的主流测序技术公司。

Illumina测序仪可分为桌媔式高通量测序仪其总体特征为快速简约和高效便捷;生产规模测序仪,其总体特征为强大高效和适合生产Illumina桌面式高通量测序仪有Miniseq系列——MiniSeq系统(2016年1月);MiSeq系列——MiSeq系统(2011年2月)、MiSeq Dx系统(2013年11月)和MiSeq

作为集合制药与诊断为一体的瑞士巨头,罗氏集团旗下的诊断部门(罗氏診断)是体外诊断的全球领导者罗氏诊断生命科学部是罗氏诊断旗下的核心事业部之一,自收购德国宝灵曼公司后成立拥有从分子生粅学到细胞组学再到蛋白质组学的仪器和科研试剂类产品,包括LightCycler系列实时荧光定量PCR系统全自动样本制备系统MagNA Lyser和MagNA Pure,高效的细胞计数仪Cedex HiRes发酵参数检测生物过程分析仪Cedex Bio/HT,还有NimbleGen测序上游富集方案以及454和未来的三代、四代测序仪

454公司可谓新一代测序技术的奠基人。2005年底454公司推絀了革命性的基于焦磷酸测序法的超高通量基因组测序系统——Genome Sequencer20 System,开创了边合成边测序的先河之后,454公司被罗氏诊断公司以1.55亿美元收购2007年,他们又推出了性能更优的第二代基因组测序系统——Genome Sequencer FLX System2008年10月,全新的GS FLX Titanium系列试剂和软件的补充让GS FLX的通量一下子提高了5倍,准确性、讀长也进一步提升

2013年9月,罗氏与太平洋生物科学公司(PacBio)签订协议以PacBio的SMRT技术为基础开发诊断产品,包括前期、里程碑和供应付款在内罗氏向PacBio支付7500万美元。根据这项协议PacBio将开发并制造供临床使用的测序系统和消耗品。

2014年上半年罗氏先后收购分子诊断公司IQuum和正在开发納米测序平台的Genia Technologies公司;下半年,罗氏又从Abvitro公司收购了用于NGS样品制备的靶向富集技术;到了12月初罗氏宣布收购Ariosa Diagnostics公司,扩充其体外诊断业务进军无创产前检测(NIPT)行业;12月下旬,罗氏又宣布收购基因组分析公司Bina Technologies进一步为其基因组学范畴的业务蓄势。

罗氏诊断的测序战略三管齐下首先,获得颠覆性的测序技术如对四代纳米孔测序公司Genia的收购;其次,在开发新平台的同时维持其在测序市场的地位,罗氏診断承诺将持续提供454测序试剂、耗材和维修服务同时不断在NimbleGen SeqCap产品上推陈出新,推出富集差异化的新一代测序上游靶向富集方案;再次提供一套集成的解决方案,跨越(包含)多项用于全面诊断的技术

Roche454测序系统是第一个商业化运营二代测序技术的平台。它的主要测序原悝如下所示:

454测序系统的文件构建方式和illumina的不同它是利用喷雾法将待测DNA打断成300-800bp长的小片段,并在片段两端加上不同的接头或将待测DNA变性后用杂交引物进行PCR扩增,连接载体构建单链DNA文库。

(2)Emulsion PCR(乳液PCR其实是一个注水到油的独特过程)

454测序仪的DNA扩增过程也和illumina的截然不同,它将这些单链DNA结合在水油包被的直径约28um的磁珠上并在其上面孵育、退火。

乳液PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA擴增其关键技术是“注水到油”(水包油),基本过程是在PCR反应前将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴这些小水滴就构成了独立的PCR反应空间。详细步骤如图4所示理想状态下,每个小水滴只含一个DNA模板和一个磁珠

这些被小水滴包被的磁珠表面含有与接头互补的DNA序列,因此这些单链DNA序列能够特异地结合在磁珠上同时孵育体系中含囿PCR反应试剂,所以保证了每个与磁珠结合的小片段都能独立进行PCR扩增并且扩增产物仍可以结合到磁珠上。当反应完成后可以破坏孵育體系并将带有DNA的磁珠富集下来。进过扩增每个小片段都将被扩增约100万倍,从而达到下一步测序所要求的DNA量

测序前需要先用一种聚合酶囷单链结合蛋白处理带有DNA的磁珠,接着将磁珠放在一种PTP平板上这种平板上特制有许多直径约为44um的小孔,每个小孔仅能容纳一个磁珠通過这种方法来固定每个磁珠的位置,以便检测接下来的测序反应过程

测序方法采用焦磷酸测序法,将一种比PTP板上小孔直径更小的磁珠放叺小孔中启动测序反应。测序反应以磁珠上大量扩增出的单链DNA为模板每次反应加入一种dNTP进行合成反应。如果dNTP能与待测序列配对则会茬合成后释放焦磷酸基团。释放的焦磷酸基团会与反应体系中的ATP硫酸化学酶反应生成ATP生成的ATP和荧光素酶共同氧化使测序反应中的荧光素汾子并发出荧光,同时由PTP板另一侧的CCD照相机记录最后通过计算机进行光信号处理而获得最终的测序结果。由于每一种dNTP在反应中产生的荧咣颜色不同因此可以根据荧光的颜色来判断被测分子的序列。反应结束后游离的dNTP会在双磷酸酶的作用下降解ATP,从而导致荧光淬灭以便使测序反应进入下一个循环。由于454测序技术中每个测序反应都在PTP板上独立的小孔中进行,因而能大大降低相互间的干扰和测序偏差

454技术最大的优势在于其能获得较长的测序读长,当前454技术的平均读长可达400bp并且454技术和illumina的Solexa和Hiseq技术不同,它最主要的一个缺点是无法准确测量同聚物的长度如当序列中存在类似于PolyA的情况时,测序反应会一次加入多个T而所加入的T的个数只能通过荧光强度推测获得,这就有可能导致结果不准确也正是由于这一原因,454技术会在测序过程中引入插入和缺失的测序错误

说起全自动测序仪,ABI公司那是绝对的领头羊其3730旗舰测序仪在人类基因组计划中立下赫赫战功。然而在新一代测序方面,454和Solexa抢了先机率先推出了NGS仪器。ABI当然不会作壁上观让客戶的实验室里摆满对手的仪器。于是它在2006年斥资1.2亿美元收购了遗传分析公司Agencourt Personal Genomics(APG),为的是第二年将新一代测序系统推向市场APG的核心技術是SOLiD(supported oligo ligation detetion),其独特之处在于以四色荧光标记寡核苷酸的连续连接合成为基础取代了传统的聚合酶连接反应,可对单拷贝DNA片段进行大规模擴增和高通量并行测序

至此,454、Illumina和ABI在新一代测序领域形成了三足鼎立的局面正是这种你追我赶,让人类基因组图谱的绘制成本大大降低时间也大大缩短。不过Illumina率先进入大型的基因组中心,抢占了先机此后它又推出了高通量的HiSeq系列,在通量上领先于SOLiD因此,ABI(及后來的Life Technologies)始终无力追赶好在,Life Technologies高瞻远瞩放眼快速经济的测序市场,在2010年收购了Ion Torrent公司尽管这种半导体测序仪未必适合30亿个碱基的人类基洇组测序,但却是更多小型实验室的理想选择

当前的国产测序仪,无论是二代还是三代其核心零部件都需要进口,比如光学系统中的蔀分核心器件来自日本、德国测序芯片和微流控系统需来自新加坡、美国。如此看来如果未来可以将核心零部件也进行自主研发,其荿本还会进一步降低

目前国产测序仪的测序产品以二代测序仪为主。据CFDA官方网站显示截至今年9月初,我国已经批准的国产基因测序仪囲有八款分别是华大基因的BGISEQ-100(基于Life Technologies的Ion Proton测序平台)和BGISEQ-1000(基于Complete Genomics公司的测序平台)、BGISEQ-500、达安基因的DA8600(基于Life 550AR(与Illumina合作)。相信这些仪器将在无创產前检测乃至未来领域发挥重要作用

2017年9月,南方科技大学贺建奎教授的团队成功研发出具有完全自主知识产权的亚洲第一台第三代基因測序仪GenoCare准确率已经达到99.9985%。截至目前全球自主研发三代测序仪的企业只有三家,另外两家分别是太平洋生物科学公司和牛津纳米孔公司GenoCare的研发成功为国产测序仪打了一剂强心针。

第三部分:与测序仪配套使用的测序试剂

靶向测序(Targeted Sequencing)又称为目标区域测序即通过核酸富集技术提炼出样本中研究人员感兴趣的基因组特定区域,构建测序文库后再进行高通量测序的方法以达到减少测序量、提高目标区域测序深度的目的。核酸富集一般通过目标序列捕获或PCR的方法实现靶向测序已成为基因组研究方法中最主要的方法之一,尤其在疾病相关基洇的研究得到非常广泛的应用

测序试剂根据用户的实验流程可分为前端样品制备试剂,以及后端的芯片加载和测序试剂

位于基因测序產业上游的测序仪市场是整个行业技术壁垒较高、外来竞争者较难进入的环节,目前由Illumina、赛默飞世尔(原Life Technologies)、罗氏、太平洋生物科学公司這四大企业垄断不同公司开发的测序仪大多因为原理不同而采用封闭的芯片加载和测序试剂,即测序仪器必须依赖配套的试剂和耗材才能运行因此试剂较为单一。

而位于产业中下游的生产、应用服务和终端用户根据市场应用的需要对前端测序文库制备和靶向捕获类试劑的需求正在不断变大,而且呈现多元化趋势文库制备和靶向捕获是整个实验流程的第一步,建库和捕获质量的高低会很大程度影响最終的测序结果尤其在疾病相关研究中,样本种类多且质量参差不齐给测序文库的制备带来了新的挑战:

起始核酸量较少,或者样品非瑺珍贵常见于游离DNA(cfDNA)和循环肿瘤DNA(ctDNA)。这类样品需要较高的文库制备转化率以便能从有限的样品中获得足够量的测序文库。此外起始量低也意味着对PCR扩增的依赖性较高,如何降低PCR的重复率提高文库的丰富程度,还原真实的样品信息也是一大挑战

核酸降解比较严偅,质量较低常见于福尔马林石蜡包埋样品(FFPE)。这类样品由于DNA和RNA降解严重适用测序的合格片段非常有限,因此也需较高的文库制备轉化率及还原度获得合格的测序文库

基因组GC含量较高或较低。PCR往往对高GC含量或低GC含量区域的扩增有不同程度的局限性因而产生扩增偏差。植物、微生物组及环境样品中这类问题尤其突出如何减少这种系统性偏差,真实再现样品原始信息是重要的考量

对检测结果的要求较高,如低频变异或稀有转录本的检出这类检测对文库的丰富度和PCR重复率要求较高,文库丰富度越高PCR重复率越低,干扰的信息越少往往就越有利于低频变异和稀有转录本的检出。

对于捕获试剂来说能不能均一性覆盖整个感兴趣的基因组区域,提高困难区域的捕获效率简化和建库流程的整合就显得尤为重要。

这里以罗氏的KAPA文库构建试剂产品和NimbleGen靶标富集试剂为例进行阐述。

罗氏NimbleGen一直是靶向序列捕獲富集技术的领导者之一而Kapa Biosystems公司(于2015年8月被罗氏收购)则多年来致力于高质量二代测序建库试剂的开发,双方联手推出了全新的产品组匼这种组合结合了罗氏NimbleGen的SeqCap系列捕获富集产品(包括用于DNA测序的SeqCap EZ产品、用于RNA测序的SeqCap RNA产品、用于甲基化测序的SeqCap Epi产品等,如表2为例这里以SeqCap EZ产品为例)的高效富集的特点,以及Kapa建库试剂的高效DNA连接和高保真DNA扩增特色将同时带来简化的实验流程和实验效果的提升。

罗氏NimbleGen的核心技術在于优越的探针设计能力和高品质的富集探针它的优点在于:(1)每种富集产品可以一次性使用多达210~420万种高密度叠瓦式探针,对目標区域进行靶向富集确保样本目标序列完全富集,提高富集效率

(2)专有的Repeat Mask算法,对艰难区域进行有效的探针设计有助发现更多关鍵变异。

(3)优化的探针排布确保目标区域的均一化富集有效降低测序成本,提高艰难区域变异的检出率使得最终的测序结果表现出覆盖的均一性。

NimbleGen目前提供了人类基因组DNA、RNA和甲基化热点区域的目录化靶标富集产品并同时支持人类和其他类型任意物种的捕获探针定制,实现在同一反应管中高特异性和高覆盖度捕获多至200Mb的目标区域可以满足基因组、转录组和表观组的全组学分析需求

Kapa文库构建试剂盒产品可分为DNA样品制备和RNA样品制备。

对KAPA DNA Hyper而言它的一体化流程合并了多步酶反应,减少了纯化步骤有效降低了文库构建时间和手工操作,同時提高了重现性其高效的HIFI酶进一步提升了文库构建效率,减少扩增偏差尤其对于困难样本类型,如FFPE、cfDNA、ctDNA等具有非常明显的性能优势

楿比其他同类型建库产品,KAPA产品具有以下优势:

(1)样品要求灵活不仅起始量要求低,而且兼容FFPE等在内的多种类型的样本;

(2)文库转囮率高只需较少的PCR扩增循环数即可,使得相同序列的重复率降低文库的丰富度变高,一次测序可以获得更多的序列信息(而不仅仅只昰反复测序相同的扩增序列)有效降低了总测序成本;

(3)高性能的HIFI酶有效降低了扩增偏差,不仅可降低PCR重复率还可更均匀覆盖高GC和高AT含量区域、低复杂性区域及其他高挑战区域;

(4)流程快速简便,整个文库制备只需3小时手动步骤少,一致性和重现性好;

(5)可匹配各种自动化工作站方便融入不同实验室的工作流程。

KAPA建库与NimbleGen探针结合可打造优化的实验流程,即HyperCap其中其详细实验流程,如图6和图7所示:

(1)各种来源的基因组DNA样本满足一定的质控标准后可用于靶向富集实验;

(2)文库制备:KAPA高效建库试剂盒提高测序接头与样本DNA片段嘚连接效率和产量降低PCR步骤导致的测序文库的GC偏好,保留更好的测序文库多样性;

(3)杂交:SeqCap捕获探针与基因组DNA文库特异性结合;

(4)磁珠捕获:SeqCap探针上带有生物素标记可被链霉亲和素包被的磁珠吸附,与探针结合的基因组DNA片段随之被富集;

(5)洗脱:去除未与探针结匼的基因组DNA片段;

(6)扩增:通过PCR扩增捕获得到的基因组DNA片段;

(7)富集实验质控:SeqCap探针内置对照探针可利用qPCR对内参位点含量测定以判斷富集效率;

(8)测序DNA文库形成:实验最终产物可直接用于高通量测序。

HyperCap工作流程将罗氏的高效KAPA DNA文库构建试剂盒与SeqCap EZ靶向富集探针集成构建成为一体化、自动化友好的的解决方案。HyperCap产品特色在于:

(1)简便无缝的靶向富集工作流程用于高度集成的样品制备解决方案;

(2)哆样的罗氏通用封闭探针(UBO)使其易于使用,简化了工作流程;

(3)可自动化的性能经验证的KAPA双端标记(96)接头,可对接高通量工作流程;

(4)可定制用于不同的样品类型和起始量;

(5)单个供应商的订购流程一体化的服务和客户支持。

HyperCap工作流程减少了用户介入减少叻特殊实验仪器如真空浓缩仪、水浴、离心机和涡旋混合仪的使用,节省了手工操作时间和实验室资源它可与多种自动化工作平台对接,让大样本量操作变得简单

大量的研究使用NimbleGen的序列捕获富集技术和产品,对肿瘤、遗传病、神经疾病和免疫类疾病等各种疾病相关的DNA区域进行目标富集并利用KAPA文库构建试剂帮助研究者轻松获得高质量的文库,较少前端样品富集的压力和成本同时有助于文库多样性和样品的高保真还原,减少后端测序成本的同时可发现更多变异位点,满足各种研究需求

Targets),这标志着MSK-IMPACT将作为首个不限癌种覆盖遗传性、原发性和转移性肿瘤,对468个与肿瘤密切相关的基因进行全面精准分析的体外诊断检测平台服务于临床。

值得一提的是MSK-IMPACT所采用的文库淛备及靶向捕获富集技术正是使用了罗氏诊断的产品,其中文库制备所使用的是KAPA DNA Hyper文库构建试剂盒靶向捕获所使用的是SeqCap EZ Choice人类定制捕获试剂盒。

MSK-IMPACT是一个更加灵活和全面的肿瘤平台基于NGS技术,由MSKCC病理科开发可适用于所有部位的肿瘤类型。它并不对肿瘤的全基因组或全外显子組进行测序而是以过往的癌症研究为基础,确定了468个“关键基因”靶标进行深度和全面的测序,发现这些基因的整个蛋白编码区、选萣的与转录启动、基因重排等密切相关的非编码区域上的所有关键变异涵盖了单核苷酸变异(SNV),插入/缺失(Indel)拷贝数变异(CNV),基洇融合(gene fusion)微卫星不稳定(MSI)等多种变异类型,可为临床诊断和治疗指导提供有价值信息也正是因为如此,MSK-IMPACT的临床意义更加明确可提供的治疗指导信息也更具有针对性,是未来肿瘤精准治疗的一个重要组成部分

MSK-IMPACT的评估结果证实了KAPA建库和SeqCap捕获产品的高性能。在所有类型的肿瘤样本中SeqCap探针都表现出了极高的捕获效率和对不同基因区段的高一致性捕获,为后续的测序提供了一个真实的基础对一些比较罕见的,突变频率低的基因也体现出很好的灵敏度而KAPA试剂盒表现出了良好的适用性,在样本质量参差的研究中用同一工作流程应对新鮮组织、石蜡包埋组织、冻存组织、ctDNA等来源的各种DNA样本,得到可重复的结果且文库转化率高,文库丰富度高重复率低,易于自动化

FDA亦认为MSK-IMPACT的认证“建立了一个良好的审批框架,为其他基于NGS的肿瘤分析工具的有效审查和获批铺平了道路”通过MSK-IMPACT的这次评估,FDA官员们发现MSK-IMPACT的准确率超过了99%,并能检测到频率低至5%的突变此外,MSK-IMPACT还可有效检测微卫星不稳定在多种癌症类型的175个病例中与传统方法有92%的┅致性。有理由相信肿瘤精准医学的时代已经开启。

第四部分、基因测序行业市场概况

基因测序行业近年来发展迅速据BBC RESERCH统计,从2007年的7.94億美元增长到2015年的59亿美元复合增长率为33.5%,预计未来几年依旧会保持快速增长2018年将达到117亿美元,复合增长率为21.1%如图所示。

源于政策红利我国基因测序市场规模也在2015年迅速扩大,从2012年的11亿元人民币增长至2015年的30亿元人民币。预计2020年国内基因测序市场规模将达到100亿元人民幣左右年复合增长率20%,如图所示

2007~2020年我国基因测序市场规模

随着全球基因测序应用持续取得技术突破,以及社会各界对基因测序应用嘚接受程度越来越高相关政策法规的进一步完善,基因测序应用将会越来越普及预计仅基因检测服务业在近几年内可以达到百亿级的市场。如果整合所有基因检测相关行业产业(产前诊断、干细胞治疗等)该产业的市场规模有望超过万亿。基因测序技术已在医用和商鼡领域成熟应用被广泛应用于个性化医疗、肿瘤和遗传病、微生物、器官移植等方面。

迄今为止基因测序相关产业已形成了包含科学發现、技术发明、产业发展的完整产业链条。微阵列芯片的代表企业是Affymetrix、Agilent、NimbleGen、Illumina等新一代基因测序的代表企业是美国Illumina公司、Life Technologies(Life Technologies)、太平洋苼物科学公司(Pacific Biosciences,简称PacBio)以及瑞士的罗氏公司(Roche)目前,新一代基因测序技术已被用于临床医学服务代表性的应用有无创产前基因检測。中国的代表企业是华大基因和贝瑞和康国外代表企业包括Sequenom、Verinata

中国基因测序行业的发展基本与全球发展同步,发展初期主要通过引进國外的第二代测序仪以用于开发下游的应用2008年,将第二代测序技术用于研究基因与表型之间的关联2010年,开发出可用于临床的应用代表产品是无创产前基因检测,国内代表企业是华大基因、贝瑞和康等新一代测序技术也被广泛地应用于科研机构、制药企业、种子公司忣其它生物公司的研发工作,国内代表企业是华大基因、诺禾致源、美吉生物、药明康德等但是目前在中国,基因检测设备自主研发能仂相比发达国家比较弱第二代测序技术应用还主要依靠美国Illumina公司和Life

基因测序行业的上游为测序仪、测序试剂和耗材的供应,代表公司为Illumina、罗氏、赛默飞世尔等;中游主要是测序服务以及测序数据的处理和解读代表公司为赛默飞世尔、华大基因等;下游为测序服务的终端應用,包括临床检测、生命科学研究等领域面向对象主要是医院、科研机构、药企等。

据Markets&Markets预测年上游市场中测序仪的复合增长率是15.4%。Φ游测序服务市场重资产、技术附加值低将是产业链中增速最快的,预计2016年超过测序仪器市场据BCC Research预测年中游市场复合增长率为29%。下游苼物信息学分析市场轻资产、技术附加值高据Frost&Sulivan预测年复合增长率为22.7%。

每一款新型测序仪癿面世都是基于测序技术理论和方法的突破因此测序仪市场准入壁垒很高,全球市场长期被国外几家大的测序仪生产商所垄断(如图12、13所示)而企业在开发测序仪时,通常都会设计與之配套的测序试剂和耗材因此测序行业上游竞争的核心还是在于测序仪的竞争。2016年时Illumina的市场市场份额达到84%,短期内Illumina等公司的行业垄斷地位难以被打破其它公司也难以冲入测序仪市场参与竞争。在国内Illumina采取与多家公司,如贝瑞和康等合作的策略垄断市场掌控市场,同时通过下游企业的代理和市场推广来培养市场第三代测序技术由于其独特的技术优势,是未来的发展方向技术成型以后有望撼动目前Illumina一家独大的市场格局。

测序行业中游的公司按照业务性质可进一步细分为提供测序服务和测序数据分析两大类随着测序技术的进步荿熟和测序仪功能的不断完善,目前测序服务行业准入门槛不高市场竞争激烈。在国内市场上测序服务的发展也进入了白热化癿阶段。据不完全统计截至2016年,我国有数百家基因测序服务公司主要分布在北京、上海、广州、深圳、杭州、天津、武汉等省市。其中位於第一方阵的企业包括四家,华大基因、贝瑞和康、达安基因、博奥生物其余较为知名的企业包括药明康德、安诺优达、诺禾致源等,洳图14所示

下游:应用服务遍地开花

随着测序技术的快速发展,测序的成本也呈现“超摩尔定待”降低由2001年的近10000美元/Mb降至目前发0.01美元/Mb。铨球目前的基因检测市场容量为200亿美元基因测序最主要的下游应用是临床检测和科研服务两方面,其中临床检测项目占据70%以上的市场鉯科研机构、药企、CRO公司和等一线科研单位为用户群体的科研服务也占据了25%左右的市场。

据Illumina公司预测全球基因测序的市场规模有200亿美元咗右:肿瘤学120亿美元、生命科学50亿美元(包括生命科学工具、复杂病症,农业基因以及影响因素和宏基因组)、生育和基因健康20亿美元(孕妇和新生儿童的检测以及基因健康)、其他应用10亿美元。

全球基因检测市场主要应用领域占比数据来源:中国产业信息网。

基因测序产业链上游为欧美企业主导我国企业主要集中在中下游测序服务业,并有往上游延伸的趋势目前,我国的基因测序企业主要集中在產业链的中下游测序服务业而上游基因测序设备耗材供应商的技术门槛较高,基本上为外资企业所垄断由于基因测序的关键技术仍长期掌握在以Illumina为代表的欧美基因测序设备及试剂耗材生产商手上,我国的基因检测行业没有彻底的定价权处处受到欧美企业的掣肘。为了妀变这一局面近年来,我国的测序企业也开始尝试冲入测序仪市场突围的模式主要有3种:

(1)采购国外的测序仪生产企业,以华大基洇为代表;

(2)自主研发以华因康基因、紫鑫药业等公司为代表,国内已有多款问世的国产测序仪---华大基因的桌面型高通量测序系统BGISEQ-500、高通量台式测序系统BGISEQ-50和超级测序仪Revolocity等;中科紫鑫的BIGIS二代测序系统和华因康的中国首创临床专用型高通量基因测序仪HYK-PSTAR-IIA;

(3)与国外知名测序儀生产企业合作在其测序仪原型的基础上加以改造,形成具有特殊用途的自主品牌的测序仪代表公司是贝瑞和康、达安基因等。

基因測序应用市场空间广阔CFDA批准的下游基因测序临床应用分为四个类别,分别为遗传病诊断、产前筛查与诊断、植入前胚胎遗传学诊断以及腫瘤诊断与治疗无创产前筛查为当下较为成熟和消费者认可程度最高的产品,且随着我国二胎政策的放开市场将有进一步的成长空间;肿瘤诊断与治疗是最具有开发潜力的应用市场,癌症已经成为全球第二大致死病因并且随着我国老龄化社会的到来,癌症在我国发病率将进一步提高二代测序在肿瘤邻域的应用将有巨大的发展潜力。

第五部分:测序技术的挑战与发展趋势

测序成本、读取长度和测序通量是评价测序技术先进与否的重要标准测序成本是一个很重要的因素,它在一定程度上决定了基因组测序应用的普及性在1995年,随着自動测序仪的出现检测一个碱基的成本大约是1美元。随后到1998年使用ABI Prism3700DNA Analyzer检测一个碱基的成本已经降到了0.1美元。而目前广泛使用的第二代测序技术的测序成本更低美国国家人类基因组研究所(NHGRI)预测,在未来5年内测序成本还将下降100倍。读取长度是指一个反应能测得数据的长喥它对测序成本和数据质量有很大的影响。更长的读取长度可以减少测序后的拼接工作量但可能也会降低测序结果的准确性。测序通量是指在一定时间内获得的数据输出量仪器的测序通量是指在样品准备充分的前提下,测序仪每24小时产生的数据量更高的测序通量也能够在一定程度上降低测序成本、提高科研工作的效率。

如今DNA测序技术已广泛应用于生物学研究的各个领域,很多生物学问题都可以借助高通量DNA测序技术予以解决而且测序技术在医疗检测中的应用也越来越深入。从精准医疗个性化用药,遗传咨询的大方向到肠道阴噵菌群基因组分析,无创产前检测胚胎植入前遗传学诊断/筛查,遗传病肿瘤液体活检,单细胞测序药物基因组等具体的应用领域。從科研领域到日常生活测序技术逐渐融入我们的生活。各种来源的测序和配套表型临床数据的爆发也预示着生物大数据时代的到来,結合相关技术科学家们能做的事情越来越超越人们的想象。

本文经授权发布版权归原作者所有;内容为作者独立观点,不代表亿欧立場如需转载请联系原作者。

基因技术虽然带来了生命科学和醫疗保健行业的深刻变革但我们必须看到,依然有很多问题值得探讨——这些问题如果不能得到很好的解决将影响行业发展进程。

为嶊动世界基因科技发展解决人类基因数据样本匮乏的问题,GTA基因链应运而生其是由GTA基金会依托先进的基因测序和解码技术,以及YTA(YottaChain)数据存储及密码学加密技术打造的世界首个具有应用价值的基因数据存储区块链项目。

GTA以协作、安全、共享、确权为原则正在全球范围内展开一场以基因技术为主导的大规模群体协作,以独特的区块链激励机制将个人用户、基因测序公司、医疗、制药、健康服务以及其他数據应用机构快速聚合在同一个平台致力为全球精准制药、精准医疗、科学研究、健康管理等机构提供大数据支持,为全人类创造健康福祉

10月18日,CoinVoice邀请到GTA中文社区发起人、GTA基金会联盟理事长李云明做客第43期VOICE商业直播

以下是我们对直播对话内容的整理,GTA目前的成绩、在区塊链+基因数据所做出的努力以及李云明对基因大数据行业的理解和分享。希望对您有所启发

CoinVoice:中国著名企业家、金融专家,GTA基金会联盟理事长、GTA中文社区发起人李云明带领GTA基因链开疆扩土,应用的正是当下火热的区块链技术请李总开宗明义,GTA基因链如何定义自己的“区块链+的时代先驱”

李云明GTA基因链旨在打造具有应用价值的基因数据存储区块链项目。在业务发展上主要表现在三个方面一是以铨基因组测序应用和精准体检为产品与服务作为支撑,二是以全基因组数据和表型数据存储及应用为核心业务三是以推动人类生命健康數据在科研领域得到广泛应用造福人类健康福祉为长期的发展战略。

在未来GTA将是一个在全球范围内具有影响力的平台。

GTA是顺应时代需求洏诞生的区块链项目准确地说,GTA是一个区块链+实体经济的项目大家都知道,基因与人类的健康紧密相关基因演绎着人类生、老、病、死等一切生命现象。基因测序技术是了解基因的唯一有效手段也是基因科学研究的基础,基因测序技术的快速发展推动了基因科技的進步

我们回顾一下基因科技的发展历史在2003年,当人类第一次完成全基因组测序应用耗时13年,花费了38亿美元而今天,随着基因测序技術的发展测序成本大大降低了,已经逐渐走入普通人的生活这将势必产生大量基因数据存储及应用业务的需求,并将推动基因数据在科学领域得到广泛应用继而给全人类带来健康福祉。

GTA依托世界上先进的全基因组测序应用技术和最安全、分布式加密存储技术以独特嘚区块链激励机制,在全球首创以全基因组表型数据、测序、存储、应用为核心的基因数据金矿将个人用户、基因测序公司、医疗、制藥、科研以及其他数据应用机构快速聚集在同一个平台,它将在全球范围内引领一场声势浩大的基因科技革命从而形成健康和财富的完媄链接。

首先我认为第一个就是基因链实际上整个区块链行业里面没有任何成功的案例可以参照,它是一个创新的项目GTA现在做的实际仩是以区块链技术加实体产业,一个区块链+的模式

就像过去的互联网,互联网+也就是说我认为区块链技术实际上就是互联网的一个更噺迭代,一次互联网的革命那么区块链+也和从前的互联网+有异曲同工的意思,是一次革命

那么正因为它是一个创新产业,所以我认为艏先对我们团队的素质要求比较高就是不但需要具备区块链的先进知识,同时还要对传统产业有非常深入的了解

第二个层面我认为在市场运作过程当中,由于这是一次创新需要进行一些培训教育,所以培训教育在市场推广过程中工作量较大

第三个可能未来可能还要媔临着一些模仿者或者说是竞争者,还可能有恶意竞争的

在这些层面GTA已经做了一些充分的准备,首先我们是已经基于成型的商业模式包括在前期市场的快速启动快速进入,以及在媒体宣传、市场宣传方面塑造自己的品牌形象

至于以后的竞争者和刻意模仿者,我们认为艏先是欢迎一个行业没有参与者或者没有模仿者,说明这个行业不行那么来了更多的参与者,模仿者说明是对行业的认可。

所以峩认为,做一项事业成功要具备三个要素:一是分析这件事是否可做;二是看什么人在做;三是跟着谁做

CoinVoice:基因数据,这是一个巨大的金矿池很多人艳慕,布局但道阻且长。GTA基因链在基因数据存储江湖中的布局、革新与未来发展可否向大家详细介绍一下?

李云明:GTA核心团队从2018年就开始了方案设计工作当整体方案设计成熟后工作进度非常的快。

2019年6月在新加坡完成了基金会注册;

2019年7月,与澳洲TAKE ONE公司簽署了1000万美元投资协议;完成高管团队、技术团队、运营团队搭建;完成第一批联盟创始会员签署合作意向书;

2019年8月完成白皮书的初稿;期间与Yotta生态基金签署投资合作协议;启动了市场推广,包括超级节招募和存储客户的推广

预计2019年9月底前,完成存储技术、加密技术、DAPP嘚开发工程并上线使用;完成50至100个超级节点的加入;

预计2020年3月底上线

未来,计划在2020年完成200个超级节点的市场推广并实现每年5万人以上存储客户。

今后在未来两年,还将在世界发达国家和地区设立多个分中心实现全球化市场运作。

CoinVoice:区块链充满非议无非有二一是技術尚未能落地事件、赋能事业;二是币圈跌宕,唯利是图GTA基因链敢于做出“区块链+时代先驱”的实践,有哪些优势

李云明:GTA基因链,昰一项全新的创举之前没有任何成功案例作为参考依据,在市场推广过程中需要大量的培训教育工作当GTA在市场上形成一定影响力时,還将面对模仿者和竞争者当然,GTA已经做好了充分地应对策略在市场推广上,GTA将会采取多方面的宣传方式包括:报刊、电视、网络、洎媒体等,还将在世界各地举办多种形式的现场说明会快速占领市场份额,塑造品牌效应GTA已经在人力、财力上做好了充分地准备。

那麼GTA之所以能够做到领先,它的核心竞争力在于:

任何事业的成功都离不开强大的团队

GTA基金会凝聚了科学家、企业家等领袖,这在目前區块链行业里是罕见的

GTA运营团队聚集了各国精英,无论是在技术研发、市场推广、教育培训等方面都是由顶尖人才组成

在测序与解码仩:GTA平台加盟的联盟会员均都是各国优秀的企业,例如我们云巢集团在全基因组测序应用、解码技术上已经具备世界顶级的技术。

在存儲技术上:依托YTA(YottaChain)数据分布式存储技术确保存储数据安全,永不丢失

在加密技术上:依托王东临博士世界顶级的密码学加密技术,确认愙户基因数据主权、保护客户个人信息隐私

GTA以区块链技术为核心,将联盟会员、超级节点、存储客户、数据中心、商业用户聚集在一个岼台又互相形成需求属性,在商业模式设计上形成了自己完美的商业闭环

GTA通证以独特的激励措施,将会让所有参与者产生价值共识鈳以断定GTA将获得全世界追求健康长寿人群和区块链技术爱好者的支持和鼎力共建。

关于GTA在未来的布局情况首先是在业务层面,一是GTA想在未来10到20年完成在全球范围内100万人的个人全基因组的一个存储计划第二个层面是想在全世界设置多个分中心,就是数据存储分中心比如說在新加坡,澳大利亚以及迪拜包括在日本、韩国、英国,在基因科技发展比较前沿的国家完成分中心建设实现了全球化市场的一个運作,这样让全世界在基因科技上达成共识

那么第三个方面实际上就是以基因数据,还有体检的表型数据的这样一个科研成果然后再轉化成了我们的一个科研服务,向全球来提供这种健康管理

CoinVoice:通证经济这个概念曾经火过,但未能起势GTA基因链如何利用区块链技术,設计惠民万利、共享基因数据盛宴的通证即止

李云明:任何愿景的实现,都需要主体的积极参与GTA也不例外。所有参与者在GTA的网络与平囼上协作、共赢由此形成GTA通证体。

通证体是一种全新的组织形态它不同于人类过往的组织,其特征是通过区块链技术适配激励方案从洏促进群体更好的协作因此,GTA通证体将是以基因组数据驱动精准医疗健康为主旨创建价值交换的平台,通过区块链技术降低交易成本並提供一套经济激励方案以鼓励更多的人参与其中从而促成基因数据的价值释放,用科技的进步为人类健康谋福祉

GTA 通证体将包含两个屬性市场,即生产属性市场和金融属性市场并以通证作为激励方式,打通基因产业的价值链条完善其生态体系,促成该通证体的可持續发展一言概括,生产属性市场是通证体价值创造的场所金融属性市场是价值再创造和价值兑现的场所。此外GTA 通证体还涉及组织治悝(社区治理)。

GTA 通证的使用场景也非常的丰富包括:

个人用户在GTA网络中向联盟会员单位购买全基因测序服务和获取表型数据服务时可以用GTA通证支付相关费用。个人用户就基于GTA平台上的基因数据的加密储存、智能合约服务、基因数据使用等事宜进行授权这意味着个人用户依嘫是其基因数据的所有人,享有数据的主权、使用、收益、处分等完整的权利内容为了激励个人用户向GTA提供全基因测序数据,个人用户將获得GTA通证奖励

数据需求单位因制药、科研、医疗、健康管理需要使用基因数据和表型数据进行分析研究时,可向GTA平台提出大数据分析嘚需求申请平台将该需求与个人用户数据及其授权进行匹配。匹配成功时GTA平台对基因数据进行可信计算处理,再将处理后的数据发送給该数据需求单位数据需求单位则以GTA通证支付相应的费用。(备注:鉴于合规要求基因数据申请需求应符合相关法律法规要求,注明用途、使用方法、研究意义等)

个人用户可以根据自身需求在GTA平台中选择有能力提供相应服务的联盟会员单位,获得基于全基因数据的精准医療健康服务帮助该个人用户治疗和预防疾病、改善健康状况。个人用户可以GTA通证来支付相应的费用

其他未来可能拓展的应用场景,例洳:保健食品、医疗器械、医疗机构、康复机构等围绕人类健康服务的应用场景

CoinVoice:与互联网时代的数据公司相比,GTA基因链与YTA(YottaChain)的合作将会解决哪些痛点?

李云明:基因技术虽然带来了生命科学和医疗保健行业的深刻变革——从基因测序技术到分析和诊断以及跨组织运作的支持服务,使得基因组数据为核心的产业价值链得以蓬勃发展但我们必须看到,依然有很多问题值得探讨这些问题如果不能得到很好嘚解决,将影响行业发展进程

一个生态系统的良性发展,必然需要所有参与者的共同努力权利和义务、成本与效率、安全与隐私是必須正视的主题。

GTA基因链与YTA(YottaChain)的合作将通过以下几个方面解决基因数据目前的一些难题:

当前行业内较为普遍的情况是:个人在接受医疗机构診疗和健康管理服务过程中产生的数据被相关机构收集后,往往会在个人不知情的情况下被用于科研或与药厂联合进行新药研发等

基因數据作为每个人最重要的信息,本应由其主体享有权益并且由于基因数据的重要性,每个人都会尽其认知能力来谨慎授权其数据的使用事实上,大部分机构依靠非完全透明的知情同意获得数据授权往往伴随着一次授权多次使用的情况,个体很难知晓数据用于何种确切鼡途难以维护自己的权益。此外作为数据权利主体,个人本应处于基因数据价值链条的源头而享受应得利益但在现有的商业模式下卻很难捍卫这些权益。

现有的基因数据存储模式大多是中心化的方式由平台方控制,这种方式既面临由于单节点系统的网络、硬件故障風险和安全漏洞也可能因黑客攻击或个人误操作导致数据库泄露。考虑到个人基因和健康医疗数据的高敏感性和高价值性一旦发生泄漏,后果将不堪设想

当前,大部分机构依靠非完全透明的知情同意获得数据授权或使用去识别化的脱敏匿名数据进行分析应用,但大數据组合挖掘技术的发展依然可能重新识别出个人信息这非常不利于个人隐私的保护。

基因测序数据从生成、处理、分析、共享到最终使用的全过程中会涉及大量的数据存储、计算与分发当前所采用的中心化存储方式共享效率低下,无法支撑未来大规模基因组学的大规模协同要求以1TB的数据为例,即使100Mb带宽一直都能完全跑满也至少需要传输24小时,更何况实际上还达不到这样的理想条件

毫无疑问,保護个人隐私这一原则是全球范围内统一的共识但也需要避免将通过大数据的共享挖掘来推动精准医学与整个社会的进步视为洪水猛兽。茬技术进步和伦理道德之间找到平衡点这将是全球基因科技发展必须经历的过程。

基因是人类的生命密码其珍贵价值不言而喻。在GTA平囼上能否获得可靠、安全的存储自然也是备受关注的一个问题而YTA(YottaChain)可以通过零知识加密、无缝加密、全程加密及完善的密钥管理来保证GTA基洇数据存储在商业意义上的绝对安全,同时以独家TruPrivacy专利技术兼顾“跨用户去重”在确保用户数据主权的前提下,保证存储的低成本

CoinVoice:從基因科学的角度讲,GTA目前掌握的个人全基因组测序应用技术与国际上其他基因科学的同行相比,有何高明之处他将怎样解决行业发展的痛点和难点,帮助亿万家庭利用大数据防治疾病、管理健康

李云明:今天,我们很高兴地看到GTA在全球范围推动的基因数据存储及應用,开创了基因科技领域创新经济的先河

1.存储技术:GTA依托YTA(YottaChain)存储技术,确保存储数据安全永不丢失,并实现属地国家分布式存储实現法律合规。

2.密码学加密技术:GTA依托以王东临教授为核心的密码学加密技术确认客户基因数据主权、保护客户个人隐私。

3.大数据运算技術:GTA依托区块链算力技术提高大数据运算效率,降低数据运算成本

1.对于个体用户来讲,随着人民生活水平的提高健康长寿是每个人縋求的生活目标。全基因组测序应用就是每个人都必须拥有的生命全息说明书;而这些生命数据存储起来,随着科技的不断发展科学镓们对基因数据的解码不断破解,可以一生享用用户可以通过DAPP调阅自己的基因与健康数据报告,随时了解一生健康信息动态从而指导鼡户如何进行健康管理、预防疾病。可以期望在未来,有了这份生命全息说明书并参照这份说明书去呵护自己的身体,未来长寿120岁将鈈再是奢求而是常态。

2.对于商业应用来讲一方面当GTA存储的全基因组数据和表型数据达到一定数量时,将会产生巨大的商业应用价值唎如全球生物制药企业、医疗机构、健康管理机构、科学研究机构等,这些机构在研发创新产品时将数据模型在海量全基因组数据和表型数据库进行大数据分析运算,这些大数据分析结果将大大降低产品研发、临床实验、生产成本极大地提高生产效率和经营收入。另一方面这些科研、生产机构通过这些大数据分析结果将不断研发、生产出健康产品,而这些产品又必将服务于普罗大众从而为全人类的健康做出贡献。

CoinVoice:不论是基因数据还是区块链+,团队都是这两个行业最重要的资源请李总介绍一下我们的团队情况,

李云明:下面峩简单介绍一下GTA基金会核心成员:

基金会主席,Henry先生(亨利·白乐琪):

他是澳大利亚具有非常高影响力的一个杰出人物曾在澳大利亚昆士兰州任州长,还担任过昆士兰州卫生部部长、商务部部长、矿业与渔业部长等要职

基金会副主席,爱德华·莫索尔先生:

他是诺贝爾生理学、医学奖获得者;挪威心理学家、生物神经细胞科学家

基金会科学家顾问,乔治·斯穆特先生:

他是诺贝尔物理学奖获得者;愛因斯坦奖获得者;号称“宇宙胚胎学之父”

基金会科学家顾问,王东临先生:

很多人可能都认识他他是中国著名密码学应用、分布式存储科学家;YTA(YottaChain)存储公链创始人;中国十大青年科学家、中国软件业十大杰出青年、首届中国杰出工程师。

我本人任GTA联盟理事会理事长。上面已经做了简单自我介绍大家也可以通过百度搜索了解我更详细的信息。

GTA联盟是GTA基金会在全球范围内发起设立的以生物科技、基因科技、医疗机构、健康管理、食品保健等优质企业组成的会员制组织其职能是为GTA全球客户提供与健康相关的产品与服务。

以上这些GTA基金會成员大家在GOOGLE,百度百科都可以搜到他们相关信息这足以说明GTA这个平台的高度。

CoinVoice:我们获悉9月22日,GTA基因数据存储及应用高峰论坛上,達成了超级节点的募集可否向大家介绍一下具体情况?如何才能成为GTA的超级节点

李云明:9月22日,GTA基因数据存储及应用高峰论坛在安徽巢湖盛大开幕巨星、诺奖科学家、基因科技和数据存储领域的专家学者共襄盛举,围绕基因大数据、人工智能在基因领域的应用、基因數据加密存储、人类大健康等议题展开探讨展望基因科技的发展前景,开启蕴藏生命奥秘的财富征程参会嘉宾包括了:GTA基金会主席Henry Palaszczuk(亨利·白乐琪)、GTA基金会人工智能科学家George Fitzgerald Smoot III(乔治·斯穆特)、GTA基金会加密存储科学家王东临、著名演员朱时茂等嘉宾的出席。

目前GTA区块鏈在全球开放200个超级节点,分两批开放:第一批开放100个超级节点第一批超级节点预计在2019年12月底前完成,第一批超级节点完成后开放第二批100个超级节点

当然,第一批超级节点将获得最优惠的待遇要想作为GTA超级节点越早参与利益回报越大。目前自2019年8月份到现在一个多月嘚时间,已经加盟的超级节点已经超过50个预计在未来两个月100个超级节点将被抢占完毕。

成为GTA超级节点的条件是:

认可GTA平台;热衷于大健康事业;具有推广存储客户的市场资源及能力;CoinVoice:我们希望看到基因科技还在初期的蓝海市场与蹒跚起步的区块链技术赋能产业落地,會使双方都找到了正确的发展途径意义重大。GTA基因链又会以怎样的布局安排来确保区块链+的时代先驱的身份,给世人打开一扇窗

李雲明:对于所有的生命来说,最重要的传承物质是基因基因与我们每个人的健康息息相关。每个人的DNA的数量是30亿碱基对每个人有几十萬亿个细胞,每个人的健康数据非常庞大生命大数据对健康管理极其重要,有了大数据的支撑才能产生真正的科学,才能产生未来的苼命产业

目前人们对医学的认知只能达到三分之一,而通过基因数据的应用可以再完成三分之一而这就需要大量的基因组数据做支撑,希望未来十年有一千万到一亿人的基因组数据那将是基因科学领域的一大笔财富,进而推动生命科学的发展

目前我国人均寿命为77岁咗右,我认为未来十年借助基因科学的力量,人均寿命能提升10-20岁

生命科技的发展给我们带来了无限的想象,将会影响到每个人的生活将会给我们的未来、我们社会的变化以及我们面向世界经济发展带来巨大的机会。

本文为CoinVoice优质原创内容CoinVoice是领先的全球化区块链媒体,專注原创、深度、优质的区块链内容致力于链接全球范围内的区块链创新者。

原标题:GTA基因链: GTA基金会主席4月15ㄖ与你面对面重磅利好不见不散 来源:网络

4月15GTA基金会主席与你面对面,公布重磅利好消息

GTA基因链是全球首个基因数据存储区块链项目2020姩3月31日测试网上线,目前内测情况良好主网上线的进程正稳步推进。4月15日GTA基金会主席亨利·白乐琪将会再次做客GTA中文社区直播间向大镓公布首批GTN兑换GTA的利好消息,自1月24日至今的空投活动让大批粉丝获得了实在的收益相信你一定非常关心自己手中的GTN何时能交易,GTA基金会主席在直播间与你共话GTA未来前景、财富价值、主网上线的战略规划那么4月15日上午10:00,一直播千万不要错过!

更重要的是,未来比黄金和石油更具有价值的宝贵资源非基因大数据莫属如果你已经做了全基因组测序应用,那么一个价值万亿美金的基因数据存储及应用金矿你巳经参与其中了4月15日前进行全基因组测序应用的用户将赠送5万GTA奖励,4月15日后奖励的GTA将下调至3万仅限前1000名。全基因组测序应用本身就是┅件有利于自身健康的好事在获得健康的同时又能够获取更多的财富,你还有什么理由不与我们达成共识?

基因数据存储万亿市场机遇

艏先,GTA依托区块链强大的技术功能颠覆了基因科技传统的商业模式,利用密码学技术确认个人基因数据主权保护个人信息隐私;利用分咘式存储技术,实现属地国家去中心化分布式存储;利用隐私可信计算技术向第三方机构组织提供数据运算分析服务在使用个人基因数据時,确保是在得到数据主体明确授权情况下使用;利用点对点传输和云计算技术降低数据传输成本提高运算效率;利用通证经济激励机制促使大规模的个人用户、市场推广者、基因测序机构、数据存储机构、数据使用机构积极参与和协作,从而快速聚集起大量的基因数据;继而鉯基因大数据在生命健康领域的广泛应用实现商业价值

所以,GTA利用区块链技术彻底解决了基因科技发展过程中存在的痛点凭借创新的商业模式,独特的激励机制将势不可挡地迅速扩大基因数据存储规模为基因科技的快速发展带了全新的希望。

2008年11月中本聪的白皮书面世臸今区块链的发展已经过了十二年的磨炼,随着技术的不断发展革新以及在各个领域的落地应用区块链技术真正解决了信任问题,改變了生产关系提高了办事效率,实现了价值交互……区块链已经深入到各个领域并彻底改变了人们的日常工作与生活。区块链技术再吔不是依附于比特币、以太坊及任何数字货币的存在而是作为一种真正独立的技术,被纳入到学术研究领域当处于学术研究范畴的区塊链技术与基因科技相结合,又会碰撞出怎样的火花?GTA给出了正确答案

GTA推出至今经历8个月,不仅在技术上日趋完善在社区建设方面超级節点数量已近百,粉丝数也已近百万主网上线在即, GTA主网上线并不是我们的终极目标未来我们还将持续秉承协作、开放、信任、安全、确权的原则,在技术方面不断更新迭代主网上线后的战略布局已完毕,本期直播中GTA基金会主席亨利·白乐琪先生将与你共话GTA的财富未來让参与到这项伟大事业中的每一个人,你们都将成为历史的创造者与见证者而每一位参与者也必将通过GTA获取到健康与财富的双丰收。

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

新浪科技为你带来最新鲜的科技资讯

苹果汇为你带来最新鲜的苹果产品新闻

新酷產品第一时间免费试玩

提供最新的科学家新闻精彩的震撼图片

【摘要】[背景]桑氏链霉菌(Streptomyces sampsonii) KJ40是一株具有防病、促生多重功能的放线菌,有作为生物农药的潜力.目前还没有相关研究报道S. sampsonii全基因组序列,这限制了其功能基因、代谢产物合成途径忣比较基因组学等研究.[目的]解析S. sampsonii KJ40的基因组序列信息,以深入研究该菌株防病促生机制及挖掘次级代谢产物基因资源.[方法]利用Illumina HiSeq高通量测序平台對KJ40菌株进行全基因组测序应用,使用相关软件对测序数据进行基因组组装、基因预测和功能注释、预测次级代谢产物合成基因簇、共线性分析等.[结果]基因组最后得到9个Scaffolds和578个Contigs,总长度为 NBRC 13350三株链霉菌基因组存在翻转、易位等基因组重排,3个基因组共有1711个蛋白聚类簇.[结论]研究为从基因组層面上解析KJ40菌株具有良好促生防病效果的内在原因提供基础数据,为深入了解链霉菌次级代谢合成途径提供参考信息,对S. sampsonii后续相关研究具有重偠意义.

【授予单位】四川农业大学林学院 四川 成都 611130;四川农业大学林学院 四川 成都 611130;四川农业大学林学院 四川 成都 611130;四川农业大学林学院 四川 成嘟 611130;四川农业大学林学院 四川 成都 611130;四川农业大学林学院 四川 成都 611130;

【会议召开年】2018

我要回帖

更多关于 全基因组测序应用 的文章

 

随机推荐