提高质谱fdr是否能鉴定到更多蛋白质谱鉴定

本类论文推荐工具类服务
编辑部专用服务
作者专用服务
新版平台已经上线,充值操作将跳转,您的账户权限不会受到影响
交联蛋白质谱鉴定的算法研究及软件开发
蛋白质序列鉴定是人类了解蛋白质的第一步,随着基于串联质谱鉴定的蛋白质鉴定技术日趋成熟,高通量、大规模的蛋白质序列鉴定已不再是难题;蛋白质交联技术建立了从蛋白质序列到蛋白质结构和蛋白质间相互作用的一座桥梁,与质谱技术结合的蛋白质交联鉴定使得高通量、大规模的交联质谱鉴定成为可能。  
本文首先综述了交联蛋白的鉴定方法,在分析和总结目前已经存在的交联质谱鉴定算法的优点和劣势的基础上,提出了一套完备的交联质谱鉴定算法--pLink,它不仅能够鉴定纯化的蛋白样品,粗打分与细打分相结合的开放式搜索流程也使得高度复杂的样品的鉴定成为可能,同时它有效地利用了交联质谱特有的碎裂规律,并采用了一种简单可靠的假阳率估计与控制方法,使得大规模、高通量、可靠地鉴定交联质谱真正可行。  
另外,本文也研究了E-value计算中的背景分数点选择问题,提出了简单的理论候选肽生成方法,并用大量实验证明了该方法的稳定性和有效性,最终这个方法被应用于pLink的E-value计算算法中,并取得了较好的效果。  
通过在标准数据集上测试,pLink在小数据库上获得了99%的灵敏度,在大数据库上获得了95%的灵敏度,而且当FDR控制在5%时,获得了非常一致的正确率--95%,这证明了pLink的鉴定效果。同时,它被应用于UTP-B纯化蛋白样品、E-coli全交联样品、Worm全交联样品以及Fib-1免疫共沉淀样品的鉴定中,值得一提的是,它对于E-coli全交联样品的鉴定结果与国际上最好水平相比提高了1倍左右,而Worm全交联样品和Fib-1免疫共沉淀样品是交联质谱鉴定迄今为止所针对的最复杂的样品。  
交联质谱鉴定是普通蛋白质序列鉴定的非平凡延伸,是一个源于“一般”的“特殊”问题,对于该问题的研究首先基于对普通蛋白质搜索引擎的学习和继承,而后其研究成果也与普通蛋白质鉴定中的问题互相印证,并可以反馈到普通蛋白质鉴定问题中。
学科专业:
授予学位:
学位授予单位:
导师姓名:
学位年度:
本文读者也读过
相关检索词
万方数据知识服务平台--国家科技支撑计划资助项目(编号:2006BAH03B01)(C)北京万方数据股份有限公司
万方数据电子出版社上传用户:uypwaxcfjv文档下载 :『』&&『』『』学位专业:&关 键 词 :&&&&权力声明:若本站收录的文献无意侵犯了您的著作版权,请点击。摘要:(摘要内容经过系统自动伪原创处理以避免复制,下载原文正常,内容请直接查看目录。)质谱技巧的成长使高通量、疾速的卵白质组判定成为能够,鸟枪法卵白质组判定战略因其高通量、主动化等特色被普遍采取,其流程分为试验和盘算两部门,试验部门产出串连质谱数据,盘算部门普通经由过程搜刮卵白质数据库给出靠得住的肽段判定成果,并由此停止卵白质拆卸。但是盘算部门产出的数据质量成绩仍非常凸起。因为卵白质数据库的不完全和序列毛病、图谱噪声(电子和化学噪声)、和肽段判定算法瓶颈等身分,肽段判定成果中常常存在年夜量的假阳性判定,并进一步招致卵白质的假阳性判定。而且,在基于鸟枪法的翻译后润饰(PTM,Post一Translational Modification)判定成果中,除肽序列以外,润饰品种和润饰位点也经常被误判。另外,因为鸟枪法形成了肽段和卵白质的联系关系信息丧失,是以不管是肽序列照样PTM判定,都存在卵白质拆卸这一步调,但由此引入的卵白质假阳性判定也越发凸起。若何精确权衡肽序列、PTM和卵白质判定成果的可托度对盘算卵白质组学提出了挑衅。研讨者们已成长出年夜量的分离针对肽序列、润饰和卵白质判定的数据质量掌握办法,但现无方法的适用性和实际基本仍存鄙人述成绩(1)固然正库一钓饵库搜刮战略(target一decoy database search strategy)被普遍用于估量肽序列判定的毛病发明率(FDR,False Discovery Rate),但今朝仍存在多种FDR盘算办法,FDR估量的精确性须要比拟和评价;(2)绝对于较为成熟的肽序列质控办法,今朝尚缺少有用的、周全的可涵盖润饰序列、类型和位点的润饰质控办法;(3)现有卵白质质控办法少少存眷卵白质拆卸对卵白质假阳性判定的影响。为进一步进步卵白质组判定的靠得住性,基于对现有研讨的充足调研和数据剖析的现实需求,我们分离在肽序列判定、PTM判定和卵白质拆卸三个方面成长了响应的质控办法,并对办法的靠得住性停止了评价。个中重点存眷了PTM判定的质量掌握,并在润饰类型疾速发明方面停止了响应摸索。起首,我们开辟了肽段判定的质控对象PepDistiller,用于一种经常使用的数据库搜刮引擎MASCOT判定成果的质量掌握。经由过程引入肽段酶切端个数等特点、改良的FDR盘算办法和多线程技巧,使得PepDistiller具有以下优势(1)与已有的高敏锐度质控对象MASCOT Percolator比拟,雷同FDR阈值下PepDistiller可过滤出更多半酶切搜库的肽段判定成果,因此可进步半酶切搜库成果的质控敏锐度;(2)PepDistiller可供给更精确的FDR估量值,改良的FDR与真实的FDR更接近;(3)PepDistiller可加速年夜范围数据集的处置速度。PepDistiller对庞杂数据集的处置时光仅是MASCOT Percolator的20%~60%。该对象及解释文档下载地址为www。bprc。ac。cn/pepdistiller,可供研讨人员无偿使用。其次,为进步经常使用的非限制性PTM搜刮引擎InsPect判定成果的靠得住性,我们分离从润饰肽段、润饰类型和润饰位点三个条理权衡了润饰判定成果的精确性,以求能精确答复“在甚么序列的哪一个位点上产生了何种润饰”:(1)润饰肽段的质控方面,我们搜集了26个用于PTM质控的分类特点,经由过程持续前向特点选择,挑选出三个分类才能最强的且互相自力的特点,并经由过程Logistic回归将其整合到新的润饰肽打分pScore中。评价注解,pScore与传统办法的分类才能相当或略好,且下降了盘算庞杂度。(2)润饰类型质控方面,基于正库一钓饵库搜刮战略,应用高斯混杂模子及贝叶斯几率实际,我们盘算了母离子与肽序列的质量差△M为准确润饰类型的几率。应用测试数据集评价和文献的证据注解,在与文献报导符合的润饰类型中,约95%的润饰类型具有高的准确几率,显示了该办法的高敏锐度。(3)润饰位点的质控方面,我们将经常使用的磷酸化位点质控算法Ascore扩大运用就任意品种润饰的位点质控和校订上,弥补了已有非限制性润饰质控对象在这方面的空白。同时,我们存眷了应用图谱对(统一肽段的润饰态和未润饰态对应的一对图谱)的母离子质量差停止高品貌润饰类型挑选的办法,即“△M histogram”办法。“△M histogram”的道理是依附图谱对的母离子(或子离子)质量差寻觅高频涌现的△M,从而到达挑选高品貌润饰的目标,是以普通不须要停止数据库搜刮。但是已有的办法都采取穷举的方法,所得的“△M histogram”是基于随意率性图谱对证量差的相对值,使得正负质量差混在一路没法辨别。若润饰图谱可被预挑选,应用润饰谱与残剩谱之间图谱对的质量差,不只可辨别正负质量误差,且有益于挑选出准确的润饰类型。在此我们将“半小数规矩”运用于润饰谱的预挑选上,即以为未润饰肽半小数散布以外的图谱为潜伏润饰谱。联合“△M histogram”办法,应用高斯混杂模子和贝叶斯几率实际,我们可从初始△M聚集挑选出高频涌现的润饰类型。评价成果注解该战略不只发明了负的高频△M,且排名前五的正质量误差里,71%的△M与已有文献报导符合,显示了该办法优越的敏锐度。最初,我们开辟了基于繁复准绳(即用起码的卵白质笼罩一切高可托的肽段判定)的卵白质拆卸对象ProRazor,并对卵白质拆卸中发生的假阳性判定停止了剖析。应用试验数据和模仿数据的评价成果注解,同已报导的四种经常使用卵白质拆卸对象比拟,ProRazor最相符繁复准绳且在进步卵白质判定精确性方面具有最好表示。基于ProRazor的卵白质拆卸成果,以卵白质判定成果的FDR和假阴性率(FNR,False Negative Rate)为评价目标,我们证实(1)应用繁复准绳停止卵白质拆卸可进步卵白判定精确性;(2)年夜数据集的卵白质拆卸成果中FDR和FNR更高;(3)若不斟酌因为数据库容量增年夜而引入的新卵白对判定成果的影响,采取分歧冗余度的数据库的对判定成果的FDR和FNR影响不年夜;(4)多肽段过滤战略会增长卵白质判定成果的FDR和FNR,注解该战略的有用性表现在进步了肽段判定成果而非卵白质拆卸成果的精确性上。本研讨旨在为年夜范围卵白质组的表达谱、润饰谱研讨供给了高敏锐度、高精确性的数据质量掌握办法。所开辟的质控对象PepDistiller和ProRazor已在小鼠肝脏细胞器卵白质表达谱、小鼠肝脏可变剪接体判定、腾冲嗜热菌卵白质表达谱研讨等多个卵白质组数据剖析中获得运用。应用该系列对象,我们在国际生物份子资本试验室协会(ABRF,Association of Biomolecular Resource Facilities)组织的2010年磷酸肽尺度批评测中胜利判定到十六个存在位点isoform的尺度磷酸肽,序列和磷酸化点都全体准确,在介入评测的四十三个试验室中首屈一指。理论证实我们的办法卓有成效。Abstract:旧服务已下线,请迁移至 http://api.目录:摘要5-8Abstract8-9英文缩写词10-11前言11-21&&&&1 利用生物质谱进行蛋白质鉴定的基本原理11-12&&&&2 非限制性PTM 鉴定12-13&&&&3 肽序列鉴定、PTM 鉴定和蛋白质装配的质量控制13-15&&&&&&&&3.1 肽序列鉴定的质量控制13&&&&&&&&3.2 非限制性PTM 鉴定的质量控制13-14&&&&&&&&3.3 蛋白质装配的质量控制14-15&&&&4 主要研究工作及创新点15-16&&&&References16-21第一章 一种可提高鸟枪法蛋白质组学中肽段鉴定灵敏度和准确性的质控工具21-37&&&&1 概述21-22&&&&2 材料和方法22-25&&&&&&&&2.1 数据集22-23&&&&&&&&2.2 数据库构建23&&&&&&&&2.3 数据库搜索23&&&&&&&&2.4 质量控制方法23-25&&&&&&&&2.5 FDR 计算法25&&&&3 结果25-31&&&&&&&&3.1 PepDistiller 提高了半酶切搜库结果灵敏度25-27&&&&&&&&3.2 Refined FDR 可进一步提高肽段鉴定灵敏度27-28&&&&&&&&3.3 Refined FDR 比PIT-fixed FDR 估值更准确28-30&&&&&&&&3.4 PepDistiller 使用优点30-31&&&&4 讨论31-32&&&&References32-37第二章 非限制性翻译后修饰鉴定的“三维”质量控制37-55&&&&1 概述37-40&&&&&&&&1.1 PTM 鉴定难点37-38&&&&&&&&1.2 非限制PTM 鉴定质量控制38-39&&&&&&&&1.3 工作概述39-40&&&&2 材料和方法40-44&&&&&&&&2.1 数据集40-41&&&&&&&&2.2 修饰“三维”质控41-44&&&&&&&&&&&&2.2.1 修饰肽段质控41-42&&&&&&&&&&&&2.2.2 修饰类型质控42-44&&&&&&&&&&&&2.2.3 修饰位点质控44&&&&3 结果44-49&&&&&&&&3.1 InsPect 与PTMFinder 评估44-47&&&&&&&&3.2 “三维”质控评估47-49&&&&&&&&&&&&3.2.1 pScore 与ModelScore 比较47&&&&&&&&&&&&3.2.2△M正确鉴定概率评估47-49&&&&&&&&&&&&3.2.3 修饰位点质控评估49&&&&4 讨论49-50&&&&References50-55第三章 利用图谱对和半小数规则进行修饰类型筛选55-69&&&&1 概述55-58&&&&&&&&1.1 非限制PTM 鉴定算法55-57&&&&&&&&1.2 工作概述57-58&&&&2 材料和方法58-61&&&&&&&&2.1 数据集58&&&&&&&&2.2 修饰图谱预过滤58-59&&&&&&&&2.3 高丰度△M筛选59-61&&&&3 结果61-65&&&&&&&& 3.1利用半小数分布过滤修饰谱61-63&&&&&&&&3.2 高丰度修饰类型发现及验证63-65&&&&4 讨论65-66&&&&References66-69第四章 鸟枪法蛋白质组学中蛋白质装配方法及其影响因素评估69-85&&&&1 概述69-70&&&&2 数据集70-72&&&&&&&&2.1 实验数据集70-71&&&&&&&&2.2 模拟数据集71-72&&&&3 结果与讨论72-81&&&&&&&&3.1 ProRazor 算法72&&&&&&&&3.2 五种基于简约原则的蛋白质装配工具比较72-75&&&&&&&&&&&&3.2.1 简约分析72-74&&&&&&&&&&&&3.2.2 鉴定蛋白质准确性比较74-75&&&&&&&&3.3 三种不同装配蛋白质方法比较75&&&&&&&&3.4 简约法影响因素评估75-81&&&&&&&&&&&&3.4.1 数据集大小影响76-78&&&&&&&&&&&&3.4.2 数据库大小影响78-79&&&&&&&&&&&&3.4.3 其他影响因素79-81&&&&References81-85全文总结85-87附录87-107&&&&附录1:人晶状体蛋白质组常见修饰质量及位点列表89-95&&&&附录2:PepDistiller 主程序源码及使用说明95-101&&&&&&&&主程序源码95-98&&&&&&&&使用说明98-101&&&&附录3:ProRazor 程序源码101-107致谢107-108在读期间发表论文全文108-116个人简历116分享到:相关文献| 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
基于正反库特征信息匹配的蛋白质二级质谱 鉴定算法
下载积分:1500
内容提示:基于正反库特征信息匹配的蛋白质二级质谱 鉴定算法
文档格式:PDF|
浏览次数:37|
上传日期: 10:34:50|
文档星级:
全文阅读已结束,如果下载本文需要使用
 1500 积分
下载此文档
该用户还上传了这些文档
基于正反库特征信息匹配的蛋白质二级质谱 鉴定算法
关注微信公众号

我要回帖

更多关于 蛋白质谱鉴定 的文章

 

随机推荐