dia-PASEF:质谱和蛋白质组学共同进化的结果
2021年3月11日
作者:代表Bruker Daltonics的Gary Kruppa
质谱(MS)长期以来一直是蛋白质组学应用的首选技术,是蛋白质科学家、生物学家和临床研究人员的强大工具。betway88体育官网多年来,不断的发展提高了质谱仪器的能力,以发现以前未开发的蛋白质组部分,最终帮助发现新药,并推动个性化医疗方法的边界。尽管有了这些进展,蛋白质组的覆盖仍然具有挑战性。直接从组织或生物液中检测和定量蛋白质是困难的,因为预期的浓度范围很大,而且蛋白质表达取决于遗传和环境因素。此外,由于选择性剪接、点突变、翻译后修饰(PTMs)和内源性蛋白水解的共同作用,一个给定的蛋白质(基因表达产物)可以表达为许多不同的蛋白质形式,每一种都可能具有专用的生物活性。
鉴于这些挑战,基于质谱的蛋白质组学方法的一个创新领域是将准确、敏感、高通量的蛋白质鉴定和定量结合起来,使用自下而上的质谱和正交方法。离子迁移谱(IMS)是一种强大的分析技术,在过去的五十年中得到了广泛的应用,主要应用于化学物理和分析化学。直到最近,IMS耦合质谱(IMS-MS)才被探索用于多肽和蛋白质的分离、鉴定和定量。IMS是一种气相离子分离技术,利用电场影响下离子在气体中的迁移率差异,在蛋白质组学应用中具有显著的潜力,可以增加峰值容量、动态范围和改善信噪比(S/N)。
有几种类型的IMS扩展了MS单独的功能,例如捕获离子迁移率光谱(TIMS),它基于向器件出口增加的非均匀电场分离被困在流动气流中的离子。TIMS是相对较小的设备,可以很容易地集成到质谱仪中,而不会在离子传输方面有明显的损失,甚至灵敏度[1]也没有增加,从而增加了化合物表征的信心。
拓展蛋白质组学的可能性
与自上而下蛋白质组学相比,鸟枪(或“自下而上”)蛋白质组学分析由蛋白质混合物的蛋白质水解消化产生的肽。鸟枪蛋白质组学方法快速生成复杂混合物中许多蛋白质的图谱。蛋白质混合物首先被蛋白酶消化,得到的多肽在高效液相色谱(HPLC)中分离,然后通过串联MS/MS分析生成与多肽序列相关的片段信息(图1A)。将每个肽段的片段信息与蛋白质数据库进行比较,以搜索与片段相匹配的蛋白水解肽,从而确定它们通过蛋白水解释放出来的蛋白质。尽管近年来蛋白质组学技术的进步使基于ms的蛋白质组学成为核心研究工具,但全面的蛋白质组学覆盖仍然难以实现,这主要是由于生物样本及其PTMs阵列的高度复杂性和动态范围。在一个特定的条件下,每个生物样品中通常存在超过10,000个蛋白质,消化后,分析物的复杂性至少增加了两个数量级,因为每个蛋白质产生数十到数百个多肽[2]。
在过去的十年中,基于ms的蛋白质组学的发展努力增加了蛋白质组覆盖的深度和广度,提高了数据质量和识别置信度,并增加了实现种群规模蛋白质组测量所需的样本吞吐量。尽管各种创新使这一目标更加接近,但通量和检测敏感性仍然限制了大样本队列研究。因此,最近的MS技术发展集中在提高碎片速度的同时不失灵敏度。
通过在四极飞行时间(Q-TOF)质谱仪的前端集成一个TIMS设备,离子可以在释放用于MS分析之前积累特定的时间(图1B和1C)。此外,通过迁移率分离离子的能力提高了灵敏度,并提供了额外的选择性,因为离子是通过第四个参数-它们的碰撞截面(CCS)分离的。具有小CCS的紧密离子比具有大CCS的扩展离子漂移得更快,有效地允许离子根据形状[3]、保留时间、质量电荷比(m/z)和强度分离。
TIMS还实现了并行积累-串行片段(PASEF)方法,增加了额外的分离维度,优越的速度,并提高了对蛋白质组学工作流程的敏感性。PASEF采集方法——基于四极子的位置来选择肽的m/z,并与迁移率洗脱曲线同步移动——利用捕获离子迁移率来实现测序速度的10倍提高。这种测序速度的提高对于深入研究复杂的蛋白质组,在短时间内获得定量数据至关重要。TIMS和PASEF的组合功能允许从复杂混合物中提取的小样本量中获得更大的蛋白质组或亚蛋白质组覆盖。
图1。dia-PASEF工作流程概述(A)从色谱柱洗脱的肽被电离,并通过玻璃毛细管进入质谱仪。(B)在双TIMS分析仪中,第一个TIMS部分捕获和存储离子包,第二个部分通过离子迁移率来解析它们。(C)离子迁移率分离的离子随着电场强度的减小依次从第二TIMS分析仪释放。(D), (E)对于DIA - pasef, DIA隔离窗口耦合到对应离子的精确离子迁移率洗脱。在单个TIMS分离中设置多个前导窗口。图从[6]复制。
使用dia-PASEF提高吞吐量
CCS作为分离的第四个维度,无论采掘策略如何,都显著提高了选择性。数据独立采集(DIA)工作流程近年来越来越受欢迎,因为它们克服了典型数据依赖采集(DDA)方法中遇到的随机选择肽前体的问题,从而在大样本队列中保证可重复和准确的蛋白质鉴定和定量。DIA为每个样品中的特定分析物提供定量答案,而DDA工作流程则需要选择单个前体。由于样品之间的差异,在每次DDA运行中可能不会选择相同的前体,这意味着在一次运行中并非所有识别的肽都与其他运行具有可比性。这就是所谓的“数据完整性问题”,DIA方法就是为了解决这个问题而开发的。
在DIA方法中,给定m/z窗口内的所有离子在每次运行中都是碎片化的,原则上可以在每次运行中进行完全识别和比较。PASEF原理现在已经与DIA结合在一种新的获取方法中,称为DIA -PASEF,它为DIA设定了新的选择性和敏感性标准,并通过可重复量化[7]实现了前所未有的肽识别率。使用PASEF的DIA方法利用了离子迁移率和m/z之间的相关性,并在TIMS扫描开始时使用从高m/z开始的窗口作为较大的物种洗脱,向下移动到较低的m/z窗口(图1D和1E)。DIA - pasef窗口方案的离子利用效率至少比DIA与其他采集方法高4倍,并且根据样品和窗口方案,可实现高达100%的效率和无与伦比的灵敏度。
先前的实验表明,从人类细胞裂解物[4]中鉴定出7000多个蛋白质,并且从三个蛋白质组[5]的复杂混合物中鉴定出8000多个蛋白质,这是可重复和准确的定量。为了进一步研究将dia-PASEF应用于不同复杂性的不同蛋白质组学样本的益处,使用不同的梯度长度(30、60和90分钟梯度)将该方法应用于人类癌细胞系(HeLa)和酵母消化的分析。通过将DIA隔离窗口与相应离子的精确离子迁移性洗脱耦合,加窗DIA与PASEF原理的组合允许在前驱体离子的单个100 ms离子迁移性分离中复用DIA窗口。
采用dia-PASEF方法,每100 ms dia-PASEF扫描2个窗口。其中16次扫描(产生32个窗口)覆盖了m/z离子迁移窗格中的对角线扫描线,以确保具有狭窄的25 m/z隔离窗口的双电荷和三电荷离子的覆盖(图2)。每个dia-PASEF循环都从一次MS1调查扫描开始。该设置的结果是总周期时间为1.7 s (1x 100 ms MS1调查扫描,16x 100 ms dia-PASEF扫描),这使得在色谱峰上获得足够的数据点,同时保持特异性和灵敏度的最佳组合。
图2。dia-PASEF的方法方案。应用的方法包括在每个100毫秒的dia-PASEF扫描中有两个窗口。这些扫描中的16个覆盖对角线,用于在m/z离子迁移平面中具有狭窄的25 m/z前体窗口的双重和三重电荷肽。
四维(4D)数据是使用Spectronaut (Biognosys AG,瑞士)的开发版本进行处理的。Spectronaut工作流程使用集成的Pulsar数据库搜索引擎直接从分馏的DDA PASEF运行生成光谱库,用于有针对性的数据提取。从高ph分馏样品中创建了项目特定的库。该文库包括HeLa样品的220,628个独特的靶标肽序列和11,578个靶标蛋白组,酵母样品的80,874个独特靶标肽和5127个靶标蛋白组。这些库在Spectronaut中用于目标数据提取,包括全自动运行校准(保留时间、质量和迁移率)、自动干扰校正、目标分析和自动质量控制。
图3显示了90分钟、60分钟和30分钟梯度下的肽序列和蛋白质组鉴定的数量,这突出了dia-PASEF在更深层次的蛋白质组覆盖和精确定量方面的优势,即使是在30分钟的较短梯度下。总的来说,在不进行分馏的90分钟梯度单次运行中,综合文库中所有蛋白质组的HeLa(图3A)和酵母(图3B)的覆盖率分别达到了66%和86%。使用30分钟的梯度,对HeLa(图4A)和酵母(图4B)的覆盖率分别为55%和79%。
本研究的结果表明,复杂HeLa消化物的识别率可以重复实现,在90分钟梯度时间内识别出7600个蛋白质组,在30分钟梯度时间内识别出近6400个蛋白质组。这些识别率,结合dia-PASEF提供的稳健和可重复的定量,使蛋白质组学领域更接近于以合理的吞吐量实现蛋白质组的良好覆盖。
监测疾病的驱动因素
将蛋白质组学引入临床领域的一个关键挑战是对高通量鸟枪蛋白质组学工作流程产生的数据进行分析和解释。初级数据分析(蛋白质鉴定和定量)可以用强大的计算技术解决,但自动解释蛋白质组学数据以确定“疾病与健康”是具有挑战性的。这样的能力需要先进的人工智能(AI)和深度学习算法,这是目前研究工作的重点,以实现真正的诊断蛋白质组学。
例如,多伦多大学Röst实验室的研究人员正在使用dia-PASEF来监测一个人一生中的人类蛋白质组,并研究如何使用机器学习来分析数据。
通过以这种方式分析大型患者队列,可以监测与健康状态的偏差,并可以量化与该偏差相关的分析。这种方法旨在提高对生物系统如何工作的理解,它们如何对这些偏差做出反应,以及信号是如何处理的。通过将这一过程应用于个体患者和患者队列,可以在很长一段时间内追踪单个患者的分子特征。这可以用来了解他们的分子轮廓如何随着时间的推移而变化,以应对环境和生活方式的变化,最终能够观察从健康轮廓到疾病轮廓的过渡,并在疾病的早期阶段做出诊断。
纵向研究患者群体对于长期比较个体的分子特征,而不是人群平均水平,以实现精准医疗方法的进展非常重要。机器学习最近被引入到蛋白质组学和代谢组学研究中,以减轻DIA所涉及的更耗时的步骤,例如谱库的生成。
Röst实验室的早期实验表明,预测这些光谱库是有可能的,这将使研究小组更有效、更直接地挖掘DIA数据,而不依赖于先前的实验证据和通常使用DDA完成的测量。
继续4D蛋白质组学革命
由于传统的DDA方法面临“缺失值问题”,蛋白质组学研究人员已经转向DIA作为一种替代方法,通过消除个体肽离子的选择进行鉴定,在大样本队列中保证可重复和准确的蛋白质定量。将此与PASEF固有的效率相结合,创建新的采集模式dia-PASEF,将从最小样本量中识别数千种蛋白质的概念变为现实。知道观察到的差异是由于生物变异,而不是在一个样本中分析的肽与另一个样本之间的差异,将使临床研究人员能够准确地监测疾病的进展。最近,深度学习在蛋白质组学中的应用使研究人员能够更有效地挖掘dia-PASEF数据,充分利用该方法提高的吞吐量、有效的离子利用、快速的肽识别和量化以及无与伦比的灵敏度。这些先进技术将继续推进基于ms的蛋白质组学的发展。
有关dia-PASEF的更多信息,请访问:
https://www.bruker.com/products/mass-spectrometry-and-separations/lc-ms/o-tof/timstof-pro.html。
参考文献
1.Wormwood KL, Deng L, Hamid AM, DeBord D和Maxon L(2019)离子迁移在药物和临床分析中的潜力。见:Woods A., Darie C.(编)质谱在生物医学研究中的进展。实验医学与生物学进展,第1140卷。施普林格,可汗。
2.Beck S(2016)用于鸟枪蛋白质组学的新型四极杆飞行时间质谱,博士论文,路德维希-马克西米利安-慕尼黑大学化学与药学学院。
3.Angel TE, Aryal UK, Hengel SM, Baker ES, Kelly RT, Robinson EW和Smith RD(2012)基于质谱的蛋白质组学:现有能力和未来方向。化学通报,41(10):3912-3928。
4.Kaspar-Schoenefeld S, Meier F, Brunner AD, Frank M, Ha A, Lubeck M, Raether O, Collins B, Aebersold R, Rost H和Mann M,“并行积累-串行碎片结合数据独立采集(diaPASEF)。”AppNote LC-MS 157, https://www.bruker.com/fileadmin/user_upload/8-PDF-Docs/Separations_MassSpectrometry/Literature/ApplicationNotes/1869385_LCMS-157_diaPASEF_ebook.pdf
5.kaspara - schoenefeld S, Marx K, Gandhi T, Reiter L, Meier F, Brunner AD, Frank M, Ha A, Lubeck M, Raether O, Distler U, Tenzer S, Aebersold R, Collins B, Rost H和Mann M.“diaPASEF:高度复杂蛋白质组的无标签量化。”AppNote LC-MS 160, https://www.bruker.com/fileadmin/user_upload/8-PDF-Docs/Separations_MassSpectrometry/Literature/ApplicationNotes/1871458_LCMS-160_diaPASEF_label-free_quantification_09_2019_ebook.pdf
6.Meier F, Brunner AD, Koch S, Koch H, Lubeck M, Krause M, Goedecke N, Decker J, Kosinski T, Park MA, Bache N, Hoerning O, Cox J, Räther O和Mann M.基于新型捕获离子迁移质谱的在线并行积累-串行碎片化(PASEF)。Mol细胞蛋白质组学,2018;mcp.TIR118.000900。©美国生物化学和分子生物学学会。
7.Meier F, Brunner AD, Frank M, Ha A, Bludau I, Voytik E, kaspa - schoenefeld S, Lubeck M, Raether O, Bache N, Aebersold R, Collins BC, Röst HL, Mann M. diaPASEF:并行累积-串行碎片化结合数据独立采集。nat方法。2020年12月;17(12):1229-1236。doi: 10.1038 / s41592 - 020 - 00998 - 0。



