什么是蛋白质设计
编辑蛋白质设计是新蛋白质分子的合理设计,旨在设计新的活性,行为或目的,并增进对蛋白质功能的基本了解。可以从头开始设计蛋白质(从头设计),也可以通过对已知蛋白质结构及其序列进行计算得出的变体进行设计(称为蛋白质重新设计)。合理的蛋白质设计方法可以预测蛋白质序列,并将其折叠成特定的结构。然后可以通过诸如肽合成,定点诱变或人工基因合成等方法对这些预测序列进行实验验证。
合理的蛋白质设计可以追溯到1970年代中期。然而,最近,有许多成功的合理设计水溶性乃至跨膜肽和蛋白质的例子,部分原因是由于人们对有助于蛋白质结构稳定性的不同因素有了更好的了解,并开发了更好的计算方法。
(adsbygoogle = window.adsbygoogle || []).push({});
概述和历史记录
编辑在合理的蛋白质设计的目标是预测氨基酸 序列,将折叠到一个特定的蛋白质结构。尽管可能的蛋白质序列数量众多,并随蛋白质链的大小呈指数增长,但其中只有一个子集可以可靠且快速地折叠为一种天然状态。蛋白质设计涉及鉴定该子集中的新序列。蛋白质的天然状态是链的构象自由能最小值。因此,蛋白质设计就是寻找具有所选结构作为自由能最小值的序列。从某种意义上讲,它与蛋白质结构预测相反。在设计上,三级结构被指定,并确定要折叠的序列。因此,它也被称为反向折叠。因此,蛋白质设计是一个优化问题:使用一些评分标准,选择可以折叠成所需结构的优化序列。
在1970年代和1980年代合理设计了xxx个蛋白质时,这些蛋白质的序列是根据对其他已知蛋白质、序列组成、氨基酸电荷和所需结构的几何形状的分析手动进行优化的。首先设计的蛋白质归功于Bernd Gutte,他设计了已知催化剂的简化版,牛核糖核酸酶以及由β-折叠和α-螺旋(包括DDT的结合剂)组成的三级结构。Urry及其同事后来根据序列组成规则设计了类似弹性蛋白的纤维肽。理查森及其同事设计了79个残基的蛋白质,与已知蛋白质没有序列同源性。在1990年代,功能强大的计算机,氨基酸构象库以及主要为分子动力学模拟开发的力场的出现促成了基于结构的计算蛋白质设计工具的开发。随着这些计算工具的发展,在过去的30年中,蛋白质设计取得了巨大的成功。Stephen Mayo和他的同事在1997年成功完成了从头开始完全成功设计的xxx个蛋白质,随后不久,Peter S. Kim和他的同事在1999年设计了不自然的右旋卷曲螺旋的二聚体,三聚体和四聚体。在2003年,大卫·贝克(David Baker)的实验室将全蛋白质设计成自然界中从未见过的折叠。之后,在2008年,贝克(Baker)小组通过计算设计了用于两种不同反应的酶。在2010年,使用计算机设计的蛋白质探针从患者血清中分离出了一种xxx大的广泛中和抗体。[8]由于这些成就和其他成功,蛋白质设计已成为可用于蛋白质工程的最重要工具之一。人们非常希望新的蛋白质的设计,无论大小,都可以用于生物医学和生物工程。
蛋白质结构和功能的基础模型
编辑蛋白质设计程序使用在体内环境中驱动蛋白质的分子力的计算机模型。为了使问题易于解决,蛋白质设计模型简化了这些作用力。尽管蛋白质设计程序相差很大,但它们必须解决四个主要的建模问题:设计的目标结构是什么,目标结构允许什么样的灵活性,搜索中包括哪些序列,以及将使用哪个力场来分数序列和结构。
目标结构
蛋白质功能在很大程度上取决于蛋白质结构,合理的蛋白质设计使用这种关系通过设计具有目标结构或折叠结构的蛋白质来设计功能。因此,根据定义,在合理的蛋白质设计中,必须预先知道靶标结构或结构的整体。这与其他形式的蛋白质工程(例如定向进化)形成鲜明对比,在定向进化中,可以使用多种方法来查找实现特定功能的蛋白质;在蛋白质结构预测中,已知序列但结构未知。
通常,靶标结构基于另一种蛋白质的已知结构。但是,自然界中看不见的新颖褶皱变得越来越有可能。彼得·S·金(Peter S.Kim)和他的同事设计了自然界中从未见过的非自然卷曲螺旋的三聚体和四聚体。在大卫·贝克(David Baker)实验室开发的蛋白质Top7,是使用蛋白质设计算法完全设计的,具有完全新颖的折叠效果。最近,贝克和同事们开发了一系列原理来设计基于蛋白质折叠漏斗的理想球状蛋白质结构在二级结构预测和三级结构之间架起桥梁。这些基于蛋白质结构预测和蛋白质设计的原理被用于设计五种不同的新型蛋白质拓扑。
序列空间
在合理的蛋白质设计中,可以从已知蛋白质的序列和结构重新设计蛋白质,或者在从头蛋白质设计中完全从头开始重新设计蛋白质。在蛋白质重新设计中,序列中的大多数残基都保留为野生型氨基酸,同时允许少数突变。在从头设计中,整个序列是在没有先验序列的基础上重新设计的。
既从头设计和重新设计的蛋白质能建立此规则序列空间:特定的氨基被允许在每个可变位置残基的酸。例如,基于进化数据和电荷平衡,限制了选择RSC3探针的 HIV-中和抗体的表面成分。蛋白质设计的许多最早尝试都很大程度上基于序列空间的经验规则。此外,纤维蛋白的设计通常在序列空间上遵循严格的规则。例如,基于胶原蛋白设计的蛋白质通常由Gly-Pro-X重复序列组成。计算技术的出现允许设计蛋白质而无需人工干预序列选择。
结构灵活性
在蛋白质设计中,蛋白质的靶结构是已知的。但是,合理的蛋白质设计方法必须在目标结构上建立一定的灵活性模型,以增加可以针对该结构设计的序列数量,并xxx程度地减少序列折叠为不同结构的机会。例如,在蛋白质的紧密堆积核心中的一个小氨基酸(例如丙氨酸)的蛋白质重新设计中,如果周围的侧链折叠,则通过合理的设计方法可以预测出很少的突变体可以折叠成目标结构不允许重新包装。
因此,任何设计过程的基本参数是侧链和主链所允许的灵活性。在最简单的模型中,蛋白质主链保持刚性,同时允许某些蛋白质侧链改变构象。但是,侧链的键长,键角和χ二面角可具有许多自由度。为了简化此空间,蛋白质设计方法使用的旋转异构体库假定键长和键角为理想值,同时将χ二面角限制为一些经常观察到的低能构象,称为旋转异构体。
旋转异构体文库基于对许多蛋白质结构的分析来描述旋转异构体。独立于主干的rotamer库描述了所有rotamer。相反,依赖于骨干的旋转异构体文库将旋转异构体描述为取决于它们在侧链周围的蛋白质骨架排列方式出现的可能性。rotamer库描述的rotamer通常是空间区域。大多数蛋白质设计程序都使用一种构象(例如,空间中旋转异构体二面体的模态值)或旋转异构体描述的区域中的多个点。在OSPREY蛋白质设计方案,相比之下,模型整个连续区域。
尽管合理的蛋白质设计必须保留蛋白质的一般骨架折叠,但允许某些骨架柔性可以显着增加折叠至结构的序列数,同时保持蛋白质的一般折叠。骨架灵活性在蛋白质重新设计中尤其重要,因为序列突变通常会导致骨架结构发生微小变化。此外,骨架灵活性对于蛋白质设计的更高级应用(例如结合预测和酶设计)可能至关重要。蛋白质设计骨架柔性的一些模型包括小而连续的整体骨架运动,目标折叠周围离散的骨架样品,反冲运动和蛋白质环柔性。
能量功能
合理的蛋白质设计技术必须能够将在目标折叠下稳定的序列与倾向于其他低能竞争态的序列区分开。因此,蛋白质设计需要精确的能量功能,该功能可以根据序列与目标结构的折叠程度对序列进行排序和评分。但是,同时,这些能量函数必须考虑蛋白质设计背后的计算挑战。成功设计中xxx挑战性的要求之一是能量函数,该函数对于计算计算而言既准确又简单。
最精确的能量函数是基于量子力学模拟的能量函数。然而,这样的模拟太慢并且对于蛋白质设计通常是不切实际的。取而代之的是,许多蛋白质设计算法使用的是基于分子力学模拟程序的基于物理学的能量函数,基于知识的能量函数或两者的混合。趋势是使用更多基于物理学的势能函数。
基于物理的能量函数(例如AMBER和CHARMM)通常来自量子力学模拟,以及来自热力学,晶体学和光谱学的实验数据。这些能量函数通常会简化物理能量函数并使它们成对分解,这意味着可以通过在每个原子对之间添加成对能量来计算蛋白质构象的总能量,这使它们对于优化算法具有吸引力。基于物理的能量函数通常对原子之间的吸引排斥Lennard-Jones项和非键合原子之间的成对静电库仑项进行建模。
与基于物理的电势相反,统计电势的优点是计算速度快,隐含地考虑复杂的影响并且对蛋白质结构的微小变化不太敏感。这些能量函数基于结构数据库中出现频率得出的能量值。
然而,蛋白质设计有时会受到分子力学力场的限制。分子力学力场是分子动力学模拟中最常用的一种,它针对单个序列的模拟进行了优化,但是蛋白质设计通过许多序列的许多构象进行搜索。因此,必须为蛋白质设计量身定制分子力学力场。在实践中,蛋白质设计能量函数通常同时包含统计术语和基于物理的术语。例如,Rosetta能量函数(最常用的能量函数之一)结合了源自CHARMM能量函数的基于物理学的能量项以及统计能量项,例如旋转子概率和基于知识的静电。通常,能源功能在实验室之间是高度定制的。
有效的设计能量功能面临的挑战
水构成蛋白质周围的大部分分子,是蛋白质结构的主要驱动力。因此,对水和蛋白质之间的相互作用进行建模对于蛋白质设计至关重要。在任何给定时间与蛋白质相互作用的水分子数量巨大,并且每个分子都有大量的自由度和相互作用伙伴。相反,蛋白质设计程序将大多数此类水分子建模为一个连续体,同时对疏水作用和溶剂化极化进行建模。
个别的水分子有时在蛋白质的核心以及蛋白质-蛋白质或蛋白质-配体相互作用中起着至关重要的结构作用。未能对此类水进行建模可能导致对蛋白质-蛋白质界面的最佳序列的错误预测。作为替代方案,可以将水分子添加到旋转异构体中。
作为优化问题
编辑蛋白质设计的目的是找到可以折叠成目标结构的蛋白质序列。因此,蛋白质设计算法必须针对目标折叠搜索每个序列的所有构象,并根据蛋白质设计能量函数确定的每个序列的最低能量构象对序列进行排序。因此,蛋白质设计算法的典型输入是目标折叠,序列空间,结构柔韧性和能量函数,而输出是一个或多个被预测稳定折叠至目标结构的序列。
设计的蛋白质的应用和实例
编辑酶设计
新酶的设计是蛋白质设计在生物工程和生物医学领域的巨大应用。通常,设计蛋白质结构可能与设计酶不同,因为酶的设计必须考虑催化机制中涉及的许多状态。然而,蛋白质设计是从头进行酶设计的先决条件,因为至少催化剂的设计需要支架,在支架中可以插入催化机理。
在21世纪的前十年,从头酶设计和重新设计取得了巨大进展。在三项主要研究中,David Baker和他的同事从头设计了用于逆醛醇反应,消除Kemp反应和用于Diels-Alder反应的酶。此外,斯蒂芬·梅奥(Stephen Mayo)和他的同事开发了一种迭代方法,以设计最有效的已知酶来消除Kemp。此外,在实验室布鲁斯唐纳德中,使用计算的蛋白设计来切换之一的特异性蛋白结构域的从其天然底物苯丙氨酸到其他非同源底物(包括带电荷的氨基酸)产生Gramicidin S的非核糖体肽合成酶;重新设计的酶具有接近野生型的活性。
亲和性设计
蛋白质间的相互作用涉及大多数生物过程。许多最难治疗的疾病,例如阿尔茨海默氏病,多种形式的癌症(例如TP53)和人类免疫缺陷病毒(HIV)感染都涉及蛋白质之间的相互作用。因此,为了治疗这种疾病,期望设计结合相互作用的伴侣之一并因此破坏引起疾病的相互作用的蛋白质或蛋白质样治疗剂。这需要设计蛋白质治疗剂以使其对伴侣具有亲和力。
可以使用蛋白质设计算法设计蛋白质之间的相互作用,因为决定蛋白质稳定性的原理也决定了蛋白质之间的结合。但是,蛋白质间相互作用设计提出了蛋白质设计中通常不存在的挑战。最重要的挑战之一是,通常来说,蛋白质之间的界面比蛋白质核心更具极性,并且结合涉及去溶剂化和氢键形成之间的权衡。为了克服这一挑战,布鲁斯·提多尔(Bruce Tidor)和他的同事们开发了一种通过专注于静电作用来提高抗体亲和力的方法。他们发现,对于研究中设计的抗体,降低界面残基的去溶剂化成本可提高结合对的亲和力。
专为设计
蛋白质与蛋白质相互作用的设计必须具有高度特异性,因为蛋白质可以与大量蛋白质相互作用。成功的设计需要选择性的粘合剂。因此,蛋白质设计算法必须能够区分靶标结合(或阳性设计)和脱靶结合(或阴性设计)。特异性设计最突出的例子之一是Amy Keating和同事针对20个bZIP家族中的19个设计了特定的bZIP结合肽。这些肽中有8种对它们的预期伴侣比竞争性肽具有特异性。此外,安德森(Anderson)及其同事还使用正面和负面的设计来预测药物靶标的活性位点的突变,从而赋予对新药的抗性。阳性设计用于维持野生型活性,而阴性设计用于破坏药物的结合。Costas Maranas和他的同事最近的计算重新设计也能够通过实验将念珠菌木糖还原酶的辅因子特异性从NADPH转换为NADH。
蛋白质换肤
蛋白质表面修复包括设计蛋白质表面,同时保留完整的蛋白质整体折叠,核心和边界区域。蛋白质表面重整对于改变蛋白质与其他蛋白质的结合特别有用。蛋白质表面修饰的最重要应用之一是在NIH疫苗研究中心设计RSC3探针以选择广泛中和的HIV抗体。首先,选择gp120 HIV包膜蛋白与先前发现的b12抗体之间的结合界面之外的残基进行设计。然后,基于进化信息,溶解性,与野生型的相似性和其他考虑因素选择间隔的序列。然后使用RosettaDesign软件在所选序列空间中找到最佳序列。
球状蛋白的设计
球状蛋白质是包含疏水核心和亲水表面的蛋白质。球状蛋白通常具有稳定的结构,这与纤维蛋白不同,后者具有多种构象。球蛋白的三维结构通常比纤维蛋白和膜蛋白更容易通过X射线晶体学和核磁共振确定,这使得球蛋白比其他类型的蛋白更具吸引力。最成功的蛋白质设计涉及球状蛋白质。无论RSD-1 ,和页首7.是从头球蛋白的设计。贝克小组于2012年设计,合成并验证了另外五种蛋白质结构。这些新蛋白质不具有生物功能,但结构旨在充当构建基块,可以扩展以包含功能性活性位点。通过使用新的启发式方法,在分析指定二级结构的序列各部分之间的连接环的基础上,通过计算发现了结构。
膜蛋白的设计
已经成功设计了几种跨膜蛋白,以及许多其他与膜相关的肽和蛋白。最近,Costas Maranas和他的同事开发了一种自动化工具,用于将E.coli的F型外膜孔蛋白(OmpF)的孔径重新设计为任何所需的亚纳米尺寸,然后将其组装在膜中以完成精确的埃尺度分离。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/109177/