GTP基因组标签计划

首页 > 新闻中心

新闻动态

技术分享:从头设计双组分的准对称蛋白笼



尽管对称性在自然界中普遍存在,但它并非总能完美对称,如富勒烯、准晶和网格蛋白笼。20世纪60年代,Caspar和Klug发现,病毒通过亚基之间的微小偏差来放松二十面体的对称性,从而产生结构更大的衣壳[1]。这种几何结构的可塑性具有进化优势,使得病毒能够扩展其衣壳结构以容纳更大的基因组载荷,而无需显著增加基因编码量。蛋白质从头设计已能产生明确的自组装二十面体结构,在疫苗、递送载体及其他应用方面显示出巨大潜力[2, 3]。然而,目前所实现的结构大多局限于具有离散拷贝数量的规则点群对称性,而伪对称结构也需要使用多个化学不同但结构相似的蛋白质链来占据独特的位置,无法实现“单一序列编码多种构象”的灵活性[4]。通过计算机设计来重现可基因编码的准对称结构,即单一序列编码多种局部构象,在纳米材料工程领域仍是一项重大挑战。这要求单一序列能够呈现出多种构象,并且在组装过程中必须采用正确的构象,以避免大规模聚集。因此,亟需开发一种以可编程方式打破完美对称性的策略,为准对称结构开辟广阔的设计空间,从而在细胞器及亚细胞尺度上实现现有方法无法企及的结构与材料特性。

2026年5月,Nature期刊在线报道了一项研究,2024年诺贝尔化学奖David Baker团队通过从头设计的方式首次实现了可编程双组分的准对称蛋白纳米笼。通过设计可互补结合的三聚体和二聚体蛋白组件,使其自组装成正曲率的六边形晶格,再引入曲率诱导的五边形缺陷,形成封闭的类球状蛋白笼组装体。通过设计不同局部曲率的二聚体,能够编程调控蛋白笼的尺寸,使其直径范围从40到超过200纳米不等,分子量则从2 MDa增至超过50 MDa,可与天然病毒衣壳相媲美。通过对这些大尺寸蛋白笼进行功能化改造,使其装载货物或作为流变学探针,从而研究尺寸依赖性的细胞质扩散和蛋白质定位。该研究为药物与基因递送、合成生物学等前沿领域提供了具有巨大潜力的新型工具[5]。

研究者试图开发一种基于“几何挫败”的通用策略,用于设计自限性的准对称颗粒。为了驱动球形颗粒的闭合,研究者向六边形组件施加正曲率使其弯曲。由于六边形本身无法铺满球面,当这些组分共同组装成闭合的球形颗粒时,五边形缺陷就可能出现,以释放累积的应力(图一a)。研究者目标是从球形六边形镶嵌结构出发,设计出近似富勒烯拓扑结构的双组分蛋白质组装体。每个顶点由先前设计的一种名为C3-A的蛋白质同源三聚体占据[6],每条边则由RFdiffusion[7]设计的具有预设曲率的一种名为C2-B连接子的同源二聚体占据(图一b和c)。使用一种先前已验证的异源二聚体[8]作为C3-A和C2-B之间的分子界面,以确保精确组装成指定的几何结构。如图一b 所示,将每个C3-A的三重对称轴放置于一个边长为l的理想六边形的顶点处;然后将每条轴向全局的六重轴倾斜,使其位于一个锥角为α的圆锥体上,l和α共同决定了目标球体的大小;最后将每个C3-A绕其自身的三重轴旋转一个角度ω,以控制C2-B结合域的相对取向。选择设计具有α-β折叠结构的C2-B连接子,相比全α螺旋折叠,这种结构能提高刚性,从而满足不同T值的蛋白笼所需的微小锥角偏差(图一c)。这一双组分系统使得能够直接分离构建模块,并在不同组装条件下进行后续的体外实验验证。

1.jpg

图一 生成准对称颗粒的计算机设计策略[5]

研究者尝试通过改变锥角来设计各种尺寸的蛋白笼。为设计T值从1到25的Goldberg二十面体[9],研究者设计了一组C2-B连接子,使其锥角α范围从40°到4°,固定边长l = 125 Å(图二a-c)。使用RFdiffusion生成C2对称的同源二聚体,这些二聚体能够在预设的几何结构下刚性支撑异源二聚体的接触界面。挑选了36个设计进行实验测试,先在大肠杆菌中表达,其中32个可被纯化,26个表现为洗脱单一峰,随后与C3-A以等摩尔比例混合后有18个能形成大的组装体。使用负染电子显微镜筛查颗粒形成情况,观察到8个设计表现出颗粒形成且多分散性低,其余10个设计形成的颗粒尺寸分布较大,可能因连接子构型不利于颗粒的闭合。对颗粒直径进行分析,发现设计的锥角与颗粒尺寸分布之间存在明显的负相关性(图二d)。

2.jpg

图二 通过二聚体连接子的曲率来控制蛋白笼的大小[5]

于是,对不同锥角设计所形成的颗粒范围进行结构表征(图二d-f)。首先检查一个锥角α = 40°的设计,正如预期形成了T = 1的规则十二面体(直径约40纳米),其中二维负染电镜分类图像主要显示五边形。将锥角减小到α = 30°产生了更广泛的多面体组装体分布,包含T = 1和更大的T = 1-3的混合物。将设计模型拟合到实验三维图中表明,基于异源二聚体相互作用的颗粒组装足以使C3-A和C2-B从原始的六边形构型发生弯曲,以实现五元环闭合。锥角α = 20°的C2-B-α20能产生直径约为50-70纳米的球形颗粒,预期T值约为3-4。锥角α = 13°的C2-B-α13则形成了直径约100纳米的球形颗粒,虽然无法精确其T值,但观察到的尺寸范围表明T ≈ 9。C2-B-α10形成了直径约130纳米的颗粒,T ≈ 16。而三个设计的α = 8°连接子产生的颗粒直径接近200纳米,对应于T ≈ 25。组装的颗粒形态呈球形而非多面体,这与预期的Goldberg多面体球形一致。更小的锥角会产生近似平坦的六边形晶格,当目标锥角小于6°时,两种组分混合后会发生不可逆的聚集。基于负染电镜二维分类平均的局部结构分析显示,所有样品中都存在五边形缺陷(图二f),证实了由协同形变导致的五边形缺陷驱动了颗粒的闭合。

接下来,研究者利用冷冻电镜对体外组装的蛋白笼进行表征,以理解准对称颗粒闭合的结构基础。先分析设计的T = 3蛋白笼,这是最简单的Goldberg二十面体,其结构等同于一个C60富勒烯,整体形状像一个足球,包含了12个五边形面和20个六边形面。蛋白笼总共有60个顶点(C3-A)和90条边(C2-B)。研究者获得了C2-B-α20连接子的2.1 Å分辨率晶体结构,与设计模型高度吻合(图三a)。对于完整的蛋白笼,同时获取了单颗粒和冷冻电子断层扫描数据(cryoET,图三b)。对全部粒子进行亚像元三维分类,将其分为三类,其中显示为半完整笼状结构的五边形和六边形组装排列与预期的T = 3结构相符(图三b顶部)。进一步对具有二十面体对称性的最大类别进行细化,得到了一张约30 Å分辨率、具有T = 3二十面体结构的三维图(图三c左)。从设计的六聚体模型出发,使用Rosetta软件结合make_symmdef_file,构建了一个保留亚基-亚基界面的C5复合物。将这些环状结构用Chimera软件对接到密度图中,提取出非对称单元(包含完整C3-A和三个相邻的C2-B-α20),然后使用Rosetta细化完整组装体达到冷冻电镜密度状态。最终得到了一个截角二十面体形状的完整组装模型(图三c右),其中向外指向的C3-A螺旋束由C2-B-α20二聚体所连接。

3.jpg

图三 体外组装蛋白笼的冷冻电镜结构表征[5]

提取出的实验六边形和五边形结构,均略小于设计的模型(图三d)。在颗粒中,同源三聚体C3-A及其相连的C2-B-α20呈现出两种不同的局部环境:相邻的两个六边形(称为6–6)或一个六边形紧邻一个五边形(称为6–5)。这种区分导致同源三聚体C3-A 打破其原有的C3对称性,变成了一个不对称的三聚体(图三e)。当以三聚体核心进行比对时,6–6与6–5这两种不同构象的末端位置相差20 Å(图三f)。还识别出C2-B-α20存在两种构象状态,它们具有不同的弯曲角度且C2对称性被打破,分别对应于六边形的6–6和五边形的6–5环构型。与6–6构型相比,6–5构型更接近于单体蛋白的晶体结构(图三g)。

为研究更高T值的大型蛋白笼,研究者收集了体外组装的T ≈ 16(C2-B-α10)的单颗粒冷冻电镜数据集。观察到大多数颗粒呈球形且闭合,没有明显的缺口(图三h)。颗粒大小和形状的差异表明,笼状组装体并非严格遵循Goldberg二十面体结构。结合二维分类平均和局部区域重建,来表征弯曲晶格以及五边形组装体的空间分布。在二维分类平均中,观察到六边形阵列模式,并确认五边形组装体的存在(图三i)。在同一个二维分类中,并未观察到存在两个五边形的情况,提示五边形的分布状态极有可能是随机而非均匀分布的。还识别出了与五边形环相邻的七边形缺陷以及畸变的六边形,这两种结构均在大尺寸富勒烯的拓扑缺陷中被观测到,这突显了晶格在容纳正负曲率方面的灵活性。重建出的曲面六边形及其邻近区域的三维图,与理想化T = 16二十面体的对应区域高度吻合(图三j)。

最后,研究者尝试对这些大型蛋白笼进行功能化改造。C3-A和C2-B都具有暴露的末端,便于与天然及从头设计的蛋白质进行直接基因融合,如荧光蛋白、从头设计的肽结合蛋白、纳米抗体和HaloTag等。研究者将C3-A-nSpyCatcher和C2-B-α20-nMCherry融合蛋白在大肠杆菌中表达,并通过尺寸排阻色谱纯化,得到了预期分子量的可溶性寡聚体(图四a)。由于内部空腔的存在,这些设计的蛋白笼具有封装大型货物如核糖核蛋白、基因编辑器的潜力,这在天然病毒颗粒和以往的设计中均颇具挑战性。为此,研究者制备了T = 3蛋白笼,其中C2-B与抗GFP纳米抗体(C2-B-α20_nGFPnb)相融合。在与GFP标记的Cas9混合后,通过尺寸排阻色谱观察到GFP信号与纳米抗体功能化蛋白笼的共洗脱,表明实现了有效的货物封装。负染电镜分析显示,封装后的颗粒没有发生明显的形态变化(图四b)。随后,研究者用设计的结合蛋白[10]对蛋白笼进行功能化改造,这些结合蛋白可靶向不同的内吞细胞表面受体以促进摄取作用。将不同C2-B-α20的N端与GFP以及三种促进内吞作用的从头设计蛋白标签(ASGPR_EndoTag、IGF_EndoTag和Sort_EndoTag)相融合。体外组装后,分别与HEP3B细胞孵育24小时,使用共聚焦显微镜均能观察到细胞内出现点状信号,且与溶酶体出现共定位(图四c)。相比之下,未标记EndoTag的GFP蛋白笼则显示出极低的内化现象(图四c)。以上两个功能化改造实例表明,设计的蛋白笼可用于货物装载和细胞摄取。

4.jpg

图四 体外组装蛋白笼在活细胞内的应用[5]

单颗粒追踪纳米流变学是一种探测细胞内环境介观物理特性的强有力策略。这些特性是动态的,且在不同时空尺度上呈现出非线性的变化。基于天然支架的基因编码多聚纳米颗粒(GEMs)已经被开发作为被动流变探针,然而制备较大的纳米颗粒一直较为困难。在与囊泡运输等细胞生物学过程相关的约100纳米尺度上,仍需定义明确的流变探针。鉴于准对称蛋白笼具有可调的尺寸和稳健的组装特性,研究者假设它们可以提供一种正交且可基因编码的方法,用于扩展纳米流变学工具库。为确认观察到的荧光信号源自设计的双组分所形成的颗粒,而非随机聚集体,先设计了双荧光颗粒:与GFP融合的C3-A通过P2A连接了与mScarlet融合的C2-B(图四d)。在U2OS细胞中进行表达,发现60%的GFP颗粒与mScarlet颗粒共定位,且几乎没有任何GFP点状结构与随机分布的点状位置接近(图四e),这符合由两种设计成分组装而成的特性。于是,构建了单荧光颗粒:与GFP融合的C3-A通过P2A连接了C2-B-α13或C2-B-α10(图四d),进行单颗粒追踪分析(图四f)。与先前开发的40纳米GEMs[11]相比,两种蛋白笼的GFP平均强度均有所增加,这与其具有更多的亚基数量相一致(图四g)。研究者分析了持续追踪超过十帧的颗粒轨迹,并根据均方位移计算出在30毫秒和100毫秒时间尺度上的有效扩散系数。发现不同颗粒的有效扩散系数与其计算设计尺寸呈负相关,这使得它们成为推断哺乳动物细胞物理参数的有效流变学工具。这三种颗粒类型在30毫秒(Deff-30ms)时的有效扩散系数均高于100毫秒(Deff-100ms),表明存在依赖于时间尺度的物理约束(图四h)。这种效应在设计的蛋白笼中更为明显,表明在较大的尺度范围内存在更为显著的细胞内约束。为探究这些探针能否有效感知细胞环境的变化,使用山梨醇处理来急剧降低细胞内水分含量、减小细胞体积,从而增加大分子的拥挤程度。随着山梨醇浓度的增加,40纳米GEMs和C2-B-α10蛋白笼的Deff-100ms均降低,表明它们的扩散对物理性质的扰动较为敏感(图四i),这正是流变示踪剂所应有的特性。

标记感兴趣的细胞内货物分子,有助于将其招募到细胞内组装的准对称蛋白笼。为探索这一可能性,研究者先建立了一个稳定表达GFP融合C2-B-α10蛋白笼的U2OS细胞系。随后,将p53蛋白C末端融合抗GFP纳米抗体和HaloTag,进行质粒瞬时转染(图四j)。在U2OS细胞中组装的C2-B-α10蛋白笼,可通过GFP与GFP纳米抗体的结合,有效地招募p53蛋白,且在加入Halo配体后,可见GFP标记的蛋白笼与Halo标记的p53显著共定位(图四j)。p53通常定位于细胞核(图四j左),但与蛋白笼结合后,这些复合物变得过大而无法进入细胞核或侵入有丝分裂染色质,而被限制在细胞质中(图四j右)。引入破坏界面的C3-A突变L267K/R,会损害蛋白笼的组装并减少p53的转位,表明货物的重新分布需要完整的蛋白笼结构。以上数据表明,设计的蛋白笼可以在细胞内装载货物,这在药物递送应用以及控制亚细胞蛋白质定位方面具有潜在价值。

综上所述,该研究利用“几何挫败”原理,通过计算机设计成功模拟了双组分的准对称组装方式,构建出尺寸可编程、功能可定制的大型纳米蛋白笼。通过设计的三聚体和二聚体两种蛋白组件,使其自组装成弯曲的六边形晶格,并借助五边形缺陷驱动球面闭合,形成封闭的类球状蛋白笼。这种蛋白笼经过功能化改造后,可以在活细胞内实现货物装载,还能被细胞吞噬进入细胞内部,提示其已具备“人工病毒载体”的雏形。该研究为下一代用于细胞内递送和合成生物学应用的可编程生物材料奠定了基础。

值得注意的是,同期David Baker团队还发表了另一篇仅用单组份成功构建出准对称蛋白纳米笼结构,通过设定整体几何规则,让局部对称性在组装过程中自发对称破缺。获得了T值在3到36之间的单组分准对称蛋白笼,直径介于68至220纳米之间,包含了180到2160个蛋白亚基。此外,还设计出1 < T < 3的非二十面体、类似网格蛋白笼的多面体结构[12]。

关于GTP.gif

GTP研发中心负责实施基因组标签计划(Genome tagging project, GTP),基于自主知识产权的类精子干细胞介导半克隆技术,为全基因组的功能基因一一贴上标签,致力于构建标签细胞和标签小鼠资源库。类精子干细胞是从精子来源单倍体囊胚中建系获得的一种孤雄单倍体胚胎干细胞,将其注入卵母细胞,能够像精子一样支持整个胚胎发育过程,产生健康的半克隆小鼠。GTP研发中心在类精子干细胞的蛋白质编码基因上原位敲入标签序列,建立了液氮保存的标签细胞资源库。研究需要时,利用半克隆技术将标签细胞注射到小鼠卵母细胞中,一步法获得标签小鼠。

联系我们.gif

已有标签产品可直接订购,详情查阅以下官网链接。如有需要欢迎联系,我们将竭诚为您服务。

标签细胞网址:

http://www.sibcb.ac.cn/gtp/

标签小鼠网址:

http://www.sibcb.ac.cn/gtp/msearch.jsp

邮箱:gtp_order@sibcb.ac.cn

地址:上海市岳阳路320号

 

责任编辑:多一百

新媒体运营:suway

 

参考文献

1. Caspar DL, Klug A: Physical principles in the construction of regular viruses. Cold Spring Harbor symposia on quantitative biology 1962, 27:1-24.

2. Hsia Y, Mout R, Sheffler W, Edman NI, Vulovic I, Park YJ, Redler RL, Bick MJ, Bera AK, Courbet A et al: Design of multi-scale protein complexes by hierarchical building block fusion. Nature communications 2021, 12(1):2294.

3. Bale JB, Gonen S, Liu Y, Sheffler W, Ellis D, Thomas C, Cascio D, Yeates TO, Gonen T, King NP et al: Accurate design of megadalton-scale two-component icosahedral protein complexes. Science 2016, 353(6297):389-394.

4. Sigl C, Willner EM, Engelen W, Kretzmann JA, Sachenbacher K, Liedl A, Kolbe F, Wilsch F, Aghvami SA, Protzer U et al: Programmable icosahedral shell system for virus trapping. Nature materials 2021, 20(9):1281-1289.

5. Wang S, Xie Y, Chmielewski D, Weidle C, Shu T, Ahn G, Kibler RD, Hernandez C, Chen W, Duran DC et al: De novo design of quasisymmetric two-component protein cages. Nature 2026.

6. Wang S, Favor A, Kibler RD, Lubner JM, Borst AJ, Coudray N, Redler RL, Chiang HT, Sheffler W, Hsia Y et al: Bond-centric modular design of protein assemblies. Nature materials 2025, 24(10):1644-1652.

7. Watson JL, Juergens D, Bennett NR, Trippe BL, Yim J, Eisenach HE, Ahern W, Borst AJ, Ragotte RJ, Milles LF et al: De novo design of protein structure and function with RFdiffusion. Nature 2023, 620(7976):1089-1100.

8. Sahtoe DD, Praetorius F, Courbet A, Hsia Y, Wicky BIM, Edman NI, Miller LM, Timmermans BJR, Decarreau J, Morris HM et al: Reconfigurable asymmetric protein assemblies through implicit negative design. Science 2022, 375(6578):eabj7662.

9. Schein S, Gayed JM: Fourth class of convex equilateral polyhedron with polyhedral symmetry related to fullerenes and viruses. Proceedings of the National Academy of Sciences of the United States of America 2014, 111(8):2920-2925.

10. Chen J, Li Q, Wang J: Topology of human apolipoprotein E3 uniquely regulates its diverse biological functions. Proceedings of the National Academy of Sciences of the United States of America 2011, 108(36):14813-14818.

11. Luby-Phelps K, Taylor DL, Lanni F: Probing the structure of cytoplasm. The Journal of cell biology 1986, 102(6):2015-2022.

12. Lee S, Chmielewski D, Wang S, Kibler RD, Shin J, Carr A, Park YJ, Veesler D, Baker D: Design of one-component quasisymmetric protein nanocages. Nature 2026.

 

转载请注明来源于【GTP研发中心】

声明:本文仅用于分享,不代表GTP研发中心立场,若有侵权,请及时联系我们第一时间更正!

文末关注.gif

文末公众号二维码.png



【返   回】

需要更多信息

For more information,please contact us


我要留言

Copyright © 2018-2028 | 中国科学院分子细胞科学卓越中心版权所有

备案号:沪ICP备2021025838号