技术分享:细胞核凝聚体的邻近蛋白质组图谱绘制
在哺乳动物细胞中,细胞核凝聚体(nuclear condensates,NC)或核体(nuclear body)是一系列实现核内空间和功能区室化的无膜细胞器,可作为关键细胞活动的发生场所,例如染色体结构与维持调控、DNA复制、DNA损伤与修复、转录、RNA加工以及核糖体生物发生[1]。核凝聚体是小型、无膜、且具有动态性的结构,通常由蛋白质和核酸等支架生物大分子通过液-液相分离形成[2]。其结构异常和功能失调与多种疾病相关,如神经退行性疾病和癌症。
迄今为止,至少18种核凝聚体已在人类细胞中被报道。其中,核仁(NO)、Cajal小体(CB)、核斑(NS)、旁斑(PS)、GEM体(GEM)和PML核体(PML-NB)的研究最为深入[1]。而核仁周围区室(PNC)、SUMO-1核体(SNB)、Sam68核体(S68B)、切割体(CLB)和IK体(IKB)等则认知甚少。这些核凝聚体不仅影响了蛋白质的核内分布,还在DNA和RNA的区室化过程中发挥关键作用。越来越多的证据表明,核凝聚体并非随机分布,与其动态结构和功能相关[3]。由热休克或其他环境压力诱导产生的核应激小体(NSB),会促进热休克因子1(HSF1)和RNA加工因子在特定基因组位点发生凝聚,促进细胞响应刺激并调节转录[4]。一些核凝聚体具有共同组分并发生物理相互作用,例如GEM通常与CB紧密关联[5]。此外,一些具有相分离潜能的核蛋白,可能作为相对独立的凝聚体发挥功能。尽管个别核凝聚体的功能已研究相对透彻,但这些凝聚体的组成成分及其时空协同组织方式鲜有研究,以及未表征的凝聚体仍有待发现。
2025年12月,Nature Cell Biology期刊报道了一项研究,利用PhastID生物素邻近标记系统描绘了HeLa细胞中18种核凝聚体的邻近蛋白质组。该研究不仅揭示了这些核凝聚体组分和复杂内部关系,还鉴定出一个此前未知的BUD13凝聚体。将邻近蛋白互作组与已发表的300余项蛋白质组学数据进行整合,绘制了一张核凝聚体全局参考图谱NOVA,可用于理解应激条件下核凝聚体的动态变化,以及疾病相关突变如何差异影响不同核凝聚体的相互作用。该研究不仅为研究核凝聚体提供了宝贵的数据资源,也为理解细胞核内亚结构组织和凝聚体的功能关联提供了新见解[6]。
首先,为探究核凝聚体的蛋白质组分,研究者针对已报道的18种核凝聚体的典型标志物,在HeLa细胞中利用PhastID邻近标记技术进行蛋白质组分析(图一a)。在6种主要的核凝聚体CB、GEM、NS、PS、PML-NB、NO中,分别选择3-6个标志物作为诱饵蛋白。次要的SNB、CLB、S68B、异染色质区域(HET)、端粒凝聚体(TEC)、组蛋白位点体(HLB)、PNC、转录凝聚体(TC)、IKB、着丝粒(CEN)、核孔复合体(NPC)、核纤层(NL)分别选择1-2个标志物作为诱饵蛋白(图一a和b)。具体操作为,将PhastID(Ph)置于诱饵蛋白的N端或C端,两者之间用Flag/HA(FH)和2×GS连接,并利用低滴度的慢病毒转导在HeLa细胞中稳定表达,其中41个标志物表现出预期的亚细胞定位和凝聚体形态。随后对这些细胞进行三次生物素标记,提取细胞核组分,进行亲和纯化及质谱分析(图一b和c)。表达带有核定位信号的PhastID作为对照细胞,质谱检测将含有2个以上唯一肽段、相比对照富集3倍以上的蛋白质视为显著相互作用子。结果显示共有2,390个蛋白质符合筛选标准,涉及10,126对邻近相互作用。其中14.7%已有文献报道,该比例与以往的免疫共沉淀-质谱和生物素标记鉴定(BioID)研究相近[7]。

图一 利用PhastID对18种核凝聚体进行邻近蛋白质组分析[6]
接下来,研究者探索各个核区室的组织结构。利用CORUM数据库[8]分析核凝聚体邻近蛋白质组的蛋白质复合物。结果显示,DNA/RNA相关功能是核凝聚体形成的基础。一组核凝聚体(异染色质域、端粒凝聚体、SUMO-1核体和转录凝聚体)富集了DNA和转录相关蛋白复合物,而另一组核凝聚体则富集了RNA加工复合物。值得注意的是,PML-NB和CB似乎是连接这两组的桥梁(图二a)。经GO分析,能区分大多数核凝聚体的特异性功能,甚至区分出核仁的三个不同层次。通过对各组分的功能注释,发现核凝聚体呈现出一种内在有序的组织结构,遵循着中心法则的核心理念(图二b),表明核凝聚体在协调基因调控过程的层级级联反应中起着关键作用。进一步分析每个核凝聚体中的蛋白质结构域和基序特征,发现一些核凝聚体富集C2H2、ING、PHD和RING结构域蛋白,这与它们参与DNA结合、表观遗传修饰和识别的作用一致。与RNA相关的核凝聚体则富集了KH、RRM和LSM等结构域。而DNA/RNA相关的核凝聚体均富集了DEXDc和HELICc结构域蛋白,已知这些蛋白是相分离凝聚体的全局调节因子[9](图二c)。值得注意的是,疏水性的FG基序在核孔复合体和核纤层中均显著富集,构成了核膜的屏障(图二d)。以上数据表明,不同区室在核内的组织是一个以遗传信息流为中心的功能网络,提示了不同核凝聚体之间可能存在广泛联系。

图二 核凝聚体邻近互作组的功能与序列特征[6]
多个核凝聚体共享组分并表现出物理接触,然而,这些相互作用的生物学相关性尚不清楚。为探究核凝聚体之间的关联,研究者使用相关性关联(RA)评分量化空间相互作用,识别出先前报道的以及预测的核凝聚体之间的物理相互作用(图三a)。着重关注GEM,其缺失是脊髓性肌萎缩症和肌萎缩侧索硬化症的标志性特征。SMN复合物是GEM的主要组分,而它们在细胞核内的功能仍不清楚。GEM通常与CB紧密相关,确实在HeLa细胞中,有49.8%的CB(COIL)和60.4%的GEM(SMN1)共定位(图三b)。CB组分WRAP53与所有五种GEM标志物高度相关(图三c),提示GEM可能辅助WRAP53发挥作用。WRAP53可作为端粒酶复合物的辅助蛋白,通过与RNA组分hTR相互作用,将hTR靶向CB以促进端粒酶组装。确实在GEM的邻近蛋白质组中发现了许多端粒/端粒酶相关蛋白,其中一些与WRAP53共享(图三d)。GEM支架蛋白SMN1和WRAP53类似,也能拉下相当数量的活性端粒酶(图三e)。为研究GEM-CB相互作用是否是端粒酶调控所必需的,研究者用EPZ015666处理细胞以抑制COIL的二甲基精氨酸修饰,推测可能破坏SMN1-COIL相互作用。EPZ015666处理有效地分离了CB和GEM,导致80%的CB-GEM共定位丧失(图三f-h)。EPZ015666处理后,端粒酶活性随时间显著下降(图三i),同时含poly-A的hTR前体逐渐积累(图三j),且破坏了COIL和SMN1与hTR前体的结合(图三k和l)。此外,研究者通过GEM和CB的共享蛋白质,鉴定出一个可调控它们之间相互作用的核糖核蛋白GAR1。过表达GAR1可抑制CB-GEM接触、并降低了端粒酶活性(图三m-o)。以上数据表明,GEM-CB的相互作用对于hTR前体的成熟和功能性端粒酶复合物的形成是必需的。

图三 CB-GEM互作协助端粒酶的生物学功能[6]
RA评分量化了诱饵蛋白与其他组分之间的关联,而这些关联也能反映互作蛋白质的核内定位。基于此,研究者预测了几个蛋白质的核内定位。例如,在NS中鉴定出C1orf63,在IKB中鉴定出PPWD1,在PS和PNC中鉴定出ESRP1(图四a和b)。在检测的候选蛋白中,BUD13与18种核凝聚体的关联均较弱(图四c)。已知BUD13是激活态的人类次要剪接体的一个组分。免疫荧光检测表明BUD13似乎并不与这些核凝聚体相关联(图四d和e),并且BUD13能够在癌细胞和正常细胞中形成小的凝聚体(图四f和g)。GFP-BUD13凝聚体是高度动态的,光漂白后恢复时间为15.1秒(图四h和i),并表现出以富含精氨酸的IDR依赖方式进行相分离的能力。这些结果表明存在一种此前未被表征的BUD13核凝聚体。

图四 BUD13是一种未知的潜在核凝聚体[6]
为确定这种核凝聚体,研究者鉴定出了另外两个与BUD13共定位的组分SNIP1和RBMX2(图四j)。BUD13核凝聚体的邻近蛋白质组分析发现,与RNA加工高度相关,并富集了参与RNA剪接、rRNA加工、组蛋白乙酰转移酶和DNA修复的蛋白质复合物(图四k)。BUD13核凝聚体的功能特征介于NS和GEM之间(图四l),表明它是一个RNA剪接的位点。预测分析支持了BUD13核凝聚体与GEM之间潜在的协同调控关系(图四m)。值得注意的是,BUD13核凝聚体的邻近蛋白质组检测到了整个GEM的核心复合物,相比之下仅鉴定出了少量CB组分(图四n)。进一步证实BUD13核凝聚体与GEM发生了物理相互作用,并在细胞核中观察到“BUD13核凝聚体-GEM-CB”三者互作结构(图四o和p)。放线菌素D(ActD)可阻止RNA聚合酶的转录延伸,导致某些RNA加工凝聚体如NS和NO的形态发生变化[10]。ActD处理后,BUD13凝聚体变大、变圆(图四q和r),提示BUD13核凝聚体参与了RNA加工。此外,主要诱导NER修复途径的紫外线辐射也能触发BUD13凝聚(图四s),相比之下,诱导双链断裂修复的电离辐射则没有效果,表明BUD13核凝聚体也能特异性响应激活NER修复途径的应激。
研究者进一步整合了311个已发表的邻近蛋白质组和54个PhastID数据集的RA评分,通过UMAP生成一张二维的核凝聚体图谱,称为细胞核无膜细胞器变异与关联图谱(NOVA,图五a)。尽管数据集来源的细胞类型和实验方法存在差异,但对于诱饵蛋白而言,核凝聚体关联表现出高度的兼容性。相同核凝聚体的组分倾向于聚集在一起,这支持了BioID平台的整体稳健性,提示利用NOVA图谱研究关键核凝聚体组分的疾病相关突变与核凝聚体变异的潜力。胰腺神经内分泌肿瘤(PNET)是第二常见的胰腺上皮源性恶性肿瘤,研究者针对四种PNET相关的DAXX突变体进行PhastID分析,NOVA图谱反映出DAXX突变体的核内分布改变(图五b),并且GO特征提示了潜在的功能转变(图五c)。A297P和L130R突变体似乎与野生型DAXX相似,但增强了与SUMO、SUMO连接酶和PML-NB组分的相互作用(图五d)。A297P突变体与许多表观遗传修饰因子,特别是转录抑制因子/共抑制因子的相互作用增强,而与转录激活因子/共激活因子的相互作用则减少(图五d),提示基因转录可能发生了改变。RNA-seq分析显示,与野生型DAXX相比,A297P突变体中91个基因的转录水平上调(图五e),表现为几个肿瘤相关通路的异常激活,包括IL-21、WNT等通路(图五f)。NOVA图谱成功预测了E465X突变体在NO的富集(图五b和g),这与其邻近蛋白质组中富集了RNA加工和核仁组分蛋白相一致(图五h)。表达E465X突变体后,细胞里核仁数量和面积均有所增加(图五i和j),同时60S/80S核糖体和多聚体组分也增多(图五k),表明其rRNA加工过度活跃和蛋白质翻译增强。

图五 NOVA图谱整合了多种BioID数据集,可揭示疾病突变体的潜在作用机制[6]
与细胞质凝聚体不同,核凝聚体对应激的响应研究较少。最后,研究者测试NOVA图谱能否反映核凝聚体在短时刺激下的动态变化。选择检测一种已知的热休克诱导的核应激小体(NSB),它由HSF1在热休克15分钟内通过相分离形成,伴随着HSF1的翻译后修饰以及下游热休克基因的转录激活。在热休克15分钟后,邻近蛋白质组检测发现增加了54个HSF1相互作用子(图六a),这些蛋白主要涉及转录调控、应激反应和蛋白质翻译后修饰(图六b和c)。NOVA图谱分析在正常条件下,HSF1与分子伴侣和基因沉默调节因子聚类在一起(图六d和e)。热休克后,HSF1(HS)聚类转变到PML-NB和HET(图六d),提示热休克诱导的HSF1翻译后修饰,尤其是SUMO化修饰,可能与PML-NB相关。为探究核凝聚体如何全局性地响应短时热休克,研究者进一步对18种核凝聚体进行热休克后的邻近蛋白质组分析(图六f)。经过15分钟的热休克后,大多数核凝聚体在形态或邻近相互作用上表现出极小的可检测变化(图六g)。变化的相互作用子主要参与RNA加工、应激反应和细胞骨架,并集中在NSB、PS、CB、TEC、PNC等核凝聚体上(图六g和h),表明这些核凝聚体在热应激下的调控发生了改变,且发现热休克后CB(COIL)与GEM蛋白的相互作用增强(图六h)。应激响应的NOVA图谱揭示,除了HSF1的转变外,COIL和SMN1之间的相对距离在热休克后显著减小(图六i),通过实验进一步证实CB和GEM的共定位在热休克后增加(图六j)、以及hTR前体水平的降低(图六k)。以上数据表明,NOVA图谱不仅可作为研究蛋白质水平动态调控的参考,也可以为无膜细胞器在刺激下动态调控提供新见解。

图六 热休克后核凝聚体的动态与功能变化[6]
综上所述,该研究采用邻近标记技术对细胞核凝聚体的组分及相互作用进行了系统性研究,代表性描绘了18种核凝聚体的41种标志物的邻近蛋白质组,揭示了核凝聚体之间的相互作用与功能协同,发现并表征了新型Bud13核凝聚体。进一步整合已发表的邻近蛋白质组和PhastID数据集,绘制了人类核凝聚体图谱NOVA,为理解细胞核组织结构及遗传信息流动提供了研究框架,并在解析快速生理过程中的核凝聚体动态与功能调控方面展示出强大潜力。该研究推动了细胞核凝聚体的研究从“剖析其组成部分”进展到“理解其运行规则”的新阶段,为探究众多核内凝聚体结构的生理功能及其病理机制提供了坚实的数据资源和分析框架。

GTP研发中心负责实施基因组标签计划(Genome tagging project, GTP),基于自主知识产权的类精子干细胞介导半克隆技术,为全基因组的功能基因一一贴上标签,致力于构建标签细胞和标签小鼠资源库。类精子干细胞是从精子来源单倍体囊胚中建系获得的一种孤雄单倍体胚胎干细胞,将其注入卵母细胞,能够像精子一样支持整个胚胎发育过程,产生健康的半克隆小鼠。GTP研发中心在类精子干细胞的蛋白质编码基因上原位敲入标签序列,建立了液氮保存的标签细胞资源库。研究需要时,利用半克隆技术将标签细胞注射到小鼠卵母细胞中,一步法获得标签小鼠。

已有标签产品可直接订购,详情查阅以下官网链接。如有需要欢迎联系,我们将竭诚为您服务。
标签细胞网址:
标签小鼠网址:
http://www.sibcb.ac.cn/gtp/msearch.jsp
地址:上海市岳阳路320号
责任编辑:甜点
新媒体运营:suway
参考文献
1. Sabari BR, Dall'Agnese A, Young RA: Biomolecular Condensates in the Nucleus. Trends Biochem Sci 2020, 45(11):961-977.
2. Wang B, Zhang L, Dai T, Qin Z, Lu H, Zhang L, Zhou F: Liquid-liquid phase separation in human health and diseases. Signal Transduct Target Ther 2021, 6(1):290.
3. Hirose T, Ninomiya K, Nakagawa S, Yamazaki T: A guide to membraneless organelles and their various roles in gene regulation. Nat Rev Mol Cell Biol 2023, 24(4):288-304.
4. Zhang H, Shao S, Zeng Y, Wang X, Qin Y, Ren Q, Xiang S, Wang Y, Xiao J, Sun Y: Reversible phase separation of HSF1 is required for an acute transcriptional response during heat shock. Nat Cell Biol 2022, 24(3):340-352.
5. Courchaine EM, Barentine AES, Straube K, Lee DR, Bewersdorf J, Neugebauer KM: DMA-tudor interaction modules control the specificity of in vivo condensates. Cell 2021, 184(14):3612-3625.e3617.
6. Li R, Li Y, Wu S, Zhou Z, Hou X, Yang P, Zhu J, Xia Y, Wu W, Feng R et al: Proximal proteomics reveals a landscape of human nuclear condensates. Nat Cell Biol 2025, 27(12):2198-2213.
7. Oughtred R, Rust J, Chang C, Breitkreutz BJ, Stark C, Willems A, Boucher L, Leung G, Kolas N, Zhang F et al: The BioGRID database: A comprehensive biomedical resource of curated protein, genetic, and chemical interactions. Protein Sci 2021, 30(1):187-200.
8. Giurgiu M, Reinhard J, Brauner B, Dunger-Kaltenbach I, Fobo G, Frishman G, Montrone C, Ruepp A: CORUM: the comprehensive resource of mammalian protein complexes-2019. Nucleic Acids Res 2019, 47(D1):D559-D563.
9. Hondele M, Sachdev R, Heinrich S, Wang J, Vallotton P, Fontoura BMA, Weis K: DEAD-box ATPases are global regulators of phase-separated organelles. Nature 2019, 573(7772):144-148.
10. Lafontaine DLJ, Riback JA, Bascetin R, Brangwynne CP: The nucleolus as a multiphase liquid condensate. Nat Rev Mol Cell Biol 2021, 22(3):165-182.
转载请注明来源于【GTP研发中心】
声明:本文仅用于分享,不代表GTP研发中心立场,若有侵权,请及时联系我们第一时间更正!


