GTP基因组标签计划

首页 > 新闻中心

新闻动态

技术分享:核斑调控GC-rich区域的RNA剪接与表达



人类基因组在碱基组成、局部基因密度以及染色质-染色质相互作用方面具有高度异质性[1]。在染色质3D结构的最高层级上,可分为活跃(A)区室和非活跃(B)区室,它们优先与同类型区室的区域发生相互作用[2]。活跃区室可进一步细分为A1和A2两个亚区室:A1亚区室的基因密度高、鸟嘌呤-胞嘧啶(GC)含量高,以及包含短且GC-rich基因;而A2亚区室的基因密度较低,包含长基因且整体GC含量较低。目前尚不清楚,为何GC-rich短基因会成簇聚集在少数基因组区域中,而GC-poor长基因更倾向于均匀地分布在整个人类基因组中。

在基因组学领域,isochore是指基因组中具有相似GC含量的DNA长片段。近期研究表明,位于GC-rich isochore区域内的基因具有一种独特的基因结构:由GC-rich外显子与其两侧GC-rich短内含子组成,称为“平齐型”外显子-内含子结构,这种结构在可变剪接时容易发生内含子保留。而A2亚区室的GC-poor长基因则倾向于具有GC-poor内含子以及相对GC-poor外显子,形成“差异型”外显子-内含子结构,这种结构在可变剪接时容易发生外显子跳跃[3]。这一区分现象在哺乳动物和鸟类基因组中已有描述,但并不普遍存在于所有脊椎动物中,且在无脊椎动物中缺失。

在基因组3D结构和RNA加工的交叉研究中发现,人类细胞中核斑(nuclear speckle) 与GC-rich的A1亚区室在空间上邻近,提示核斑与GC-rich基因之间存在明显的空间相关性[4]。核斑是一种无膜细胞器,由数百种蛋白质组成的大型、形状不规则的核内凝聚物,被认为参与转录、剪接、终止、RNA修饰及核输出等过程[5]。然而,核斑是否参与维持基因组3D结构,又是如何影响转录调控、剪接等过程,及其功能如何演化,目前尚不明确。

2026年4月,Cell期刊报道了一项研究,发现核斑是调控GC-rich isochore区域基因表达的关键结构。通过急性去除核斑的核心组分SON和SRRM2蛋白,诱发核斑解体,发现染色质在细胞核内异常扩散,导致GC-rich isochore区域的基因表达显著下降,是由于剪接混乱所致。而其他区域的基因表达不受影响。进化分析发现,核斑及其调控的GC-rich isochore只存在于羊膜动物中。SON蛋白的内在无序区(IDR)是形成功能性核斑的必要且充分条件,其长度在羊膜动物中发生了显著扩展,提示了核斑与羊膜动物基因组中GC含量增高呈协同进化关系[6]。

GC-rich基因密度高的染色质在核斑周围呈现出优先定位的现象(图一A),提示核斑可能在染色质3D结构中发挥着组织作用。先前认为核斑由多种丝氨酸/精氨酸蛋白共同形成,缺乏具体的组织核心。研究者在前期证明了核斑是由SON和SRRM2两个大分子无结构蛋白质所形成的[7],为直接研究其功能提供了可能性。于是,研究者首先构建了急性解体核斑的方法来解析其功能。在HCT116细胞基因组中,N端原位敲入Halo Tag来内源性标记SON,以及C端原位敲入SNAP-tag/FKBP12F36V来内源性标记SRRM2。随后,添加小分子降解剂HaloPROTAC3和dTAG,分别特异性快速降解SON和SRRM2蛋白(图一B和C)。采用N-羟基琥珀酰亚胺(NHS)-488进行细胞染色,发现核仁和核斑是细胞核内蛋白质最密集的区域,占据了核内相当大的空间。当同时去除SON和SRRM2后(ΔSpeckles),NHS-488染色所显示的密集区域只剩下核仁,进一步证实这两种蛋白是核斑的结构支架。随后,通过FRAP分析内源性表达的SON和SRRM2蛋白的流动性。结果显示,SRRM2的荧光恢复相对较快,而SON的恢复则非常缓慢。在光漂白后5分钟内,仅有约58%的SON信号能够恢复,表明相当一部分SON蛋白是不动的,提示SON赋予了核斑粘弹性特性。在SON缺失(ΔSON)的细胞中,核斑塌缩成球状体,类似于通过液-液相分离形成的液滴(图一C)。这些缺乏SON的核斑结构的完整性依赖于SRRM2的存在,将其称为“SRRM2液滴”,因为随着SRRM2的去除,会导致核斑的完全解体(图一C)。在ΔSON细胞中,SRRM2液滴最初塌缩成小的球形凝聚体,随后融合成数量更少、体积更大的凝聚体。

1.png

图一 缺失SON和SRRM2会破坏核斑结构,进而影响染色质运动和3D结构[6]

为观察染色质的运动情况,研究者在细胞内表达携带光激活GFP标签的组蛋白H2B(PA-GFP-H2B),仅激活细胞核内的一个限定区域(图一D)。在对照细胞中,PA-GFP-H2B在激活后6-7小时内EGFP荧光仍局限于细胞核的一半区域。相比之下,在ΔSON细胞和ΔSpeckles细胞中,PA-GFP-H2B信号在相同时间内荧光扩散至整个细胞核(图一E和F),表明核斑的急性去除导致染色质的运动增加。由于核斑定位于A1亚区室附近,那么核斑的缺失是否影响染色质-染色质之间的相互作用?为捕捉时间动态变化,研究者在降解剂处理后6、12和18小时进行Pore-C分析,在ΔSpeckles细胞中染色质-染色质的相互作用模式在很大程度上得以保留,而代表远端、跨区室间接触的非对角线接触则变得不那么明显。Saddle图显示区室化强度在核斑缺失后6小时就已出现下降,并在18小时后最为明显(图一H)。ΔSpeckles细胞表现出一种独特的“葡萄干”样的细胞核形态,伴有皱褶的核膜和异常的H3K9me3分布(图一G),而ΔSON或ΔSRRM2细胞则没有。考虑到核结构、染色质区室化与染色质状态密切相关,使用靶向H3K9me3的CUT&RUN技术检测组成型异染色质的定位模式。在所有处理条件下,尤其是在ΔSpeckles细胞中,观察到靠近核斑的位点处H3K9me3水平出现轻度且持续性的下降,同时远离核斑的位点处H3K9me3水平升高(图一I)。以上结果表明,核斑主要通过SON所提供的粘弹性特性,限制染色质的随机运动,在维持人类细胞核结构和染色质3D结构中发挥重要作用。

接下来,研究者测量核斑缺失后的转录水平变化,对新生RNA进行脉冲标记和RNA-seq测序。尽管在染色质形态、核结构以及H3K9me3分布方面观察到了变化,但在ΔSpeckles细胞中,新生RNA转录水平的变化相对较为温和(图二A左)。进一步对带有多聚腺苷酸尾p(A)的mRNA进行测序,测量稳态基因表达的变化。与新生RNA测序数据结果相反,p(A)+ RNA-seq数据显示ΔSpeckles细胞中基因表达发生了剧烈变化,并且明显倾向于下调(图二B左)。核斑富集在GC-rich染色质附近(图一A),而这些区域富含短且GC-rich的基因。一致地,在ΔSpeckles细胞的下调基因中GC含量显著高于上调基因(图二D)。此外,径向图显示下调的mRNA几乎全部来源于靠近核斑的GC-rich位点(图二A-C)。将下调基因标注在染色体示意图上,可以发现下调区域集中在基因组的GC-rich区段(图二E)。一个典型的例子是整体GC含量最高且最靠近核斑的19号染色体,它在ΔSpeckles细胞中呈现出端到端的整体表达下调,而大小相似但GC含量较低的18号染色体则不然(图二E和F)。DNA荧光原位杂交(FISH)实验表明,19号染色体不仅靠近核斑,还常常环绕在核斑周围(图二G)。SON的缺失减少了19号染色体与SRRM2液滴之间的接触(图二H),进一步凸显了SON在功能性核斑形成中的重要性。

2.png

图二 破坏核斑会影响GC-rich基因组区域的基因表达[6]

为更详细地分析ΔSpeckles细胞中的GC含量与基因表达变化的关系,研究者采用三种独立的基因组分割策略。其一,仅使用平均GC含量,将基因组分割为五个isochore区域:H3、H2、H1、L2和L1。在ΔSpeckles细胞中下调基因最显著地富集于GC含量最高的H3 isochore区域(图二I上)。其二,将每个基因分配到基于Hi-C数据划分的六个亚区室之中,ΔSpeckles下调基因富集于A1亚区室(图二I中)。其三,使用SPIN状态,该方法结合了Hi-C数据与靶向核斑、核纤层和核仁的邻近标记技术,将基因组分割为10种状态。ΔSpeckles下调基因富集于SPIN状态中的“核斑”(图二I下),这也是GC含量最高的SPIN状态。此外,将分析扩展到ENCODE子集里的RNA结合蛋白相关的RNA-seq数据中,均未观察到下调基因在H3 isochore区域中的富集程度能达到核斑扰动实验中的水平(图二J),表明这种下调模式是核斑扰动所特有的。以上数据表明,GC-rich基因组区域依赖于核斑的基因表达调控作用。

既往研究表明,核斑将剪接相关RNA结合蛋白(SR蛋白)凝聚在GC-rich短基因周围[8]。于是,研究者分析已发表的FLASH数据集,发现除SRSF10、SRSF12、TRA2A和TRA2B外,所有SR蛋白均富集在靠近核斑的外显子中,表明核斑将大多数SR蛋白局部凝聚于GC-rich基因上。使用rMATs进行剪接变化定量分析,在ΔSpeckles细胞中鉴定出852个差异变化的内含子保留事件,其中89%的事件(758/852)表现为内含子保留增加(图三A),提示剪接效率下降。这些事件来源于靠近核斑的基因(图三B右),证实了GC-rich、平齐型外显子-内含子结构容易发生内含子保留事件,与先前的研究相一致[9]。此外,在ΔSpeckles细胞中检测到差异变化的外显子跳跃事件比内含子保留事件高出了一个数量级,其中80%(4,287/5,359)表现为外显子跳跃增加(图三A),这些事件大部分也来源于靠近核斑的基因(图三B左)。作为比较,研究者同时去除TRA2A和TRA2B两个蛋白,已报道在人类细胞中调控数千个可变剪接事件[10]。TRA2A/B的联合去除导致了4,461个差异变化的外显子跳跃事件,其中77%(3,451/4,461)表现为外显子跳跃增加(图三A)。与ΔSpeckles细胞中检测到的外显子跳跃事件不同,TRA2A/B调控的外显子大多来源于远离核斑的基因(图三C),并且能够被TRA2A/B所结合。进一步分析基因组结构,发现ΔSpeckles细胞特异性变化的核斑依赖性剪接单元显著更短(图三D),GC含量异常升高(图三E),并呈现出平齐型外显子-内含子结构(图三F),与TRA2A/B依赖性调控具有显著不同(图三D-F)。

3.png

图三 破坏核斑导致SR蛋白凝聚受限,进而影响剪接[6]

ΔSpeckles细胞中外显子跳跃事件的普遍发生提示,靠近核斑基因的RNA剪接主要通过外显子定义而非内含子定义机制来进行识别的[3]。外显子定义的一个关键是依赖SR蛋白来界定剪接位点并稳定早期剪接体因子。为验证ΔSpeckles细胞中剧烈的外显子跳跃表型是否由靠近核斑基因的SR蛋白局部浓度急剧下降所引起,研究者针对SR蛋白的活性磷酸化形式(pSR)进行了FLASH实验。在野生型细胞中,pSR结合高度富集在核斑依赖性外显子上(图三G左)。在ΔSpeckles细胞中,这些外显子显示出pSR结合的严重下降(图三G),SR蛋白水平没有显著变化,表明pSR与核斑依赖性外显子结合的特定减少很可能是由于局部蛋白浓度下降所致。外显子定义被认为是一种进化机制,旨在应对脊椎动物中观察到的逐渐增大的内含子尺寸。在长基因中发生的外显子跳跃,通常导致相对简单的剪接结果。然而,靠近核斑的这些基因比较特殊,它们不仅内含子短,还通过外显子定义机制来识别外显子-内含子单元。若不能及时组装剪接复合体,可能导致多个不匹配的剪接位点同时暴露,从而引发复杂的剪接产物(图三H)。以上结果表明,核斑通过高效地凝聚剪接因子在GC-rich基因的外显子上,确保具有平齐型结构的GC-rich基因能够被准确加工。

剪接的复杂性可使用Whippet工具进行量化,该方法为每个剪接事件计算熵值。ΔSpeckles细胞中的剪接熵值显著高于对照组细胞(图四A)。在SR蛋白结合新生RNA及定义外显子后,由SF3复合体促进剪接供体位点与剪接受体位点之间的首次接触[11]。免疫荧光显示,SF3A2在ΔSON和ΔSpeckles细胞中完全弥散分布(图四B)。SF3B1的FLASH实验显示,在SON缺失的情况下,SF3B1与核斑依赖性外显子的结合丢失(图四C)。剪接与mRNA核输出相偶联且同步进行,核斑曾被推测参与RNA核输出[12]。因此,核斑的缺失或SON的去除可能导致mRNA在核内滞留以及基因表达下调。通过比较对照组与ΔSON细胞中核内RNA与总RNA的相对比例来分析核滞留情况。分析结果显示,与对照组相比,ΔSON细胞中有710个mRNA的核内RNA比例显著升高,而这些mRNA在细胞质中持续减少(图四D)。重要的是,大多数出现核滞留的基因在ΔSRRM2、ΔSON和ΔSpeckles细胞中均表达下调,并且这些基因多来源于GC-rich H3 isochore(图四E)。剪接调控失常继而引发无义介导的mRNA降解(NMD)是ΔSpeckles细胞中RNA下调的主要驱动因素。以上结果表明,由SON作为成核核心所形成的核斑提供了局部的高浓度SR蛋白、SF3复合体及其他因子,这对于确保短的、GC-rich、具有平齐型结构的基因进行有序剪接和核输出是必需的。在人类中,这种基因结构几乎仅存在于靠近核斑的区域,相比之下,远离核斑的基因不具有这种结构,也不受核斑缺失的影响(图四F)。

4.png

图四 ΔSpeckles细胞中剪接紊乱导致靶RNA降解[6]

最后,研究者探究平齐型/差异型的外显子-内含子结构和基因-核斑定位之间的进化相关性。比较了人类核斑依赖性外显子与非依赖性外显子及其侧翼内含子在脊椎动物中的直系同源物。结果显示,核斑依赖性外显子在羊膜动物中GC含量增加,在哺乳动物中达到峰值,而非依赖性外显子的GC含量则保持恒定。类似地,核斑依赖性外显子周围的内含子在鱼类中GC含量较低,但在羊膜动物中GC含量显著上升,而非依赖性内含子在所有脊椎动物中始终保持低GC含量(图五A)。核斑依赖性内含子在鱼类的直系同源物长度是哺乳动物的五倍,这些内含子在两栖动物中甚至更长,但在羊膜动物中经历了明显的缩短事件,在哺乳动物中达到最短(图五B)。此前研究表明,核斑的核心蛋白SON从低等动物中的约600个氨基酸扩展至某些脊椎动物中的约5000个氨基酸,这一扩展主要由编码内在无序区(IDR)的单个外显子的扩增所驱动(图五C和D),提示SON作为核斑的主要支架蛋白,其成核能力与其不断扩展的IDR长度协同演化。

5.png

图五 SON蛋白的IDR扩展与核斑的进化密切相关[6]

为测试SON蛋白进化中不同IDR如何影响其成核特性及剪接结果,研究者构建了多种SON构建体,分别编码来自不同物种的SON全长直系同源物(图五D)。过表达人全长SON能够完全恢复ΔSON细胞的典型核斑形态(图五E),并且能挽救大多数观察到的剪接缺陷(图五F和H)。无脊椎动物和鱼类的SON蛋白较小且IDR含量低,但仍编码高度保守的C端,且在C端之后均含有一个短IDR(图五D)。当在ΔSON人类细胞中过表达这两个直系同源物时,均未能恢复核斑形态(图五E),也未能挽救剪接缺陷(图五F),提示C末端短IDR的作用小。推测维持核斑凝聚所需的主要因素编码在SON的长IDR中。为验证这一点,研究者构建了SONΔC构建体,该构建体包含人源SON的IDR但缺少保守的C端。作为对照,还构建了仅含C端的SONC-term-only(图五D)。与短的直系同源物类似,SONC-term-only既不能恢复核斑形态(图五G),也不能挽救剪接缺陷(图五H)。该构建体弥散分布于核质中,部分富集于核仁(图五G)。相比之下,SONΔC能够恢复核斑形态(图五G),且能够挽救大部分剪接缺陷,尽管挽救效率低于全长SON(图五H),提示尽管保守C端是SON充分发挥功能所必需的,但SON在剪接中的作用主要由快速演化的长IDR所驱动。以上结果表明,人源SON的IDR既是维持核斑凝聚所必需的,也是促进精确剪接的充分条件。

综上所述,该研究在人类细胞中系统地表征了核斑在靶基因的表达调控、细胞核结构与染色质空间结构维持中的作用。揭示了SON与SRRM2两种蛋白共同形成一个具有粘弹性特性的核斑结构,能够限制染色质的随机运动,并且靶向基因组的GC-rich区域对其mRNA剪接加工至关重要。核斑通过提供局部高浓度的剪接相关RNA结合蛋白(SR蛋白)、维持SF3复合体定位,保证GC-rich靶基因的正确剪接、促进其RNA核输出并防止RNA降解。该研究展现了物种间的基因组进化与RNA加工结构的协同进化,GC-rich isochore区域与核斑均为羊膜动物所特有,其中SON蛋白的内在无序区(IDR)扩展是其进化演变的分子基础。该研究首次证明了核斑对GC-rich基因表达调控的直接作用,对深度理解基因表达调控、基因组演化以及相关疾病机制具有重要意义。

关于GTP.gif

GTP研发中心负责实施基因组标签计划(Genome tagging project, GTP),基于自主知识产权的类精子干细胞介导半克隆技术,为全基因组的功能基因一一贴上标签,致力于构建标签细胞和标签小鼠资源库。类精子干细胞是从精子来源单倍体囊胚中建系获得的一种孤雄单倍体胚胎干细胞,将其注入卵母细胞,能够像精子一样支持整个胚胎发育过程,产生健康的半克隆小鼠。GTP研发中心在类精子干细胞的蛋白质编码基因上原位敲入标签序列,建立了液氮保存的标签细胞资源库。研究需要时,利用半克隆技术将标签细胞注射到小鼠卵母细胞中,一步法获得标签小鼠。

联系我们.gif

已有标签产品可直接订购,详情查阅以下官网链接。如有需要欢迎联系,我们将竭诚为您服务。

标签细胞网址:

http://www.sibcb.ac.cn/gtp/

标签小鼠网址:

http://www.sibcb.ac.cn/gtp/msearch.jsp

邮箱:gtp_order@sibcb.ac.cn

地址:上海市岳阳路320号

 

责任编辑:多一百

新媒体运营:suway

 

参考文献

1. Rao SS, Huntley MH, Durand NC, Stamenova EK, Bochkov ID, Robinson JT, Sanborn AL, Machol I, Omer AD, Lander ES et al: A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping. Cell 2014, 159(7):1665-1680.

2. Lieberman-Aiden E, van Berkum NL, Williams L, Imakaev M, Ragoczy T, Telling A, Amit I, Lajoie BR, Sabo PJ, Dorschner MO et al: Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science 2009, 326(5950):289-293.

3. Tammer L, Hameiri O, Keydar I, Roy VR, Ashkenazy-Titelman A, Custódio N, Sason I, Shayevitch R, Rodríguez-Vaello V, Rino J et al: Gene architecture directs splicing outcome in separate nuclear spatial regions. Molecular cell 2022, 82(5):1021-1034.e1028.

4. Quinodoz SA, Ollikainen N, Tabak B, Palla A, Schmidt JM, Detmar E, Lai MM, Shishkin AA, Bhat P, Takei Y et al: Higher-Order Inter-chromosomal Hubs Shape 3D Genome Organization in the Nucleus. Cell 2018, 174(3):744-757.e724.

5. Spector DL, Lamond AI: Nuclear speckles. Cold Spring Harb Perspect Biol 2011, 3(2).

6. Małszycki M, Martina L, Ilık İ A, Salgado Figueroa D, Dasgupta N, Çoşar MF, Kim KT, Carraco G, Fauler B, Meierhofer D et al: Nuclear speckles enable processing of RNA from GC-rich isochores. Cell 2026, 189(7):2024-2039.e2025.

7. Ilik İ A, Malszycki M, Lübke AK, Schade C, Meierhofer D, Aktaş T: SON and SRRM2 are essential for nuclear speckle formation. Elife 2020, 9.

8. Mintz PJ, Spector DL: Compartmentalization of RNA processing factors within nuclear speckles. Journal of structural biology 2000, 129(2-3):241-251.

9. Barutcu AR, Wu M, Braunschweig U, Dyakov BJA, Luo Z, Turner KM, Durbic T, Lin ZY, Weatheritt RJ, Maass PG et al: Systematic mapping of nuclear domain-associated transcripts reveals speckles and lamina as hubs of functionally distinct retained introns. Molecular cell 2022, 82(5):1035-1052.e1039.

10. Best A, James K, Dalgliesh C, Hong E, Kheirolahi-Kouhestani M, Curk T, Xu Y, Danilenko M, Hussain R, Keavney B et al: Human Tra2 proteins jointly control a CHEK1 splicing switch among alternative and constitutive target exons. Nature communications 2014, 5:4760.

11. Wahl MC, Will CL, Lührmann R: The spliceosome: design principles of a dynamic RNP machine. Cell 2009, 136(4):701-718.

12. Galganski L, Urbanek MO, Krzyzosiak WJ: Nuclear speckles: molecular organization, biological function and role in disease. Nucleic acids research 2017, 45(18):10350-10368.


转载请注明来源于【GTP研发中心】

声明:本文仅用于分享,不代表GTP研发中心立场,若有侵权,请及时联系我们第一时间更正!

文末关注.gif

文末公众号二维码.png



【返   回】

需要更多信息

For more information,please contact us


我要留言

Copyright © 2018-2028 | 中国科学院分子细胞科学卓越中心版权所有

备案号:沪ICP备2021025838号