技术分享:细胞内蛋白质编辑技术实现非天然氨基酸插入内源蛋白质
技术发展是推动生物医学科学进步的关键,促使研究人员更精准地解析和理解细胞互作、信号通路及分子活动。CRISPR-Cas9基因编辑技术的发展彻底改变了生物医学研究,实现了对内源基因位点的精确操控,包括添加表位标签,荧光蛋白及配体结合域等[1]。在哺乳动物细胞中研究蛋白质有着许许多多的方法,但大多数方法都依赖于标记目标蛋白质,从而实现高特异性的实验结果[2]。标记技术便于对目标蛋白质开展各种研究,例如通过显微镜技术进行细胞内可视化定位,鉴定其互作网络,或在实验过程中进行动态追踪等[3]。而蛋白标签的选择较多,从短肽片段如1.1 kDa的HA标签到较大体积的如28 kDa绿色荧光蛋白等等。
尽管哺乳动物细胞的蛋白质研究已取得丰硕成果,但现有技术仍存在着局限性。现有标签技术仅限于基因编码元件,这意味着非蛋白源性的小分子如荧光基团、光交联剂或亲和基团,在常规细胞生物学实验中仍未被充分利用。将小分子与目标蛋白质偶联具有多重优势:标记物体积小,干扰程度低,且在显微镜成像和蛋白质分离等应用中表现良好。虽然抗体技术为哺乳动物细胞的蛋白质追踪提供了替代方案,但其同样受限于抗体分子的大体积,特异性以及与活细胞实验的不兼容性。最后,多数细胞生物学方法难以捕捉短时程动态生物学过程,常进行稳态分析。以细胞信号转导为例,该过程通常在分钟至小时尺度内快速完成[4],但现有技术体系往往无法实时解析此类瞬时事件。表明目前尚不存在能够实验性追踪或操控蛋白质的通用方法。因此,需要开发更多新型的多样化标记技术来提升蛋白质的可及性并准确维持其生物学特性。
2025年5月,Science期刊报道了一种蛋白质编辑技术,实现对哺乳动物细胞内的蛋白质一级氨基酸序列进行翻译后编辑。该技术依赖于两对正交的分裂内含肽,串联使用时,通过特定排列实现两个分裂结构域间序列的置换,最终实现几乎无痕的蛋白质编辑。利用该技术成功将标签蛋白、非天然氨基酸、荧光团和生物素等引入外源性和内源性蛋白质,用于时间分辨率的蛋白追踪和功能分析[5]。
多项研究表明,两个正交分裂内含肽对可串联使用,通过特定排列实现两个分裂结构域间序列的置换。受此启发,研究者设想建立一种哺乳动物细胞内的蛋白质一级序列修饰平台(图一A)。研究者筛选了两种特征明确的分裂内含肽:Gp41-1和AvaN:NpuC。Gp41-1是当前已知最快的分裂内含肽,生理条件下剪接半衰期仅约5秒[6]。AvaN:NpuC作为经典DnaE Npu分裂内含肽的最新衍生变体,同样具有较快的剪接速率,体外剪接半衰期约1分钟[7]。将分裂内含肽的N端和C端结构域分别构建于两个载体,称为"内含肽受体"和"内含肽供体",供体上分裂内含肽结构域之间的序列可被插入受体。经剪接反应后,四个分裂内含肽结构域将从蛋白质构建体中精准切除(图一B),从而在蛋白质一级序列上实现近乎无痕的编辑。
图一 通过串联分裂内含肽系统,在哺乳动物细胞内实现蛋白质的肽段交换[5]
研究者选择内质网膜伴侣蛋白钙连蛋白(CANX)作为模型靶标。首先构建一种哺乳动物细胞瞬时表达质粒:以FLAG标签标记的钙连蛋白序列为骨架,在第14号外显子后插入内含肽受体构建体(定位于胞质C端区域)。该受体构建体包含Gp41-1N与NpuC两个内含肽结构域,其间连接mClover3荧光蛋白和Myc标签(CANX1-595-Gp41-1N-mClover3-Myc-NpuC)。将mClover3替换为mNeonGreen211(mNG211)构建替代版本(CANX1-595-Gp41-1N-mNG211-Myc-NpuC)。在HEK293T细胞中瞬时共表达上述两种钙连蛋白内含肽受体与携带HA标签的内含肽供体(Gp41-1C-HA-AvaN)后,成功检测到内部插入HA标签的编辑后的钙连蛋白。随后,建立稳定表达含有mClover3或mNG211的钙连蛋白-内含肽受体构建体的HEK293 TREx FlpIn细胞系,其中修饰后的钙连蛋白受四环素(Tet)诱导表达(图一C)。在这些细胞系中瞬时表达携带HA标签的内含肽供体后,成功将HA标签插入钙连蛋白内部位点(图一C和D)。接着,在HAP1细胞中对CANX基因进行内源性标记,先细胞打靶分别插入含有mClover3或mNG211的内含肽受体构建体,使其整合至钙连蛋白第14号外显子下游(图一E),发现用Myc抗体或钙连蛋白抗体均可检测到分子量更大的内含肽受体标记的钙连蛋白(图一F)。当在这些细胞中瞬时表达带有HA标签的内含肽供体时,观察到编辑后的钙连蛋白-HA产物形成(图一G)。
为实现在外源性表达蛋白或内源性蛋白的内部化学修饰的目的,研究者尝试在大肠杆菌中制备重组内含肽供体蛋白。已知分裂内含肽是一类不稳定且无序的蛋白质,重组表达时易发生聚集沉淀。因此,在带有HA标签的内含肽供体构建体中加入N端SUMO可溶性标签,经过充分优化后,最终获得足量的纯化蛋白,随后电转入钙连蛋白内源性标记内含肽受体-mNG211的HAP1细胞系中(图二A)。结果观察到新形成的带有HA标签的钙连蛋白产物,同时伴随预期的Myc信号减弱(图二B)。此外,发现含mClover3的内含肽受体会导致不完全剪接并产生非目标副产物。进一步确认编辑后钙连蛋白的分子特性并验证两对内含肽是否均完成剪接。选用表达FLAG-钙连蛋白–内含肽受体–mNG211的HEK293 TREx FlpIn稳定细胞系,电转携带HA的内含肽供体或不含内含肽供体的对照样本。通过抗FLAG亲和树脂分离FLAG标记的钙连蛋白复合物,经蛋白质印迹(WB)验证富集效果(图二C)后,对所得蛋白进行胰酶消化和液相色谱-串联质谱(LC-MS/MS)分析。获得了编辑后钙连蛋白-HA产物的大部分序列覆盖(图二C和D),并检测到跨越两个剪接位点的肽段,证实两对分裂内含肽均完成剪接并形成预期产物(图二E和F)。为检测内源性标记内含肽受体的剪接速度,在电转携带HA的内含肽供体后不同时间点收集细胞,在最早可检测的10分钟就可观察到完全编辑的钙连蛋白-HA产物(图二G)。同时发现,Myc-钙连蛋白-内含肽受体在初始时间点几乎完全耗竭,随后随着蛋白重新合成信号逐渐增强(图二G)。以上数据表明,重组内含肽供体可用于蛋白质编辑,双内含肽剪接在细胞内极为迅速,可实现时间分辨率的新蛋白生成。
图二 在哺乳动物细胞中利用重组蛋白实现编辑钙连蛋白[5]
接着,研究者验证上述蛋白质编辑方法的普适性,将其应用于定位和功能各异的多种蛋白。选取了细胞骨架组分βactin和α-actinin-1、激酶Chk1以及转录因子c-Myc作为模型系统。在βactin第2号和第5号外显子下游分别插入含mNG211的内含肽受体,并构建Tet诱导的HEK293 TREx FlpIn细胞系。电转携带HA标签的内含肽供体后,两种βactin-内含肽受体细胞系均产生高效的βactin-HA产物(图三A-C)。该系统同样具有快速编辑特性,电转后10分钟内即可形成完全剪接的βactin蛋白(图三D)。此外,内含子标记技术也成功应用于α-actinin-1的编辑。
图三 对细胞内多种蛋白质进行蛋白质编辑并实现动力学调控[5]
进一步应用于细胞关键激酶Chk1。激酶作为细胞信号网络的核心组分,其研究常面临三大挑战:动力学调控手段缺乏,特异性抑制剂不足和信号通路适应性补偿效应。Chk1在DNA损伤应答中扮演关键角色——被ATR激酶磷酸化后,作为信使激活下游效应蛋白。研究者采用序列替换后恢复的创新设计:用含Myc标签和mNG211的内含肽受体替换Chk1第315-348位氨基酸,通过蛋白编辑将原始序列精准复原,仅引入2个必需的外显肽突变。电转携带Chk1315-348的内含肽供体蛋白后检测到预期大小的编辑后Chk1产物(图三E和F),且同样具有快速编辑特性。验证编辑后的Chk1是否保持DNA损伤应答功能。羟基脲(HU)诱导DNA损伤时,ATR激酶会在Chk1的Ser345位点进行磷酸化修饰[8]。HU处理后,在编辑组细胞裂解物中观察到Chk1 pSer345反应条带,该条带对应被磷酸化的编辑后Chk1(图三G),表明编辑后的Chk1仍能被ATR识别,并响应DNA损伤发生正常磷酸化,证明蛋白编辑技术可在保留关键功能位点的前提下实现精准修饰。
随后,研究者探究这种蛋白编辑技术能否用于研究蛋白质稳态和周转。传统方法通常使用翻译延伸抑制剂环己亚胺,然而该方法存在显著缺陷,如长期细胞毒性和系统干扰引入混杂变量。选择致癌转录因子c-Myc作为研究对象[9],构建C端带有FLAG标签的c-Myc-内含肽受体,包含mNG211和V5表位标签,并靶向替代c-Myc的46-70氨基酸(图三H)。设计携带核定位信号(NLS)的重组c-Myc46-70内含肽供体,电转入稳定表达c-Myc-内含肽受体的细胞后,出现新的c-Myc抗体反应条带,伴随V5信号消失(图三H和I)。互作组分析显示,c-Myc-内含肽受体与编辑后c-Myc的相互作用谱高度相似(图三J)。测定剪接后c-Myc蛋白的半衰期,在电转后的不同时间点采集细胞样本,WB定量分析显示编辑后的c-Myc蛋白表现出预期的快速周转特性(t1/2 = 41分钟,图三K和L),与既往环己亚胺处理条件下报道的半衰期数据高度一致[10]。验证编辑后c-Myc的生物学功能,检测其与经典靶位点的结合能力。显示编辑后c-Myc-FLAG与DNA的结合模式符合预期,在启动子区域呈现显著富集,其基因组定位特征与FLAG-c-Myc及内源性c-Myc高度相似(图三M-O)。此外,三组样本的高置信度结合峰基因集存在显著重叠(图三P)。以上数据表明,编辑后c-Myc保留完整的DNA结合能力,能精准定位至特征性基因组位点。
接下来,研究者将蛋白质编辑技术拓展至基因编码功能之外。在大肠杆菌中利用遗传密码扩展技术(GCE)将点击化学手柄引入重组内含肽供体,点击化学手柄可以被标记,然后使用蛋白质编辑技术将标记物插入到感兴趣的蛋白质中。GCE利用终止密码子将非天然氨基酸(ncAA)掺入到蛋白质中,再结合点击反应对蛋白质实现定点标记。选择叠氮基苯丙氨酸(pAzF)作为ncAA,因为它具有点击化学手柄和光交联剂的功能。携带pAzF的最小内含肽供体包含外显子残基和pAzF,最终导致七个残基(包括pAzF)插入到感兴趣的蛋白质中。使用各种点击化学反应将一组小分子标记物,包括生物素、荧光团(Fluor488、TAMRA和Alexa Fluor 647)、Gly-Gly-Gly肽和糖GlcNAc,与纯化的内含肽供体pAzF结合(图四A)。随后,测试含有TAMRA和生物素的内含肽供体能否插入到哺乳动物细胞中的蛋白质中。使用先前构建的含有βactin-内含肽受体的稳定HEK293 TREx FlpIn细胞系,将携带HA标签或经TAMRA/生物素标记的pAzF内含肽供体电转入细胞。发现在各自处理组中观察到约44 kDa处的HA标签,TAMRA和生物素信号,编辑后的βactin在预期分子量(~44 kDa)处显示FLAG信号,Myc标签的消失表明分裂内含肽存在剪接(图四B和C,图四C将ACTB错误写成CANX)。ActinTracker染色后,观察到TAMRA呈现弥散的胞质分布,同时在细胞膜处有部分富集(图四D)。在电转后不同时间点固定细胞,结果显示标记βactin的TAMRA信号持续存在超过24小时,这与βactin的较长半衰期相符,而野生型细胞中的TAMRA信号在电转后4小时内即降至背景水平(图四E和F)。用脂质纳米粒(LNP)递送重组蛋白供体,发现仅在LNP处理组中检测到TAMRA反应条带,对应编辑后的钙连蛋白-TAMRA及内含肽供体(图四G)。以上数据表明,这种蛋白质编辑技术可以将非天然氨基酸与生物标记物插入到蛋白质中。
图四 在稳定细胞系中将非天然氨基酸及生物标记物插入蛋白质[5]
最后,研究者将该方法应用于内源蛋白的位点特异性标记,实现非破坏性且多样化的化学修饰。利用钙连蛋白内源性标记内含肽受体的HAP1细胞系,电转导入含HA标签或经TAMRA/生物素标记的pAzF内含肽供体。针对不同标记物的WB检测,观察到钙连蛋白分子量的增加与标记物的插入相符(图五A和B)。使用共聚焦显微镜观察编辑后内源性钙连蛋白的亚细胞定位,TAMRA荧光信号定位于内质网(ER),与钙连蛋白的定位特征相符,并通过内质网标志物ConA共染色得到验证(图五C和D)。来自ER的TAMRA信号持续了约8小时以上,而内含肽供体-TAMRA电转入野生型HAP1细胞时,初期可见荧光弥散分布于整个细胞及点状结构中,但信号随时间逐渐减弱(图五E)。在内源性标记的HAP1细胞中,将生物素编辑至钙连蛋白,使用链霉亲和素琼脂糖成功实现下拉实验(图五F)。下拉的蛋白富集后,通过LC-MS/MS分析鉴定出多个钙连蛋白的特征肽段(图五G)。以上数据表明,该蛋白质编辑技术可以将非天然氨基酸编辑至内源性蛋白,用于下游的分离与分析。
图五 将携带功能标记的pAzF编辑至内源性钙连蛋白[5]
综上所述,该研究开发了一种可在哺乳动物活细胞中对蛋白质一级序列进行翻译后编辑的技术,实现外源性和内源性蛋白质的近乎无痕的精准编辑。通过引入荧光基团、生物素等功能分子,可以进行经典的细胞生物学实验如显微镜观察或下拉实验,和具有时间分辨率的短时程动态生物学过程。该技术对现有技术进行了扩充。
然而,该方法操作复杂导致效率不高,先进行一轮细胞打靶建系、体外纯化蛋白、再将纯化蛋白导入细胞,细胞内实现的蛋白质编辑时效性短,使得实验及观测时程短,因而更适用于体外细胞的外源性蛋白质编辑,很难应用于内源性低表达的目标蛋白质。此外,该方法对内源性蛋白质的编辑位点有限,只能插入在外显子之间,使得不同蛋白质的内源标记普适性较低。
GTP研发中心拥有自主知识产权的“人造精子细胞”介导的半克隆技术,可在体外实现“人造精子细胞”的多位点改造并进行功能元件测试,最后将“人造精子细胞”通过卵母细胞注射可以一步法获得基因改造小鼠。基于“人造精子细胞”单倍体打靶高效率的优势,可快速构建定制化小鼠,如基因组安全位点大片段敲入、条件性基因敲除/敲入和人源化基因改造等。多个复杂调控元件可以通过多次体外细胞打靶构建在同一株“人造精子细胞”中,经细胞水平质控后,一步法获得基因改造小鼠。
如有需要欢迎联系我们,GTP研发中心将竭诚为您设计最佳方案,制定专属于您的基因改造小鼠。
网址:http://www.sibcb.ac.cn/gtp/
地址:上海市岳阳路320号
责任编辑:甜点
新媒体运营:suway
参考文献
1. Serebrenik YV, Mani D, Maujean T, Burslem GM, Shalem O: Pooled endogenous protein tagging and recruitment for systematic profiling of protein function. Cell genomics 2024, 4(10):100651.
2. Rood JE, Hupalowska A, Regev A: Toward a foundation model of causal cell and tissue biology with a Perturbation Cell and Tissue Atlas. Cell 2024, 187(17):4520-4545.
3. Vandemoortele G, Eyckerman S, Gevaert K: Pick a Tag and Explore the Functions of Your Pet Protein. Trends in biotechnology 2019, 37(10):1078-1090.
4. Valls PO, Esposito A: Signalling dynamics, cell decisions, and homeostatic control in health and disease. Current opinion in cell biology 2022, 75:102066.
5. Beyer JN, Serebrenik YV, Toy K, Najar MA, Feierman E, Raniszewski NR, Korb E, Shalem O, Burslem GM: Intracellular protein editing enables incorporation of noncanonical residues in endogenous proteins. Science 2025, 388(6746):eadr5499.
6. Carvajal-Vallejos P, Pallissé R, Mootz HD, Schmidt SR: Unprecedented rates and efficiencies revealed for new natural split inteins from metagenomic sources. The Journal of biological chemistry 2012, 287(34):28686-28696.
7. David Y, Vila-Perelló M, Verma S, Muir TW: Chemical tagging and customizing of cellular chromatin states using ultrafast trans-splicing inteins. Nature chemistry 2015, 7(5):394-402.
8. Petermann E, Orta ML, Issaeva N, Schultz N, Helleday T: Hydroxyurea-stalled replication forks become progressively inactivated and require two different RAD51-mediated pathways for restart and repair. Molecular cell 2010, 37(4):492-502.
9. Grandori C, Cowley SM, James LP, Eisenman RN: The Myc/Max/Mad network and the transcriptional control of cell behavior. Annual review of cell and developmental biology 2000, 16:653-699.
10. Gregory MA, Hann SR: c-Myc proteolysis by the ubiquitin-proteasome pathway: stabilization of c-Myc in Burkitt's lymphoma cells. Molecular and cellular biology 2000, 20(7):2423-2435.