融合蛋白表达系统常遇问题
研究者们在分离到某一基因后,要对其编码蛋白质进行研究最理所当然的工作就是表达――即:有目的性地合成外源基因产物。在重组 DNA技术的发展早期,人们认为在基因的前面有一个强启动子和一个起始密码子就足以在大肠杆菌中获得很好的表达。随后,认识到获得有效的翻译所需的条件要复杂得多,除了要有强启动子和起始密码子外,良好的表达尚需编码目的蛋白的mRNA中含有核糖体结合位点,表达水平受密码子喜好程度的影响,也受编码序列中其他目前尚未明了的因素影响。通过改变起始密码子前端的序列,或者在不改变蛋白质序列的条件下利用密码子的简并性改变5’末端编码序列往往有助于解决问题。
通常,两个基因之间的融合表达能更快地解决这些问题。在这种方式中,目的基因被引入某个高表达蛋白序列(fusion tag)的3’末端,比如大肠杆菌 的一段序列,或者任一可在大肠杆菌中高度表达的基因,它提供良好表达所必需的信号,而表达出的融合蛋白的N末端含有由fusion tag编码的片段。fusion tag所编码的可能是整个功能蛋白或是其中的部分。比如6x His Tag、β-半乳糖苷酶融合蛋白和trpE融合蛋白、谷胱甘肽S-转移酶(GST)融合蛋白以及硫氧还蛋白(Trx)融合蛋白等。
由于利用tag的特性通常可以对融合蛋白进行亲和层析等分离提纯,更多情况下选择融合表达是为了简化重组 蛋白的纯化。因此出现两种融合表达类型:一是fusion tag位于目的蛋白的N端,这时tag可以提供良好表达所必需的信号,帮助提高目的蛋白的表达,缺点是纯化的表达产物中可能会有不完整的目的蛋白,原因是在翻译过程中意外中断的少量(C端)不完整的表达产物会一起被纯化。另一是fusion tag位于目的蛋白的C端,这可以保证只有完整的表达产物才会被纯化。当目的蛋白的功能区位于N端时,fusion tag位于C端可能减少对其功能的影响,反之亦然。
进行融合蛋白的表达经常会遇到三个问题,它们是:表达蛋白的溶解性、稳定性和fusion tag的存在。前两个问题在融合蛋白表达 系统和非融合蛋白表达系统都会遇到,而第三个问题是融合蛋白系统所独有的。
裂解融合蛋白以除去fusion tag
为了对目的蛋白进行生化及功能分析,通常要从目的蛋白上去除fusion tag部分。早期已建立了数种对融合蛋白进行位点特异性裂解的方法。化学裂解如溴化氰(Met↓)、BNPS-3-甲基吲哚(Trp↓)、羟胺(Asn↓Gly)等,不但便宜且有效,往往还可以在变性条件下进行反应。但由于裂解位点的特异性低和可能对目的蛋白产生的不必要修饰,使该法渐渐被酶解法取代。酶解的方法相对来说反应条件较温和,更重要的是,普遍用于此用途的蛋白酶都具有高度的特异性。其中有用的酶有:Xa因子、凝血酶、肠激酶、凝乳酶、胶原酶。所有这些酶都具有较长的底物识别序列(如在凝乳酶中为7个氨基酸),从而降低了蛋白质中其他无关部位生断裂的可能性。而酶解法存在成本高(这些蛋白酶价格一般都相当昂贵),反应时间长等问题,更重要的是蛋白酶本身不可避免地会混入目的蛋白中,造成新的污染,提高纯化的复杂性。
IMPACT系统的推出是融合表达系统的一个重大突破。该系统最大的优点是表达的融合蛋白无需蛋白酶裂解即可实现目的蛋白与fusion tag的精确切割。IMPACT(Intein Mediated Purification with an Affinity Chitin-binding Tag)系统利用一个来源于枯草杆菌的5kDa大小的几丁质结合域(chitin binding domain,用于亲和纯化)和一个来源于酵母intein 蛋白质组成一个双效的fusion tag,再与克隆到多克隆位点的目的基因融合表达。Intein是一个蛋白质剪接元件,类似于基因组 中的内含子intron在RNA的剪接中所起的重要作用,intein在较低的温度和还原条件下发生自身介导的N端裂解,可以释放出与之相连的目的蛋白。也就是说融合表达产物在挂上亲和层析柱后只需要在低温(4度)条件下用含DTT,或者巯基乙醇,或者半胱氨酸的溶液洗脱,即可将目的蛋白洗脱,而将fusion tag留在纯化柱上。而还原剂的小分子可以非常简单的去除。该系统的出现是融合表达系统的重大突破,完全避免了蛋白酶的使用,不但可以有效降低成本,提高效率,也避免了蛋白酶与目的蛋白的分离纯化的麻烦。
随后推出的IMPACT-CN系统提供了两种选择,即fusion tag可以选择在目的蛋白的C端或者N端,使克隆或表达都能满足不同需要。但是这一系统仍然有一个缺陷,那就是含有较多二硫键的蛋白不适用这一系统,因为还原剂的存在会破坏/影响蛋白的二级结构。
IMPACT―TWIN的推出为我们带来了更大的惊喜。在多克隆位点的两端各有一段intein和几丁质结合域的fusion tag,提供了三种选择:1、在克隆时切掉N端的fusion tag 1,插入目的基因,同原来的系统一样,可以在表达产物挂上亲和纯化柱后加入还原剂,将目的蛋白从fusion tag上解离并洗脱下来,得到的目的蛋白C端带有硫酯键,可以直接用于连接一个标记物、非编码氨基酸或者另一个蛋白;2、在克隆时切掉C端的fusion tag 2并插入目的基因,当表达产物挂上亲和纯化柱时只需要改pH值和温度(pH7,25度)即可将目的蛋白从fusion tag上解离并洗脱下来。这不但避免了蛋白酶的使用,更重要的是也避免了还原剂对含丰富二硫键的蛋白二级结构的破坏。由于调节缓冲液的pH值非常方便且无需另外去除洗脱产物中的还原剂,这大大地简化了目的蛋白的纯化过程,也扩大了该系统的应用范围。3、可以将目的基因插入两个fusion tag之间,这样表达产物的两端都含有fusion tag,当产物挂上亲和纯化柱并经过两级洗脱后,由于目的蛋白两端分别有一个硫酯键和半胱氨酸,可以自身环化得到环形蛋白。
表达蛋白的可溶性
在大肠杆菌中许多外源蛋白的高水平表达最后都会导致形成包涵体,它是致密的不溶性蛋白和RNA的凝聚体,含有大部分的表达蛋白。蛋白质沉淀形成包涵体有利的一面是可以利用包涵体的不溶性和致密性,通过超声波破碎、离心就能相对容易地对之进行初级纯化。此外,以可溶性蛋白形式表达时往往易被降解的蛋白质,以包涵体形式表达时却可以很稳定。纯化时,可用盐酸胍或尿素变性溶解包涵体中的蛋白质。透析除去变性剂后,蛋白质可重新折叠复性。然而这种方法亦有其弊端,经变性/复性后正确折叠的蛋白质的产量不稳定,有时会很低,更有些蛋白尤其是大蛋白基本上不能正确进行重折叠。
当包含体复性后的产量太低,而所需表达的是可溶性蛋白时,有多种解决方法可供尝试。一个重要的变量就是温度,由于尚未明了的原因,高温(37℃和42℃)会促进包涵体形成,低温(30℃)的抑制其形成;另一个变量是表达水平,有时降低表达水平可增加可溶蛋白比例;第三个变量是携带表达载体的细胞株背景,不同的受体菌株表达出的特定蛋白的可溶性有显著的差异,但各株间究竟是何种遗传差异决定了溶解性的差异仍属未知;最后,值得注意的是,改变fusion tag往往可以影响所表达的融合蛋白的溶解性。
表达蛋白的稳定性
在大肠杆菌中表达外源蛋白,尤其是真核蛋白时,经常会遇到稳定性的问题。包含体有助于稳定融合蛋白;采用缺失已知蛋白酶的大肠杆菌株作为宿主也是解决的方法之一。比如,缺失数种胞质蛋白酶的lon htpR双突变株可减少不稳定蛋白质的降解。与之相似的是,degP突变株可稳定胞质中的融合蛋白、ompT突变株被证实在蛋白质的粗提过程中能避免一些非融合蛋白中暴露的碱性氨基酸残基之间的肽键发生断裂(如Arg-Arg)。最后,对于某一特定融合蛋白来说,在不同的野生型实验株内其稳定性亦有差异,可能归因于不同株内蛋白酶的水平不同。