真核细胞常见的表达载体
蛋白表达技术全攻略
真核细胞常见表达载体
1. pCMVp-NEO-BAN载体
特点: 该真核细胞表达载体分子量为6600碱基对,主要由CMVp启动子、兔β-球蛋白基因内含子、聚腺嘌呤、氨青霉素抗性基因和抗neo基因以及pBR322骨架构成, 在大多数真核细胞内都能高水平稳定地表达外源目的基因。
更重要的是,由于该真核细胞表达载体中抗neo基因存在,转染 细胞后,用G418筛选,可建立稳定的、高表达目的基因的细胞株。
插入外源基因的克隆位点包括Sal1、BamH1和EcoR1位点。注意在此载体 中有二个EcoR1位点存在。
2. pEGFP, 增强型绦色荧光蛋白表达载体 (Enhanced Fluorecent Protein Vector)
特点: pEGFP表达载体中含有绿色荧光蛋白,在PCMV启动子驱动下,在真核细胞中高水平表达。载体骨架中的SV40 origin使该载体在任何表达SV40 T 抗原的真核细胞内进行复制。
Neo抗性盒由SV40早期启动子、Tn5的neomycin/kanamycin抗性基因以及HSV-TK基因的聚腺嘌呤信号组成,能应用G418筛选稳定转染的真核细胞株。此外, 载体中的pUC origin 能保证该载体在大肠杆菌中的复制, 而位于此表达盒上游的细菌启动子能驱动kanamycin抗性基因在大肠杆菌中的表达。
用途: 该表达载体EGFP上游有Nde1、Eco47111和Age1克隆位点,将外源基因扦入这些位点,将合成外源基因和EGFP的融合基因。 借此可确定外源基因在细胞内的表达和/或组织中的定位。
亦可用于检测克隆的启动子活性(取代CMV启动子,Acet1-Nhe1)。
Excitation maximum = 488 nm; Emission maximum = 507
图示为启动子分泌信号肽和多克隆位点区域:
Ase1.pCMV…ccg cta gcg cta ccg gtc gcc acc atg- .EGFP…BamH1…SV40 poly A+
Nhe1 Age1
3. pEGFT-Actin, 增强型绿色荧光蛋白/人肌动蛋白表达载体
特点: pEGFP-Actin表达载体中含有绿色荧光蛋白和人胞浆β-肌动蛋白基因,在PCMV启动子驱动下,在真核细胞中高水平表达。载体骨架中的SV40 origin使该载体在任何表达SV40 T 抗原的真核细胞内进行复制。
Neo抗性盒由SV40早期启动子、Tn5的neomycin/kanamycin抗性基因以及HSV-TK基因的聚腺嘌呤信号组成,能应用G418筛选稳定转染的真核细胞株。此外, 载体中的pUC origin 能保证该载体在大肠杆菌中的复制, 而位于此表达盒上游的细菌启动子能驱动kanamycin抗性基因在大肠杆菌中的表达。
用途: pEGFP-Actin载体在真核细胞表达EGFP-Actin融合蛋白,该蛋白能整合到胞内正在生的肌动蛋白,因而在活细胞和固定细胞中观察到细胞内含肌动蛋白的亚细胞结构。
Excitation maximum = 488 nm; Emission maximum = 507
图示为启动子和多克隆位点区域:
pCMV….Nhe1….Age1….EGFP…Bgl11…Actin…BamH1…SV40 poly A+
4. pSV2表达载体
特点:该表达质粒是以病责SV40启动子驱动在真核细胞目的基因进行表达的,克隆位点为Hind111。SV40启动子具有组织/细胞的选择特异性。此载体不含neo基因,故不能用来筛选、建立稳定的表达细胞株。
图示为启动子和多克隆位点区域:
Pvu11…pSV40….Hind111….SV40 IVS….SV40 polyA+
5. CMV4 表达载体
特点:该真核细胞表达载体由CMV启动子驱动,多克隆区域酶切位点选择性较多。含有氨苄青霉素抗性基因和生长基因以及SV40复制原点和fl单链复制原点。但值得注意的是,该表达载体不含有neo基因,转染細胞后不能用G418筛选稳定的表达细胞株。
图示为启动子和多克隆位点区域:
CMVp…Bgl11…Kpn1…Mlu1…Cla1…Hind111…Xbal1…Sma1…GH…….SV40 ori
其他常用克隆Vector:
pBluscript II KS DNA 15 ug
pUC18 DNA 25 ug
pUC19 DNA 25 ug
说明:
pBluescript II kS、pUC18 & Puc19载体适合于DNA的克隆、DNA测序和对外源基因进行表达等。
这些载体由于在lacZ基因中含有多克隆位点,当外源DNA扦入,转化lacZ基因缺乏细胞,并在含有IPTG和X-gal的培养基上培养时,含有外源DNA载体的细胞将为白色菌落,而无外源DNA载体的细胞则为兰色菌落,由此易于筛选有无外源DNA的载体。此外,这些载体中有便于测序的M13、T7和T3的通用引物进行DNA测序。
保存液: TE Buffer
TE Buffer组成:
10 mM Tris.HCL(Ph 8.0)
真核细胞表达外源基因的调控
1.真核基因组的复杂性
与原核生物比较,真核生物的基因组更为复杂,可列举如下。
(1)真核基因组比原核基因组大得多,大肠杆菌基因组约4×106bp,哺乳类基因组在109bp数量级,比细菌大千倍;大肠杆菌约有4000个基因,人则约有10万个基因。
(2)真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有遗传成分(如线粒体DNA等),这就增加了基因表达调控的层次和复杂性。
(3)原核生物的基因组基本上是单倍体,而真核基因组是二倍体。
(4)如前所述,细菌多数基因按功能相关成串排列,组成操纵元的基因表达调控的单元,共同开启或关闭,转录出多顺反子(polycistron)的mRNA;真核生物则是一个结构基因转录生成一条mRNA,即mRNA是单顺反子(monocistron),基本上没有操纵元的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽形成的亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比原核生物复杂得多。
(5)原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因组中仅约10%的序列为蛋白质、rRNA、tRNA等编码,其余约90%的序列功能至今还不清楚。
(6)原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质编码的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),转录后需经剪接(splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达调控的环节。
(7)原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多。哺乳动物基因组中则存在大量重复序列(repetitive sequences)。用复性动力学等实验表明有三类重复序列:
①高度重复序列(highly repetitive sequences),这类序列一般较短,长10-300bp,在哺乳类基因组中重复106次左右,占基因组DNA序列总量的10-60%,人的基因组中这类序列约占20%,功能还不明了。
②中度重复序列(moderately repetitive sequences),这类序列多数长100-500bp,重复101-105次,占基因组10-40%。例如哺乳类中含量最多的一种称为Alu的序列,长约300bp,在哺乳类不同种属间相似,在基因组中重复3-×105次,在人的基因组中约占7%,功能也还不很清楚。
在人的基因组中18S/28SrRNA基因重复280次,5SrRNA基因重复2000次,tRNA基因重复1300次,5种组蛋白的基因串连成簇重复30-40次,这些基因都可归入中度重复序列范围。
③单拷贝序列(single copy sequences)。这类序列基本上不重复,占哺乳类基因组的50-80%,在人基因组中约占65%。绝大多数真核生物为蛋白质编码的基因在单倍体基因组中都不重复,是单拷贝的基因。
从上述可见真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还很有限,使现在国际上制订的人基因组研究计划(human gene project)完成,绘出人全部基因的染色体定位图,测出人基因组109bp全部DNA序列后,要搞清楚人全部基因的功能及其相互关系,特别是要明了基因表达调控的全部规律,还需要经历很长期艰巨的研究过程。
2.真核基因表达调控的特点
尽管我们现在对真核基因表达调控知道还不多,但与原核生物比较它具有一些明显的特点。
(1)真核基因表达调控的环节更多
如前所述,基因表达是基因经过转录、翻译、产生有生物活性的蛋白质的整个过程。同原核生物一样,转录依然是真核生物基因表达调控的主要环节。
但真核基因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多的分量。
例如编码完整抗体蛋白的基因是在淋巴细胞分化发育过程中,由原来分开的几百个不同的可变区基因经选择、组合、变化,与恒定区基因一起构成稳定的、为特定的完整抗体蛋白编码的可表达的基因。这种基因重排使细胞可能利用几百个抗体基因的片段,组合变化而产生能编码达108种不同抗体的基因,其中就有复杂的基因表达调控机理。
此外,真核细胞中还会发生基因扩增(gene amplification),即基因组中的特定段落在某些情况下会复制产生许多拷贝。最早发现的是蛙的成熟卵细胞在受精后的发育过程中其rRNA基因(可称为rDNA)可扩增2000倍,以后发现其他动物的卵细胞也有同样的情况,这很显然适合了受精后迅速发育分裂要合成大量蛋白质,需要有大量核糖体。
又如MTX(methotrexate)是叶酸的结构类似物,一些哺乳类细胞会对含有利用叶酸所必需的二氢叶酸还原酶(dihydrofolate reductase, DHFR)基因的DNA区段扩增40?00倍,使DHFR的表达量显著增加,从而提高对MTX的抗性。基因的扩增无疑能够大幅度提高基因表达产物的量,但这种调控机理至今还不清楚。
(2)真核基因的转录与染色质的结构变化相关
真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中NA和组蛋白的结构状态都影响转录,至少有以下现象:
1)染色质结构影响基因转录 细胞分裂时染色体的大部分到间期时松开分散在核内,称为常染色质(euchromatin),松散的染色质中的基因可以转录。
染色体中的某些区段到分裂期后不像其他部分解旋松开,仍保持紧凑折叠的结构,在间期核中可以看到其浓集的斑块,称为异染色质(heterochromatin),其中从未见有基因转录表达;原本在常染色质中表达的基因如移到异染色质内也会停止表达;哺乳类雌体细胞2条X染色体,到间期一条变成异染色质者,这条X染色体上的基因就全部失活。可见紧密的染色质结构阻止基因表达。
真核细胞表达外源基因技术
1.生化方法
(1)磷酸钙介导的质粒DNA转染真核细胞
1)转染前24 h,通过胰酶消化收集细胞,用适当的完全培养基以1×105至4×105细胞/cm2的密度平铺细胞于60 mm组织培养皿或12孔板上。于含5%~7% CO2的37℃温箱孵育20~24 h。转染前1 h换液。
2) 按照下属方法制备磷酸钙-DNA沉淀:于5 ml灭菌塑料管内混合100μl 2.5 mol/L CaCl2与25μg质粒DNA,如有必要用0.1×TE(pH7.6)将体积补至1 ml。室温下将以上2×钙-DNA溶液与等体积的2×HEPES盐溶液混合。迅速弹敲试管侧壁混匀溶液,静置1 min。
3)立即将磷酸钙-DNA悬液转移至上述单层细胞的细胞培养基中。每1 ml培养基加0.1 ml悬液。轻轻摇动平皿混匀培养基,培养基会变成混浊的橘黄色。一旦形成DNA沉淀,转染效率会大大降低,因此此步动作应尽可能迅速。如果是用氯喹、甘油与/或丁酸钠处理细胞,直接进行步骤5。
4)如果转染的细胞不用转染促进剂处理,则置于含5%~7%CO2的37℃温箱孵育。2~6 h后,吸去培养基与DNA沉淀。加入5 ml 37℃预热的完全培养基,将细胞放回孵箱孵育1~6天。继续步骤6检测转染DNA的瞬时表达,或者如果是稳定转化则直接进行步骤7。
5)在磷酸钙-DNA沉淀物的存在下用氯喹处理细胞或者吸去沉淀溶液后将细胞暴露于甘油与丁酸钠中会促进细胞吸收DNA。
(2)用氯喹处理细胞
氯喹是一种弱碱,推测是通过抑制细胞内溶酶体水解酶降解DNA而发挥作用(Luthman and Magnusson 1983)。细胞对氯喹毒性的敏感度限制了培养基中加入氯喹的浓度及时间,不同细胞所需氯喹最佳浓度根据经验而定。
1)在把磷酸钙-DNA沉淀物加入细胞前或后按1:1000将100 mmol/L氯喹直接加入培养基中。
2)细胞于含5%~7%CO2的37℃温箱中孵育3~5 h。
3)在用DNA于氯喹孵育细胞后,移去培养基,用磷酸盐缓冲液洗涤细胞,加5 ml预热的完全培养基。细胞于孵箱中培养1~6天。继续步骤6检测转染DNA的瞬时表达,或者直接进行步骤7以获得稳定转化子。
(3)丁酸钠处理细胞
丁酸钠的作用机制并不确定;但它是组蛋白乙酰化形成使外来质粒DNA趋于转录的染色质结构(Workman and Kingston 1998)。
1)甘油休克处理后,将500 mmol/L丁酸钠直接加入生长培养基(甘油处理的步骤d)。细胞类型不同,所用丁酸钠的浓度也不同。例如:
CV-1 10 mmol/L
NIH-3T3 7 mmol/L
HeLa 5 mmol/L
CHO 2 mmol/L
其他细胞系所需浓度依经验而定。
2)细胞于孵箱中培养1~6天。继续步骤6检测转染DNA的瞬时表达,或者直接进行步骤7以获得稳定转化子。
6)若要检测细胞转染后导入DNA的瞬时表达,可在转染后1~6天收获细胞。杂交分析DNA或RNA。通过体内代谢标记进行放射免疫、免疫印渍、免疫沉淀或测定细胞提取物的酶活性来分析新合成蛋白。
7)分离稳定转染体
(1)用非选择性培养基孵育细胞24~48 h,使转染的DNA有足够时间表达。
(2)胰酶消化细胞并重铺细胞于选择性培养基中,或者直接加选择性培养基/
(3)每2~4天更换培养基,持续培养2~3周,目的是清除死细胞残骸,促进抗性细胞生长。
(4)克隆独立菌路、繁殖,以用于检测(方法见Jakoby and Pastan 1979或Spector et al. 1998b [《细胞试验手册》的第86章])。
(6)用预冷的甲醇固定细胞15 min,然后室温下用10% Giemsa染色15 min,流水冲洗,这样可以记录细胞克隆数目。
2.物理方法
(1)电穿孔转染DNA
1)细胞生长到对数中期或晚期时收集细胞,用包有橡皮的玻璃棒或胰酶释放贴壁细胞。4℃、500g离心5 min(Sorvall H1000B转子用1 500r/min).
2)用0.5体积的初始培养基重悬细胞,用血细胞计数器计细胞数目。
3)离心(同步骤1)收集细胞,室温下用培养基或磷酸盐缓冲液重悬细胞至2.5×106~2.5×107细胞/ml。
4)将400μl的各等份细胞悬液(106~107细胞)加入标记好的电转化池中,冰浴。
5)设置电转化参数。一般电容量为1050μF。电压在200 V和250 V之间,不同细胞系所需电压不同,平均为260 V。内部阻抗设为无穷大。进行电穿孔前先用一个装有PBS的电转化池放电至少两次。
6)每一装有细胞的电转化池内加入10~30μg、体积最大可至40μl的质粒DNA。用吸管将DNA与细胞轻轻混匀。立刻继续进行第7步。
7)立即将电转化池移至电极间放电,1~2min后,取出电转化池,水浴,立即进行下一步操作。
8)用带有高压灭菌吸头的微量移液器将电穿孔的细胞转移至35 mm培养皿中。用等体积的培养基洗涤电转化池,洗液加入培养皿。培养皿置于含5%~7% CO2的37℃孵箱。
9)重复第6~8步,电转化所有DNA与细胞样品。记录下每一电转化池的实际脉冲时间以便于比较。
现已分离出有作用的真核细胞可诱导性表达元件有多种,如重金属离子诱导的金属硫蛋白启动子,具有正负调控作用的糖皮质激素启动子及干扰素诱导的启动子系统等。将这些启动子元件与目的基因融合构成转基因,常可表现出相应基因的可诱导性表达。
3.哺乳动物细胞表达系统
由哺乳动物细胞翻译后再加工修饰产生的外源蛋白质,在活性方面远胜于原核表达系统及酵母、昆虫细胞等真核表达系统,更接近于天然蛋白质。哺乳动物细胞表达载体包含原核序列、启动子、增强子、选择标记基因、终止子和多聚核苷酸信号等。
将外源基因导入哺乳动物细胞主要通过2类方法 :一是感染性病毒颗粒感染宿主细胞,二是通过脂质体法、显微注射法 、磷酸钙共沉淀法及DEAE一葡聚糖法等非病毒载体的方式将基因导入到细胞中。
外源基因的体外表达一般采用质粒表达载体,如将重组质粒导入CHO细胞可建立高效稳定的表达系统,而利用COS细胞可建立瞬时表达系统。目前,病毒载体已成为动物体内表达外源基因的有力工具,在临床基因治疗的探索中也发挥了重要作用。
痘苗病毒由于其基因的分子量相当大(约187kb),利用它作为载体可同时插入几种外源基因,从 而构 建多价疫苗。另外,逆转录病毒感染效率高,某些难转染的细胞系也可通过其导入外源基因,但要注意的是逆转录病毒可整合入宿主细胞染色体,具有潜在的危险性。
由于腺病毒易于培养、纯化,宿主范围广,故采用该类病毒构建的载体被广泛应用腺病毒载体的构建依赖于腺病毒穿梭质粒和包装载体之间的同源重组。但是哺乳动物细胞内的这种同源重组效率很低,利用细菌内同源重组法构建重组体效率会大大提高,即将外源基因插入到腺病毒穿梭质粒中,形成转移质粒,将其线性化后与腺病毒包装质粒共转化大肠埃希菌。
另一种方法是通过CrelaxP系统构建重组腺病毒载体,在转移质粒和包装质粒中都插入laxP位点,然后将两个质粒共转染表达Cre重组酶的哺乳动物细胞,通过Cre介导两个laxP位点之间的DNA发生重组,可获得重组腺病毒,这种重组效率比一般的细胞内同源效率高30倍。
最近,人们在杆状病毒中插入巨细胞病毒的启动子建立了高效的基因转移载体。由于杆状病毒是昆虫病毒,在哺乳动物细胞中不会引起病毒基因的表达,而且载体的构建容易,因而利用杆状病毒进行基因转移为我们提供了很好的途径。
利用哺乳动物细胞表达外源基因时,大多数情况下不需要诱导,但当表达产物对细胞有毒性时应采取诱导,这样可避免表达产物产生早期就对细胞产生影响。
哺乳动物细胞中用到的诱导型载体主要与启动子有关如热休克蛋白启动子可在高温下被诱导,还有重金属、糖皮质激素诱导的启动子。但这些系统存在一些共同的缺陷,如诱导表达特异性差;当系统处于关闭状态时表达有泄漏诱导剂本身有毒性,常对细胞造成损伤等。
为此,Gossen等构建了受四环素负调节的Tet-on基因表达系统,该系统由调节质粒和反应质粒组成。调节质粒中具有编码转录激活因子(fIA)的序列,在没有四环素或强力毒素存在的情况下 tTA可引起下游目的基因表达。
随后Gossen等又对tTA的氨基酸序列进行了改造,构建了受四环素正调节的Tet-on基因表达系统,该系统在没有四环素的情况下启动子不被激活,而在加入四环素或强力毒素后目的基因高效表达。四环素诱导的基因表达系统是目前应用最广泛的哺乳动物细胞诱导表达系统,该系统具有严密、高效可控制性强的优点。
外源蛋白的表达会对哺乳动物细胞产生不利影响,因此利用哺乳动物细胞表达外源基因时,一个主要问题便是外源基因不能持久稳定地表达。
Mielke等构建了一种能够在哺乳动物中稳定表达异二聚体蛋白的载体系统,在这个系统中,编码抗体重链和轻链的cDNA及嘌呤霉素抗性基因被转录成三顺反子mRNA。内部的顺反子通过内核糖体进入位点(IREs)介导进行翻译,通过持续选择压力,无需繁琐的筛选过程,便可获得持久、稳定表达抗体分子的重组体。
哺乳动物细胞表达系统常用的宿主细胞有CHO、COS、BHK、SP2/0、NIH3T3等,不同的宿主细胞对蛋白表达水平和蛋白质的糖基化有不同的影响,因此在选择宿主细胞时应根据具体情况而定。
利用基因工程技术表达外源蛋白。其产量还不高,难以满足大规模的实际应用。通过转基因动物或转基因植物技术可从动物的乳汁或植物的叶组织中很方便地获得大量较纯的生物活性物质,但目前这项技术还不很成熟,有待进一步研究。
4.结语
目前已经建立了多种诱导表达系统,但它们都有其优点和不足,这就需要我们根据自己的要求选用适当的表达系统。一般来说,一个理想的可诱导表达系统需要符合下述几个方面的要求:
①特异性:该系统不受其他内源因素的影响,仅能被外源的非毒性药物所活化。
②非干扰性:该系统成分不能对细胞通路有干扰。
③可诱导性:该系统在非活化状态下本底活性最低,而在活化状态下能快速产生高水平的基因表达。
④诱导剂的生物利用率:调节分子能快速渗透人各组织,能通过胎盘屏障及血脑屏障。
⑤可逆性:诱导剂能快速被各组织清除使该系统很快恢复非活化状态。
⑥剂量依赖性:该系统的反应与诱导剂的浓度成正比,以便进行定性定量分析。
总之,各种表达系统各有其优缺点,酵母和昆虫细胞表达系统蛋白表达水平高,生产成本低,但它们的加工修饰体系与哺乳动物细胞不完全相同;哺乳动物细胞产生的蛋白质更接近于天然蛋白质,但其表达量低、操作繁琐。各种表达系统由于翻译后的加工不完全相同,因而产生的重组蛋白的生物学活性和免疫原性有时会有差别。
Van der GeId等利用不同的表达系统表达了蛋白激酶(PR30),并对它们的抗原性进行了比较,结果发现,在哺乳动物细胞中表达的PR3具有与抗PR3抗体结合的所有表位,在昆虫细胞中表达的PR3具有大部分表位,而在 甲醇酵母中表达的PR3只具有少数几个表位。
因此,选择表达系统时,必须充分考虑各种因素,如所需表达的蛋白质性质、实验条件、生产成本、表达水平、安全性等,权衡利弊后再选择相应的表达系统。