基因组DNA文库构建必备实验技巧
基因组DNA文库用途十分广泛,如用于人类及动植物基因组学研究,基因表达调控研究,分析、分离特定的基因片段等。通常情况下,基因组文库构建的基本流程可以归为四大步骤:分离基因组DNA、对基因组DNA作相关的处理、将基因组DNA片段连接入载体、将重组载体转入宿主细胞。一、分离基因组DNA(gDNA) 毫无疑问,高质量的
基因组DNA对于基因组文库构建是至关重要的。需要通过经验来选择合适的基因组DNA 分离方法,在分离 过程中保证DNA不被过度剪切或降解,同时也要尽量保证DNA的纯度。
二、处理基因组DNA根据研究目的,研究者需要选择合适的载体。不同的载体对基因组DNA的长度有不同的要求,必须选择合适长度的基因组DNA来构建基因组文库。比如,对于黏粒载体,合适的片段长度大约为40kb;对于BAC载体,合适的片段长度平均为120kb-300kb。
构建黏粒基因组DNA文库,需要将基因组DNA用注射器抽打来随机剪切DNA;接着用末端修复酶修复DNA,可以提高DNA连接入载体的效率;然后通过脉冲场电泳或者普通电泳来找到40kb左右的DNA片段,随后使用胶回收试剂盒回收DNA。构建BAC基因组DNA文库,需要将基因组DNA用限制性内切酶(常用EcoR I、BamH I或者Hind III)来消化基因组DNA,然后通过脉冲场电泳找到合适长度的DNA片段(比如100kb-150kb),随后透析回收DNA。需要注意:(1)电泳时,要选用合适的DNA Ladder,以保证电泳后可以准确定位所需分子量的DNA。
(2)电泳以后,应尽量缩短用紫外光照射目标DNA的时间,否则会显著降低克隆效率。
(3)回收DNA的时候,应该要避免过度离心,以防止DNA被剪切,降低文库质量。三、载体的选择目前,常用的基因组文库载体有黏粒载体、P1噬菌体载体、PAC载体(P1人工染色体)、BAC载体(细菌人工染色体)和YAC载体(酵母人工染色体)。选用何种载体可以参考如下几个因素:1、目标区域的大小:如果基因组的目标区域很小(小于50kb),那么可以选择黏粒载体甚至λ噬菌体载体。利用现有的商品化的黏粒载体、高效率的包装混合物和合适的大肠杆菌菌株,可以方便的构建黏粒载体文库。如果基因组的目标区域比较大,那么P1、PAC或者BAC就比较合适了。P1操作比较困难,PAC相对简便。BAC载体也是很好的选择,可以利用现有的成熟产品来构建BAC文库,比如商业化的一系列BAC载体及配套试剂盒。如果目标区域非常大(大于250kb),那么YAC载体就是首选了。不过,应用YAC载体来构建基因组文库,操作非常繁琐困难。表1 各种载体的比较
载体 | 容量(kb) | 宿主 | 导入细胞方式 |
黏粒 | 30-45 | 大肠杆菌 | 转导 |
P1 | 70-100 | 大肠杆菌 | 转导 |
PAC | 130-150 | 大肠杆菌 | 电转 |
BAC | 120-300 | 大肠杆菌 | 电转 |
YAC | 250-400 | 酵母 | 转化 |
2、筛选文库的难易程度:黏粒载体一般使用传统的滤膜影印杂交来筛选,但是这种方法对于构建区域图谱及叠连群来说既费力又浪费。大容量载体文库,如P1、PAC、BAC、YAC,以二维阵列保存,既可以用传统的单拷贝的探针杂交法筛选,又可以用PCR进行多克隆的群体筛选。
而且,使用高容量载体构建文库,可以减少染色体步查的步骤。3、 载体拷贝数的考虑:当把大片段DNA片段克隆到高拷贝的载体时,克隆DNA会发生重组,从而影响克隆序列的保真性和稳定性;而单拷贝载体的低产量DNA是高通量分析的瓶颈。对这一矛盾的解决方案可采用克隆系统,整合了单拷贝载体与多拷贝载体的优点。
单拷贝载体能提高插入片段的稳定性,而且能在诱导剂的作用下,即时扩增出高拷贝数的克隆而获得高产量的DNA。四、将基因组DNA片段连接入载体使用连接酶把上述大小合适的DNA片段连接入载体。许多商业化载体已经经过预处理,可以直接使用,无需内切酶消化及脱磷酸化处理。选用连接快、效率高的连接酶,连接反应体系以100μl为宜。注意:BAC载体连接完以后,需要将连接产物做脱盐处理,除去连接反应缓冲液里的盐分。五、将重组载体转入宿主细胞如果构建黏粒文库,需要用包装蛋白来包装上述的连接反应产物,测定包装好的黏粒克隆的滴度,然后转染。挑出重组子,鉴定插入片段的大小。如果文库的大小和质量都令人满意的话, 就可以铺板进行文库筛选,或者扩增、保存文库。如果构建BAC文库,应选择电转法,将上述连接产物转入受体菌,涂板长出克隆。获得克隆后需要对BAC克隆的大小进行评估,确定文库大小是否能够满足要求。如果文库大小合适,就可以进行后续操作了。六、文库克隆数的确定基因组DNA文库需要包含足够多的克隆,来保证文库的代表性。一般使用如下的经验公式来确定:N = ln (1-P ) / ln (1-f ) P是希望得到的覆盖率,f是插入片段大小与基因组DNA大小的比值,N是所需的克隆数。举例来说,用BAC载体构建人类基因组文库,人类基因组大小为3 x 109 bp, 插入片段大小为100kb,希望覆盖率99%,那么所需要的BAC克隆数为:N = ln (1 - 0.99) / ln (1 - [106bp / 3 x 109 bp]) = 138,298