PacBio RS II 的高通量测序应用
Pacific Biosciences 公司的 PacBio RS II 单分子实时测序(single molecule, real-time,SMRT)测序反应是在其专利 SMRT cell 中进行的,每个 SMRT cell 中有 150,000 个 ZMW(纳米级的零模波导孔 zero-mode waveguides), 每个 ZMW 都能够包含一个 DNA 聚合酶及一条 DNA 样品链,SMRT Cell 能够平行检测大约 75,000 个单分子测序反应。
当测序进行时,专利的包被技术保证 DNA 聚合酶和模板形成的复合体被锚定在 ZMW 的底部,反应溶液中带有标记着不同荧光磷酸基团的高浓度核苷酸可有效保证聚合酶合成的速度、精确性和持续合成的能力。
检测装置则透过 ZMW 底部的基层来实时观察 DNA 的合成过程:当 DNA 聚合酶检测到正确的核苷酸并将其插入模板时,这些碱基会在插入位置保留几十毫秒,而游离状态的碱基扩散的速度大约是几十微秒,在这个时间差中,检测器就可以检测到插入碱基的荧光信号,并将其转换成相对应的碱基类型。然后,DNA 聚合酶将碱基所带的标记着荧光集团的磷酸基团剪掉以形成天然 DNA 链,荧光信号迅速衰减至基线并开始下一轮的合成。
PacBio RS II 使用一套优化的算法,将光学系统所捕获的信息翻译成对应的 ACGT 碱基信息。一旦测序开始,实时的数据就被传送到初步分析系统中,以实时生成碱基组成和质量值等信息。
单分子测序建库不经 PCR 扩增,精巧的 ZMW 设计有效将背景干扰降到最低,通过检测碱基配对动力学变化现超长读长、减弱 GC 偏向性等技术特点,使得 PacBio RS II 测序具有以下测序优势:
1、超长的测序读长:NGS 读长在 35-700bp 之间,而 PacBio RS II 平均测序读长能达到 3-10kb,最长的序列能达到 20kb;
2、极高的准确率:对基因组组装和基因组变异检测,可以最多达到 99.999% 的准确率;选用特殊测序模式,测序准确率可以在达到单个分子 99% 准确率的条件下,读长超过经典的 Sanger 测序法;
3、最小的 GC 偏向性(GC bias):在极端高 GC 和极端低 GC 区域,可以轻松测定,从而保证序列的均匀覆盖度;
4、无 PCR 扩增偏向性:样本不需要进行 PCR 扩增,避免了覆盖度不均一和 PCR artifacts.
现上海翰宇生物和上海南方基因中心合作,拥有 PacBio RS II 单分子实时测序平台,通过其优良的测序特性,致力于为广大科研工作者等提供优质高效的测序服务。下面上海翰宇生物将对 PacBio RS II 的应用进行简要概述:
基于 PacBio RS II 单分子实时测序的强大性能,在基因组、转录组和表观遗传学方面有了更大的应用突破。
1、全基因组 de novo 测序
与二代测序最高不超过 1kb 的读长相比,PacBio RS II 的长读长将有效解决短序列数据的拼接难题。同时,与二代测序的模板样品需要扩增相比,PacBio RS II 无需扩增可直接对单个分子进行测序,有效避免了 PCR 扩增偏好性和 GC 偏好性,PacBio RS II 可轻松跨越 GC 含量异常(过高或过低)及高度序列重复的区域,实现序列覆盖的完整性和均一性。
2、基因组草图的优化及基因组完成图绘制
对前期已开展测序的动植物、微生物基因组结合三代长读长测序数据进行完善和提升。针对前期已经开展全基因组测序,获得基因组草图的动植物、微生物等,可以结合 PacBio RS II 平台长读长 reads 进行补充,从而快速获得前期没有测得的信息及提升基因组的完整度。另外还可以针对前期没有检测获得的结构变异信息(structural-variation events)、串联重复序列信息(tandem duplication)、易位信息(Inversion)等。
3、全长转录本测序
PacBio RS II 的长读长可实现全长转录本测序,并使基因可变剪接形式的识别成为可能,因此可以对新基因及其 isoform 进行更全面的研究。同时,长读长不再需要对 RNA-Seq 的 reads 进行组装,因此可以更完整的对基因模型和转录的基因进行更全面的注释,用以改进参考基因组中的基因注释信息。
4、宏基因组测序
长读长 reads 能够更为精准地鉴定水体、土壤、肠道等生境中微生物的种类的鉴定,能够更加快捷地获得更多微生物种的全基因组序列。
5、16S rDNA 全长
测 PacBio RS II 的平均读长为 8-10Kb,而 16S rDNA 长度大约为 1540bp,因此结合该平台测序可以成功测序获得 16S 的全长序列。
6、细胞器基因组测序
叶绿体基因组和线粒体基因组序列都包含重复序列、反向重复序列等复杂结构,PacBio RS II 的长读长可直接跨越这些区域获得这些细胞器的全基因组序列信息等,基因组组装不依赖于是否有近缘物种的线粒体和叶绿体基因组信息。
7、全基因组重测序&稀有变异鉴定
PacBio RS II 长读长测序 reads 无 GC 偏好,能够全面获得基因组的遗传变异,包括 SNPs、InDels、CNV、SV 等,可应用于人类癌症基因组重测序等。PacBio RS II 平台测序周期在 10 hours 小时即可完成测序,可应用至需要快速反馈的临床检测中,如细菌感染疾病中细菌的鉴定、病毒的鉴定等,取样开展重测序和目前已有的细菌、病毒基因组数据库进行比对鉴定即可。
8、表观遗传学
PacBio RS II 利用测序过程聚合酶反应的动力学变化,首次实现对碱基修饰进行直接测序。当碱基有额外修饰时,DNA 聚合酶的合成速度会减慢,对应的信号会被检测出来。每种碱基修饰事件都会使聚合酶的「停顿模式」PacBio RS II 产生微小差异,最终反映到荧光脉冲信号的间隔上。除了甲基化修饰,还可以检测 5-hC、5-hmU、5-hU、1-mA、6-mA、8-oxoA、BPDE、6-mT、6-mG 等碱基修饰,甚至可以鉴别传统亚硫酸氢盐测序法无法区分的甲基化修饰和羟甲基化修饰。PacBio 平台可以在测序的同时即可检测表观遗传学修饰信息,只需对测序数据选择合适的软件即可分析碱基修饰信息。
以上技术信息参考自 PacBio 官网和 SCI123