比较建模法预测蛋白质的结构
比较建模法预测蛋白质的结构 比较建模法(comparative modeling method)是基于知识的蛋白质结构预测方法,又称为同源结构预测,是根据大量已知的蛋白质三维结构来预测序列已知而结构未知的蛋白质结构。 按照目前的定义,若待模型构建蛋白质的序列与模板序列经比对(alignment)后的序列同源性(sequence identity)在40%(也有人认为在35%)以上,则它们的结构可能属于同一家族,它们是同源蛋白(homology)可以用同源蛋白模型构建的方法预测其三维结构。因为它们可能是由同一种蛋白质分化而来,具有相似的空间结构及相同或相近的功能。因此,若知道了同源蛋白家族中某些蛋白质的结构,就可以预测其他一些序列已知而结构未知的同源蛋白的结构,可以用同源模型构建的方法预测未知蛋白质的三维结构。同源蛋白模型构建的步骤如下。 (一)目标蛋白序列与目标序列的匹配 应用FASTA或BLAST搜索软件,在PIR、SWISSPROT或GENEBANK等序列库中按序列同源性挑选出一些同源性比较高的序列,然后把挑选出的序列与目标序列基序多重匹配,得到模板结构等价位点套的初始集合。 (二)根据模板结构构建目标蛋白结构模型 在已确定的模板结构等价位点套的初始集合的基础上,旋转每一个模板的结构,使它们相互间的未知尽可能多地重叠在一起。不同两个模板在空间中若复合一定的重叠距离标准,那它们相互之间的关系就是等价位点。许多这样的等价位点构成了等价位点套。 叠合结束后,即得到了同源蛋白的结构保守区(SCR),以及相应的基架结构(framework)。模板结构匹配后,一般还要用得到的同源体的SCR的第一条序列与目标序列匹配,挑选出目标序列上的高相似区,定义为目标蛋白的SCR。Homology、UQANTA/CHARM、COMPOSER、CONSENSUS、MODELLER和Collarextension等软件和方法可以用于目标蛋白结构模型的构建。 (三)对模型构建结构基序的优化和评估 同源结构模型构建(预测)得到的蛋白质结构模型,通常含有一些不合理的原子间接触,须对模型进行分子力学和分子动力学优化,消除模型中不合理的接触。另外,模型中有些键长、键角和两面角也有可能不合理,也须检查评估。PROCHECK和PROSAⅡ等软件常用于完成这类工作。