通过蛋白质互作网络预测已知部分功能的蛋白质的精细功能

作者:李彦辉; 郭政; 马文财; 杨达; 王栋; 张敏; 朱晶; 钟国才; 李永进; 姚晨; 王靖
来源:科学通报, 2007, (20): 2367-2373.

摘要

基于高通量数据,研究人员已经设计了许多算法用于寻找功能完全未知蛋白质的功能.然而,这些算法的效率受到一些根本因素的制约,包括:(ⅰ)功能完全未知的蛋白质参与一个精细功能的先验概率低;(ⅱ)高通量互作数据中有大量的假阳性互作;(ⅲ)蛋白质互作数据对功能类的覆盖不完全;(ⅳ)训练算法的大量阴性样本数据是异质的;(ⅴ)训练算法的蛋白质的精细功能知识不足.因此,本研究提出一种新的方法对已知部分功能的蛋白质进行功能预测,即利用功能特异的蛋白质互作子网或者基因表达模式信息来寻找蛋白质更为精细的功能.该方法能够通过恰当地定义预测范围和过滤假阳性数据减少上述提到的问题,因此可以高效地发现蛋白质的新功能.对于几千个已知部分功能的酵母与人类蛋白质,该方法能够以超过90%的精确率找到它们更为精细的功能.预测的精细功能对于指导随后的湿实验和提供必要的功能知识来学习其他蛋白质的功能都具有重要的意义.