摘要

在蛋白质组学研究中,通常使用数据库检索算法进行蛋白质的鉴定。使用完整性较高但注释不准确的数据库,可能能够鉴定到更多的蛋白质,但存在数据不准确的风险;使用注释准确但完整性较低的数据库,则有可能漏掉一些数据库中未收录的蛋白。如何兼顾蛋白质鉴定结果的完整性和准确性是一个重要的问题。本研究以人类蛋白质组为例,采用不同质谱仪及不同样品产生的蛋白质组数据,比较了常用的IPI数据库、UniProt数据库和Swiss-Prot数据库的检索结果。结果表明,3个数据库在不同的蛋白质组数据中表现各有优劣,但总体来讲差异很小;每个数据库可鉴定到的、特有的多肽数不超过总数的5%,蛋白数的差异为1%~5%。说明3个数据库...