基于Ensemble SVM的蛋白质结构域边界预测

作者:刘文; 樊永显
来源:桂林电子科技大学学报, 2017, 37(01): 63-67.
DOI:10.16725/j.cnki.cn45-1351/tn.2017.01.013

摘要

针对蛋白质结构域边界预测问题,提出一种基于机器学习算法的从头预测方法。通过评估不同特征组合,选取最优特征来训练SVM分类器,使用基于Ensemble SVM模型的方法预测蛋白质结构域边界。采用下采样的方法解决训练过程中样本严重不平衡性问题。实验结果表明,在包含143个单结构域蛋白质和122个多结构域蛋白质的数据集上,该方法蛋白质结构域数目的预测精度为66.4%,蛋白质结构域边界的精确率和召回率分别为35.9%和55.0%。

全文