摘要

由于真核启动子DNA序列结构复杂、数据量巨大,启动子序列辨识一直是一个难点。首先对真核启动子序列寡核苷酸位置分布特征进行高斯混合模型建模,能够将出现频率少但重要的基序提取出来。并将高斯混合模型作为真核启动子最小二乘支持向量机分类器中的核函数,将最小二乘支持向量机模型简化为最小二乘模型,计算量减少。辨识结果表明,该算法的辨识精度优于贝叶斯辨识算法,和RBF核LS-SVM相比,辨识精度基本相同,建模时间略有缩短。