摘要

从DNA序列片段个案中密码子分布密度角度出发,提取出DNA序列片段的特征,基于氨基酸分子中侧链基极性性质把氨基酸分成5大类,计算5大类出现的频率,这种考虑生物意义的特征提取方法不仅考虑碱基的含量,还在一定程度上考虑碱基的排列顺序,应用层次聚类分析方法和BP神经网络法对DNA序列片段进行分类。结果表明,2类算法分类结果精度较高,且一致性也较高。说明这种特征提取法比传统的单纯考虑碱基的特征提取法效果更优。

  • 出版日期2014
  • 单位宁波大红鹰学院

全文