摘要

本文介绍一种用于富含G+C的DNA序列蛋白编码区识别的计算机“构架”分析方法,首先计算G+C的总含量,再统计三个码位的可变窗函数(t=20-50)内的G+C含量,移动窗位置画出三条不同颜色的“G+C”曲线,这三种可能的序列读出区分别用紫兰红色曲线表示。“构架分析”表明蛋白编码区的非随机分布性。计算机程序从正逆两个方向检索三位读出的蛋白转译开始码(ATG)与终止码(TAA,TAG,TGA),将六个可能的通读区与G+C曲线比较用计算机“构架”分析方法分析了不同种类的放线菌DNA序列小鼠和人癌基因,实验结果表明这种方法有助于识别G+C富含的核酸序列的蛋白编码区。

  • 出版日期1987
  • 单位四川大学; 四川省肿瘤研究所