青篱柴转录组数据SSR位点的生物信息学分析

作者:黄建敏; 李菲; 刘云静; 李彦勋; 汤晓辛*
来源:江苏农业科学, 2019, 47(02): 54-58.
DOI:10.15889/j.issn.1002-1302.2019.02.012

摘要

为探讨青篱柴转录组中简单重复序列(simple sequence repeat,简称SSR)位点信息,开发青篱柴分子标记技术,采用高通量测序技术获得青篱柴转录组原始试验数据,经过生物信息学软件Trinity拼接后,获得66 755条单基因簇(universal gene,简称unigene)。进一步采用生物信息学分析软件MISA对所有的unigene进行SSR位点数据挖掘。共计搜索出22 542个SSR位点,分布在18 972条unigene中,出现频率为33. 77%,发生频率为28. 42%,SSR平均长度为15 bp,平均分布频率是1/3. 98 kb,在青篱柴转录组的SSR中,单核苷酸、三核苷酸和二核苷酸重复序列为主要重复类型,分别占总SSR的47. 59%、27. 95%、23. 45%。青篱柴转录组数据中SSR序列共包括161种重复基元类型。其中出现频率高的基序主要有A/T、AG/CT、AAG/CTT、AT/AT、C/G、AGG/CTT。重复序列长度在10~144 bp之间,大多小于24 bp,大于24 bp的仅有0. 22%(48个SSR位点)。另外,设计筛选得到15 425对SSR引物。综上表明青篱柴SSR位点多态性潜能较高,具有很大的可开发性。

全文