基于高通量测序的极小种群野生植物长梗杜鹃转录组分析

李太强; 刘雄芳; 万友名; 李正红; 起国海; 李钰莹; 刘秀贤; 和锐; 马艳; 马宏

摘要

为加强特有濒危植物长梗杜鹃资源的评价、保护和鉴定工作,及为今后遗传育种和改善其农艺性状提供有益参考。本研究采用新一代高通量测序平台Illumina Hi Seq 4000对其转录组测序,得到的数据过滤后进行de novo组装并聚类去冗余,获得74 092个Unigenes,平均长度、N50、Q20、Q30以及GC含量分别为938 nt、1 616 nt、98.22%、95.20%和43.24%,其中1 Kb以上的Unigenes有23 879条。通过与七大功能数据库比对,分别有39 876（NR:53.82%）、38 065（NT:51.38%）、27 384（Swissprot:36.96%）、16 099（COG:21.73%）、30 401（KEGG:41.03%）、17 518（GO:23.64%）以及29 676（Interpro:40.05%）条Unigenes获得功能注释。长梗杜鹃转录组中的Unigenes根据GO功能大致可分为生物学过程、细胞组分和分子功能3大类56亚类,其中执行生物学过程的基因最多,占41.53%;与COG数据库比对,根据其功能大致可分为25类;以KEGG数据库为参考,可归为6个代谢通路大类、32类代谢途径,并发掘出176条与人类疾病相关的Unigenes,包括内分泌及代谢疾病（167条）和抗药性（9条）。根据注释结果共检测出39 418个CDS,未注释上的Unigenes使用ESTScan预测后获得3 194个CDS。同时,预出到1 488个编码TF的Unigenes,以及检测到57 927个SNP多态位点。该转录组分析为今后长梗杜鹃乃至杜鹃属植物功能基因挖掘与利用、基因克隆、抗性机理分析、遗传资源分类和进化、分子标记开发以及分子辅助育种等研究提供了基础数据和重要参考。

出版日期2017
单位中国林业科学研究院资源昆虫研究所

收藏分享被引浏览

更新时间：2021-04-25 07:00

基于高通量测序的极小种群野生植物长梗杜鹃转录组分析

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友