祁连山黄参叶片转录组测序及生物信息学分析

作者:张春梅*; 闫芳; 宋海; 张喜峰; 陈叶
来源:广西师范大学学报(自然科学版), 2022, 40(06): 247-256.
DOI:10.16088/j.issn.1001-6600.2021080902

摘要

在《本草纲目》中黄参被誉为“小人参”,以黄参叶片为试材,采用高通量测序平台BGISEQ-500进行转录组测序,利用转录组分析软件进行组装、注释。结果表明:1)利用组装软件,获得99 981个Unigene,总长度是113 850 816 bp,平均长度是1 138 bp, N50的长度是1 874 bp, GC含量是39.93%。2)将Unigene比对到7大功能数据库进行注释,分别有49 390(NT:49.40%)、48 281(SwissProt:48.29%)、61 116(KOG:61.13%)以及55 859(Pfam:55.87%)个Unigene获得功能注释。3)比对到NR数据库共有66 451条,黄参与胡萝卜Daucus carota subsp.sativus有较高同源性,与其他物种的同源性较低。4)基因本体(gene ontology, GO)数据库注释显示,有78 040条Unigene得到注释,按功能分为生物过程、细胞组分、分子功能三大类,分别有15、11、14个亚类,其中执行生物过程的类区较多。5)51 479条Unigene富集在KEGG数据库的20条代谢通路中。6)在KOG数据库中,有61 116条Unigene被分配到26个基因功能大类中,参与功能预测、信号转导、翻译、修饰及蛋白质运输的基因最多。7)使用Transdecoder检测出62 323个CDS,检测出17 308个SSR(simple sequence repeats)分布于13 256个Unigene中,双核苷酸重复基元类型最为丰富(6 721,占38.83%);预测出2 370个编码转录因子的Unigene。黄参遗传信息丰富,本文研究结果将为揭示黄参遗传背景、分子标记研究、开展其功能基因组分析等提供基础数据,也为黄参的综合利用及研发奠定基础。