面向国产处理器大数据一体机的基因压缩技术研究

作者:陈国良; 尧海昌; 陈帅; 吴梦雪; 方厚之; 法虎; 孟朝霞; 刘尚东; 王汝传; 季一木*
来源:南京邮电大学学报(自然科学版), 2020, 40(05): 11-26.
DOI:10.14132/j.cnki.1673-5439.2020.05.003

摘要

大数据一体机作为大数据时代的基础设施,其自主安全可控显得尤为重要。基因数据因其巨大的社会价值、经济价值及军事价值,其安全是国家安全的一部分。因此,存储、分析与处理基因数据是国产处理器大数据一体机的重要应用之一。文中首先介绍了国产处理器大数据一体机和基因序列文件主要格式,然后分为无参考序列基因压缩算法和基于参考序列基因压缩算法综述了FASTA格式基因数据压缩技术及基因压缩并行化技术的发展历程和研究现状,同时在国产处理器大数据一体机上验证了近年来优秀基因压缩算法的性能。研究面向国产处理器大数据一体机的基因压缩技术对解决基因数据安全和基因压缩技术自主可控具有很重要的意义,也为我国基因处理技术的全面国产化提供了参考。