基于MapReduce的基因读段定位算法

作者:涂金金; 杨明; 郭丽娜
来源:模式识别与人工智能, 2014, (03): 206-212.
DOI:10.16451/j.cnki.issn1003-6059.2014.03.001

摘要

RNA-seq测序技术的高速发展所产生的海量数据在执行效率上给原有读段定位算法带来严峻的挑战.为此,提出基于MapReduce的不跨越剪切位的空位种子索引算法(PSeqMap)和跨越剪切位的空位种子索引算法(PJuncSeqMap),以及一种负载平衡解决方案.该算法利用MapReduce框架实现空位种子索引算法的并行化,在拟南芥菜基因数据集上的实验结果表明文中提出的算法能够充分利用集群的存储和计算能力,高效处理海量基因数据.

全文