摘要

新兴的Spark大数据并行计算模型为实现遗传算法深度前馈神经网络数据并行训练提供了一个可能的选择。但是,Spark模型有其特有的数据编码规则和转换规则,目前尚无成熟方法在该模型上实现GADFNN训练。为此,研究了Spark模型的数据编码和转换规则与GADFNN训练的内在关系,提出一个基于Spark模型的GADFNN训练算法——Spark-GADFNN。实验表明,提出的Spark-GADFNN训练算法在中、大规模数据集上,训练时间分别缩短为传统算法的18.18%和16.67%。