摘要

为解决新一代民航旅客服务信息系统中数据缺失不能准确进行旅客流失预测的问题,考虑旅客流失预测任务与旅客缺失数据填补任务具有相关性,提出基于部分距离的SMOTE算法和基于降噪自编码器的多任务深度学习网络模型。基于部分距离的SMOTE算法在数据不完备场景下,对少数类别已流失旅客和准流失旅客进行过采样;设计的多任务深度学习网络模型利用逐层无监督训练和有监督微调,同时进行对缺失数据填补与民航旅客流失预测。实验结果表明,相比传统处理方法,该方法能有效提高数据质量和旅客流失预测的准确性。