一个端到端的基于深度学习的查询优化引擎

作者:孙佶; 李国良
来源:赤峰学院学报(自然科学版), 2019, 35(01): 1-170.
DOI:10.13398/j.cnki.issn1673-260x.2019.01.001

摘要

数据库查询优化迄今已经在数据库领域广泛研究数十年,一个好的查询优化器对于数据库性能来说是至关重要的,但是不论是传统的基于统计和采样的基数估计还是多表连接物理计划生成,在一些真实数据集上效果依然不尽如人意.深度学习是当前被广泛研究和使用的基于神经网络的机器学习算法,但是将深度学习应用到数据库系统中却是学术界近几年刚开始的尝试.我们结合传统主流数据库查询优化器的架构以及学术界最近的数据库查询优化进展,分析了目前查询优化所面临的痛点,并且利用深度神经网络模型和深度强化学习模型分别提升数据库查询基数估计和查询计划生成的时间性能和效果,最后,我们提出基于规则和基于置信度的两种计划验证方法以及高效异步模型更新方法.我们提出的端到端的基于机器学习的数据库查询优化引擎在标准测试集和真实数据机上的性能和效果要显著优于传统数据库Postgresql中的优化器.

  • 出版日期2019

全文