摘要

对短租房价格原始数据集进行缺失值和异常值处理,针对短租房价格的影响因素构建包括23个特征的特征体系,使用OLS回归和分位数回归对这些因素的影响程度和影响方向进行分析,最后挑选具有较强显著性的18个特征构建XGBoost模型,用于预测房源价格。建模过程中采用网格搜索法调参。拟合优度这一指标在使用XGBoost模型进行价格预测时可以达到0.60,而线性回归模型仅为0.38。因此,使用XGBoost模型对短租房价格进行预测较优,将其与OLS回归和分位数回归相结合,既保留了传统统计模型的解释性,又提升了预测的精确度。