基于集成学习优化的肉制品安全风险等级预警分析

作者:穆书敏; 陈锂; 尹佳; 郭鹏程; 陈晨; 董曼; 赵锦; 徐晴雪; 文红*; 桂预风*
来源:现代食品科技, 2023, 39(08): 273-286.
DOI:10.13982/j.mfst.1673-9078.2023.8.0878

摘要

该研究依据2013~2017年肉制品抽检数据构造了5个安全风险等级,使用特征构造及独热编码进一步关联与肉制品安全相关的影响因素,构建极端梯度提升树算法(Extreme Gradient Boosting,XGBOOST)研究食品生产过程各类因素对于食品安全风险等级的影响程度,并使用多个指标评价模型。此外通过上采样解决样本不平衡问题、贝叶斯优化调节超参数,来提高模型性能及分类效果。相较于模型决策树(Decision Tree,DT)和随机森林(Random Forest,RF),XGBOOST模型在肉制品安全风险等级分类中的表现效果最佳。研究结果表明,食品生产过程环节错综复杂,使用one-hot encoding处理后的模型能够有效判断出各类因素对于食品安全风险等级的影响程度,集成模型中RF的学习效果比较稳定,XGBOOST经过参数调节后准确率等指标得到有效的提升且优于RF。不同采样下XGBOOST的平均精确率均能达到89.14%,平均F1值为88.59%,说明XGBOOST在肉制品安全风险等级预警中适用性,为日常抽检提供技术指导。

全文