摘要

大豆品种快速准确的鉴别,对于鉴定种子品质、净化种业市场以及保障粮食安全具有重要意义。为解决传统农作物品种鉴别方法中存在精度差和效率低等问题,采用拉曼光谱结合特征波长提取方法建立偏最小二乘(PLS)鉴别模型,对黑龙江省4个高蛋白大豆品种(黑农88、黑农98、绥农71以及绥农76)进行快速鉴别。随机蛙跳(RF)算法是一种通过迭代计算变量被选概率,以确定变量重要性的新型特征波长选择算法,可以有效剔除全光谱数据中的冗余信息。该方法存在初始变量集随机性、所需迭代次数大、阈值选取不确定的问题,因此提出一种基于最小绝对收敛与选择算子(LASSO)回归的改进随机蛙跳(MRF)算法。采用LASSO算法提取与属性变量最相关的特征波长点作为RF初始变量集F0,消除初始变量的随机性,在此基础上开始迭代计算,可以减少无用迭代次数,提高模型的预测精确度。RF算法通过设定阈值的方法选择变量,因此提取的特征波长往往具有不确定性。改进如下:首先去除被选概率为0的变量,对于排序后变量以10个波长点为间隔,每次增加1个间隔建立特征波长与大豆品种属性的偏最小二乘回归模型,当交叉验证均方根误差(RMSECV)取最小值时的建模波长为优选特征波长。以MRF优选特征波长作为输入变量建立PLS鉴别模型,并与全光谱以及常用的RF、LASSO和ElasticNet特征波长选择算法建模结果进行对比分析。结果表明,MRF算法提取300个特征波长点,仅占全谱波长的9.37%,有效筛选了关键特征变量,简化了模型复杂度。预测结果中均方根误差(RMSEP)和决定系数(Rp2)分别为0.246 9和0.951 2,识别准确率达到100%,为所有模型中最优。拉曼光谱结合MRF算法可以实现大豆品种的快速鉴别,同时也为其他农作物品种的快速鉴别提供了一种新思路。