
研究背景
哈密瓜的风味品质和商品价值与甜度密切相关,而可溶性固形物含量(SSC)是评价果实甜度的重要指标。传统SSC检测多依赖折光仪测定,虽结果可靠,但需取样、榨汁或切片,具有破坏性,难以满足批量化、连续化和在线分选对快速无损检测的需求。高光谱成像技术融合了图像与光谱信息,能够间接反映果实内部化学成分(如糖、水分、酸度)的分布与含量,为非破坏性检测提供了新路径。然而,现有研究多集中于单一品种,跨品种检测的模型泛化能力仍面临挑战,尤其是哈密瓜这类果皮差异大、糖分分布不均的厚皮甜瓜。
近日,青岛农业大学赵磊老师团队在《Symmetry》发表了一项研究,系统探索了高光谱成像结合机器学习在哈密瓜多品种可溶性固形物(SSC)无损检测中的应用,提出了一种基于RPD加权的集成模型,显著提升了跨品种预测的鲁棒性和准确性。
图1.光谱采集过程。
研究方法
样本准备:
品种:西州蜜、伽师瓜、金凤凰、黑眉毛(各40个,共160个);
采样位置:赤道部位果肉,分别测量近核部(BRIX1)和近皮部(BRIX2)的SSC;
数据集划分:每品种30个训练,10个测试;
高光谱数据采集:通过穹顶光源 + 精密电动平移台搭载Resonon Pika L高光谱成像仪,结合150 W石英钨卤素灯、输送装置等进行高光谱数据采集;
光谱参数:
波长范围:400–1000 nm;
光谱分辨率:2.7 nm;
参数设置:帧率16 Hz,物距 978 mm、图像采集速度 15.3 mm/s;
数据处理和模型构建:研究采用“基线校正+SNV+Savitzky-Golay平滑”进行光谱预处理,并比较PLSR、SVR、RF、XGBoost和LightGBM等模型,最终通过随机搜索、5折交叉验证及基于验证集RPD加权的集成策略优化预测性能;
表1.不同预处理方法下PLSR模型预测性能比较(以BRIX1为例)。

图2.每个品种的样品子集的平均光谱:(a)原始光谱;(b)预处理后的光谱。
表2.模型性能的综合比较。

图3.四种哈密瓜品种无损SSC评估的模型结果:(a) 基于偏最小二乘回归(PLSR)模型的 SSC(BRIX1) 结果;(b) 基于随机森林(RF)模型的 SSC(BRIX2) 结果;(c) 集成模型对 SSC(BRIX1) 的预测结果;(d) 集成模型对 SSC(BRIX2) 的预测结果。
表3.所有基础模型和集成模型在独立测试集上的偏差-方差分解结果。
图4.集成模型预测误差分析:(a) BRIX1实测值与预测值的散点图(按品种着色);(b) BRIX2实测值与预测值的散点图(按品种着色)。
研究结果
组合预处理提高了糖敏感波段光谱一致性,增强了模型建模质量与泛化能力;
BRIX1预测中,PLSR表现出较强泛化性,但集成模型整体性能最优;
BRIX2预测中,RF为最佳单一模型,集成模型进一步提升了近皮SSC预测稳定性;
RPD加权集成策略融合了不同模型优势,实现了预测精度与泛化稳定性的平衡;
不同品种间仍存在预测差异,提示后续需扩大样本并引入品种自适应校正;
结语
研究以四种主栽哈密瓜品种为对象,系统验证了高光谱成像技术结合机器学习在多品种SSC无损检测中的可行性。同时,研究也提示,跨品种统一模型仍会受到品种表型、生理差异及样本来源的影响。未来,随着样本规模扩大、整果检测场景验证以及品种自适应校正方法的引入,高光谱无损检测有望在果品品质分级、采后分选和智慧农业中发挥更大作用。
发表期刊:Symmetry【影响因子:2.2】
研究单位:青岛农业大学、哈密市农牧产业发展投资有限公司等
使用设备:Resonon Pika L高光谱成像仪
DOI:https://doi.org/10.3390/sym18030462