风味解码:基于EEG频谱与Hjorth参数利用增强树回归模型预测咖啡感官属性
【字体:
大
中
小
】
时间:2025年10月10日
来源:Frontiers in Human Neuroscience 2.7
编辑推荐:
本文探索性地利用脑电图(EEG)频谱与时域特征,结合最小二乘提升树(LSBoost)机器学习模型,成功预测咖啡的苦、甜、酸和涩感强度。研究采用留一被试交叉验证(LOSO)和贝叶斯超参数优化,模型表现出高预测精度(MAE < 0.75)和中等至大效应稳健性(Cohen's d > 0.6),为替代传统描述性感官分析(DSA)提供了客观、神经营销学与感官科学交叉的新途径。
咖啡作为全球热饮市场的主要组成部分,年产量超过1.76亿袋,消费量达70亿公斤。消费者对咖啡的偏好和购买意愿主要受其主观风味体验驱动,包括味觉、嗅觉与口腔触觉等多模态感知。风味感知涉及从孤束核、丘脑腹后内侧核至岛叶前部味觉皮层的信号传递,并在眶额皮层(OFC)整合嗅觉、体感与三叉神经输入,最终形成带有情感效价的多模态表征。
目前,咖啡风味评估主要依赖描述性感官分析(DSA),由专业品鉴小组对标准化感官属性进行评分。然而,DSA易受感觉适应、期望误差、光环效应等多种生理与心理偏倚的影响。近年来,基于生物电信号的直接测量技术——如脑电图(EEG)——被提出作为补充或替代工具。已有研究发现δ波段相位、α与θ波段频谱功率等EEG特征与味觉处理相关,但多数研究仍局限于基础味觉溶液分类,而非连续强度预测,且存在反向推理风险。
为此,本研究采用机器学习(ML)中的模式解码方法,使用提升树回归模型从EEG信号预测咖啡感官属性强度,以避免传统DSA的主观偏倚,并为风味神经机制提供新的数据驱动见解。
过去研究多集中于使用EEG和机器学习区分基本味觉溶液。例如,De等人(2023)利用长短期记忆循环神经网络(LSTM-RNN)对酸、甜、苦、咸、鲜味和中性溶液进行分类,准确率达97.16%;Xia等人(2024)使用卷积神经网络(CNN)处理空时增强的EEG原始信号,判别四种基本味道,准确率99.5%。仅有Zhao等人(2022)尝试预测五种基本味道的强度,但其最佳模型(XGBoost)拟合优度R2在-0.22到0.18之间,预测性能有限。
此外,仅有少数研究涉及真实食物或饮料。González-Espa?a等人(2023)用SVM区分葡萄酒与水、以及不同葡萄酒,准确率超70%;Naser与Aydemir(2024)使用k近邻(kNN)和随机森林(RF)区分橙油、薄荷油、百里香油和丁香油,最高准确率87.5%。在咖啡研究中,Maram等人(2023)用CNN分类咖啡品牌偏好(准确率83.43%),Xu等人(2021)则用贝叶斯回归预测情绪反应,均未直接涉及感官属性强度预测。因此,现有模型无法替代或补充传统DSA方法。
15名专业咖啡品鉴师(9名女性,年龄24–59岁,平均40.13±13.80岁)参与实验,按经验分为训练组(T,经验<3年)与专家组(E,经验>3年)。样本量虽低于以往EEG研究平均值(19.67±12.31),但符合DSA研究通常使用5–15名专家的惯例。两组在平均年龄上无显著差异,但性别比例不平衡(E组2名女性,T组7名女性)。敏感性分析(G*Power软件)显示可检测中等至大效应量(f = 0.302)。研究获伦理委员会批准,遵循赫尔辛基宣言,所有参与者签署知情同意。
使用NVX-52系统(Medical Computer System Ltd.)采集38导联 scalp EEG,电极按10-10系统布置,参考自由,以左乳突(M1)为接地。数据以2 kHz采样频率、24位分辨率记录(Neorec软件)。实验指令通过iMotions软件呈现,并通过ESB同步盒发送TTL脉冲确保数据同步。所有计算在AMD Ryzen? Threadripper PRO工作站(32核,256 GB DDR4内存)上使用MATLAB R2024b完成,未使用GPU加速。
实验包含60秒闭眼基线(BSL)和两个阶段:基准(Be)与咖啡(Co)。Be阶段品尝4种溶液:蔗糖(甜)、咖啡因(苦)、柠檬酸(酸)、硫酸铝钾(涩);Co阶段品尝4种不同阿拉比卡/罗布斯塔比例(100:0, 80:20, 85:15, 70:30)的咖啡。阶段顺序固定,品尝顺序随机。液体 administration masked,Be溶液为室温,Co咖啡约60°C。每次品尝前用水漱口(WR任务),含液10秒(TL任务)后吞咽,随后在0–10分尺度评分苦、甜、酸、涩强度。
使用EEGLab工具箱进行预处理:EEG重采样至512 Hz,0.1–40 Hz带通滤波(四阶零相移巴特沃斯),CleanLine去除50/100 Hz工频干扰,ASR(κ=20)校正非平稳伪迹。采用SOBI算法进行ICA分解,ICLabel(Pr{!brain}≥0.9)识别并去除伪迹成分(平均3.8±1.373个),最后使用REST算法重参考至零理想电位。
清洗后的EEG数据对齐TTL脉冲 onset,按实验阶段分段(BSL、WR、TL)。个体α频率(IAF)定义为7.5–12.5 Hz频段功率谱密度(PSD)重心(Welch方法,1秒汉明窗,50%重叠),用于定义被试特异的δ、θ、α、β、γ频带:δ = [0, IAF-6],θ = [IAF-6, IAF-2],α = [IAF-2, IAF+2],β = [IAF+2, IAF+16],γ = [IAF+16, IAF+25]。
特征从WR与TL时段提取,以避免非任务相关活动干扰。对每个通道C与频带B,计算归一化频谱功率pC,B(公式2),即B频段内Welch PSD积分与全频段积分之比。同时计算Hjorth参数:活动度(AC)、移动度(MC)、复杂度(CC)(公式3),其中活动度为时间方差。此外,考虑 expertise level(组别)与年龄的影响。特征向量(306维)由频谱(190维)、时域(114维)特征及年龄、组别(分类变量)拼接而成。TL向量xT,P相对于WR向量yT,P进行归一化(公式4,Hadamard除法)。最终构建Be、Co及合并BeCo三个数据集(规模分别为60×306、60×306、120×306),目标变量y经log(1+y)转换。
选择LSBoost(最小二乘提升树)作为预测模型,因其非线性集成特性与内置特征选择能力。超参数包括学习器数量(n∈[1,500])、学习率(ρ∈[0.01,1])、叶节点大小(ls∈[1,100])、最大分裂数(ns∈[1,100])及标准化方法(S∈{z-score, minmax, median, none})。通过100步贝叶斯优化(目标函数为留一被试交叉验证的MAE)求解CASH问题(公式5),最大评估次数100,随机种子固定。
基线模型为均值回归器(Me)与lasso回归(LR),lasso惩罚项λ按公式6设置(n=56, p=306)。通过Cohen's d(公式7)比较LSBoost与基线模型的MAE差异,d>0.5、0.8分别对应中、大效应,显著性由95%置信区间(非中心t分布)评估。对显著模型,提取特征重要性(归一化至总和1),绘制地形图展示通道级重要性分布。
四个模型显示显著改进:Be阶段预测苦(Bi)与甜(Sw),Co阶段预测酸(Ac),BeCo阶段预测涩(As)。总体MAE为0.537±0.073(反log转换后0.714±0.124),Cohen's d为dMe = 0.858±0.341, dLR = 0.897±0.326。Ac预测性能最佳(MAE = 0.459±0.178),Sw最差(MAE = 0.600±0.282);Bi模型稳健性最高(dMe = 1.344, dLR = 1.372),Sw最低(dMe = 0.651, dLR = 0.660)。
最优超参数因目标与数据集而异:Bi(Be)使用minmax标准化、n=271、ρ=0.27、ls=7、ns=74;Sw(Be)为z-score、n=498、ρ=0.01、ls=2、ns=77;Ac(Co)为minmax、n=500、ρ=0.01、ls=1、ns=100;As(BeCo)为无标准化、n=500、ρ=0.01、ls=1、ns=100。训练时间17.35–141.78秒不等。
特征重要性分析显示,频谱功率(尤其pα,中位数0.139)总体贡献高于时域参数(M最低,中位数0.034)。年龄与组别在部分模型中为预测因子:年龄对Sw(Be)与Ac(Co)重要,组别对Ac(Co)与As(BeCo)重要,且组别重要性最高(中位数0.252)。地形图表明中央、枕、顶、额区通道贡献最大。
本研究成功使用EEG特征与LSBoost模型预测咖啡感官属性强度,验证了EEG结合机器学习在风味评估中的可行性。模型性能优于均值与lasso基准,具较高精度与稳健性。Ac的易预测性契合既往研究(Zhao等人2022),Sw的预测难度与低判别性(De等人2023)一致,而Bi的高稳健性或反映苦味敏感性的进化基础(Wooding等人2021)。
频谱特征(pα、pβ、pγ、pδ、pθ)的重要性与以往研究一致,时域参数(Hjorth参数)的有效性则支持使用原始EEG信号的深度学习模型。中央-顶-额区的重要性符合味觉处理神经通路,年龄与 expertise 的影响则呼应了Croijmans与Majid(2016)及Mojet(2003)的发现。
研究存在若干局限:样本量较小,数据质量受肌电伪迹影响;实验设计存在潜在偏倚(固定阶段顺序、温度差异、视觉线索);缺乏重测信度验证。未来需扩大样本、改进盲法设计、进行纵向研究。尽管如此,本研究为基于EEG的客观风味评估奠定了基础,有望替代传统DSA方法。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号