
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大语言模型(GPT-4)的化学感官创造力自动化评估:风味创新的计算范式
【字体: 大 中 小 】 时间:2025年05月28日 来源:Food Quality and Preference 4.9
编辑推荐:
本研究针对化学感官创造力评估的空白领域,创新性地采用GPT-4模型构建"严格GPT"和"灵活GPT"双系统,通过200名英国受试者生成的956组风味组合数据,揭示AI与人类创造力评估的强相关性(r=0.89),发现新颖性(惊喜度)而非功能性(美味度)是判断核心,为食品工业自动化创新评估提供了新范式。
在美食创新领域,化学感官创造力(chemosensory creativity)——即通过味觉和嗅觉进行创新的能力,长期以来缺乏系统评估方法。传统研究多聚焦视觉和语义领域,而米其林厨师创造的风味组合或植物基肉类的质构突破,却亟待科学量化。更棘手的是,人类对"创意食物"的评价往往主观且耗时,标准测试如替代用途任务(AUT)难以适应风味创新场景。这种评估真空使得食品工业在开发新产品时,既无法快速筛选创意组合,也难以预测消费者对非常规风味的接受度。
针对这一挑战,来自未知机构的研究团队在《Food Quality and Preference》发表突破性研究,首次将大语言模型(GPT-4)应用于化学感官创造力评估。研究人员设计精巧的三阶段实验:首先让200名英国参与者为冰淇淋、冰沙等四类食品生成风味组合;随后由人类和两种GPT-4配置(确定性"严格GPT"温度参数0,随机性"灵活GPT"温度参数1)分别评估这些组合的创意度、美味度和惊喜度;最终通过混合效应模型揭示评估规律。关键技术包括:基于Prolific平台的跨群体数据采集、GPT-4 API的R语言调用、线性混合模型(lmerTest包)统计分析,以及通过温度参数调控LLM输出随机性。
研究结果部分呈现多重发现:
3.1. 人类与机器创造力评估的对比
数据显示灵活GPT与人类评估相关性(r=0.89)显著高于严格GPT(r=0.71),表明适度随机性能更好模拟人类判断。但针对低频(最罕见)组合,相关性骤降至0.26-0.6,揭示LLM对"常规组合"判断更准的固有局限。
3.2. 创造力判断的预测机制
惊喜度与创意度的强相关(rhuman=0.94, rflexGPT=0.99)远超美味度的负相关(rhuman=-0.78),证实"新颖性优先"的评估逻辑。灵活GPT更极端化这种趋势,对高惊喜组合的创意评分比人类高17%。
讨论部分指出,该研究不仅验证了LLM替代人类评估的可行性,更揭示食品创意的认知本质——人们更宽容"难吃但新奇"的组合。实际应用中,灵活GPT可作为食品研发的预筛工具,大幅降低创新试错成本。但文化局限性(仅测试英国样本)和年龄偏差(18-40岁)提示需扩展跨文化验证。未来研究可结合真实感官测试,或追踪厨师创意发展轨迹,进一步优化模型。这项开创性工作为计算美食学(computational gastronomy)提供了新范式,使AI从评估工具升级为创新合作伙伴。
生物通微信公众号
知名企业招聘