基于大语言模型(GPT-4)的化学感官创造力自动化评估:风味创新的计算范式

【字体: 时间:2025年05月28日 来源:Food Quality and Preference 4.9

编辑推荐:

  本研究针对化学感官创造力评估的空白领域,创新性地采用GPT-4模型构建"严格GPT"和"灵活GPT"双系统,通过200名英国受试者生成的956组风味组合数据,揭示AI与人类创造力评估的强相关性(r=0.89),发现新颖性(惊喜度)而非功能性(美味度)是判断核心,为食品工业自动化创新评估提供了新范式。

  

在美食创新领域,化学感官创造力(chemosensory creativity)——即通过味觉和嗅觉进行创新的能力,长期以来缺乏系统评估方法。传统研究多聚焦视觉和语义领域,而米其林厨师创造的风味组合或植物基肉类的质构突破,却亟待科学量化。更棘手的是,人类对"创意食物"的评价往往主观且耗时,标准测试如替代用途任务(AUT)难以适应风味创新场景。这种评估真空使得食品工业在开发新产品时,既无法快速筛选创意组合,也难以预测消费者对非常规风味的接受度。

针对这一挑战,来自未知机构的研究团队在《Food Quality and Preference》发表突破性研究,首次将大语言模型(GPT-4)应用于化学感官创造力评估。研究人员设计精巧的三阶段实验:首先让200名英国参与者为冰淇淋、冰沙等四类食品生成风味组合;随后由人类和两种GPT-4配置(确定性"严格GPT"温度参数0,随机性"灵活GPT"温度参数1)分别评估这些组合的创意度、美味度和惊喜度;最终通过混合效应模型揭示评估规律。关键技术包括:基于Prolific平台的跨群体数据采集、GPT-4 API的R语言调用、线性混合模型(lmerTest包)统计分析,以及通过温度参数调控LLM输出随机性。

研究结果部分呈现多重发现:

3.1. 人类与机器创造力评估的对比
数据显示灵活GPT与人类评估相关性(r=0.89)显著高于严格GPT(r=0.71),表明适度随机性能更好模拟人类判断。但针对低频(最罕见)组合,相关性骤降至0.26-0.6,揭示LLM对"常规组合"判断更准的固有局限。

3.2. 创造力判断的预测机制
惊喜度与创意度的强相关(rhuman=0.94, rflexGPT=0.99)远超美味度的负相关(rhuman=-0.78),证实"新颖性优先"的评估逻辑。灵活GPT更极端化这种趋势,对高惊喜组合的创意评分比人类高17%。

讨论部分指出,该研究不仅验证了LLM替代人类评估的可行性,更揭示食品创意的认知本质——人们更宽容"难吃但新奇"的组合。实际应用中,灵活GPT可作为食品研发的预筛工具,大幅降低创新试错成本。但文化局限性(仅测试英国样本)和年龄偏差(18-40岁)提示需扩展跨文化验证。未来研究可结合真实感官测试,或追踪厨师创意发展轨迹,进一步优化模型。这项开创性工作为计算美食学(computational gastronomy)提供了新范式,使AI从评估工具升级为创新合作伙伴。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号