基于大语言模型(GPT-4)的化学感官创造力自动化评估：风味创新的计算范式

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年05月28日 来源：Food Quality and Preference 4.9

编辑推荐：

　　本研究针对化学感官创造力评估的空白领域，创新性地采用GPT-4模型构建"严格GPT"和"灵活GPT"双系统，通过200名英国受试者生成的956组风味组合数据，揭示AI与人类创造力评估的强相关性(r=0.89)，发现新颖性(惊喜度)而非功能性(美味度)是判断核心，为食品工业自动化创新评估提供了新范式。

在美食创新领域，化学感官创造力（chemosensory creativity）——即通过味觉和嗅觉进行创新的能力，长期以来缺乏系统评估方法。传统研究多聚焦视觉和语义领域，而米其林厨师创造的风味组合或植物基肉类的质构突破，却亟待科学量化。更棘手的是，人类对"创意食物"的评价往往主观且耗时，标准测试如替代用途任务(AUT)难以适应风味创新场景。这种评估真空使得食品工业在开发新产品时，既无法快速筛选创意组合，也难以预测消费者对非常规风味的接受度。

针对这一挑战，来自未知机构的研究团队在《Food Quality and Preference》发表突破性研究，首次将大语言模型(GPT-4)应用于化学感官创造力评估。研究人员设计精巧的三阶段实验：首先让200名英国参与者为冰淇淋、冰沙等四类食品生成风味组合；随后由人类和两种GPT-4配置（确定性"严格GPT"温度参数0，随机性"灵活GPT"温度参数1）分别评估这些组合的创意度、美味度和惊喜度；最终通过混合效应模型揭示评估规律。关键技术包括：基于Prolific平台的跨群体数据采集、GPT-4 API的R语言调用、线性混合模型(lmerTest包)统计分析，以及通过温度参数调控LLM输出随机性。

研究结果部分呈现多重发现：

3.1. 人类与机器创造力评估的对比
数据显示灵活GPT与人类评估相关性(r=0.89)显著高于严格GPT(r=0.71)，表明适度随机性能更好模拟人类判断。但针对低频（最罕见）组合，相关性骤降至0.26-0.6，揭示LLM对"常规组合"判断更准的固有局限。

3.2. 创造力判断的预测机制
惊喜度与创意度的强相关(r_human=0.94, r_flexGPT=0.99)远超美味度的负相关(r_human=-0.78)，证实"新颖性优先"的评估逻辑。灵活GPT更极端化这种趋势，对高惊喜组合的创意评分比人类高17%。

讨论部分指出，该研究不仅验证了LLM替代人类评估的可行性，更揭示食品创意的认知本质——人们更宽容"难吃但新奇"的组合。实际应用中，灵活GPT可作为食品研发的预筛工具，大幅降低创新试错成本。但文化局限性（仅测试英国样本）和年龄偏差（18-40岁）提示需扩展跨文化验证。未来研究可结合真实感官测试，或追踪厨师创意发展轨迹，进一步优化模型。这项开创性工作为计算美食学(computational gastronomy)提供了新范式，使AI从评估工具升级为创新合作伙伴。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号