用于识别再利用机会的大语言模型:系统性评估

《Proceedings of the Design Society》:Large language models for identifying repurposing opportunities: a systematic evaluation

【字体: 时间:2026年07月03日 来源:Proceedings of the Design Society

编辑推荐:

  在循环经济(Circular Economy, CE)框架下,再利用可延长产品生命周期并降低资源消耗,但识别可行的再利用机会仍具挑战性。为此,研究人员基于同行评审文献中已记录的再利用案例,评估了大语言模型(Large Language Models, LLMs

  
在循环经济(Circular Economy, CE)框架下,再利用可延长产品生命周期并降低资源消耗,但识别可行的再利用机会仍具挑战性。为此,研究人员基于同行评审文献中已记录的再利用案例,评估了大语言模型(Large Language Models, LLMs)识别此类再利用场景及其相关属性的能力。测试涵盖三种模型,结果显示LLMs在识别再利用场景方面具备潜力,但由于属性识别存在系统性局限,仍需结构化方法与进一步研究支持。

论文解读

研究背景与意义

全球资源消耗持续增长,据测算2025年地球生态超载日(Earth Overshoot Day)为7月24日,而2060年全球物质资源使用量预计较2020年翻倍,经济增长对传统资源消耗的依赖已成为可持续发展核心矛盾。欧盟已将资源管理效率作为核心政策目标,循环经济(CE)因可实现经济增长与资源消耗脱钩成为关键应对策略。在CE的多层级策略中,再利用(repurposing)属于高价值保留型路径:相较于回收(recycling)需破坏产品结构并消耗大量能源重构材料,再利用通过保留产品原有结构与功能、将其迁移至替代应用场景,可在维持附加价值的同时显著降低整体能耗与资源投入,被证实可减少53%原生原材料消耗。但目前再利用在研究与工业实践中渗透率极低,核心瓶颈之一是缺乏系统化识别可行再利用场景的方法——现有研究多依赖预定义场景,且即使场景本身可行,具体产品的属性兼容性不足也会导致90%以上的个体选项无法落地,例如笔记本电脑改造为瘦客户端的案例中仅9%设备满足技术要求。近期研究虽证实LLMs可生成新颖再利用思路,但其能否可靠识别技术可行的再利用场景尚未得到验证,因此本研究聚焦评估LLMs对该过程的系统性支撑能力。本研究成果发表于《Proceedings of the Design Society》。

关键技术方法

研究人员采用四阶段研究设计:首先基于PRISMA 2020方法学构建验证数据集,通过Scopus与Web of Science数据库检索2015–2025年工程与环境科学领域同行评审文献,经筛选提取105个再利用案例,去重后得到72个唯一场景,按复杂度分为低复杂度集群(n=50,仅需物理复用)与高复杂度集群(n=22,需系统集成与功能耦合),同时筛选出32个含≥3项记录属性的场景,按文献出现频率将属性分为高频(前20%)、中频(中间60%)与低频(后20%)三类;其次设计标准化提示词,统一包含问题描述、任务描述与格式约束,分别针对场景识别(RQ1)与属性识别(RQ2)两类任务,经10%数据集迭代优化确保无表述偏差;随后定义量化评估指标,场景识别率(Scenario Identification Rate, SI)为模型输出中命中数据集记录场景的比例,属性识别率(Property Identification Rate, PI)为模型输出中命中记录属性的比例,所有结果经语义匹配与人工校验;最后选取GPT-5、Claude Sonnet 4.5、Gemini 2.5 Pro三款前沿模型,通过官方API在零样本条件下执行十次独立运行,共完成3120次实验以确保结果稳健。

研究结果

性能发现
三类模型的场景识别率为78%–84%,属性识别率仅为42%–46%,无任何单次运行能完整识别某场景的全部记录属性。模型间性能差异极小,任务类型与场景复杂度的影响远高于架构差异。低复杂度场景的平均SI达90%,高复杂度场景则降至60%;属性识别呈现显著的频率依赖性:高频属性识别率超70%,中频属性识别率约40%,低频属性识别率为0,表明模型对罕见技术特征的捕捉能力缺失。
结果分析
RQ1的结果显示,LLMs在低复杂度场景中可稳定输出有效再利用概念,但在高复杂度场景中因难以处理多属性交互与技术约束,识别准确率显著下降,证明其泛化能力局限于简单结构关系。RQ2的结果揭示属性识别的选择性偏差:模型依赖训练数据中的统计关联而非领域推理,导致罕见或案例特异性属性被系统性遗漏,且不存在单模型可完整覆盖属性集的情况,反映其缺乏系统性的技术特征提取能力。

讨论与结论

讨论部分指出,性能局限的核心原因是模型对技术问题的理解能力不足,而非提示词设计缺陷:相同提示下低复杂度场景表现稳定,证明任务理解无偏差,但高复杂度场景的性能衰减、属性识别的频率依赖与完整性缺失共同指向模型仅具备模式识别能力,缺乏结构化领域知识与工程推理机制。研究同时指出当前局限性,包括数据集未覆盖所有潜在场景、零样本设置未引入外部工程知识、未评估模型生成的新颖场景可行性等,未来可通过检索增强生成(Retrieval-Augmented Generation, RAG)、领域微调、引入专家验证等方式提升可靠性。
研究最终结论为:LLMs可为低复杂度再利用场景的识别提供有效支撑,但在高复杂度场景与属性识别任务中存在系统性局限,目前尚不具备可靠的再利用技术可行性评估所需的领域推理能力。该研究建立了LLMs在该领域的基准性能框架,明确了后续研究方向,包括超参数敏感性分析、轻量级模型的领域适配、外部知识集成与专家验证流程构建,为开发可落地的再利用机会识别系统提供了方法论基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号