从几何到功能:迈向面向工程设计的上下文感知生成式人工智能

《Proceedings of the Design Society》:From geometry to function: towards context-aware generative AI for engineering design

【字体: 时间:2026年07月03日 来源:Proceedings of the Design Society

编辑推荐:

  当前用于计算机辅助设计(Computer-Aided Design,CAD)的生成式人工智能,主要针对几何相似性进行优化,却忽视了功能性、可制造性与可持续性等工程判据。本文针对这一缺口,提出了一个概念性框架,旨在推动生成式CAD从“复制形状”转向“实现功能”。

  
当前用于计算机辅助设计(Computer-Aided Design,CAD)的生成式人工智能,主要针对几何相似性进行优化,却忽视了功能性、可制造性与可持续性等工程判据。本文针对这一缺口,提出了一个概念性框架,旨在推动生成式CAD从“复制形状”转向“实现功能”。研究人员提出了两种混合训练策略:其一为预学习(pre-learning)方法,即利用经合成标注的数据集进行训练,这些数据集通过有限元分析(Finite Element Analysis,FEA)、计算机辅助制造(Computer-Aided Manufacturing,CAM)与生命周期评估(Life Cycle Assessment,LCA)进行评价;其二为自学习(self-learning)方法,即由生成式人工智能将这些基于知识的工具作为强化反馈回路加以利用。
本文发表于《Proceedings of the Design Society》,核心目标是推动生成式计算机辅助设计(Computer-Aided Design,CAD)从以几何相似性为中心的生成范式,转向以工程功能实现为中心的设计范式。研究背景在于,当前生成式人工智能(Generative Artificial Intelligence,GenAI)与大语言模型(Large Language Models,LLMs)已开始广泛进入工程设计领域,能够依据文本描述或多模态输入生成CAD模型。然而,现有方法的训练与评估大多依赖Chamfer Distance(CD)、Intersection-over-Union(IoU)、Normal Consistency(NC)等几何指标,这类指标只能衡量生成形体与参考模型在形状上的接近程度,却无法反映结构是否满足载荷要求、是否可加工制造、是否具备成本合理性与环境可接受性。研究人员据此指出,工程设计的根本并非“形状复现”,而是围绕设计意图、功能需求、工艺约束和应用情境展开,因此现有生成式CAD系统存在明显的“几何偏置”,这正是开展本研究的直接动因。

围绕这一问题,论文提出了三个核心研究问题:哪些工程设计要素能够支撑上下文感知的生成式CAD;训练策略如何整合多目标工程约束;预学习与自学习两类策略之间存在哪些权衡。为回答上述问题,研究人员构建了一个面向功能导向设计过程的概念框架,将工程相关的评价维度引入生成模型训练与评测环节,以突破仅依赖几何相似性学习的局限。论文的基本主张是:若要使生成式AI真正服务工程设计,就必须使其学习“功能—约束—形态”的生成逻辑,而不是仅根据外部形状进行表面模仿。

从研究背景的理论基础看,论文首先回顾了数据驱动生成方法与知识驱动工程方法之间的差异。数据驱动方法具有良好的可扩展性与生成多样性,但常常缺乏物理合理性与工程可行性的约束;知识驱动工程(Knowledge-Based Engineering,KBE)方法则依托显式规则、物理模型与工艺边界条件,能够生成满足功能目标的有效方案,例如拓扑优化、参数化生成设计和基于规则的设计综合等。此类方法尤其适合在数据不足或产品新颖度较高的场景下应用,但其不足在于知识获取、形式化建模、维护更新成本高,适用域相对受限。论文据此将“混合方法”界定为关键方向,即通过将数据驱动模型与仿真、规则、优化等知识型工具耦合,兼顾生成能力与工程有效性。

研究人员采用设计研究方法学(Design Research Methodology,DRM)作为总体研究框架,通过描述性研究与规定性研究相结合的方式提出方案。在技术路线上,论文强调一个关键前提,即必须严格区分“项目上下文”与“可迁移工程知识”。前者包括机床能力、刀具目录、供应链条件、法规约束、材料牌号、质量目标、成本与CO2指标等,会随着具体项目频繁变化;后者则包括功能实现原理、结构规则、公差与设计准则等,相对稳定。论文认为,如果将两者混杂在一起,项目特异性会渗入通用规则,从而削弱模型的可复用性、可维护性与可解释性。因此,训练和评测时应采用“晚绑定”思想:以上下文中立的方式表达功能—几何知识,再在决策时透明地绑定具体上下文参数。研究人员进一步提出,训练集应包含跨情景多样性、负样本与失败信号、保守默认情景与替代情景,并在固定知识核心条件下仅变动上下文进行基准测试,以验证模型是否真正具备上下文敏感的泛化能力。

主要关键技术方法可概括为三类。第一,采用设计研究方法学(DRM)组织研究并提出概念框架。第二,构建两条混合式训练路径:一条是基于强化学习思想的自学习路径,将有限元分析(FEA)、计算机辅助制造(CAM)仿真和生命周期评估(LCA)作为确定性评价器;另一条是基于合成标注数据的预学习路径,从DeepCAD、Fusion360 Gallery、shaft dataset等参数化CAD数据源中提取模型并进行工程指标标注。第三,通过功能规格、制造约束、可持续性与成本指标的多目标建模,将工程价值转化为可学习信号,并用于生成模型的训练、微调与基准评测。本文未涉及生物样本或临床队列来源。

在研究结果部分,论文依照主体结构给出了较为清晰的论证与方法展开。

4. Required contextual information and design knowledge for context-sensitive generative AI systems
本节的核心结果是明确了上下文感知生成式AI系统所需的信息结构。研究人员指出,生成式CAD必须同时处理项目特定上下文与可迁移工程知识,并强调二者在系统设计和训练过程中的严格分离。通过内角圆角、晶格结构、轴连接形式等实例,论文论证了同一工程知识在不同制造路线、材料体系和设备条件下会因上下文不同而产生完全不同的几何决策。由此得出的结论是:实现上下文感知生成,不在于向模型灌输更多几何样本,而在于让模型学会在固定知识库基础上,根据具体环境参数执行透明的情境绑定。该节还提出了一套训练原则,包括知识规则与上下文表分离、跨情景任务覆盖、显式失败标签、默认与替代上下文并行评估,以及固定知识核心下的基准设计。这些内容为后续数据工作流奠定了规范性基础。

5. Proposed data workflow
本节提出了实现功能导向生成式CAD的数据工作流,指出现有CAD生成模型缺少以工程目标为标注依据的数据集,是阻碍领域进展的基础瓶颈。研究人员据此提出两种互补方案:自学习与预学习。总体结论是,若要让模型从几何模仿转向工程性能优化,必须为每个CAD对象配套可量化的功能、制造、成本与可持续性指标,使工程价值维度成为训练信号。

5.1. Approach 1: self-learning approach
该节提出一种基于强化学习思想的自学习框架。研究人员将生成模型与知识型工程评价工具耦合,在给定功能规格后,由模型以概率方式生成N个候选CAD序列,随后通过质量过滤剔除无效或不完整设计,再将保留方案输入FEA、CAM或LCA等工具进行确定性评价。每个设计依据目标工程判据获得评分,高分设计强化模型行为,低分设计触发负向更新。通过这一闭环,模型逐渐学会生成不仅几何上合理,而且在功能、经济性与可制造性上更优的设计。该节的核心贡献在于把知识驱动评价器从“外部验证工具”转化为“内部学习信号源”,从而使生成过程直接面向工程目标。

5.2. Approach 2: pre-learning approach
该节提出预学习路线,即不依赖迭代修正单个CAD对象,而是通过构建“功能规格—理想几何”配对数据集,使生成式AI直接学习输出更优几何。研究人员指出,目前缺少此类现成资源,因此提出合成数据生成流程。首先,从包含参数化构造历史或边界表示(B-Reps)的基础数据集提取CAD模型;其次,为每个模型配置功能规格,如载荷工况、重量约束等;随后,借助知识型工程工具完成确定性评价:功能性可通过特征识别或轻量化FEA评估,可制造性通过CAM刀路可行性与特征可加工性检查评估,可持续性通过材料用量、废料与加工能耗估计评估,成本则通过机时与材料费率模型估计;最后,将CAD实例与其工程指标共同存储,形成体现工程价值的几何—属性配对数据。该节得出的结论是,这一流程可为生成模型微调和代理模型训练提供现实可行的数据基础,使工程判据由“难以纳入的外部限制”转化为“可监督的学习目标”。

6. Discussion
讨论部分围绕两种策略的优势与局限展开,构成论文的重要综合结论。

6.1. Approach 1 – self-learning
研究人员认为,自学习路径能够直接针对工程目标进行优化,是更彻底的混合式方法。其优势在于可将功能性、可制造性、成本和可持续性统一纳入奖励函数,支持多目标权衡、Pareto最优解探索以及偏好学习;同时,这一路径不受限于现有数据集覆盖范围,可以借助确定性的知识型评价“神谕”学习训练数据中未显式包含的设计策略,理论上具有更高的泛化潜力。
但论文也明确指出,这一路径面临显著实现挑战。首先是计算成本高,每个候选设计都需要进行完整工程评价,单次评价耗时可达10–60秒,而收敛通常需要数百至数千轮迭代。其次,奖励稀疏性严重,许多生成序列可能在几何有效性、网格划分或基本可制造性上直接失败,从而无法提供稳定梯度信号。再次,特征识别误差和仿真失败会引入噪声,降低学习稳定性。最后,在训练层面还需采用近端策略优化(Proximal Policy Optimization,PPO)、KL散度约束、课程学习(curriculum learning)和代理模型审计等策略,以避免模式坍塌或发散。由此可见,自学习更灵活,但研发和训练难度明显更高。

6.1.1. Experimental validation
该小节给出了一个概念验证实验。研究人员选取Pitman arm CAD模型,利用具备工具调用能力的Claude 4.5与Autodesk Inventor交互,使其能够修改几何、执行FEA并评估结果。设计目标设定为在特定载荷下最小化重量并维持结构完整性,奖励信号由低质量和低Von Mises应力共同构成。实验不包含模型权重更新,因此并非严格意义上的强化学习训练,而是采用类似强化学习的直接仿真反馈模式。尽管实验问题被有意简化,未覆盖真实工程设计的复杂性,但结果证明了本文核心设想的可执行性:数据驱动智能体能够有效调用并解释知识型工程工具,且在设计迭代中表现出目标导向与可理解的推理行为,只增加适量材料以平衡体积与应力。论文将此结果界定为“存在性证明”,而非完整验证。

6.2. Approach 2 – pre-learning
对于预学习路径,研究人员认为其最大优点在于实现直接、工程上更易部署。利用现有参数化CAD数据集并附加确定性工程指标后,可较容易构建具备工程意识的训练数据;而且一旦标注完成,即可训练代理模型近似高成本仿真器,并高效地比较不同模型架构与训练配置。
然而,该方法的局限也十分明确。首先,数据集覆盖面受源数据几何多样性限制,复杂或特定领域设计在训练集中可能代表不足。其次,更关键的问题在于,自动分析生成的标签本质上受制于标注阶段所设定的假设,难以推广到新的场景。由于其依赖理想化载荷工况与标准化制造情景,得到的标签只是在固定假设下的静态评价快照,无法反映真实工程设计中反复迭代、需求演变和约束变化的过程特征。因此,预学习提供的是静态监督,而非与工程目标持续交互的自适应改进机制,其探索超出训练分布的新设计方案的能力较弱。

7. Limitations
论文明确提出了方法边界。第一,该框架要求功能需求能够被计算性指标量化,例如承载性能可由FEA评估,成本可由物料清单和加工费用估算;但对于可维修性、可服务性或用户体验等定义较弱的设计目标,则难以直接适用。第二,计算资源需求较大。无论是大语言模型推理还是仿真评价,都具有显著时间和算力开销,尽管这一特征与拓扑优化等成熟计算设计方法具有可比性,但在资源受限或时效要求高的应用中仍会限制部署。

综合全文,论文的讨论部分表明,生成式CAD若想真正适配工程设计,必须突破单一几何拟合框架,引入功能、制造、成本与可持续性等多维工程价值,并通过上下文分离与知识耦合机制实现真正的情境敏感设计。自学习路径更具适应性与探索能力,适合追求工程目标直接优化的场景;预学习路径更便于落地与规模化训练,适合构建工程感知型基础模型。两者并非互斥,而是可形成互补的混合生态。

研究结论部分可译为:当前生成式CAD方法优化的是几何相似性而非工程价值,所采用的Chamfer Distance等指标忽略了功能性能与可制造性。本文提出了一个框架,通过两种互补策略将生成式CAD重新导向工程目标:其一是在合成标注数据上进行预学习,其二是通过仿真反馈产生的强化信号开展自学习。该方法能够支持基于功能需求和制造要求的基准评测,支持多目标权衡,并为结合数据驱动学习与知识驱动评价的混合系统奠定基础。通过将关注点从形状保真度转向性能与可行性,生成系统将更贴近工程推理方式与设计意图。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号