基于轨迹的无训练扩散模型：实现精准可控的图像生成新方法中文标题

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《INTERNATIONAL JOURNAL OF COMPUTER VISION》：TraDiffusion: Trajectory-Based Training-Free Image Generation

【字体：大中小】 时间：2025年10月18日 来源：INTERNATIONAL JOURNAL OF COMPUTER VISION 9.3

编辑推荐：

　　来自某研究团队的研究人员针对文本到图像生成中精确空间控制难题，开发了一种基于轨迹的无训练调控方法TraDiffusion。该方法通过设计距离感知能量函数引导潜在变量，实现在鼠标轨迹限定区域内的高质量图像生成，实验证明其能灵活操纵生成图像的显著区域、属性及关系，为可控AI图像生成提供了创新解决方案。

本研究提出一种无需训练、基于轨迹的可控文本到图像生成方法TraDiffusion。该创新技术允许用户通过鼠标轨迹轻松引导图像生成过程。为实现精确控制，研究团队设计了一种距离感知能量函数，可有效引导潜在变量，确保生成焦点始终集中于轨迹定义的区域内。该能量函数包含控制函数（将生成内容拉近至指定轨迹）和移动函数（抑制轨迹远端区域的生成活性）。通过在COCO数据集上的大量实验与定性评估，结果表明TraDiffusion能够实现更简单、更自然的图像控制。此外，该方法还展现出对生成图像中显著区域、属性及关系的操纵能力，并支持基于任意轨迹或增强轨迹的视觉输入。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号