基于轨迹的无训练扩散模型:实现精准可控的图像生成新方法 中文标题

《INTERNATIONAL JOURNAL OF COMPUTER VISION》:TraDiffusion: Trajectory-Based Training-Free Image Generation

【字体: 时间:2025年10月18日 来源:INTERNATIONAL JOURNAL OF COMPUTER VISION 9.3

编辑推荐:

  来自某研究团队的研究人员针对文本到图像生成中精确空间控制难题,开发了一种基于轨迹的无训练调控方法TraDiffusion。该方法通过设计距离感知能量函数引导潜在变量,实现在鼠标轨迹限定区域内的高质量图像生成,实验证明其能灵活操纵生成图像的显著区域、属性及关系,为可控AI图像生成提供了创新解决方案。

  
本研究提出一种无需训练、基于轨迹的可控文本到图像生成方法TraDiffusion。该创新技术允许用户通过鼠标轨迹轻松引导图像生成过程。为实现精确控制,研究团队设计了一种距离感知能量函数,可有效引导潜在变量,确保生成焦点始终集中于轨迹定义的区域内。该能量函数包含控制函数(将生成内容拉近至指定轨迹)和移动函数(抑制轨迹远端区域的生成活性)。通过在COCO数据集上的大量实验与定性评估,结果表明TraDiffusion能够实现更简单、更自然的图像控制。此外,该方法还展现出对生成图像中显著区域、属性及关系的操纵能力,并支持基于任意轨迹或增强轨迹的视觉输入。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号