LN3DIFF++:可扩展的潜在神经场扩散技术,用于快速生成三维模型

《IEEE Transactions on Pattern Analysis and Machine Intelligence》:LN3DIFF++: Scalable Latent Neural Fields Diffusion for Speedy 3D Generation

【字体: 时间:2025年11月25日 来源:IEEE Transactions on Pattern Analysis and Machine Intelligence 18.6

编辑推荐:

  神经渲染领域提出LN3DIFF++框架,通过3D架构与VAE编码构建潜在空间,结合Transformer解码器生成高容量3D神经场,实现ShapeNet、FFHQ及Objaverse上更优的快速3D生成。

  

摘要:

神经渲染领域取得了显著进展,这得益于生成模型和可微分渲染技术的进步。虽然2D扩散技术已经取得了显著成果,但开发统一的3D扩散流程仍然是一个未解决的挑战。本文提出了一种新的框架LN3DIFF++,旨在填补这一空白,实现快速、高质量且多用途的条件式3D生成。我们的方法利用了具有3D感知能力的架构和变分自编码器(VAE)将输入图像编码到结构化、紧凑的3D潜在空间中。然后,基于Transformer的解码器将潜在表示解码为高容量的3D神经场。通过在具有3D感知能力的潜在空间上训练扩散模型,我们的方法在ShapeNet和FFHQ数据集上的特定类别3D生成任务中表现优异,并且在Objaverse数据集上实现了无类别图像/文本条件下的3D生成。此外,它在推理速度上也超过了现有的3D扩散方法,且无需针对每个实例进行优化。视频演示可以在我们的项目网页上找到:https://nirvanalan.github.io/projects/ln3diff。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号