
-
生物通官微
陪你抓住生命科技
跳动的脉搏
LCDiff:基于粗到细扩散和掩码引导投票机制的线稿着色方法及其在动画制作中的应用
【字体: 大 中 小 】 时间:2025年09月24日 来源:Domestic Animal Endocrinology 2.1
编辑推荐:
本文推荐LCDiff(Line art colorization with coarse-to-fine diffusion and mask-guided voting)方法,通过结合光流初步颜色估计(optical flow-based preliminary color estimation)和标签图扩散细化(label map diffusion refinement)模块的粗到细框架,有效处理动画帧间大运动;引入色彩校正通路(color correction pathway)避免序列处理中的误差累积;采用掩码引导投票机制(mask-guided voting)解决像素级处理中的颜色碎片化问题,显著提升线稿着色质量与一致性。
Segment-based animation colorization
早期线稿着色研究主要集中于线段匹配策略,依赖传统图像处理方法进行着色[12][13][14][15]。Maejima等人[16]提出基于图匹配的线稿着色方法,利用形状上下文和边缘长度相似性进行区域匹配。该方法采用光谱匹配算法选择最优参考图像进行着色,但在复杂场景中的性能存在局限。
Framework
我们提出的LCDiff框架如图2所示,具体包含三个核心模块。首先,我们引入基于光流的初步颜色估计模块(图2(a)),用于探索参考线与目标线稿之间的运动关系并合成初步颜色图像。该模块在角色发生大幅度运动时尤为关键。其次,我们设计了标签图扩散细化模块(图2(b)),通过扩散过程优化颜色分布的细节一致性。最后,我们整合掩码引导投票机制(图2(c)),通过目标线稿掩码指导颜色分配,确保同一区域内颜色的一致性。
Datasets and evaluation metrics
数据集: 为有效训练和评估模型,我们采用两个专业线稿着色数据集:PaintBucket-Character数据集[30]和Anita数据集[33]。PaintBucket-Character数据集包含14,545张图像,其中11,345张用于训练,3200张用于验证与测试,涵盖多种动漫角色风格与构图(如面部特写和全身像)。Anita数据集包含16,000张手动绘制和着色的帧,...
Conclusion
本文提出LCDiff,一种新颖的粗到细渐进式线稿着色框架。我们的方法整合了三个关键组件:结合光流初步颜色估计和标签图扩散细化模块的粗到细框架,通过先捕捉角色轮廓再增强边缘对齐精度,有效处理帧间大运动;扩散模型中的色彩校正通路,防止序列处理中的误差累积;以及掩码引导投票机制,解决像素级处理中的颜色碎片化问题。
Declaration of competing interest
作者声明不存在已知的竞争性财务利益或个人关系,这些利益或关系可能影响本文所报告的研究成果。
生物通微信公众号
知名企业招聘