
-
生物通官微
陪你抓住生命科技
跳动的脉搏
中国传统绘画元素的三维重建图像生成技术研究
【字体: 大 中 小 】 时间:2025年06月25日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
为解决传统中国绘画元素缺乏三维数据集和重建技术难题,研究人员提出TCPE-3D框架,通过OTX-MVG模块生成多视角图像,结合NeRF合成模块和网格生成技术,实现高保真3D重建。该研究不仅解决了Janus问题,还构建了3DTCP数据集,为文化遗产数字化保护与VR应用提供了新工具。
中国传统绘画作为文化遗产的重要载体,其数字化保护一直面临技术瓶颈。当前三维重建技术多集中于实物对象,而传统绘画的二维特性与抽象风格使得直接应用现有方法效果不佳。更棘手的是,缺乏专门的三维数据集和针对性的算法,导致重建结果常出现多面体扭曲(Janus问题)和细节丢失。这一现状严重制约了绘画元素在虚拟现实、数字艺术等领域的创新应用。
西北大学的研究团队在《Engineering Applications of Artificial Intelligence》发表论文,提出名为TCPE-3D的创新框架。该研究通过三个核心技术模块:OTX-MVG多视角生成模块利用扩散模型从单幅图像预测六个固定视角;NeRF合成模块采用ZeroRF优化训练过程,实现连续视角预测;网格生成模块则通过Nerf2mesh将LLFF格式数据转化为高质量网格模型。研究同时构建了3DTCP数据集,包含从合作机构获取的200幅去背景绘画元素,涵盖人物、花鸟等主题。
主要技术方法
研究采用多阶段处理流程:1)通过分割算法提取绘画元素;2)使用改进的Stable Diffusion模型生成多视角图像;3)基于NeRF的ZeroRF方法合成连续视角;4)双层级MLP网络分解光照信息生成纹理。实验数据来自合作机构提供的数字绘画库及开源数据库。
研究结果
传统方法到3D生成
对比传统深度相机和激光扫描技术,指出单图像重建的局限性,为后续神经网络方法提供理论依据。
整体结构
OTX-MVG模块显著提升视角一致性,NeRF合成模块训练效率较传统方法提高40%,网格生成模块的PSNR指标达28.6dB。
数据集
3DTCP数据集包含200幅标注图像,涵盖5大类主题,为领域内首个专门针对中国绘画的3D重建数据集。
主要结果
定量对比显示,TCPE-3D在LPIPS(学习感知图像块相似度)指标上优于DreamGaussian等基线模型23.7%,视觉评估中解决90%的Janus问题案例。
消融实验
验证了OTX-MVG中视角数量与质量的正相关性,六视角配置达到最佳平衡。
用户研究
40位艺术专业评估者中,83%认为TCPE-3D生成模型更符合传统美学特征,尤其在《佛像》等复杂元素上优势显著。
结论与意义
该研究突破性地将NeRF技术应用于中国传统绘画领域,提出的TCPE-3D框架不仅解决了艺术类图像重建的特殊挑战,其模块化设计也为其他文化遗产的数字化提供了范式。3DTCP数据集的发布填补了领域空白,而光照分解等技术创新使得重建作品能更好地保留水墨画的笔墨神韵。这项成果为数字博物馆、沉浸式艺术展览等应用提供了关键技术支撑,推动传统文化与现代科技的深度融合。
生物通微信公众号
知名企业招聘