
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向博物馆交互式展台的实时人脸感知罗马马赛克渲染算法研究与应用
【字体: 大 中 小 】 时间:2025年09月25日 来源:Visual Informatics 3.9
编辑推荐:
本刊推荐:为解决博物馆交互体验中如何将古罗马马赛克艺术与现代数字技术融合的问题,研究人员开发了一种基于Battiato算法扩展的实时人脸感知马赛克渲染系统。该系统通过集成face-api.js人脸检测技术,实现了从实时照片生成个性化数字马赛克的功能,并在科英布拉博物馆进行了应用评估。研究结果表明,该系统能有效提升观众参与度,但存在处理时间过长和网络依赖性强等问题,为文化遗产数字化展示提供了新的技术路径和优化方向。
在古罗马艺术宝库中,马赛克作为镶嵌艺术的瑰宝,通过精心排列的tesserae(镶嵌块)生动展现了古代社会的文化叙事与审美追求。这些距今两千年的艺术遗产,如今在葡萄牙科英布拉的Conimbriga罗马遗址等场所仍熠熠生辉。然而随着时代变迁,传统马赛克制作技艺逐渐式微,现代观众尤其是年轻群体与这种古老艺术形式之间存在着明显的认知鸿沟。尽管博物馆承担着文化传承的重任,但静态的文物展示方式难以满足当代观众对互动性和参与感的迫切需求。
传统的数字化马赛克生成算法存在明显局限:Hausner算法需要手动标注图像边缘,不适合即插即用的博物馆场景;Fritzsche系统虽然支持参数调节但操作复杂,需要工具栏交互;而RenderBots代理系统则因自主性过强导致输出结果不可控。更重要的是,现有算法都未能专门针对人脸特征进行优化,无法满足博物馆观众对个性化体验的期待。
为此,科英布拉大学信息工程系的Beatriz Madeira和Jorge C.S. Cardoso教授团队在《Visual Informatics》发表了创新性研究成果。他们扩展了Battiato等人2006年提出的算法框架,开发出集实时人脸检测与罗马马赛克风格化渲染于一体的交互式展台系统。这项研究的核心突破在于将人脸检测技术与马赛克生成算法有机结合,通过face-api.js库实现面部特征点定位,并采用Statistical Region Merging (SRM)图像分割技术区分前景(人脸)和背景,最终生成具有罗马opus vermiculatum(蠕虫状镶嵌)和opus musivum(网格状镶嵌)两种传统风格的数字马赛克。
研究人员采用的关键技术方法包括:基于face-api.js的面部特征点检测与定位;图像自动裁剪算法(以人脸边界框为基础扩展30%宽度和50%高度 margins);距离变换矩阵(DTM)、梯度矩阵(GM)和等值线矩阵(LLM)计算;基于Voronoi图的镶嵌块生成与修剪;以及CIE LAB色彩空间的调色板匹配技术。系统使用Web技术栈(HTML/CSS/JavaScript/PHP)开发,依托UTKFace数据集进行算法验证,并在科英布拉博物馆进行了实地测试。
研究结果通过多维度评估验证了系统的有效性:
在算法性能方面,团队测试了6种参数组合(表1),发现矩形镶嵌块比方形需要更多修剪时间(变异1耗时70.25秒 vs 变异2的60.76秒)。执行时间主要取决于镶嵌块数量,但形状影响重叠修剪需求。视觉评估显示10×10的大尺寸镶嵌块(变异6)缺乏面部细节,而间距设置为2时会出现过度褪色效果。
主观视觉评估通过50人参与的在线问卷进行,结果显示变异2(3.3.8.1参数组合)获得最高评分(图10-11)。不同性别和年龄组之间未出现显著偏好差异(Fisher检验p值>0.05),表明算法具有普适性。参与者特别赞赏算法对面部特征的增强效果,但指出发型变化对snakeSize参数的调整带来挑战。
用户体验评估分两个阶段进行:首先在大学部门内对13人进行初步测试,随后在科英布拉博物馆对28名游客实地评估。博物馆环境的评价显著更高(曼-惠特尼U检验p=0.027),证明文化语境增强用户体验。利克特量表(1-6分)数据显示:视觉吸引力(5.46±0.58)、易用性(5.86±0.36)和整体体验(5.79±0.42)获得高度认可。但生成时间评分较低(3.29±1.56),且QR码因网络问题偶尔失效。
讨论部分揭示了系统面临的三大挑战:首先,算法执行时间接近用户可接受阈值,需通过并行计算或简化镶嵌规则优化;其次,网络依赖性严重影响可靠性,需开发离线处理能力;最后,物理展台设计缺乏吸引力,需要改进外观设计和互动吸引模式。研究人员建议增加教育内容展示以利用等待时间,并采用镜像相机预览提升交互体验。
该研究的核心创新在于将人脸检测技术与罗马马赛克算法相结合,创造了真正个性化的博物馆体验。与传统方法相比,该系统无需手动干预即可自动突出面部特征,更贴近罗马工匠的艺术手法。同时,Web技术栈的选择确保了平台的兼容性和易部署性。
未来研究方向包括:集成Segment Anything Model (SAM)等先进视觉模型以支持更多物体类型;添加教育指标如镶嵌块数量计算和石材来源说明;以及开发多变体实时预览功能。这些改进将强化系统与罗马文化遗产的实质联系,超越单纯的娱乐功能。
这项研究不仅推动了数字文化遗产保护的技术边界,更为博物馆交互设计提供了新模式。通过将古老的马赛克艺术转化为沉浸式数字体验,该系统成功搭建了连接古代艺术与现代技术的桥梁,为文化传承注入了新的活力。随着算法的不断优化和硬件性能的提升,这种融合人脸感知与文化遗产的交互模式有望成为未来博物馆的标准配置,让千年艺术在数字时代焕发新的生机。
生物通微信公众号
知名企业招聘