OBIFormer:甲骨文高效注意力去噪框架,开启古文字研究新篇

【字体: 时间:2025年05月09日 来源:Displays 3.7

编辑推荐:

  为解决甲骨文因自然和人为破坏导致自动识别难,且现有去噪方法计算量大等问题,研究人员开展 OBIFormer 去噪框架研究。结果显示该框架在多数据集表现优异,助力甲骨文自动识别,为相关研究提供新途径。

  甲骨文,作为中国最早的成熟文字系统,承载着古老的历史文化信息,对人类学和考古学研究意义非凡。然而,历经数千年的岁月侵蚀,出土的甲骨文碎片大多严重受损。自然风化、腐蚀以及人为破坏,让这些珍贵的文字变得残缺不全、模糊不清,给自动识别工作带来了极大的挑战。传统的去噪方法,如基于各种滤波器的技术,在面对甲骨文复杂的退化情况时,效果差强人意。深度学习兴起后,虽有不少针对图像去噪的方法被应用于甲骨文领域,但这些方法往往只关注像素级信息,忽略了甲骨文独特的字形信息,导致去噪效果不理想,而且部分方法计算量巨大。在这样的背景下,开展一项能够高效、精准地对甲骨文进行去噪,助力自动识别的研究显得尤为迫切。
国内研究人员针对上述问题展开了深入研究,提出了一种名为 OBIFormer(甲骨文注意力去噪框架)的创新方法。研究表明,OBIFormer 在合成和原始甲骨文数据集上,凭借 PSNR 和 SSIM 指标,取得了领先的去噪性能。在真实的甲骨文数据集实验中,该框架展现出了在辅助自动甲骨文识别方面的巨大潜力,这一成果意义重大,为甲骨文研究开辟了新的路径,有望推动古文字研究领域的进一步发展。相关研究成果发表在《Displays》上。

研究人员在开展研究时,运用了多项关键技术方法。OBIFormer 框架包含输入投影仪、输出投影仪、额外特征校正器以及多个 OBIFormer 模块(OFBs)。OFBs 又由通道自注意力模块(CSABs)、字形结构网络模块(GSNBs)和选择性内核特征融合(SKFF)模块构成。通过这些模块的协同作用,实现对甲骨文图像的去噪处理。实验选用了三个具有代表性的甲骨文数据集,即 Oracle - 50K、RCRN 和 OBC306,以此全面评估 OBIFormer 的性能。

甲骨文数据集研究


近年来,随着甲骨文相关计算机视觉任务的发展,多种甲骨文数据集应运而生。从内容来源划分,主要包括手印和拓片两类。手印数据集由甲骨文专家重新书写的无失真拓片图像构成;拓片数据集则直接来源于真实的甲骨文拓片。这些数据集为后续的研究提供了丰富的数据基础。

方法研究


OBIFormer 框架在设计上独具匠心。输入投影仪负责从输入图像中提取浅层特征。OFBs 中的 CSABs 用于提取重建特征,GSNBs 专注于学习甲骨文的字形信息,SKFF 模块则将这两种信息进行动态融合,将字形特征融入去噪主干网络,引导模型在去除复杂噪声的同时,完整保留甲骨文的固有字形。最后,输出投影仪根据融合后的信息重建去噪图像,额外特征校正器获取甲骨文的骨架图像。

实验研究


研究人员在三个具有代表性的甲骨文数据集 Oracle - 50K、RCRN 和 OBC306 上进行了全面实验。在 Oracle - 50K 和 RCRN 数据集上,OBIFormer 在 PSNR 和 SSIM 指标上展现出了卓越的去噪性能,超越了其他基线方法。在 OBC306 数据集上的实验,进一步验证了 OBIFormer 强大的泛化能力,证明其在辅助自动甲骨文识别方面具有巨大潜力。

研究人员提出的 OBIFormer 为甲骨文去噪和自动识别带来了新的解决方案。通过通道自注意力、字形提取和选择性内核特征融合技术,OBIFormer 在去噪性能上实现了突破,并且在计算效率上优于其他方法。在真实数据集上的良好表现,充分展示了其在实际应用中的价值,为甲骨文研究和自动识别技术的发展提供了重要的理论和实践支持。未来,有望基于该研究成果进一步优化算法,提高甲骨文识别的准确率和效率,推动古文字研究领域的发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号