
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于信息解耦的无监督域自适应甲骨文检测方法研究
【字体: 大 中 小 】 时间:2025年06月21日 来源:Signal Processing: Image Communication 3.4
编辑推荐:
为解决甲骨文检测中因域偏移(domain shift)导致的手写体和照片域性能下降问题,研究人员提出了一种基于信息解耦的无监督域自适应(UDA)方法。通过构建内容编码器与风格编码器分离图像特征,并利用目标域信息引导重构源域图像,显著提升了跨域检测性能。实验表明,该方法在手写体和照片域的mAP分别提升0.5%和0.6%,为甲骨文多模态数据自动化分析提供了新思路。
甲骨文作为商周时期的重要文字载体,其研究对揭示中国古代文明具有不可替代的价值。随着计算机技术的发展,利用深度学习自动检测甲骨文成为可能。然而,甲骨文数据存在多种形式——拓片(rubbing)、手写体(handwriting)和照片(photo),不同域之间因采集方式差异导致显著的分布差异(domain shift)。传统方法依赖大量标注数据,而手写体和照片域的标注成本高昂且需专业知识。更棘手的是,直接迁移拓片域训练的模型至其他域时,性能会因域偏移和噪声信息而急剧下降。
为解决这一挑战,河南师范大学等机构的研究团队在《Signal Processing: Image Communication》发表论文,提出了一种基于信息解耦的无监督域自适应(Unsupervised Domain Adaptation, UDA)甲骨文检测方法。该方法通过分离图像的内容与风格特征,利用目标域信息重构源域数据,有效缓解了域偏移问题。关键技术包括:1)构建内容编码器(content encoder)和风格编码器(style encoder)实现特征解耦;2)设计重构解码器(reconstruction decoder)跨域融合特征;3)建立包含拓片、手写体和照片三域的OBIs DAOD Benchmark验证性能。
Methodology
研究团队将源域数据定义为Ds={(xis,yis)},目标域为Dt={(xit)}。核心框架通过双编码器分离图像的内容特征(跨域共享)和风格特征(域特异性),再通过解码器重构源域图像。这一过程迫使模型学习域不变特征,同时保留目标域的结构信息。
Datasets
构建的OBIs DAOD Benchmark包含三个域:拓片(来自公开数据集)、手写体和照片(源自甲骨文目录数据库)。统计显示,拓片域标注实例最多(12,308个),而照片域仅1,024个实例,凸显了域适应的必要性。
Conclusion and future work
该方法在跨域检测中取得显著提升,手写体和照片域的mAP分别提高0.5%和0.6%。研究不仅为甲骨文多模态分析提供了实用工具,其信息解耦思路对其它跨域视觉任务也有借鉴意义。未来可探索更复杂的噪声抑制策略和半监督学习框架。
这项研究的创新性体现在三方面:首次将信息解耦引入甲骨文UDA检测;构建首个多域OBIs检测基准;实验证明方法在极端域偏移下的鲁棒性。正如通讯作者Yahong Han强调的,该方法“为文化遗产的数字化保护提供了可扩展的技术路径”。
生物通微信公众号
知名企业招聘