古代马拉地语铭文数据库:评估用于古代铭文增强系统的数据增强技术

《Digital Applications in Archaeology and Cultural Heritage》:Ancient Marathi Inscription Database: Evaluation of data augmentation techniques for ancient inscription enhancement system

【字体: 时间:2026年02月16日 来源:Digital Applications in Archaeology and Cultural Heritage CS4.1

编辑推荐:

  本研究构建了包含1000幅古代马拉地铭文图像的数据库,用于提升图像质量及后续分析。传统增强方法(旋转、翻转等)效果有限(PSNR<20dB),而基于GAN和风格迁移的增强技术显著提升图像质量(PSNR>33dB,SSIM>0.9),并降低LPIPS和FID指标。该数据库为古代文献图像处理研究提供基础数据集。

  
Bapu D. Chendage | Rajivkumar S. Mente
印度马哈拉施特拉邦索拉普尔市PAH索拉普尔大学计算机科学系

摘要

本文提出了一个用于古代马拉地文铭文图像增强系统的铭文图像数据库。该数据库是基于古代马拉地文雕刻文本的图像创建的,为开发古代马拉地文铭文图像增强算法提供了基础。数据库包含1000张铭文图像,共计10,000个字符。增强技术在提升图像处理模型的性能中起着重要作用。数据库应用了多种传统和基于机器学习的增强技术。实验表明,常见的处理方法(如翻转、旋转和调整大小)导致的PSNR值低于20 dB,SSIM得分约为0.7,说明铭文图像的改善效果有限。而基于GAN和风格迁移GAN的方法显著提高了图像质量,PSNR值超过33 dB,SSIM得分超过0.9,LPIPS和FID测量的感知距离也大幅降低。数据库地址如下:https://rb.gy/lg78sk

引言

通过图像分析整合考古学、语言学和技术对于收集古代马拉地文铭文数据至关重要,因为这些铭文具有历史价值。马拉地文铭文包含了关于过去文明的语言、文化和宗教方面的关键信息。研究人员可以利用多种方法通过基于图像的数据收集来获取这些信息(Indu等人,2015年)。
马拉地文铭文通常出现在墙壁、金属板和石头等不同表面上,它们是我们了解过去的重要线索。然而,由于自然条件和噪声的影响,这些铭文的文字可能已经发生了变化或消失。保护这些铭文对于揭示过去的秘密至关重要。
通过拍摄高分辨率的铭文图像来收集数据有助于保留其重要特征(Jayanthi和Indu,2017年)。这些图像为进一步分析提供了基础,包括铭文图像增强、模式识别以及语言和历史信息的提取(Jayanthi和Uma Maheswari,2024年)。增强技术常用于机器学习和数据分析中,能够增加训练数据的多样性、质量和数量,从而提升机器学习模型的性能和鲁棒性。这些技术在计算机视觉、自然语言处理、图像处理应用和音频处理等多个领域得到广泛应用。

古代马拉地语概述

马拉地语自1966年起属于印欧语系;它已成为马哈拉施特拉邦的官方语言,在印度排名第四大常用语言,在全球范围内排名第十。马拉地语拥有丰富的古代文献;早期它还有其他名称,如Maharashtri和Mahratti。

马拉地文铭文可追溯至11世纪,最初使用Modi文字书写,直到1950年后转为Devanagari文字(Chendage和Mente,2021a)

铭文概述

铭文是指刻在石头、砖块等硬表面上的历史信息或记录。印度铭文大致分为四类:洞穴铭文、岩石铭文、石板铭文和柱子铭文。洞穴铭文记录了洞穴内的信息,而石板铭文则刻在天然石头上。随后,石板铭文和柱子铭文则刻在经过人工处理的类似石头的石板和柱子上(Crowther,1997年;Chendage和Mente,2021b)

铭文图像中的噪声类型研究

由于环境退化、环境条件和保存方法的影响,古代铭文图像可能存在各种类型的噪声(见图8)。图9展示了一些可能影响这些图像的常见噪声类型。

噪声去除技术

去除古代铭文图像中的噪声对于提高其可读性和保留其历史意义至关重要。图11展示了一些用于去除这些图像中各种噪声的噪声去除技术:

图像增强

算法

用于古代马拉地文铭文的GAN增强数据增强
增强技术用于改进机器学习和图像分析的数据。它们增加了图像数据的多样性、质量和数量,提升了机器学习模型和图像处理应用的性能和鲁棒性。这些技术在计算机视觉、自然语言处理和图像处理等多个领域得到广泛应用(Maharana等人,2022年)

数据库标准化

在初步研究中,我们收集并分析了三种不同类型的铭文图像:石刻铭文、文档铭文和金属板铭文。这些铭文的字体、风格和大小并不统一。而文档则使用标准的字体、风格和大小。在石刻铭文中,字符由不同的人雕刻,导致字体、风格和字符存在差异。因此,对文档进行二值化处理更有利于增强其质量

结论

古代马拉地文铭文图像数据库的建立为铭文图像增强和识别系统的研究奠定了重要基础。从历史记录和文物中系统地收集数据对于构建该数据库非常有用。该数据库提供了多种图像,可用于机器学习算法的实现。传统的增强技术(如旋转、缩放和翻转)在感知质量方面的提升效果较为有限,PSNR值较低

CRediT作者贡献声明

Bapu D. Chendage:撰写原始草稿、软件开发、资源准备、方法设计、数据整理。
Rajivkumar S. Mente:审稿与编辑、数据可视化、验证、项目监督、形式化分析、概念构思。

利益冲突声明

作者声明以下可能构成潜在利益冲突的财务利益或个人关系:Bapu D. Chendage的报告由索拉普尔大学提供。如果还有其他作者,他们声明没有已知的财务利益或个人关系可能影响所报告的工作

致谢

作者感谢PAH索拉普尔大学在研究工作中的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号