阿拉伯手稿的对齐、分割、识别与分类
《ACM Transactions on Asian and Low-Resource Language Information Processing》:Arabic Manuscripts Alignment, Segmentation, Recognition, and Classification
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
编辑推荐:
本研究提出自动化阿拉伯手稿对齐(ArM)方法,通过降噪、旋转校正及模板对齐实现手稿定位与分类,结合高精度OCR系统完成文本识别,实验显示准确率达99.69%,并强调基准数据集和系统模块评估的重要性。
摘要
本研究提出了一种新的方法,用于对阿拉伯手稿进行对齐、分割、识别和分类。对齐过程包括去除噪声、校正旋转和倾斜,并将手稿与标准模板对齐。这种对齐对于判断手稿是已知还是未知至关重要。所提出的方法称为“自动化阿拉伯手稿对齐”(ArM),它接收多张输入图像,对这些图像进行对齐,优化其内部参数,并分析每个参数。然后,该方法识别手稿中的感兴趣区域(RoI),并将其与相应的印刷或手写内容对应起来。最后,使用合适的光学字符识别(OCR)系统来识别每个区域内的内容。研究的第一阶段专注于将历史和古代手稿与OCR系统对齐。在第二阶段,将对齐与OCR技术结合使用,以从阿拉伯手稿的每个感兴趣区域中提取和识别文本。此外,通过数字图像处理技术(特别是对阿拉伯文本的分析和感兴趣区域的提取)对手稿进行已知或未知类别的分类。目的是使整个过程更加高效、准确和快速。使用“交集覆盖并集”(IoU)指标对手稿的不同区域进行了多次实验。默认的阿拉伯语OCR系统取得了最佳结果,准确率为99.69%。为了评估这项技术与现有技术的性能,它依赖于OCR处理流程中的多个相互连接的模块,包括图像预处理、布局分析、行和词的分割以及字符识别。本文概述了阿拉伯语OCR的评估过程,强调了可用工具的重要性及其对所使用指标的影响。还讨论了基准数据集的规范和准备,因为这显著影响了评估结果。总体而言,全面评估OCR技术(考虑各个子系统)并仔细选择基准数据集对于与当前领域进展进行准确性能比较至关重要。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号