一种用于从棕榈叶手稿中识别马拉雅拉姆语字符的集成神经网络模型
《ACM Transactions on Asian and Low-Resource Language Information Processing》:An Ensemble Neural Network Model For Malayalam Character Recognition From Palm Leaf Manuscripts
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
编辑推荐:
棕榈叶手稿自动字符识别模型研究(摘要)
针对马拉地语棕榈叶手稿字符识别难题,提出融合CNN与BiLSTM的混合模型。在1800-1908年手稿数据集上验证,准确率达96.40%,NPV 99.3%,F1值88.39%。有效解决复杂字形、相似字符及独特书写风格问题,为医学古籍数字化提供新工具,助力疾病防控研究。
摘要
棕榈叶手稿(PLMs)对古代交流至关重要,其中蕴含了丰富的信息,涵盖文化、艺术、文学、宗教和医学智慧。喀拉拉邦的官方语言马拉雅拉姆语在医学科学领域发挥了重要作用,这使得棕榈叶手稿变得极为珍贵,尤其是在疫情期间。本研究提出了一种用于自动识别马拉雅拉姆语棕榈叶手稿中字符的创新模型。据我们所知,这是首次基于深度学习的技术尝试,旨在实现棕榈叶手稿中马拉雅拉姆语字符的自动化识别。该模型结合了经过微调的卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)。通过多个卷积层从手稿中的每个字符提取出具有区分性的特征,然后利用集成深度学习模型将这些特征向量分类到相应的字符类别中。使用1800年至1908年间制作的马拉雅拉姆语棕榈叶手稿数据集对所提出方法的性能进行了评估。该模型成功克服了复杂字形、大量字符、相似字符以及独特书写风格等挑战,实现了96.40%的惊人准确率,超越了现有的最先进系统。值得注意的是,该模型的阴性预测值(NPV)为99.3%,阳性预测值(PPV)为83.33%,灵敏度为79.55%,特异性为99.45%,F值(F-Measure)为88.39%。因此,这一进展标志着自动转录技术的一个重要里程碑,为医生和研究人员提供了重要的工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号