利用学习系统进行手写奥里亚语数字识别:神经网络与支持向量机模型的比较
《ACM Transactions on Asian and Low-Resource Language Information Processing》:Handwritten Odia Digit Recognition using Learning Systems: A Comparison of Neural Networks and Support Vector Machine Models
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
编辑推荐:
奥里亚数字识别研究对比了CNN和SVM模型效果,使用自绘数据集进行训练测试,CNN达到95%准确率优于SVM的86%。该研究为百年历史文档数字化提供了技术解决方案,对文化遗产保护有重要意义。
摘要
奥里亚语是印度众多地区性语言之一,它是印度东部奥里萨邦的官方语言。奥里亚语拥有1500年的历史,在全球范围内有超过5000万人使用。由于每个字符中都包含许多曲线,因此奥里亚语的数字系统相当复杂。手写体更是由于书写风格的多样性而变得更加复杂。然而,开发一种创新的机器学习模型至关重要,因为奥里亚语的手写文字包含了大量历史文献,这些文献的年代可追溯至1000多年前。一种可靠的自动化方法将有助于将这些历史文献转换为数字形式,从而保护这些珍贵的文化遗产。这将为社会解决一个重大问题。本研究通过实施两种不同的分类器来探索奥里亚语的手写数字识别方法:第一种是卷积神经网络(CNN),第二种是支持向量机(SVM)。最后,对这两种方法的结果进行了比较。数据集是通过在MS Paint中手写数字生成的。CNN和SVM模型均使用Python编程实现,用于将输入数据分类到相应的类别中。模型的训练和测试均使用了该数据集。实验结果显示,CNN模型的准确率为94.999%,接近95%;而SVM模型的准确率为86%。综合比较来看,在本研究的情况下,CNN模型优于SVM分类器。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号