基于Mamba增强Transformer和实例分割的线状图表数据高效提取方法研究

【字体: 时间:2025年05月27日 来源:Graphical Models 2.5

编辑推荐:

  针对线状图表数据提取自动化程度低、复杂图表处理困难等问题,研究人员提出了一种基于Mamba增强Transformer的实例分割方法,结合曲线掩膜引导训练和YOLOv9元素检测技术,构建了包含100K图表的文本识别数据集。该方法实现了93%的平均提取精度,显著优于现有技术,为大规模科学数据分析和机器学习模型开发提供了高效基础。

  

在科学研究与商业分析中,线状图表作为数据可视化的核心工具,承载着大量实验数据。然而,现有数据提取工具面临自动化水平低、复杂图表处理困难等挑战,尤其是曲线交叉、遮挡和密集排列等问题导致传统算法性能不佳。手动提取数据耗时费力,严重阻碍了大规模数据分析的效率。随着数据驱动方法的兴起,对自动化图表数据提取的需求日益迫切。

为解决这些问题,国内某研究机构的研究人员开展了一项创新性研究,提出了一种全新的线状图表数据提取方法。该研究将数据提取问题重新定义为实例分割任务,引入了Mamba增强的Transformer掩膜查询方法和曲线掩膜引导训练技术,有效解决了曲线检测中的长依赖和交叉问题。同时,利用YOLOv9进行图表元素的检测与分类,构建了包含约100K图表的文本识别数据集,并开发了基于LSTM的注意力机制文本识别算法。最终,研究人员提出了一种将图像数据自动转换为结构化JSON数据的方法,显著提高了数据提取的效率和准确性。该研究成果发表在《Graphical Models》上,为自动化数据提取技术的发展提供了重要推动力。

研究主要采用了以下关键技术方法:基于Swin Transformer-S的多尺度特征提取、Mamba增强的Transformer解码器设计、曲线掩膜引导的多层训练策略、YOLOv9图表元素检测,以及基于Bresenham算法的曲线掩膜生成和LSTM文本识别模型。

研究结果部分,首先在“总体架构”中展示了基于查询的曲线分离框架,通过Transformer解码器预测掩膜嵌入向量,实现了曲线实例的精准分割。在“Mamba增强的Transformer”部分,通过调整自注意力和交叉注意力的顺序,并引入Mamba模块替代传统FFN,显著提升了曲线预测的连续性。“多层曲线掩膜引导训练”通过引入真实掩膜作为额外输入,减少了层间预测的不连续性。“图表元素识别”利用YOLOv9实现了18类图表元素的检测,准确率达84.5%,并开发了专用文本识别算法,对刻度标签的识别准确率达99%。“数据转换”部分提出了基于中值滤波的数据点提取方法和坐标轴数据范围估计算法,实现了从像素空间到实际数值的自动转换。

在性能评估中,该方法在AdobeSynth19、PMC和LineEXData数据集上的曲线检测精度分别达到99.17%、94.87%和99.42%,数据提取精度(像素)分别为99.17%、91.03%和98.69%。特别是在真实数据集PMC上,数据转换精度达到87.91%,显著优于现有方法。消融实验验证了Mamba增强和曲线掩膜引导训练的有效性,分别带来5.15%和10%的性能提升。

这项研究的创新性在于将线状图表数据提取重新定义为实例分割问题,通过Mamba增强的Transformer和掩膜引导训练解决了曲线检测中的关键挑战。构建的大规模文本识别数据集和专用算法显著提升了数据转换精度。研究成果不仅推动了自动化数据提取技术的发展,还为科学数据分析和机器学习模型构建提供了高效基础设施,具有重要的理论价值和实际应用意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号