
-
生物通官微
陪你抓住生命科技
跳动的脉搏
LightGastroFormer:一种轻量级的多分辨率变换器,用于胃肠道疾病分类
《Scientific Reports》:LightGastroFormer: a lightweight multi-resolution transformer for gastrointestinal disease classification
【字体: 大 中 小 】 时间:2026年06月10日 来源:Scientific Reports 3.9
编辑推荐:
摘要 为了促进早期诊断并减轻医生在内镜检查和胶囊内镜检查过程中的工作负担,对胃肠道(GI)图像进行自动化分析至关重要。然而,当前的深度学习技术往往无法同时捕捉长距离的上下文信息和细粒度的局部模式,尤其是在大规模且数据严重不平衡的数据集中。我们提出了LightG
为了促进早期诊断并减轻医生在内镜检查和胶囊内镜检查过程中的工作负担,对胃肠道(GI)图像进行自动化分析至关重要。然而,当前的深度学习技术往往无法同时捕捉长距离的上下文信息和细粒度的局部模式,尤其是在大规模且数据严重不平衡的数据集中。我们提出了LightGastroFormer,这是一种基于轻量级Transformer架构的模型,旨在实现可靠且有效的胃肠道疾病分类。该模型结合了门控前馈网络、有效的自注意力机制以及多分辨率的分块分词器,能够在保持计算效率的同时高效地识别微小病变特征。我们使用了三个公开基准测试来评估LightGastroFormer:Kvasir v1、Kvasir v2以及庞大的Kvasir-Capsule数据集。在所有评估的数据集中,该模型均表现出稳定的强劲性能,与现有的基于CNN和Transformer的方法相当甚至更优。特别是,在不使用显式数据平衡策略的情况下,LightGastroFormer在Kvasir v1数据集上的准确率为0.94,在Kvasir v2数据集上的准确率为0.95,在数据严重不平衡的Kvasir-Capsule数据集上的准确率为0.97,F1分数也为0.97。进一步的消融研究证实了各个架构组件的有效性,并揭示了模型在类别不平衡情况下的行为特征。LightGastroFormer仅有642万个可训练参数,它在准确性、鲁棒性和效率之间取得了良好的平衡,非常适合用于实际的临床胃肠道疾病筛查和诊断任务。代码链接如下:https://github.com/Prateeksingh-moa/LightGastroformer。
生物通微信公众号