
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于智能手机端AI的MR图像脑肿瘤分类系统开发与性能评估
【字体: 大 中 小 】 时间:2025年08月27日 来源:Advanced Intelligent Systems 6.1
编辑推荐:
这篇综述创新性地开发了基于深度学习(DL)的移动端应用,通过整合卷积神经网络(CNN)、视觉变换器(ViT)和轻量化MobileViT模型,实现MR图像的脑肿瘤快速分类。研究采用迁移学习(Transfer Learning)优化VGG16/ResNet152V2等预训练模型,结合Otsu阈值分割等预处理算法,使MobileViT在推理时间(平均317.50?ms)与准确率间取得最佳平衡。该系统通过Flutter框架实现跨平台部署,为临床决策提供低成本、高可及性的AI辅助工具。
脑肿瘤作为中枢神经系统的异常增生,其良恶性鉴别直接影响治疗方案制定。传统诊断方法受限于专家资源与主观误差,而现有计算机视觉研究多依赖云端算力。本研究提出基于智能手机端人工智能(AI)的解决方案,通过集成轻量化深度学习模型,实现MR图像的实时分类,突破地理与硬件限制。
早期研究采用支持向量机(SVM)和随机森林(RF)等机器学习(ML)算法,依赖人工特征提取,最高准确率仅90%。随着深度学习兴起,CNN架构如ResNet-50和MobileNet-V2通过迁移学习将准确率提升至98%。近年来,视觉变换器(ViT)凭借自注意力机制在全局特征捕获中展现优势,ViT-b32模型在脑肿瘤分类中达到98.24%准确率。
移动健康(mHealth)领域已出现多款AI集成应用,如基于MobileNetV2的皮肤癌分类应用(准确率91.11%)和糖尿病视网膜病变分级系统。这些案例验证了移动端部署的可行性,但脑肿瘤诊断领域仍缺乏兼顾性能与效率的解决方案。
研究采用Otsu阈值法自动生成二值图像,通过OpenCV轮廓检测定位最大区域并裁剪,消除背景干扰。该预处理使定制CNN模型的准确率从91%提升至95%。所有图像统一缩放至256×256像素,确保模型输入一致性。
定制CNN:采用4层卷积结构,逐步增加滤波器数量(16→64),结合L2正则化和Dropout(0.5)防止过拟合。
ViT实现:将图像分割为16×16块,通过768维嵌入向量编码,利用Transformer编码器捕捉块间依赖关系。
MobileViT混合架构:融合CNN的局部特征提取(深度可分离卷积)与ViT的全局建模(多头注意力),其倒残差块通过Swish激活函数提升非线性表达能力。
迁移学习策略:冻结VGG16/ResNet152V2等模型的底层参数,仅微调顶层分类器,显著减少训练时间。
模型在公开数据集"Brain Tumor MRI Dataset"上测试,MobileViT以最优平衡性胜出。转换为TensorFlow Lite(TFLite)格式后,集成至Flutter开发的跨平台应用。实测显示,不同设备平均推理时间仅298.98-317.50?ms,满足临床实时性需求。
该系统通过三重创新——轻量化模型选择、智能裁剪预处理、移动端无损部署,为资源有限地区提供专家级诊断支持。未来可扩展至多模态影像联合分析,并探索联邦学习增强数据隐私保护。研究证实,移动设备已具备承载复杂医疗AI的潜力,将深刻重塑分级诊疗格局。
生物通微信公众号
知名企业招聘