
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于CLIP框架的宫颈细胞学实时AI辅助诊断系统CYTOLONE的开发与验证
【字体: 大 中 小 】 时间:2025年06月13日 来源:Modern Pathology 7.1
编辑推荐:
推荐:本研究针对传统宫颈细胞学筛查依赖人工镜检耗时耗力、现有AI系统需全切片扫描(WSI)成本高昂的问题,开发了基于CLIP框架的CYTOLONE模型。通过层次化标签结构和iPhone-显微镜联动系统,实现0.5秒/图的实时诊断,异常检测准确率达95.8%,为资源有限地区提供高效解决方案。
宫颈细胞学检查是癌症早期筛查的重要手段,但传统人工镜检流程存在效率低下、结果主观性强等痛点。虽然AI辅助系统逐渐兴起,但现有方案多依赖全切片成像(Whole Slide Imaging, WSI),需要昂贵的扫描设备和海量存储空间,在资源有限地区难以推广。更关键的是,WSI制作过程会中断诊断流程,反而可能增加整体工作时间。这些瓶颈促使研究者思考:能否绕过WSI环节,开发更轻量化的实时辅助系统?
来自滨松医科大学等机构的研究团队在《Modern Pathology》发表创新成果,提出名为CYTOLONE的解决方案。这项研究巧妙结合了多模态AI框架和消费级硬件,通过对比语言-图像预训练(Contrastive Language-Image Pretraining, CLIP)技术,构建出可直接分析显微镜视野的智能系统。
研究团队采用三项关键技术:首先利用WSI分割算法获取1024×1024像素的图块(tile)作为训练数据;其次基于CLIP-ViT-B/16架构开发层次化标签学习系统,整合异常(Anomaly)、恶性程度(Malignancy)、贝塞斯达分类(Bethesda)和诊断(Diagnosis)四级标签;最后创新性地采用iPhone+Apple Silicon Mac的硬件组合,通过显微镜适配器实现端到端实时处理。样本来自日本三家医院2020-2024年的318例宫颈LBC标本,涵盖NILM、LSIL、HSIL、SCC和ADC等病理类型。
【模型性能】章节显示,CYTOLONE在测试集上表现显著优于基线模型:异常检测准确率95.8%,恶性分类92.8%,贝塞斯达系统分类61.5%,具体诊断57.5%。特别值得注意的是,所有癌症病例均未被误判为NILM,保障了筛查安全性。
【特征空间可视化】通过UMAP降维显示,CYTOLONE学习的特征空间具有更清晰的类别边界。与原始CLIP模型混沌分布的特征相比,其恶性程度和诊断类别呈现梯度过渡,反映出模型捕捉到疾病发展的连续病理特征。
【创新工作流程】是该研究最大亮点。如图4所示,传统WSI流程需要先扫描、后分析的串行操作,而新方案允许细胞技师在镜检时随时拍摄视野,通过本地AI实时获得分级建议。该系统在Apple Silicon芯片上实现0.5秒/图的处理速度,且无需云端传输,兼顾效率与隐私。
讨论部分深入剖析了技术优势与临床启示。层次化标签结构使模型能同步学习细胞形态的宏观特征(如异常与否)和微观特征(如核异型程度),这解释了为何在连续谱系的鳞状上皮内病变分类中仍保持较高精度。对于医疗资源分布不均的现实困境,该方案首次证明消费级硬件也能支撑专业细胞学AI诊断,单设备成本不足传统WSI系统的1/10。
研究也坦诚当前局限: dysplasia(异型增生)分类准确率相对较低,这实际反映了细胞学诊断本身的固有挑战——病理学家同样面临轻度与中度异型增生的判别难题。未来计划通过集成大语言模型的鉴别诊断建议功能,并开发注意力可视化(Explainable AI, XAI)模块来提升临床接受度。
这项研究的价值不仅在于技术突破,更重新定义了AI与医疗工作流的融合方式。通过"显微镜-手机-笔记本"的极简配置,CYTOLONE证明高质量医疗AI未必需要超级算力或庞大数据中心,关键在于算法设计与临床需求的精准匹配。这种思路为其他医学影像领域AI开发提供了重要借鉴,尤其对发展中国家推进智慧医疗具有特殊意义。
生物通微信公众号
知名企业招聘