
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于模块化系统的琼脂平板微生物材料聚类分析:AgarNet架构与BRUKERCLUSTER数据集创新
【字体: 大 中 小 】 时间:2025年09月04日 来源:Array 4.5
编辑推荐:
研究人员针对微生物菌落自动分析中存在的分割精度低、聚类困难等问题,开发了集成Attention U-Net和EfficientNetB4的AgarNet分割系统(F1-score 0.906),结合XGBoost聚类计数预测和GMM聚类算法(V-measure 0.727),并发布首个专家标注的BRUKERCLUSTER数据集,为微生物自动化分析设立新基准。
微生物学研究长期面临菌落分析自动化的技术瓶颈。传统方法依赖人工观察或简单图像处理工具,难以应对菌落形态的高度变异性——颜色、纹理、光照反射及菌落融合现象(如图1所示)常导致误判。更棘手的是,混合培养中不同微生物的视觉特征可能重叠,而现有算法无法实现像素级聚类。这种局限性严重制约了抗生素敏感性测试、环境微生物监测等关键应用的效率。
为突破这一困境,Michal Cicatka团队在《Array》发表研究,提出三阶段模块化系统:首先通过AgarNet(基于Attention U-Net和EfficientNetB4骨干网络)实现菌落分割;随后采用XGBoost预测聚类数量;最终利用高斯混合模型(GMM)完成像素级聚类。研究使用Bruker Daltonics GmbH提供的MBT Pathfinder?仪器采集276块琼脂平板图像,涵盖31种培养基类型,构建了首个专家标注的BRUKERCLUSTER数据集。通过遗传算法(GA)优化多尺度特征选择,系统在真实条件下达到0.532的V-measure,在理想分割条件下提升至0.727。
关键技术包括:
多模态特征提取:融合EfficientNetB7、InceptionResNetV2等模型的卷积层特征
稳态遗传算法:采用自定义突变函数优化30维特征子集
合成数据增强:通过随机化菌落位置消除空间偏差
评估指标:采用平衡同质性和完整性的V-measure
研究结果:
分割实验:EfficientNetB4骨干的AgarNet以0.906 F1-score超越DenseNet201和ResNet50V2
聚类计数预测:XGBoost在真实数据上表现最佳(MSE 0.350),但合成数据测试揭示模型易受空间分布干扰
聚类质量:GMM显著优于K-means(p<0.05),在给定真实掩膜和聚类数时V-measure达0.723
系统瓶颈分析:分割误差对最终结果影响最大(Wilcoxon检验p<0.001)
讨论与结论:
该研究首次实现微生物菌落的像素级半监督聚类,其创新性体现在三方面:
数据层面:BRUKERCLUSTER数据集填补了领域空白,其标准化标注支持跨研究比较
算法层面:GA驱动的特征选择突破了传统聚类对人工特征的依赖
系统设计:模块化架构允许单独优化各组件,适应不同应用场景
局限性在于遗传算法的内存瓶颈限制了训练数据规模,未来可通过特征降维或分布式计算解决。这项成果为自动化菌落挑取、快速污染检测等应用提供了可靠工具,尤其对临床微生物实验室的数字化转型具有重要推动意义。
生物通微信公众号
知名企业招聘