
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于持续同调的CT扫描图像COVID-19分类:一种拓扑数据驱动的诊断新范式
【字体: 大 中 小 】 时间:2025年05月28日 来源:Computers in Biology and Medicine 7.0
编辑推荐:
【编辑推荐】本研究针对COVID-19 CT影像诊断中深度学习模型数据需求大、可解释性差的问题,创新性地采用拓扑数据分析(TDA)中的持续同调(PH)技术,通过分析肺部CT中磨玻璃影(GGOs)和实变区域的拓扑特征,构建支持向量机(SVM)分类模型。在SARS-CoV-2和HRCT Chest COVID两个公开数据集上分别取得99.4%和99.6%的F1值,为资源有限的医疗场景提供了高性能、可解释的自动化诊断方案。
在全球累计报告7.767亿例COVID-19病例的背景下,快速准确的早期诊断成为疫情防控的关键。尽管RT-PCR检测存在假阴性问题,胸部CT扫描因其高敏感性(98%肺炎检出率)成为重要替代方案。然而,传统放射科医师读片效率低下,而深度学习模型又面临数据饥渴和“黑箱”难题。这一矛盾催生了对兼具高性能与可解释性新方法的迫切需求。
来自国内的研究团队在《Computers in Biology and Medicine》发表的研究中,另辟蹊径地运用拓扑数据分析(TDA)这一交叉学科工具。他们发现COVID-19患者的CT影像中,磨玻璃影(GGOs)和实变区域具有独特的拓扑结构特征——这些特征可通过持续同调(Persistent Homology, PH)量化为持续图(PDs),进而转化为支持向量机(SVM)可处理的向量。研究团队创新性地组合了低星滤过(lower-star filtration)捕捉强度特征与维托里斯-里普斯复形(Vietoris–Rips complexes)提取形状特征,在完全不依赖数据增强或预训练的情况下,仅用2482例和6082例样本就实现了超越深度学习的分类性能。
关键技术包括:1)基于CT图像构建单纯复形并计算H0/H1持续图;2)将PDs映射到希尔伯特球面实现统计运算;3)使用SVM进行降维分类。实验采用巴西圣保罗医院(SARS-CoV-2数据集)和多中心来源(HRCT数据集)的CT影像进行验证。
【数学基础】
通过引入单纯复形、边界算子、同调群等代数拓扑概念,建立从图像空间到拓扑特征的数学桥梁。关键创新在于将CT像素强度视为高度函数,通过滤过过程捕捉拓扑特征的“生灭”动态。
【方法与算法】
针对GGOs和实变的双重特征,设计混合拓扑描述符:低星滤过量化强度分布(对应CT值异常区域),点云构建捕捉病灶形状(如“阿尔卑斯山”状强度峰)。这些特征通过PH转化为包含H0(连通分量)和H1(环形结构)的二维持续图。
【结果与讨论】
在SARS-CoV-2数据集(1252阳性/1230阴性)和HRCT数据集(2242阳性/3840阴性)上,模型F1值分别达99.4%和99.6%。特别值得注意的是,该方法对数据异质性表现出强鲁棒性——不同采集中心的影像无需特殊处理即可直接应用,这归功于拓扑特征对设备参数变化的天然不变性。
【结论】
该研究开创性地证明:在医学影像分析中,拓扑特征可同时解决“小样本”与“可解释性”两大痛点。其临床价值在于:1)拓扑模式(如H1环形结构)与放射科医师关注的GGOs形态直接对应;2)模型参数仅为深度学习的0.1%;3)适用于医疗资源匮乏地区。作者Sohail Iqbal等指出,这种“几何优先”的策略为开发其他传染性肺病的诊断工具提供了新范式。
生物通微信公众号
知名企业招聘