基于持续同调的CT扫描图像COVID-19分类:一种拓扑数据驱动的诊断新范式

【字体: 时间:2025年05月28日 来源:Computers in Biology and Medicine 7.0

编辑推荐:

  【编辑推荐】本研究针对COVID-19 CT影像诊断中深度学习模型数据需求大、可解释性差的问题,创新性地采用拓扑数据分析(TDA)中的持续同调(PH)技术,通过分析肺部CT中磨玻璃影(GGOs)和实变区域的拓扑特征,构建支持向量机(SVM)分类模型。在SARS-CoV-2和HRCT Chest COVID两个公开数据集上分别取得99.4%和99.6%的F1值,为资源有限的医疗场景提供了高性能、可解释的自动化诊断方案。

  

在全球累计报告7.767亿例COVID-19病例的背景下,快速准确的早期诊断成为疫情防控的关键。尽管RT-PCR检测存在假阴性问题,胸部CT扫描因其高敏感性(98%肺炎检出率)成为重要替代方案。然而,传统放射科医师读片效率低下,而深度学习模型又面临数据饥渴和“黑箱”难题。这一矛盾催生了对兼具高性能与可解释性新方法的迫切需求。

来自国内的研究团队在《Computers in Biology and Medicine》发表的研究中,另辟蹊径地运用拓扑数据分析(TDA)这一交叉学科工具。他们发现COVID-19患者的CT影像中,磨玻璃影(GGOs)和实变区域具有独特的拓扑结构特征——这些特征可通过持续同调(Persistent Homology, PH)量化为持续图(PDs),进而转化为支持向量机(SVM)可处理的向量。研究团队创新性地组合了低星滤过(lower-star filtration)捕捉强度特征与维托里斯-里普斯复形(Vietoris–Rips complexes)提取形状特征,在完全不依赖数据增强或预训练的情况下,仅用2482例和6082例样本就实现了超越深度学习的分类性能。

关键技术包括:1)基于CT图像构建单纯复形并计算H0/H1持续图;2)将PDs映射到希尔伯特球面实现统计运算;3)使用SVM进行降维分类。实验采用巴西圣保罗医院(SARS-CoV-2数据集)和多中心来源(HRCT数据集)的CT影像进行验证。

【数学基础】
通过引入单纯复形、边界算子、同调群等代数拓扑概念,建立从图像空间到拓扑特征的数学桥梁。关键创新在于将CT像素强度视为高度函数,通过滤过过程捕捉拓扑特征的“生灭”动态。

【方法与算法】
针对GGOs和实变的双重特征,设计混合拓扑描述符:低星滤过量化强度分布(对应CT值异常区域),点云构建捕捉病灶形状(如“阿尔卑斯山”状强度峰)。这些特征通过PH转化为包含H0(连通分量)和H1(环形结构)的二维持续图。

【结果与讨论】
在SARS-CoV-2数据集(1252阳性/1230阴性)和HRCT数据集(2242阳性/3840阴性)上,模型F1值分别达99.4%和99.6%。特别值得注意的是,该方法对数据异质性表现出强鲁棒性——不同采集中心的影像无需特殊处理即可直接应用,这归功于拓扑特征对设备参数变化的天然不变性。

【结论】
该研究开创性地证明:在医学影像分析中,拓扑特征可同时解决“小样本”与“可解释性”两大痛点。其临床价值在于:1)拓扑模式(如H1环形结构)与放射科医师关注的GGOs形态直接对应;2)模型参数仅为深度学习的0.1%;3)适用于医疗资源匮乏地区。作者Sohail Iqbal等指出,这种“几何优先”的策略为开发其他传染性肺病的诊断工具提供了新范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号