
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于CT影像组学与职业健康监测数据的煤矿工人尘肺病早期预测多模态机器学习模型研究
【字体: 大 中 小 】 时间:2025年08月13日 来源:Journal of Translational Medicine 7.5
编辑推荐:
本研究针对煤矿工人尘肺病(CWP)早期诊断难题,创新性地整合CT影像组学特征与职业健康监测数据,构建了多模态机器学习预测模型。研究人员通过YOLOX网络实现肺部自动提取,采用LASSO和mRMR算法筛选关键特征,开发出决策树(DT)分类器在测试集达到AUC 0.94、特异性1.00的优异性能。该研究为临床前CWP的精准识别提供了新方法,对职业病的早期干预具有重要意义。
煤矿工人尘肺病(CWP)作为一种典型的职业性肺病,长期困扰着全球煤炭行业从业者。据统计,2019年全球新增CWP病例达20万例,其中中国占比超过80%。这种由煤尘沉积引发的肺部纤维化疾病具有潜伏期长、早期症状隐匿等特点,当患者出现明显临床表现时,肺组织往往已发生不可逆损伤。更严峻的是,目前临床缺乏有效治疗手段,使得早期诊断成为防控的关键环节。
传统诊断依赖胸部X线摄影(DR),但其二维成像存在解剖结构重叠、对小阴影敏感性不足等固有缺陷。国际劳工组织(ILO)分类标准虽被广泛采用,但受读片者主观影响大,对于临床前阶段(0/1亚类)的识别准确率仅60-70%。计算机断层扫描(CT)虽能提供更清晰的三维影像,但因成本与辐射问题尚未成为筛查常规。这种诊断困境导致大量高危工人错失早期干预时机,最终进展为晚期尘肺。
中国医科大学公共卫生学院环境与慢性病研究中心的研究团队在《Journal of Translational Medicine》发表创新研究,通过整合CT影像组学与职业健康监测数据,构建了多模态机器学习模型。该研究回顾性收集了874名煤矿工人的CT影像和76项职业健康数据,包含228例I期、4例II期患者以及642名对照。采用YOLOX网络实现肺部自动提取(AP=0.98),通过LASSO和mRMR算法筛选出12个关键特征,最终开发出决策树分类器在测试集达到AUC 0.94、特异性1.00的优异性能。
关键技术方法包括:1)使用YOLOX网络进行三维肺部自动提取与重建;2)采用PyRadiomics提取116个影像组学特征;3)应用LASSO和mRMR进行双模态特征选择;4)构建CT模型、临床模型和融合模型三类预测体系;5)通过SHAP值解析特征贡献度。所有数据来自安徽淮北职业病防治中心,经伦理委员会批准([2022]119)。
【材料与方法】
研究团队创新性地采用轻量级YOLOX模型替代传统分割算法,实现CT图像中肺部区域的快速定位,在保持诊断敏感性的同时显著提升处理效率。通过三维重建算法(层厚1mm)生成的肺部容积数据,为后续纹理分析奠定基础。特征选择阶段采用严格的双重筛选策略,确保最终入选的8个影像组学特征和4个临床特征具有高度可靠性。

【结果】
模型比较显示,多模态融合模型显著优于单一数据源模型:在142例测试样本中,决策树融合模型的AUC(0.94 vs 0.93/0.88)、准确率(0.95 vs 0.93/0.83)和约登指数(0.83 vs 0.80/0.72)均取得最优值。SHAP分析揭示,服务年限、总蛋白水平和原始形状平坦度是最具预测力的特征。值得注意的是,基于CT的模型对0/1亚类的识别灵敏度达95%,远超常规DR诊断水平。

【讨论】
该研究的创新价值体现在三个方面:首先,首次将YOLOX网络应用于尘肺病CT图像分析,为职业性肺病的智能筛查提供了新范式;其次,通过多模态数据融合克服了单一模态的局限性,特别是将职业暴露史等非影像指标量化纳入预测体系;最后,建立的临床前预测模型可使干预窗口提前5-8年,对改变尘肺病传统"发现即晚期"的被动局面具有重要意义。
局限性与展望方面,研究者指出当前单中心数据需要多中心验证,且高级别病例样本不足。未来工作将聚焦于:1)整合DR与CT建立复合金标准;2)开发跨设备特征对齐算法;3)探索SMOTE等过采样技术解决类别不平衡问题。这些改进有望使模型性能进一步提升,最终实现临床转化应用。
这项研究为职业性肺病的早期防控提供了重要技术支撑,其多模态融合思路也可拓展至其他职业病筛查领域。随着人工智能技术在医疗领域的深入应用,这种将先进影像分析与职业健康大数据结合的策略,或将成为职业病早期预警体系建设的典范。
生物通微信公众号
知名企业招聘