人工智能在儿科骨骼X光片中预测生物性别:一项基于大规模创伤影像数据的研究
《Scientific Reports》:Predicting biological sex in pediatric skeleton X-rays using artificial intelligence
【字体:
大
中
小
】
时间:2025年12月13日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对人工智能在儿科影像中预测生物性别的能力尚不明确的问题,研究人员基于超过50万张儿科创伤X光片的大规模数据集,系统评估了EfficientNet(B0-B7)系列卷积神经网络模型在不同身体区域和年龄组的性能。结果显示AI模型平均准确率达0.722±0.032,显著优于人类专家(0.520±0.011),尤其在骨盆区域表现最佳(PR AUC=0.972),为AI辅助儿科影像分析提供了重要依据。
当我们带孩子去医院拍X光片时,医生通常专注于诊断骨折或其他骨骼问题,很少有人会思考一个问题——能否从这些黑白影像中判断出孩子的性别?这听起来像是法医人类学家的专业领域,但一项最新研究表明,人工智能(AI)在这方面展现出了超越人类专家的惊人能力。
在医学影像分析领域,卷积神经网络(CNN)作为人工智能的重要分支,近年来在肿瘤检测、疾病分类和预后预测等方面取得了显著成就。然而,将这种技术应用于儿科患者的性别预测却面临独特挑战。儿童骨骼系统处于持续发育状态,性别二态性特征远不如成人明显,这使得传统方法难以准确识别。此外,儿科影像分析还需考虑年龄相关的发育变化、不同身体区域的解剖差异,以及常见损伤(如骨折)对图像特征的影响。
这项发表在《Scientific Reports》上的研究由Michael Janisch、Mario Scherkl等学者组成的国际团队完成,他们提出了一个关键科学问题:人工智能能否从儿科骨骼X光片中准确预测生物性别?这一问题的解答不仅具有学术意义,更在法医学、流行病学研究以及医疗AI系统质量控制等方面具有重要应用价值。
研究团队回顾性分析了2008-2018年间奥地利格拉茨大学医院收集的大规模儿科创伤影像数据集,包含541,864张图像,涉及113,636名独特患者。所有图像均经过标准化预处理,包括灰度归一化和对比度增强。研究采用EfficientNet(B0-B7)系列CNN模型进行二元性别分类,并精心构建了平衡的测试集(10,902张图像),确保年龄、性别、身体区域和骨折状态的代表性。通过GradCAM++技术可视化模型关注区域,并与7名人类专家(5名放射科医生和2名儿科外科医生)的表现进行对比。
研究表明,EfficientNet模型在儿科性别预测任务中表现出色,平均精确度为0.731±0.035,召回率为0.718±0.110,准确度为0.722±0.032,F1分数为0.724±0.050。不同版本的EfficientNet中,B4、B5和B6变体表现最为稳定,其中B5在骨盆区域的PR AUC(精确度-召回曲线下面积)达到了惊人的0.991(95%置信区间:0.983-0.998),接近完美分类。
研究发现了明显的区域特异性性能差异。骨盆X光片的分类指标最高,平均精确度0.948±0.064,平均召回率0.960±0.016,平均准确度0.948±0.038。相反,上肢区域(如肱骨)的表现最差,平均PR AUC仅为0.657。轴向骨骼(如骨盆、脊柱)的性能显著优于附肢骨骼(p<0.001),长管状骨区域(锁骨、上肢、前臂、大腿、小腿)由于图像长宽比不对称,性能也相对较差。
分类性能与年龄呈正相关,随着年龄增长而提高。0-6岁组平均精确度为0.682±0.033,7-12岁组升至0.727±0.037,13-18岁组达到0.800±0.037。这一趋势与青春期骨骼性别二态性逐渐明显的发展规律一致,表明AI模型确实学习到了与性发育相关的解剖特征。
一个反直觉的发现是,存在骨折的图像中性别分类指标普遍较低。与正常图像相比,骨折图像的精确度(0.707±0.073 vs 0.754±0.086)、准确度(0.699±0.065 vs 0.744±0.072)和F1分数(0.706±0.071 vs 0.742±0.076)均显著下降(p<0.001)。研究人员推测,这可能是因为损伤相关的软组织变化干扰了模型对骨骼特征的提取。
在相同的测试子集上,AI的表现远胜人类专家。人类评估者的平均准确度仅为0.520±0.011,几乎等同于随机猜测,而AI模型达到0.760±0.009(p<0.001)。即使在人类相对熟悉的骨盆区域,专家的表现(平均准确度0.856±0.124)也不及AI(0.948±0.038)。这一差距凸显了AI在识别细微解剖模式方面的独特优势。
通过GradCAM++生成的显著性图显示,AI模型的决策主要基于骨骼解剖结构而非伪影(如侧标记或防护装置)。在骨盆图像中,尽管部分病例存在性腺防护罩,但模型注意力仍集中在骨盆骨骼构型上,表明学习到的特征是生物学相关的。
这项研究系统证明了人工智能在儿科骨骼X光片性别预测中的有效性和优越性。研究不仅证实了AI在此任务上的可行性,还深入分析了影响性能的关键因素,包括身体区域、患者年龄和骨折状态等。特别值得关注的是,AI能够从人类专家难以察觉的影像特征中提取与性别相关的信息,这为医学影像分析开辟了新途径。
研究的实际意义多元而深远。在法医学领域,这种方法可辅助身份不明的儿童遗骸鉴定;在流行病学研究中,可自动化处理大规模数据集;在临床实践中,可提高医学图像标注的效率和准确性。此外,研究揭示的年龄和区域特异性性能差异,为优化儿科AI应用提供了重要参考。
然而,研究也存在一定局限性,如单中心数据可能影响模型泛化能力,以及无法完全排除数据中可能存在双胞胎样本的潜在偏差。未来研究需通过多中心外部验证进一步确认模型的稳健性,并探索如何将这种技术整合到临床工作流程中。
总体而言,这项工作标志着儿科影像AI分析的重要进展,展示了计算机视觉在提取人类难以感知的医学信息方面的巨大潜力,为下一代智能医疗工具的开发奠定了坚实基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号