编辑推荐:
为解决新生儿黄疸传统筛查方法的局限,泰国研究人员开展基于纹理的机器学习用于新生儿黄疸筛查研究。结果显示该方法准确性良好。这为资源有限地区提供新筛查手段,值得科研读者一读。
新生儿黄疸是新生儿时期常见的病症,表现为血液中胆红素水平升高(即高胆红素血症)。由于新生儿的红细胞寿命较短(约 90 天)、肝功能不成熟,且血细胞比容较高,使得他们更容易患上黄疸。而且,未结合胆红素可能穿过血脑屏障,引发胆红素脑病(俗称 “核黄疸”),造成永久性的脑损伤 。一些风险因素,像葡萄糖 - 6 - 磷酸脱氢酶(G6PD)缺乏、Rh 和 ABO 血型不合等,也会增加新生儿患黄疸的几率。因此,对新生儿黄疸进行早期准确的筛查,在新生儿护理中至关重要。
目前,传统的新生儿黄疸筛查方法存在不少问题。侵入性的血液检测虽然精度高,但会给婴儿带来不适和痛苦。而经皮胆红素仪这种非侵入性的检测方法,成本较高,在资源有限的地区难以普及 。近年来,随着图像处理和人工智能技术的发展,出现了一些新的非侵入性黄疸检测方法。比如,有研究利用视觉检查法进行初步的新生儿黄疸筛查;还有不少基于智能手机的检测方法被开发出来,不过这些方法在不同人群中的准确性差异较大,受种族、肤色和环境条件等因素影响明显,而且大多需要在特定人群中进一步验证 。
为了解决这些问题,来自泰国的研究人员在《Scientific Reports》期刊上发表了一篇名为 “Texture-based machine learning approach for neonatal jaundice screening using the Neonatal Jaundice Screening and Assessment Plate (NJSNAP)” 的论文。他们发现,基于纹理的机器学习方法作为一种非侵入性的新生儿黄疸早期筛查工具具有很大的潜力。这一发现对于资源有限地区的新生儿黄疸筛查意义重大,有望提供一种低成本、可靠的筛查手段。
研究人员为了开展这项研究,用到了几个主要的关键技术方法。首先,他们设计了新生儿黄疸筛查评估板(NJSNAP),这是一种定制的亚克力板,能通过对婴儿皮肤施加轻微压力,挤出毛细血管中的血液,从而显示出婴儿皮肤的真实颜色,就像医生传统检查黄疸的方法一样 。然后,利用 iPhone 11 智能手机在婴儿的额头、胸骨、腹壁和小腿四个部位拍照。之后,通过图像预处理,将图像分为感兴趣区域(ROI),包括用于图像校准分析的黄色潘通色区域(ROI<sub>yellow</sub> )和用于模型训练和预测的皮肤区域(ROI<sub>skin</sub> ),并进行颜色校准。接着,从校准后的图像中提取纹理特征,包括临床特征和基于纹理的特征,总共提取了 92 个特征。最后,应用两种特征选择方法(Regressional Relief - F 和单变量回归),并比较了 8 种机器学习模型(SVM、线性回归、决策树 DT、梯度提升、随机森林 RF、AdaBoost、神经网络和 k 近邻 kNN ),以评估模型预测胆红素水平的性能 。
下面来看看具体的研究结果。
- 婴儿数据用于模型开发:这项可行性研究招募了 200 名符合新生儿黄疸筛查标准或有临床黄疸表现,且家长同意参与的婴儿。这些婴儿的平均胎龄为 38.03 周,平均筛查年龄为 56.30 小时。他们是在 2022 年 3 月至 10 月期间,从泰国曼谷的 Phramongkutklao 医院的新生儿重症监护室、托儿所和门诊部招募的。研究排除了患有严重疾病或皮肤病变影响筛查区域的婴儿 。
- 胆红素水平预测准确性:研究人员比较了不同模型在不同特征选择方法下,对四个解剖位置(头部、胸骨、腹部和小腿)胆红素水平预测的均方根误差(RMSE)和平均绝对误差(MAE)。结果发现,不同位置的模型性能有所差异。比如,在小腿区域,在单变量回归下,AdaBoost 的 RMSE 最低,为 2.888;而 SVM 在最小化 MAE 方面表现最佳,为 2.151 。综合来看,头部和胸骨测量中,SVM 搭配 RRelief - F 特征选择表现最优;腹部和小腿测量中,SVM 搭配单变量回归表现最好。这些表现最佳的模型被选用于 AmberSNAP 网络应用程序中 。
- 网络应用程序开发和盲测:研究人员开发了名为 AmberSNAP 的网络应用程序。在盲测中,纳入了 40 个病例来评估该程序预测胆红素水平的准确性。结果显示,AmberSNAP 程序的 MAE 为 1.675mg/dL,RMSE 为 2.192mg/dL,平均绝对百分比误差(MAPE)为 18.52%,R2 分数为 0.327 。这表明该模型在临床估计中具有可接受的准确性,但仍有优化空间。同时,预测和测量的胆红素水平之间存在中度正相关(皮尔逊相关系数为 0.644,p<0.001),胆红素水平在 10 - 14mg/dL 之间的相关性更好 。
研究结论表明,基于纹理的机器学习方法配合定制的 NJSNAP 设备,在不同解剖位置的胆红素水平预测中展现出了较高的准确性。AmberSNAP 在盲测中的良好表现,证明了这种方法作为新生儿黄疸筛查工具的可行性,尤其是在资源有限的地区。不过,该研究也存在一些局限性。比如,盲测阶段的样本量较小,可能无法完全代表不同的新生儿群体,影响研究结果的普遍性;研究主要针对东南亚人群,不同种族的皮肤色调差异可能影响胆红素测量的准确性,模型在其他人群中的适用性还需进一步研究;研究使用的是传统的特征提取和选择方法,未来可以尝试深度学习技术,如卷积神经网络(CNN),也许能提升模型性能。此外,还可以纳入更多的临床变量,如出生体重、胎龄、肤色阴影和其他风险因素,进一步提高预测性能 。
总的来说,这项研究为新生儿黄疸的筛查提供了一种新的思路和方法,虽然还有一些需要完善的地方,但它为后续的研究和临床应用奠定了基础,有望在未来帮助更多的新生儿及时发现黄疸问题,保障他们的健康。