基于傅里叶变换红外光谱(FTIR)的分子指纹技术结合机器学习方法,用于快速区分人类血清中的登革热和基孔肯雅热病毒:一项观察性研究

《The Lancet Regional Health - Southeast Asia》:FTIR-based molecular fingerprinting for the rapid classification of dengue and chikungunya from human sera using machine learning: an observational study

【字体: 时间:2025年07月17日 来源:The Lancet Regional Health - Southeast Asia 5.0

编辑推荐:

  本研究利用傅里叶变换红外光谱(FTIR)和拉曼光谱结合机器学习算法,对来自印度的登革热(142例)、寨卡病毒(120例)和健康对照组(40例)的血清样本进行分类。FTIR分析显示,登革热患者血清中β-折叠含量显著增加,而寨卡病毒患者则表现出独特的α-螺旋与高频率β-折叠共存的特征。机器学习模型(SVM、神经网络、随机森林)在测试集上达到近完美分类(AUC=1.000,准确率≥98.9%),尤其FTIR在无监督聚类中表现更优。该方法为资源有限地区提供了一种快速、无标记的血清诊断工具,揭示了病毒感染引起的蛋白质二级结构变化。

  在东南亚和印度地区,登革热和寨卡病毒是两种由伊蚊传播的病毒性疾病。这些疾病在流行区域内的共存,使得临床诊断变得尤为复杂,因为它们的临床症状有很大程度的重叠,比如发热、皮疹、肌肉疼痛和关节痛等。传统的诊断方法,如酶联免疫吸附试验(ELISA)和逆转录聚合酶链反应(RT-PCR),虽然在特定情况下具有高灵敏度和特异性,但在实际应用中存在一些显著的局限性。例如,ELISA可能会出现抗原-抗体交叉反应,从而导致假阳性结果,而RT-PCR则需要昂贵的设备和专业人员进行操作,限制了其在资源匮乏地区的可及性。此外,快速诊断方法(如快速诊断测试,RDT)虽然便于现场使用,但在病毒早期感染阶段的灵敏度往往较低。因此,寻找一种准确、快速且适用于现场的诊断工具对于有效控制这些疾病的暴发和提升临床管理具有重要意义。

近年来,振动光谱技术,特别是傅里叶变换红外光谱(FTIR)和拉曼微光谱,作为一种无标记的分析手段,为生物医学诊断提供了新的可能性。这类技术能够直接检测宿主生物分子的变化,无需使用特定的标记物或复杂的技术流程,从而显著简化了诊断步骤。同时,振动光谱在分析过程中能够提供丰富的化学信息,使得其在区分不同疾病方面具有潜力。本研究中,研究人员利用FTIR和拉曼光谱技术,结合机器学习算法,对登革热和寨卡病毒感染的血清样本进行了分类,以评估其在诊断中的应用潜力。

研究采用了一种观察性实验设计,收集了来自确诊登革热(N=142)、寨卡病毒(N=120)以及健康对照组(N=40)的血清样本。通过对这些样本进行FTIR和拉曼光谱分析,研究人员提取了光谱特征,并利用支持向量机(SVM)、神经网络(NN)和随机森林(RF)等机器学习模型进行分类。结果显示,这些模型在测试数据集上实现了近乎完美的分类效果,其曲线下面积(AUC)达到了1.000,分类准确率(CA-score)均在0.989以上,远超传统诊断方法的性能。此外,t-SNE(t-分布随机邻域嵌入)和Silhouette(轮廓)分析进一步验证了FTIR在无监督聚类中的优越性,其中寨卡病毒样本的平均Silhouette得分为0.385,而拉曼光谱在聚类方面表现较弱。

FTIR光谱分析揭示了登革热和寨卡病毒感染样本之间的显著差异,尤其是在酰胺I和III区域,这些区域与蛋白质二级结构的变化密切相关。研究发现,登革热感染的血清中β-折叠结构显著增加,而α-螺旋结构则减少。相比之下,拉曼光谱则揭示了核酸骨架振动和蛋白质构象的差异,这为疾病识别提供了额外的信息。然而,尽管拉曼光谱在某些方面提供了有价值的补充,其在无监督聚类中的表现仍不如FTIR,这可能是由于血清基质中荧光背景的干扰和光谱重叠所导致。

在机器学习模型的训练过程中,研究人员将数据集分为训练集(70%)和测试集(30%),以确保分类的无偏性。支持向量机、神经网络和随机森林模型均表现出色,其中SVM和神经网络在测试数据集上实现了100%的分类准确率,而随机森林的准确率也达到了非常高的水平(96.7%)。这些结果表明,FTIR光谱数据结合机器学习算法,可以作为一种高准确率、高效率的诊断工具,特别是在需要快速、无标记诊断的场景中。

从临床角度出发,登革热和寨卡病毒的鉴别诊断一直是挑战,因为它们的临床表现相似,尤其是在感染初期。此外,这两种病毒在某些地区可能同时存在,导致复杂的混合感染情况,使得常规的诊断方法难以准确区分。本研究中的方法通过直接分析宿主血清中的生物分子变化,提供了一种潜在的解决方案。这种方法不仅能够快速识别疾病状态,还能揭示病毒诱导的蛋白质变性和炎症反应,从而为疾病的病理生理机制提供新的视角。

与传统方法相比,振动光谱技术具有多个显著优势。首先,它不需要特定的抗体或试剂,从而减少了对复杂实验室设备的依赖,使得在资源有限的地区也能实现快速诊断。其次,该技术的检测时间非常短,仅需不到30分钟,这对于需要及时处理的传染病暴发情况尤为重要。此外,振动光谱具有高通量和高灵敏度的特点,能够在感染早期检测到细微的生物分子变化,有助于疾病的早期识别和干预。

尽管本研究取得了令人鼓舞的成果,但仍存在一些局限性。例如,样本来源仅限于印度的一个地理区域,因此需要进一步验证其他地区或人群中的表现。此外,研究中使用的是干燥的血清薄膜,这可能会影响光谱的准确性,因为某些光谱特征可能在液体状态下更为显著。因此,未来的研究应探索在原位检测条件下的性能,以确保该方法在不同环境中的适用性。同时,由于拉曼光谱在聚类和分类方面表现较差,可能需要进一步优化其技术条件,例如通过荧光抑制或表面增强等手段,以提高其在实际应用中的可靠性。

本研究的结果不仅为登革热和寨卡病毒的诊断提供了新的方法,也为未来开发多病原体检测平台奠定了基础。通过整合FTIR和拉曼光谱技术,并结合先进的机器学习算法,研究人员能够实现对多种病毒性疾病的区分。这种技术可以扩展到其他病毒性疾病,如寨卡病毒、西尼罗病毒和日本脑炎等,从而为热带和亚热带地区的公共卫生监测提供支持。

此外,研究还强调了标准化报告和开放共享原始数据的重要性。这些措施对于加速监管审批和将该技术整合到国家监测体系中至关重要。通过标准化数据采集和处理流程,可以确保不同研究之间的可比性,从而提升技术的可信度和实用性。同时,开放共享数据有助于其他研究团队进行验证和进一步的优化,推动该技术在更广泛范围内的应用。

总的来说,本研究展示了一种创新的诊断平台,能够通过血清样本的振动光谱分析快速区分登革热和寨卡病毒。该平台不仅在准确性方面表现出色,还为理解病毒对宿主生物分子的影响提供了新的视角。在资源有限的地区,这种无标记、快速、可扩展的诊断方法具有重要的公共卫生意义,可以显著改善这些疾病的监测和临床管理。未来的研究和应用应进一步探索该技术在其他病毒性疾病中的潜力,并推动其在实际临床和现场检测中的广泛应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号