编辑推荐:
为探究 COVID-19 起源,研究人员分析相关数据,发现其或由恙虫病引发,为溯源提供新方向。
在全球与新冠病毒(SARS-CoV-2)抗争的漫长历程中,新冠疫情的反复犹如高悬的达摩克利斯之剑,时刻威胁着人类的健康与生活。世界卫生组织(WHO)曾发出夏季疫情激增的警告,这让人们再次绷紧了神经。尽管科研人员在新冠研究领域不断探索,但新冠的起源却始终如一团迷雾,难以捉摸。其源头的不确定性不仅导致了全球经济遭受数以万亿计的损失,更夺走了数百万人的生命。正是在这样的背景下,探寻新冠的起源、揭示 SARS-CoV-2 复制的驱动因素变得刻不容缓,这不仅能帮助人们更好地理解这场全球性灾难的起因,也为未来防控类似疫情提供关键线索。
为了揭开新冠起源的神秘面纱,国外研究人员开展了深入研究,相关成果发表在《Advances in Biomarker Sciences and Technology》上。研究发现,COVID-19 很可能是由罕见的恙虫病(Sennetsu fever)引发,传播途径或许是食用了感染吸虫的生或未煮熟的鲻鱼,或者接触了感染鼻疽病(glanders)的个体。这一发现为新冠溯源提供了全新的方向,意义重大,它有助于人们更深入地了解新冠病毒的起源,为后续研究奠定了重要基础,也为生物安全和生物安保措施的制定提供了关键依据。
在研究方法上,研究人员未进行临床试验或实验室实验,而是从基因表达综合数据库(Gene Expression Omnibus,GEO)获取数据,使用了 GSE174818 和 GSE193879 等数据集。他们运用新证明的 max-logistic intelligence 回归分类器,该分类器与传统方法不同,具有更强的可解释性、一致性和稳健性,能有效区分确诊 COVID-19 病例、健康对照和其他非 COVID-19 的呼吸道疾病患者。此外,研究人员还引入了新的计算 β 值公式(M + 100)/(M + U + 200),以更好地分析数据。
在研究结果部分,研究人员对 GSE174818 数据集进行分析。通过求解 S4 分类器,得到不同分类器的性能数据。如 CF1、CF2、CF3 等分类器对住院 COVID-19 患者和其他类型患者的分类准确性、敏感性和特异性各不相同,而 CFmax(max-logistic intelligence 分类器)在分类上达到了 100% 的准确性。通过分析相关基因,发现 SAMM50 基因与恙虫病和鼻疽病相关,这一发现暗示了 COVID-19 与这两种罕见疾病之间可能存在联系。
进一步对 GSE193879 数据集进行队列间交叉验证,该数据集包含不同地区、不同年龄段的患者(西班牙儿科患者)。结果显示,虽然不同数据集分类器的系数存在差异,但 SAMM50 基因在不同数据集中都表现出一定的稳定性,再次表明其在 COVID-19 发展中的重要作用。
在讨论部分,研究人员指出许多已发表的 COVID-19 基因组研究存在方法学局限,难以在不同队列中交叉验证结果,且往往忽略基因间的相互作用。而他们的研究方法具有独特优势,无需进行批次效应校正就能达到高准确性,还能有效避免传统方法中假阳性和多重检验校正的问题。研究还强调了理论模型在简化表观遗传景观复杂性方面的作用,以及探索海鲜市场和全球供应链在新冠溯源中的重要性。
总的来说,该研究为 COVID-19 的起源提供了极具价值的线索,虽然目前的研究结果还需要进一步的微生物学和实验室验证,但它无疑为后续研究指明了方向。未来,基于这些发现,研究人员可以开展更深入的研究,完善对 COVID-19 起源的认识,制定更有效的生物安全和生物安保措施,从而更好地应对未来可能出现的罕见传染病威胁。