发现 17 种焦虑症表观遗传生物标志物,开启精准诊疗新篇

【字体: 时间:2025年02月18日 来源:Clinical Epigenetics 4.8

编辑推荐:

  为解决焦虑症诊断等难题,韩国蔚山科学技术院等机构研究人员开展焦虑症相关甲基化生物标志物研究。他们识别出 17 种相关生物标志物,构建分类模型性能良好。推荐科研读者阅读,助力深入探索焦虑症诊疗新方向。

  
在当今社会,焦虑症已成为一个不容忽视的健康问题。全球大约 4% 的人受焦虑症困扰,这一比例比其他许多精神疾病都要高。可别小瞧了这个数字,换算成具体人数那可是相当庞大的群体。而且,焦虑症在诊断、治疗和预防复发等方面都面临着巨大的挑战。传统的诊断方法主要依靠问卷调查,然而这种方式很容易受到被调查者当时的健康状况和心情的影响。想象一下,一个人在心情好的时候和心情差的时候填写问卷,答案可能会相差很大,这样得出的诊断结果怎么能准确呢?这就好比用一把刻度经常变化的尺子去量东西,得到的尺寸肯定不靠谱。

为了更深入地了解焦虑症,科学家们一直在努力寻找新的方法。之前的研究虽然在寻找焦虑症的生物标志物方面取得了一些进展,比如从血液转录组、基因多态性等角度发现了一些相关的基因和区域,但这些研究存在不少局限性。一方面,很多被发现的生物标志物缺乏有效的验证,就像是找到了一把可能打开宝藏的钥匙,但还没试过能不能真的打开;另一方面,对于这些生物标志物在诊断方面的应用研究也比较缺乏。这就好比找到了一些可能很重要的线索,但还不知道怎么把它们运用到实际的诊断工作中。

在这样的背景下,韩国蔚山科学技术院(Ulsan National Institute of Science and Technology)等机构的研究人员决心攻克这些难题。他们在《Clinical Epigenetics》期刊上发表了一篇名为 “Identification of 17 novel epigenetic biomarkers associated with anxiety disorders using differential methylation analysis followed by machine learning - based validation” 的论文。经过一系列艰苦的研究工作,他们有了重大发现:成功识别并验证了 17 种与焦虑症相关的新型表观遗传生物标志物,而且基于这些生物标志物构建的分类模型在区分焦虑症患者和健康人方面表现出色,曲线下面积(AUC)达到了 0.876。这一成果意义非凡,为焦虑症的早期诊断、治疗效果预测、病情持续监测以及个性化治疗干预都提供了新的可能,就像是给焦虑症的诊断和治疗开辟了一条新的道路。

研究人员为了完成这项研究,运用了多种先进的技术方法。首先是靶向亚硫酸氢盐测序(targeted bisulfite sequencing),这项技术可以帮助研究人员分析血液样本中 DNA 的甲基化情况,就像是给 DNA 的甲基化状态拍了一张高清照片。然后,他们利用甲基化风险评分(Methylation Risk Score,MRS)模型和两种基于树的机器学习模型 —— 随机森林(Random Forest)和极端梯度提升(XGBoost),对这些生物标志物进行验证和评估,通过这些模型来判断生物标志物在区分焦虑症患者和健康人方面的能力。

下面我们来详细看看研究结果。

检测差异甲基化位点和构建分类模型


研究人员在发现集上运用自展法(bootstrapping),经过 1000 次的生物标志物发现过程,最终确定了 18 个甲基化生物标志物,这些标志物在焦虑症患者和健康对照之间表现出显著不同的甲基化值,并且重复性超过 95%。不过,最优的标志物集其实是由 17 个标志物组成的,它们的重复性至少达到 97%。这 17 个标志物中,有 16 个是低甲基化生物标志物,1 个是高甲基化生物标志物。更重要的是,这些标志物在验证集中同样表现出显著差异,而且不受吸烟、饮酒以及抗抑郁药物使用等因素的影响,这就说明它们反映的是焦虑症本身的特征。

为了评估这些生物标志物的区分能力,研究人员采用了三种方法:线性计算的 MRS 模型以及基于树的随机森林和 XGBoost 机器学习模型。结果显示,这三种模型都表现出色,受试者工作特征曲线下面积(AUROC)都超过了 0.8。其中,随机森林和 XGBoost 模型的平均性能更高,不过 MRS 模型的表现也很稳定。最后,研究人员利用表现最佳的 XGBoost 模型对标志物集进行优化,得到了性能更高的 17 个生物标志物集,用这个集合训练的 XGBoost 模型在分类焦虑症患者方面展现出了卓越的性能,AUROC 达到了 0.876。

17 种甲基化生物标志物的定位


研究发现,这 17 个差异甲基化位点(DMSs)位于 11 个基因的基因组位置上。其中,高达 82.35%(14/17)的 CpG 位点位于基因的启动子区域(包括转录起始位点上游 1 - 5kb 的区域),而且同样比例的 CpG 位点位于 CpG 岛(CpG island,DNA 上富含 CpG 二核苷酸的区域,与基因表达调控密切相关)内,另外 3 个位于 CpG 岸(CpG shore,定义为 CpG 岛上下游 2kb 的区域)。这表明这些生物标志物在富含 CpG 的区域调节分子机制方面发挥着重要作用,就像是一群小小的 “指挥官”,在关键区域调控着与焦虑症相关的分子活动。

与 17 种甲基化生物标志物相关的 11 个基因的解读


通过查阅文献,研究人员发现这 11 个基因主要与两种机制有关。一方面,5 个基因(ATP5F1A、INPP5A、ESRRA、MRPL45 和 MUTYH)与线粒体功能有关,尤其是 ATP 合成以及对活性氧(ROS)应激的反应。线粒体就像是细胞的 “能量工厂”,当它的功能出现异常时,细胞的能量供应和应对压力的能力都会受到影响。另一方面,5 个基因(MIR3146、ESRRA、SEC23IP、DIP2C 和 CPD(SLC6A4))与血清素(serotonin,一种神经递质,对情绪调节很重要)和 γ- 氨基丁酸(GABA,主要的抑制性神经递质)神经递质直接相关,而这两种神经递质与情绪障碍,如抑郁症和焦虑症密切相关。值得注意的是,MIR3146 和 ESRRA 这两个基因既与细胞凋亡有关,又与神经信号调节有关,这暗示了这两种基本机制之间可能存在潜在的联系。

在讨论部分,研究人员也提到了研究存在的一些局限性。比如,虽然构建的焦虑症患者分类模型性能优于之前的研究,但他们还无法明确这些生物标志物在焦虑症患者中独特表现的具体因果关系,也不清楚为什么与神经信号调节相关的生物标志物会出现在全血样本中。而且,研究的样本主要来自韩国的一个特定医院,样本量相对较小,并且患者和对照的招募来源不同,这可能会导致研究结果存在偏差。不过,尽管有这些不足,这项研究依然意义重大。它强调了血液液体活检在焦虑症诊断中的临床实用性,为后续进一步研究焦虑症的发病机制、诊断和治疗提供了重要的基础,就像为未来的研究点亮了一盏明灯,指引着科研人员继续探索焦虑症这个神秘领域的方向。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号