代谢物数量性状位点分析:不同数据转换和研究设计的影响 —— 为代谢组学研究指明可靠方向

《SCIENCE ADVANCES》:On the analysis of metabolite quantitative trait loci: Impact of different data transformations and study designs

【字体: 时间:2025年04月14日 来源:SCIENCE ADVANCES 11.7

编辑推荐:

  在代谢组全基因组关联研究(mGWASs)中,代谢物数据的复杂性导致缺乏稳健方法和分析指南。研究人员使用两项独立研究的全基因组测序和代谢组数据,对比不同数据转换和分析方法。结果表明,秩逆正态转换等方法更可靠,该研究为未来 mGWAS 分析方法的选择提供了依据。

  在生命科学研究的广阔领域中,代谢组学逐渐崭露头角。代谢组全基因组关联研究(mGWASs),也叫代谢物数量性状位点(metQTL)分析,致力于探索遗传变异与代谢物水平之间的关系,这对于揭示疾病的发生机制、发现潜在治疗靶点意义重大。然而,目前该领域面临诸多挑战。代谢物测量分布的偏态性,使得标准统计方法难以适用,因为这些方法往往需要满足一定的分布假设。同时,缺乏统一、稳健的分析方法和指南,不同研究采用的方法差异较大,导致研究结果的可靠性和可比性受到影响。在这样的背景下,开展系统研究以比较不同分析方法的优劣、确定可靠的分析策略迫在眉睫。
为了解决这些问题,来自相关研究机构的研究人员开展了一项深入研究。他们利用两项独立的儿童哮喘及其父母的多组学研究数据,包括全基因组测序(WGS)和代谢组数据,旨在探究不同数据转换、稳健回归模型、排列检验对 mGWAS/metQTL 结果的影响,并对比群体分析和家族性分析的差异。该研究成果发表在《SCIENCE ADVANCES》上,为该领域的研究指明了方向。

研究人员开展研究时用到的主要关键技术方法如下:首先,利用来自遗传学哮喘研究(GACRS)和儿童哮喘管理项目(CAMP)的样本队列,获取全基因组测序数据和代谢组数据。其次,采用不同的数据转换方法,如 log10转换、秩逆正态转换等,并结合群体分析和家族性分析方法进行研究。此外,运用排列检验和 Huber 回归对研究结果进行验证。

研究结果具体如下:

  1. 研究对象:分析基于 GACRS 和 CAMP 的参与者。群体分析纳入 1021 名 GACRS 儿童和 712 名 CAMP 儿童;家族性分析纳入 897 个 GACRS 家庭和 340 个 CAMP 家庭。GACRS 儿童较年轻、BMI 较低,且均为西班牙裔;CAMP 参与者多为欧洲血统。两个队列共测量 195 种代谢物。
  2. 五种不同的 metQTL 分析方法:研究采用五种方法,包括不同的数据转换和群体(模型 1 - 3)、家族性(模型 4 - 5)测试。模型 1 对代谢物水平进行 log10转换;模型 2 进行秩逆正态转换;模型 3 采用两步法;模型 4 和 5 分别对 log10转换和秩逆正态转换后的代谢物水平进行家族性分析。
  3. 群体分析中全基因组显著的 SNP - 代谢物关联:群体分析比家族性分析识别出更多的 metQTL 关联。模型 1 识别出 159 个,模型 2 识别出 54 个,模型 3 识别出 1977 个,但模型 3 的关联多集中于少数代谢物。
  4. 排列检验、Huber 回归和在 CAMP 中的验证:模型 2 在排列检验和 Huber 回归中的表现优于模型 1 和 3,其识别的 metQTL 关联在 CAMP 中的复制率更高。模型 1 和 3 中部分关联可能是假阳性。
  5. 潜在假阳性发现的驱动因素:在 GACRS 中,次要等位基因频率(MAF)是潜在假阳性关联的主要驱动因素。模型 1 中低频遗传变异较多,与偏态代谢物相关;模型 3 的关联主要由两种偏态代谢物驱动。
  6. I 型错误模拟研究:模拟研究表明,标准线性回归在分析偏态代谢物数据时,假阳性率较高,尤其是低频 SNP。Huber 回归和 FBAT 能更好地控制 I 型错误率。
  7. 家族性分析在 mGWAS 中的表现:家族性分析识别的 metQTL 关联较少,但结果一致性高,在 CAMP 中的复制率高。FBAT 统计量对偏态分布和数据异常值具有鲁棒性。
  8. 所有模型中 metQTL 关联的一致性:三个群体模型中有 41 个共同的 metQTL 关联,其中 34 个在 CAMP 中复制。排列检验中,模型间一致性更高,部分关联已在文献中报道。

研究结论和讨论部分指出,目前 mGWAS 和 metQTL 研究缺乏金标准和分析指南。log 转换虽能减少数据分布偏态,但分析低频变异时仍可能产生假阳性。秩逆正态转换能有效控制 I 型错误率,但数据转换可能导致假阴性。排列检验和 Huber 回归可作为验证的替代方法。家族性分析不易出现假阳性,但功效较低。该研究为未来 mGWAS 分析方法的选择提供了重要参考,研究人员在开展相关研究时,应综合考虑不同方法的优缺点,选择最适合研究问题和背景的方法,推动代谢组学研究的进一步发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号