ApplyPolygenicScore:标准化多基因风险评分模型应用的R包开发与应用
《Genes & Diseases》:ApplyPolygenicScore: An R package for applying polygenic risk score models
【字体:
大
中
小
】
时间:2025年10月26日
来源:Genes & Diseases 9.4
编辑推荐:
为解决多基因风险评分(PGS)应用流程复杂、标准化不足的问题,研究人员开发了开源R包ApplyPolygenicScore,通过输入验证、等位基因匹配和可视化功能实现了PGMs的自动化应用。在1,071名癌症患者中的实证研究表明该工具能有效预测BMI相关遗传倾向,为拓展PGS在精准医学中的应用提供了重要技术支撑。
随着基因组学研究的深入,多基因风险评分(Polygenic Risk Score, PGS)已成为预测个体对复杂性状遗传易感性的重要工具。通过整合全基因组关联研究(Genome-Wide Association Studies, GWAS)中数千个常见变异的影响,PGS能够量化个体罹患特定疾病或表现特定性状的遗传风险。然而,将已发表的多基因风险模型(Polygenic Risk Model, PGM)应用于新的遗传数据集时,研究人员面临诸多挑战:包括数据格式不统一、等位基因匹配困难、计算流程缺乏标准化等。这些技术壁垒限制了PGS在更广泛研究领域的推广应用,特别是阻碍了非遗传学专业研究人员利用这一有力工具。
为解决上述问题,由Nicole Zeltser、Rachel M.A. Dang、Rupert Hugh-White、Daniel Knight、Jaron Arbet和Paul C. Boutros组成的研究团队开发了ApplyPolygenicScore——一个专门用于标准化应用PGS模型的开源R软件包。该研究成果发表于《Genes》期刊,为促进PGS在不同研究场景下的可靠应用提供了重要技术支持。
研究团队采用模块化设计思路,开发了包含输入验证、等位基因匹配、PGS计算和结果可视化四大核心功能的技术框架。输入验证模块确保基因型数据格式符合要求;等位基因匹配模块通过算法自动比对参考面板与目标数据集中的等位基因方向;PGS计算模块实现权重文件与基因型数据的矩阵乘法运算;可视化模块则生成直观的结果图表。研究选取1,071名膀胱癌、肝癌和子宫内膜癌患者作为验证队列,应用BMI相关的PGM进行实证研究,评估该工具在实际应用场景中的性能。
研究结果显示,ApplyPolygenicScore能够有效完成PGM在新数据集中的应用任务。在BMI预测案例中,计算得到的PGS确实能够预测癌症患者的BMI值,但预测准确度相对较低。这一发现提示,在癌症患者群体中,非遗传因素可能对BMI具有更强的影响作用,而遗传因素的作用相对较弱。尽管如此,该结果仍证明了ApplyPolygenicScore在实际研究中的适用性。
从方法学角度看,ApplyPolygenicScore的优势体现在多个方面:高度自动化的流程减少了人工操作错误,标准化的输出格式确保了结果的可比性,详细的文档说明降低了使用门槛。特别是等位基因匹配算法的优化,有效解决了不同数据集间等位基因编码不一致这一常见技术难题。
在讨论部分,作者强调该工具的核心价值在于搭建了统计遗传学专家与其他领域研究者之间的桥梁。通过降低技术门槛,ApplyPolygenicScore鼓励更广泛的研究群体参与PGS相关研究,有望促进跨学科合作和新发现。例如,肿瘤学家可借助该工具探索遗传因素在癌症预后中的作用,而无需深入掌握复杂的遗传数据处理技术。
值得注意的是,研究也指出了PGS方法本身的局限性。如BMI预测案例所示,PGS仅能捕获遗传因素对性状的贡献,而环境、生活方式等非遗传因素同样具有重要影响。因此,在解释PGS结果时需保持谨慎,避免过度解读遗传因素的贡献。
综上所述,ApplyPolygenicScore为PGS的标准化应用提供了可靠工具,有望推动这一方法在疾病风险预测、精准预防等领域的更广泛应用。随着更多高质量PGM的开发和共享,此类工具将在促进科研成果转化、加速精准医学发展方面发挥越来越重要的作用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号