编辑推荐:
基因组研究代表性不足及计算培训匮乏阻碍研究者分析大规模遗传数据。贝勒医学院的 All of Us BR 学者项目通过云端培训,借助 Jupyter Notebooks 和 Hail 框架,让早期研究者掌握 GWAS、质控等技能,成功开展 GWAS 并提升计算资源管理能力,助力精准医学创新与基因组研究公平性。
基因组研究中存在代表性不足以及计算培训获取受限的问题,这为许多试图分析大规模遗传数据集的研究者设置了障碍。“All of Us” 研究计划提供了前所未有的机遇来填补这些空白,它提供了来自广泛参与者的基因组数据,但其影响力取决于能否让研究者掌握有效使用这些数据的必要技能。贝勒医学院的 “All of Us” 生物医学研究者(BR)学者项目旨在通过 “All of Us 遗传学研究晚间项目” 为早期研究者提供计算基因组学的实操培训,从而打破这些障碍。这项为期一年的项目以 faculty summit 为开端,这是一场线下计算集训营,通过云端研究环境向学者介绍使用 “All of Us” 数据集的基础技能。基因组学教程聚焦全基因组关联研究(GWASs),利用 Jupyter Notebooks 和 Hail 计算框架,为大规模数据分析提供可及且可扩展的方法。学者参与实操练习,内容涵盖数据准备、质量控制、关联测试和结果解读。到集训营结束时,参与者已成功开展 GWAS、可视化关键发现,并对计算资源管理建立了信心。这一举措通过为不同背景的早期研究者配备分析 “All of Us” 数据的工具和知识,扩大了基因组研究的可及性。通过降低入门门槛并推动对代表性人群的研究,该项目促进了精准医学的创新,推动了基因组研究的公平性发展。