综述:儿童急性淋巴细胞白血病中常见宿主基因组变异的作用
《Leukemia》:Role of common host genome variants in Childhood Acute Lymphoblastic Leukemia
【字体:
大
中
小
】
时间:2025年12月09日
来源:Leukemia 13.4
编辑推荐:
这篇来自《白血病》的权威综述系统梳理了儿童急性淋巴细胞白血病(ALL)常见宿主基因组变异的研究进展。文章深入探讨了全基因组关联研究(GWAS)在揭示ALL易感性、治疗反应(如6-巯基嘌呤(6MP)代谢)及毒性风险(如胰腺炎、骨坏死)相关遗传标志物方面的成果与挑战,并前瞻性地介绍了旨在弥合遗传发现与临床实践间鸿沟的大规模国际合作平台ELEGANT。尽管TPMT和NUDT15等少数变异已用于临床,但多数发现的临床转化仍受限于效应值不足、人群普适性缺乏及明确的治疗修正策略缺失。综述强调,将多组学数据与多基因风险评分等先进生物信息学方法结合,是推动儿童ALL精准医疗发展的关键。
引言
儿童急性淋巴细胞白血病(ALL)作为最常见的儿童恶性肿瘤,其治愈率在高收入国家已超过90%,这主要归功于风险适应的多药联合化疗方案。然而,治疗相关的急性毒性和长期并发症仍然是影响患者生活质量和生存的主要挑战。尽管体细胞突变在疾病发生和发展中扮演核心角色,但种系DNA变异——尤其是常见的宿主基因组变异——作为疾病易感性和治疗反应个体差异的重要来源,其临床价值尚未被充分挖掘。这些遗传倾向大致可分为两类:常见的低外显率变异(次要等位基因频率MAF > 1%)和导致所谓癌症易感综合征(CPS)的罕见高外显率变异(MAF < 1%)。
人类每分钟产生数千万个细胞和数千公里的DNA,复制过程并非完美,平均每次细胞分裂会发生1-2个突变。这些突变大多无关紧要,但也可能驱动癌症的发生。当突变发生在种系DNA时,其后果从无影响到致命不等。过去十年中,各种宿主基因组变异研究已经发现了许多与ALL易感性、疗效和毒性风险相关的常见变异。然而,其中只有极少数成功应用于临床,TPMT和NUDT15变异是目前临床上广泛使用的例子。一个变异能否顺利转化为临床应用主要取决于四个特征:(1) 表型的严重程度;(2) 表型的罕见性以及遗传变异所能解释的病例比例(总体或患者亚组);(3) 该变异作为附加临床决策支持工具的应用价值;(4) 干预和/或预防措施的可用性、成本及潜在副作用。这种临床转化的主要障碍包括效应值不足、缺乏在不同人群中的重复验证,以及缺乏成熟的治疗修正策略。尽管如此,大规模国际合作能够产生必要的统计效力,包括支持更复杂的生物信息学方法,如多基因风险评分和更先进的机器学习策略。
基因型-表型研究策略
尽管癌症由种系DNA变异和获得性突变共同驱动,但抗癌药物的药理学、毒性风险甚至治疗效果主要受宿主基因组变异的影响。由于ALL是一种罕见病,在发达国家发病率仅为每10万名儿童3-4例,因此需要广泛的国际合作来绘制种系DNA变异对这些表型的临床影响。
历史上的遗传研究主要遵循“表型优先”的策略,即基于明确的性状设计研究。这种策略存在偏倚,倾向于捕获具有最严重表型表现的个体的遗传变异。然而,在大规模GWAS中,已经转向“基因型优先”的策略,这可能有助于识别在更广泛谱系(包括亚临床病例)中影响表型的遗传变异。
确定通过GWAS发现的常见基因组变异的影响面临挑战,需要应对多重检验校正的问题,并且在测试的变异数量远超过研究参与者数量的研究中统计效力有限。这种高维设置不仅由于多重检验增加了假阳性发现的风险,而且在估计效应值(例如优势比OR)时也带来了更大的不确定性。过于严格的多重检验校正以控制假阳性会降低统计效力并可能引入II类错误。相反,专注于更窄的变异集合以减少多重检验的负担,有可能忽略重要的基因组区域,这凸显了基因组分析中全面性与可行性之间的权衡。
在GWAS或候选基因分析中发现潜在关联后,可以对有限数量的SNP进行验证研究,这需要的统计效力远低于发现阶段。这种候选基因方法也可以基于先前的生物学知识、GWAS顶级SNP所在同一通路中的其他已知变异,或在成人人群中与类似表型相关的变异(例如,与普通人群中血栓形成相关的SNP)来研究SNP。当GWAS中的顶级SNP位于占人类基因组98%的非编码区时,后一种策略并不总是可行。
在GWAS中,基因型插补常被用于利用已知的连锁不平衡模式来推断未分型的变异。该方法依赖于一个密集分型或完全测序的、 ancestry匹配的参考人群来估计未观测位点的最可能基因型。这可以将SNP数据集从几百万个SNP扩展到1000-2000万个高质量插补SNP,具体取决于芯片密度、插补软件和参考面板的覆盖范围。然而,这种变异数量的增加只有在插补的变异能捕获额外信息时才有意义——特别是,如果它们与表型的关联比直接分型的变异更强。当单倍型中的几种SNP组合与同一个插补变异相关时,这种情况就会发生,该插补变异与潜在的因果变异有更强的LD,从而能更精确地标记效应并提高统计效力。
从设计上讲,GWAS几乎无法识别像引起CPS那样的罕见高影响突变,但它对于检测具有较小效应(OR约1.5-3.0)的常见变异至关重要,这些变异有助于揭示潜在的疾病机制。由于只有一部分被探索的个体携带这些变异,大多数特定表型仍无法得到解释(见表1)。然而,它们也可能使得多基因风险评分的开发成为可能,例如,这可以预测高外显率的癌症风险并指导筛查策略。此外,将传统的GWAS数据与表观遗传标记和暴露组数据整合,可以加深我们对遗传和环境因素如何共同影响癌症风险和疾病特征的理解。
通过GWAS识别的变异在表现出足够令人信服的效应大小时具有临床潜力,这反映在诸如遗传力系数(即遗传学解释的表型方差的比例)和人群归因分值(PAF,即人群中可归因于特定风险因素的病例比例)等指标中。要具有临床可操作性,一个变异必须与足够严重程度的表型相关,并能解释相当大比例的病例——这由其效应大小和MAF决定。这类变异可能实现更有效的筛查和/或靶向干预,并且可以通过仅针对携带这些变异的患者进行干预,来减少需要治疗的患者数量,从而增强随机对照试验的统计效力。重要的是,一个变异的临床相关性取决于具体情境。在大的、未选择的人群中,即使仅具有中等效应大小的变异,如果其流行率高且累积预测能力强,仍然可能具有临床效用,可用于风险分层。这类变异可以指导预防性监测或早期干预策略。相反,在较小的、遗传同质的亚组中——例如由血统、体细胞特征或罕见合并症定义的亚组——尽管普遍性有限,但流行率低的变异可能预测强烈的治疗效果。理想情况下,这类变异还应能平滑地整合到现有的临床工作流程中——例如,支持在发生毒性后是否重新引入药物的决策,或通过纳入最可能获益的患者来丰富临床试验人群。最终,在实践中使用一个变异的价值还取决于相应干预措施的可用性、成本及潜在副作用。
-8),蓝点表示低于阈值的信号,黑点突出显示接近全基因组显著性的变异。位点包括主要风险变异和与ALL相关表型(如治疗期间的硫嘌呤代谢)的关联。'>
病因学:从罕见变异到常见的ALL易感变异
虽然CPS和常见变异可能看起来代表了基因组研究的不同方面,但考虑到突变外显率的巨大差异,它们最好被理解为一个连续谱系的一部分。例如,2-3%的唐氏综合征患者会发展为白血病,而超过10%的共济失调毛细血管扩张症患者,以及几乎所有患有结构性错配修复缺陷的患者会在儿童期发生癌症。CPS包含多种综合征。至少对于某些成人发病的CPS表型,基于GWAS的多基因风险与CPS突变共同影响着总体疾病风险预测。虽然超出本综述范围,但CPS对于理解癌症易感性、发病机制和治疗反应非常重要。
从最罕见的变异开始,平均每个人携带10-100个在大型人类遗传数据集(最大的为gnomAD)中其他参与者没有的新编码变异。gnomAD数据分析最近表明,儿童癌症,包括ALL,使得现代人类基因组的某些部分受到约束,即含有很少的功能丧失性突变,这是由于在进化过程中对关键基因中的有害突变产生了负向选择压力,这些突变本身会消亡,因为它们损害生殖或在生殖前导致致命疾病(如癌症)。种系罕见变异已被证明是高达5%的儿童ALL病例的基础。这种进化约束反映在该变异在超过80万成年人中极为罕见。
在人类突变谱的另一端是常见变异。常见变异由于奠基者效应或在历史上某个时期或整个历史过程中赋予了进化上的早期生存和/或生殖优势而持续存在于人类基因组中。因此,这类变异通常仅与疾病风险的微小增加相关。一个众所周知的例外是因子V Leiden突变,存在于5%的(欧洲血统)人群中,导致血栓栓塞事件的风险增加10倍。历史上,这个起源于2-3万年前的变异可能通过降低分娩或受伤时危及生命的出血风险而有益。然而,在现代环境下——以长时间的航空或汽车旅行以及广泛使用促进血栓形成的药物(如口服避孕药)为特征——同一个变异现在使携带者易患血栓栓塞事件。
由于与儿童期ALL明确相关的进化选择压力,与常见变异相关的任何风险都必须是微乎其微的和/或被并存的生殖生存优势所抵消,后者被称为“拮抗性多效性”。这些SNP所受约束极小,大多数常见的ALL易感变异以加性方式 confer 风险。总体而言,已知的14个常见ALL易感变异通常表现出约1.3的效应大小。虽然没有设立官方阈值,但OR < 2 通常不被认为是独立的临床相关标志物。虽然这些SNP在ALL易感性中独立作用微不足道,但由于其丰度,它们被认为贡献了高达四分之一的总体ALL风险变异,其累积效应可能将ALL风险提高高达10倍。值得注意的是,rs3731249 SNP尤为突出,它是CDKN2A中的一个编码变异(Ala148Thr),OR为2.99。在约1%的MAF下,rs3731249也是迄今为止与总体ALL易感性相关的最罕见的SNP。该变异接近中等罕见性,这是常见遗传变异(可通过GWAS探索)和罕见变异(在家族性疾病或综合征中研究)之间的“遗传暗区”。这是理解像儿童ALL这类疾病遗传易感性的一个日益受到关注的领域,可能有助于识别疾病中明显的“缺失遗传性”。
与儿童ALL相关的14个独立的常见低外显率变异包括参与造血过程的基因,主要编码转录因子和细胞周期调节蛋白。在这些SNP中,有几个与特定的ALL亚型相关,包括高超二倍体(ARID5B和PIP4K2A)和Ph样ALL(GATA3和BCL11A-PAPOLG),而其他则显示出与谱系无关的易感性。
尽管有这些证据,仍需要大规模国际合作的基因型-表型研究,涉及数万名患者,以阐明常见变异对儿童ALL易感性的真实影响。
暴露组与儿童ALL病因中的遗传交互作用
“延迟感染假说”仍然是关于暴露组在儿童ALL病因中作用的最一致且研究最深入的理论之一。它提出,产前“第一次打击”产生了一个前白血病克隆,其扩增足以在出生时被检测到,随后在儿童早期对常见感染出现延迟但增强的免疫反应——“第二次打击”——触发了恶性转化。这种增强的免疫反应应反映了早期生命感染暴露的延迟和减少,这损害了免疫系统的成熟。由于感染负担难以直接测量,通常使用代理指标,如出生顺序和早期儿童保育 attendance,这些指标与ALL风险降低相关。其他环境风险因素包括高出生体重、空气污染和产前烟草暴露。母亲吸烟对ALL风险的影响可能因遗传背景而异,在PTPRK和DPP6位点存在提示性的交互作用。最后,有大量证据表明MTHFR变异与母亲孕期使用叶酸补充剂在儿童ALL风险上存在基因-环境交互作用。这些发现对于考虑主要具有产前起源的ALL亚型(例如,高超二倍体和ETV6::RUNX1)尤为重要,这些亚型在工业化国家中占B前体ALL病例的50%以上。然而,很少有研究尝试将常见的ALL易感变异与儿童感染数据联系起来,这反映了获取高质量暴露组数据的挑战——与通常精确的遗传数据形成对比。
ALL疾病生物学与表型
白血病初诊时的白细胞计数(WBC)是一个预后生物标志物,反映了髓外白血病细胞的生存能力。WBC因年龄、免疫表型和细胞遗传学亚型而异,在年轻患者和T-ALL中计数较高,在预后良好的遗传亚型(ETV6::RUNX1和高超二倍体)中计数较低。Helenius等人的研究发现,在调整年龄和ALL亚型后,种系变异对WBC的影响有限,这表明诊断时的WBC是由白血病亚型而非宿主基因组变异决定的。针对代表髓外白血病细胞生存的其他临床特征(如中枢神经系统或睾丸受累)的类似研究仍然缺乏。未来旨在厘清这些贡献的研究需要对表型进行明确定义(例如,使用流式细胞术更准确地评估CNS受累),并对已知混杂因素(包括ALL亚型)进行适当调整。
药物基因组学
药物基因组学涵盖了遗传变异对药物疗效和毒性的综合影响。在儿童ALL中,治疗反应和不良反应与影响药物代谢、转运及分子靶点相互作用的药物基因组因素紧密相关。为了概念清晰,我们在此更广泛的药物基因组学框架内呈现与疗效和毒性相关的发现。
化疗药物可大致分为三类(图3)。第一组包括抗代谢物(如甲氨蝶呤、阿糖胞苷、硫鸟嘌呤、6MP和奈拉滨),它们通过干扰嘌呤和嘧啶的从头合成或掺入DNA来干扰DNA合成和/或修复。由于其与内源性叶酸或正常核苷酸的结构相似性,其作用机制和代谢已被充分了解,使得相关基因非常适合候选基因研究。第二组包括DNA损伤剂(如蒽环类药物、表鬼臼毒素、烷化剂),它们造成更直接的DNA损伤,包括链断裂和交联。这些药物常引起恶心——这是一种对摄入DNA损伤毒素的进化保守反应——并且由于其对基因组完整性的直接影响,更常与严重的晚期效应相关。第三类涉及转录后作用的药物,如天冬酰胺酶、长春新碱和皮质类固醇,以及较新的靶向治疗,如酪氨酸激酶和Janus激酶抑制剂。这些药物通常不损伤DNA,与基因组不稳定性导致的严重晚期效应关联较小,但仍可能因急性毒性导致晚期并发症。
这些抗白血病药物的药理学受到关键代谢酶中常见遗传变异的影响,这些酶调节激活和失活途径之间的平衡。最突出的例子是硫嘌呤代谢,其中TPMT和NUDT15功能丧失变异可以指导预防性剂量调整。纯合或复合杂合患者应接受显著降低的硫嘌呤剂量,一些研究组也对杂合子进行调整。TPMT变异在欧洲白种人和非洲人中常见(5-10%),而NUDT15变异在西班牙裔和东亚人中最为常见(约10%)。此外,NT5C2种系变异与DNA硫鸟嘌呤积累相关,并且在硫嘌呤为基础维持治疗期间复发的患者中发现了获得性NT5C2突变。
对于最广泛使用的抗代谢物甲氨蝶呤(MTX),药物基因组学已被广泛研究,但由于结果不一致,仍未在临床上应用。三项GWAS证实了SLCO1B1与大剂量MTX(1-5 g/m2)治疗期间MTX清除率降低相关,尽管它仅解释了约10%的MTX清除率变异,限制了其临床相关性。GWAS还将DHFR变异(rs1382539)与短链MTX多聚谷氨酸相关联,将FPGS(rs35789560)与长链MTX多聚谷氨酸水平较低相关联,后者也与复发风险增加相关。
MTHFR多态性已被链接到MTX毒性,包括肝毒性、骨髓抑制、粘膜炎、其他胃肠道问题以及皮肤反应,但结果不一。几项荟萃分析探讨了C677T和A1298C变异对骨髓、肝脏和皮肤等各种毒性风险的影响,得出了多样化的结果。在大剂量MTX背景下,GSTP1 rs1695 由于谷胱甘肽结合受损而与肝毒性增加相关,而荟萃分析探讨了C677T和A1298C对骨髓抑制的影响,对亚叶酸解救时机有启示意义。
天冬酰胺酶的疗效和毒性受遗传变异影响,包括GRIA1变异如rs4958351,它通过调节谷氨酸信号传导与超敏反应相关。遗传变异对天冬酰胺酶反应的影响在后续毒理学章节中有更详细的介绍。
长期以来,人们怀疑GSTT1的变异影响对泼尼松的反应不良。泼尼松反应也受VDR rs1544410的调节,它与第8天原始细胞清除较慢相关,并且受NR3C1 BclI多态性(rs41423247)的影响,该多态性影响类固醇敏感性和骨坏死风险。
抗白血病治疗疗效
儿童ALL复发后的生存率约为50%,预计随着细胞免疫疗法和其他免疫疗法的普及将显著提高。虽然可测量(先前称为微小)残留病(MRD)是一个公认的独立预后因素,但遗传因素与MRD或治疗结果之间的关联尚未得到深入探索。儿童ALL的治疗反应受多种因素影响,包括白血病细胞遗传学、药物暴露和时间、治疗依从性、分子治疗反应以及遗传的宿主变异。早期时间点,如第7天泼尼松反应或第15天或第29天骨髓MRD,反映了早期药物暴露和对有限数量药物的内在白血病化疗敏感性,与总体复发率相比,混杂因素和生物学变异性更小。
鉴于相当数量的复发发生在初始MRD阴性的患者中,识别遗传变异可能有助于解释结果的变异性。几项研究已经确定了与复发风险相关的种系变异,但由于效应值低或缺乏重复验证,大多数临床效用有限。在特定变异中,GATA3(rs3824662)的一个变异已被证明在不同队列中影响治疗反应并增加复发风险,特别是在Ph样ALL中,且存在种族频率差异。影响维持治疗6-巯基嘌呤(6MP)/甲氨蝶呤(MTX)药代动力学的变异也可能影响复发风险。NT5C2种系变异rs72846714减少DNA-硫鸟嘌呤积累,并与使白血病细胞对硫嘌呤耐药的获得性NT5C2复发突变相互作用;而FPGS基因中的rs35789560 SNP与较低水平的长链MTX多聚谷氨酸和较高的复发风险相关。尚待确定这类患者是否能从更高或更频繁的MTX剂量中获益。
由于研究人员可以获取丰富的背景数据,包括基因特异性通路、组织特异性表达谱和蛋白质-蛋白质相互作用网络(通过GTEx和PharmGKB等资源),在某些情况下,候选基因方法可能比不可知的GWAS提供更具针对性和可解释性的见解。一项2015年全面的多基因候选基因研究利用机器学习(ML)方法,分析了三个独立的丹麦和德国儿童ALL队列中约30,000个位于已确立的ALL相关药理学或其他生物学通路中的SNP。该研究提供了一个遗传风险分组,复发率从最佳72%患者的4%(95%置信区间CI: 1.6-6.3%)到最差5-10%患者的76%(95% CI: 41-90%)。通过仅关注已知药理学通路内的变异,作者确保任何关联都可以在明确的生物学背景下进行解释——即使不一定代表真正的因果机制。这种方法说明了基于先验生物学知识的候选基因研究产生有意义见解的潜力。然而,这些发现仍有待验证。
毒理学
随着当代治疗方案下总生存期(OS)超过90%,治疗相关严重毒性的相对影响变得越来越重要。可靠的GWAS研究依赖于基于共识的相关毒性定义。识别遗传风险变异可以深入了解潜在生物学,并可能指导抗白血病治疗(例如,天冬酰胺酶相关胰腺炎(AAP)后重新使用天冬酰胺酶)和支持治疗。儿童ALL的毒性大致可分为三类。第一类反映了在普通人群中也会发生的现象,如感染、高血压、高脂血症、代谢综合征和血栓栓塞。在此,候选基因方法是相关的。第二类包括某种程度上ALL治疗特有的表现,例如天冬酰胺酶超敏反应或天冬酰胺酶相关胰腺炎。最后一类是第二恶性肿瘤(SMNs)。个体毒性(不包括下面讨论的SMN)和关键的基因组关联总结在补充材料和图4中。
第二恶性肿瘤
SMN是儿童ALL严重的晚期并发症,通常由癌症治疗的诱变效应引起。特定治疗如拓扑异构酶II抑制剂(如依托泊苷)、烷化剂、颅脑放疗和长期免疫抑制治疗(如硫嘌呤)已知会引起DNA损伤或损害免疫监视,从而增加治疗相关白血病、中枢神经系统肿瘤和淋巴瘤的风险。其机制通常涉及染色体易位、非整倍性或免疫抑制诱导的淋巴组织增生。虽然这些暴露明确涉及SMN的发生,但大多数接受相同治疗的患者从未发生SMN,这表明宿主基因组因素——包括罕见和常见的——可能影响个体易感性。一些CPS,如Li-Fraumeni综合征,已明确与SMN风险增加相关,这可能是无事件生存测量中最常见的事件。虽然调节基因组稳定性(如参与DNA修复和细胞周期控制的)基因变异可能发挥作用,但常见宿主基因组变异对SMN风险的贡献仍不清楚。在一项Ponte-di-Legno研究(642例SMN病例)中,19名治疗相关髓系肿瘤中存在5q-或7号染色体单体性的患者中,有10人患有高超二倍体ALL(即也是拷贝数异常),在较小的NOPHO研究中也观察到了这一趋势。在最大的NOPHO随访(3591例ALL患者,40例第二癌症)中,高超二倍体普遍存在(64%),但在调整后的Cox分析中与第二癌症风险无显著关联。
鉴于许多SMN预后不良,并且发生在约1-10%的儿童ALL患者中,需要大规模国际合作来识别使患者SMN风险增加的常见宿主基因组变异,并最终指导一线治疗的修改以预防这种严重并发症。
患者/家庭视角
面临癌症诊断的儿童和家庭在被邀请参与遗传研究时面临伦理挑战。诊断时的情感负担和复杂信息可能使知情同意复杂化。允许反思时间至关重要。重要的是,当研究仅关注常见变异时,与高外显率CPS相关的伦理问题很少出现,前提是分析平台过滤掉了CPS。关键考虑包括:
- 1.遗传倾向与次要发现(当识别出CPS时):识别与疾病相关的变异可能引起痛苦,并可能导致医疗决策,如监测或生育计划。然而,当仅检查效应值较小的常见变异时,家庭决策仍然有限。
- 2.父母决策与儿童参与(特别是当识别出CPS时):父母必须代表孩子同意,在保护和包容之间取得平衡。传达结果可能影响家庭动态。虽然孩子的“不知情权”在CPS相关发现中至关重要,但对于常见变异其重要性较低。
- 3.家庭披露(特别是当识别出CPS时):在相关时,决定如何告知亲属共享的变异在伦理上可能很复杂。然而,这在GWAS中很少适用。
- 4.数据隐私和滥用:尽管GWAS数据在严格协议下受到保护,但泄露风险仍然存在。国际数据共享需要强大的安全程序。研究人员有责任防止对GWAS结果的误解,特别是在可能对边缘化群体造成污名化的情况下。
分析方面
儿童ALL的遗传易感性研究受到疾病异质性、环境影响以及数据处理复杂性——特别是在定义表型方面——的挑战。进行GWAS通常需要深度表型分析以避免II类错误。虽然第7天治疗反应——测量为外周血淋巴细胞计数——是一个定义明确、生物学上直接、混杂因素最少的表型,但更复杂的结果,如毒性或复发,受众多生物和环境因素影响,需要严格表征。一个代表性例子是骨坏死,它不能通过简单的二元分类来捕获。准确的表型分析涉及记录性别和年龄、骨坏死发生时间和严重程度分级、使用的糖皮质激素和天冬酰胺酶制剂、以及是否存在高脂血症。ALL治疗的复杂性——通常涉及多种并发药物和临床调节因素——使得难以将真正的种系关联与治疗相关的噪音分离开。此外,ALL亚型之间巨大的体细胞异质性(例如,染色体改变、基因融合)引入了生物多样性,可能与种系效应相互作用或掩盖种系效应。通过遗传变异进行进一步分层使这个问题更加复杂,因为亚组特异性关联可能在统计效力不足的分析中被稀释,或者在变异频率低时被完全忽略。
人群分层是另一个问题,因为遗传祖先差异可能使结果产生偏倚。大多数研究过度代表欧洲血统的个体,降低了对其他人群的适用性。变异频率在不同人群中也不同,使罕见变异的检测和结果的普遍性复杂化。
在像ALL这样的罕见病中,重复验证尤其困难,因为缺乏额外的病例来验证发现。应对这些挑战需要研究具有更大的多样性、针对特定人群的调整以及改进的分析方法,以考虑复杂的遗传背景。
ELEGANT平台
为了应对上述部分挑战,国际柏林-法兰克福-明斯特(IBFM)ALL和种系变异委员会发起了一项倡议,旨在所有三个欧洲ALL联盟(即ALLTogether, AIEOP, 和ALLIC)内实现大规模基因型-表型研究,命名为“探索白血病:教育、遗传学和新技术(ELEGANT)”。作为一个数据库,它将包含来自这三个欧洲联盟(也包括澳大利亚、阿根廷、智利和乌拉圭)覆盖的30多个国家的至少15,000名ALL儿童的基因型数据(作为SNP谱)。作为一个研究平台,ELEGANT将这些遗传数据存储在安全的数据仓库中,研究人员可以在其中完成他们选定的表型兴趣研究。无需监管机构的额外批准,研究人员可以专注于已作为临床试验一部分映射的多种表型(疾病表现[如肿瘤负荷,CNS白血病]、反应[如MRD,复发率]、药理学[如大剂量MTX药代动力学]、毒性[如天冬酰胺酶超敏反应,骨坏死]),上传他们的表型,并在获得试验科学委员会批准后获取相应的基因型数据。所有分析都在安全的ELEGANT数据环境中进行,该环境包含必要的软件工具,并支持共享生物信息学脚本。这种“基因型优先”的方法在大规模基因型-表型研究中是完全独特的。重要的是,如果GWAS产生显著位点,所有参与者都已同意对相关区域进行靶向测序,以识别潜在的因果变异以及相关基因中的私有突变。
ELEGANT平台将包含来自多个来源的基因型数据,包括SNP微阵列和全基因组测序(WGS)。SNP微阵列是一种经济有效的方法,可在多个样本中对全基因组几百万个SNP进行分型(通常为0.5至500万个SNP)。这些芯片利用遗传变异的结构(通常一起遗传)来通过插补覆盖未分型的SNP。如果本地已有WGS数据,可使用脚本来提取仅与所用微阵列上位置匹配的位点(排除ACMG基因中的可操作变异),从而提供伪微阵列数据集。为确保
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号