光学图谱揭示父系传递的强直性肌营养不良和独立帕金森病家族中更高水平的大规模结构变异

《The Journal of Pathology》:Optical mapping reveals a higher level of large-scale structural variants in a family with paternally transmitted myotonic dystrophy and independent Parkinson's disease

【字体: 时间:2026年06月12日 来源:The Journal of Pathology 5.2

编辑推荐:

  强直性肌营养不良1型(DM1)是一种临床上具有挑战性的多系统神经肌肉遗传性疾病,其严重程度代际递增且发病年龄提前。该病由DMPK基因座上不稳定的胞嘧啶-胸腺嘧啶-鸟嘌呤重复扩增引起,并伴有相关的遗传和表观遗传修饰。虽然体细胞嵌合体和减数分裂不稳定性已得到充分证

  
强直性肌营养不良1型(DM1)是一种临床上具有挑战性的多系统神经肌肉遗传性疾病,其严重程度代际递增且发病年龄提前。该病由DMPK基因座上不稳定的胞嘧啶-胸腺嘧啶-鸟嘌呤重复扩增引起,并伴有相关的遗传和表观遗传修饰。虽然体细胞嵌合体和减数分裂不稳定性已得到充分证实,但据研究人员所知,尚无研究对整体遗传不稳定性进行全基因组层面的探究。通过执行全基因组光学图谱(optical mapping)并结合基于序列分辨率的结构变异验证,研究人员在一个表现为一系列神经系统表现(包括早发性帕金森病(PD))的非典型父系传递DM1家族中,检查了整体遗传不稳定性。尽管青少年发病的先证者表现出伴有相关超甲基化的10倍重复扩增,但其部分超甲基化的无症状原突变父亲在较年轻的预突变同胞中传递了一个1.8倍收缩的等位基因。成年发病的症状性DM1和PD表型的父系姑妈显示出显著的全基因组拷贝数改变,包括PD相关的chr19非整倍体缺失,以及chr16、17和22上的额外缺失。在没有潜在致病性新生或母系遗传结构变异的情况下,先证者表现出影响基因候选物CASC15、CBFA2T3、GPHN、H3F3A、SDK1和SPAG16的大规模父系遗传畸变,并伴有全面的低甲基化。研究人员在此提出,遗传不稳定性可能有助于表型变异性,包括多神经系统表现和单代重复扩增或收缩。通过提供遗传性大规模结构变异的全景,这项单一家系研究扩展了对这一广泛且不断增长的疾病类别的认识。? 2026作者。《病理学杂志》由John Wiley & Sons Ltd代表大不列颠及爱尔兰病理学会出版。
**论文解读文章**

**研究背景与问题**

强直性肌营养不良1型(myotonic dystrophy type 1, DM1)是一种常染色体显性遗传的多系统疾病,患病率每10万人中0.5至18.1例。患者因肌纤维膜电活动异常,在自主收缩后出现肌肉放松延迟(肌强直),导致骨骼肌和平滑肌进行性无力。DM1临床表现高度异质,发病年龄和疾病严重程度差异显著,从轻度晚发型到严重先天性型。先天性DM1伴有显著的发病率和死亡率,但并非普遍致命。非先天性形式中,临床特征除了肌强直,还包括肌肉萎缩、白内障、心脏传导异常、内分泌功能障碍和神经精神表现。DM1的一个关键特征是遗传早现现象,即疾病在连续代际中通常更早发生且更严重,导致临床复杂性和平均延迟7年的诊断。DM1的分子基础是位于chr19q13.3上强直性肌营养不良蛋白激酶(dystrophia myotonica protein kinase, DMPK)基因3'非翻译区的不稳定胞嘧啶-胸腺嘧啶-鸟嘌呤(cytosine-thymine-guanine, CTG)三核苷酸重复扩增。预突变和扩增等位基因被证明不稳定,在代际和体细胞中观察到重复长度变异。在RNA水平,扩增的胞嘧啶-尿嘧啶-鸟嘌呤转录本在核内积累并隔离RNA结合蛋白,包括Muscleblind-like(MBNL)蛋白和CELF1,导致多个组织中广泛的选择性剪接失调。根据重复长度,CTG重复被分类为预突变(36–50次重复)、原突变(51–80次重复)、小扩增(81–150次重复)、中等扩增(151–1,000次重复)或大扩增(>1,000次重复)。较大的CTG重复大小通常与较早的发病年龄和增加的严重程度相关,范围从无症状、成年、少年发病到严重或先天性DM1。因此,在家族中定义重复长度不仅能够诊断无症状和晚发病例,还能为受影响成员的计划生育和临床管理提供便利。该研究旨在探索一个两代父系传递的DM1家族,该家族表现出显著的家族内表型异质性,从少年发病到无症状DM1,并包含一例无关(非DMPK扩增)的早发性帕金森病(Parkinson's disease, PD)病例。PD的异常共现提示该家族存在更广泛的神经异质性,值得进一步的全基因组探索性研究。由于神经肌肉疾病与大规模基因组事件相关,研究人员寻求使用相对未被充分重视的非测序高分辨率成像技术——光学基因组图谱(optical genome mapping, OGM),以捕获六名代表性家族成员中遗传性和新生基因组复杂性的完整谱系,并提供进一步先证者-父母三人组的长读长SV验证和全基因组甲基化预测。

**研究内容与结论**

研究人员使用OGM、靶向Oxford Nanopore Technology(ONT)长读长测序、PacBio长读长测序和Illumina短读长测序技术,对一个两代父系传递的DM1家族(包括先证者、母亲、父亲、弟弟、PD表型姑妈和DM1表型姑妈)进行了全面的基因组分析。主要结论包括:(1)通过靶向ONT诊断方法,确认了DMPK重复长度:先证者13/777次重复(ONT)或13/849次重复(PacBio),父亲12/83次重复(ONT)或12/79次重复(PacBio),弟弟11/47次重复,母亲11/13次重复,PD姑妈12/16次重复,DM1姑妈5/178次重复。(2)OGM检测显示,除DM1位点的扩增外,所有家族成员均携带独特的大规模结构变异(structural variants, SVs)。先证者有26个独特SVs,其中16个为父系遗传,8个为母系遗传,2个为新生。父系遗传的SVs中有7个影响了6个与神经肌肉疾病相关的基因:SPAG16、GPHN、CASC15、SDK1、CBFA2T3和H3F3A。(3)先证者与其父系DM1姑妈共享50%的父系遗传SVs,而与PD姑妈仅共享12.5%。(4)PD姑妈和DM1姑妈均表现出显著的全基因组拷贝数缺失,包括PD姑妈的chr19非整倍体缺失和额外chr16、chr17和chr22缺失。(5)PacBio甲基化分析显示,先证者在DMPK CTCF结合位点存在超甲基化,而在DMPK基因间区域存在广泛低甲基化;父亲仅CTCF2超甲基化;母亲则为低甲基化。先证者还表现出DAXX、TPRA1等基因的低甲基化和H4C1、H4C11的超甲基化,并具有显著的全基因组低甲基化。

**主要关键技术方法**

该研究使用了光学基因组图谱(OGM)技术,对从全血中提取的高分子量DNA进行荧光标记(6–7碱基基序),在Saphyr芯片上通过电泳将DNA分子线性化并通过纳米通道,成像后利用Bionano Solve软件进行从头组装和与GRCh38参考基因组的比对,检测大于500 bp的结构变异。OGM数据通过PacBio HiFi长读长测序(先证者三人组,覆盖度11.43×至13.04×)和Illumina NovoSeq 6000短读长全基因组测序(先证者39.44×覆盖度)进行验证。靶向ONT长读长测序用于DMPK重复长度估计。PacBio数据还用于CpG甲基化概率分析(使用pb-CpG-tools)。样本队列来源:该家族来自澳大利亚St Vincent's人类研究伦理委员会批准的临床研究。

**研究结果**

**先证者临床表现**:女性先证者(Lab18)早产(29周胎龄),无DM1临床体征。出生24小时内出现气胸需补氧治疗。因面部畸形特征进行核型分析未见异常。发育里程碑延迟,前2年存在胃食管反流和营养维持困难。3岁诊断为重度焦虑障碍,包括社交、广泛性和分离焦虑障碍及特定恐惧症,恐慌发作频率和严重程度随年龄稳步增加。8至10岁开始意识到手臂和腿部肌肉无力,青少年中期诊断为自闭症1级。早期医学观察包括发育不良、过度睡眠或日间疲劳、夜间遗尿。多次住院但结论不明确。复发性尿路感染归因于尿潴留。青少年晚期DM1样症状加重,包括手和踝关节肌强直和肌肉无力、足内翻加重、头部下垂、歪斜微笑和眼睑下垂、心动过速、头皮银屑病、吞咽和咀嚼能力下降、严重睡眠呼吸暂停。20岁经历激素诱导的肺栓塞,21岁通过Southern blot(>700次重复)诊断为DM1,23岁因子宫内膜异位症接受手术治疗。

**复杂家族史、遗传诊断和传递**:父母双方均无DM1史。母系祖父母活到80多岁,但父系祖母33岁死于宫颈癌,祖父53岁死于心肌梗死。通过父亲大家族(11个同胞)的广泛遗传检测,心肌梗死归因于LDLR基因中经遗传确认和胆固醇水平相关的致病性变异(c.1329G>C, p.Trp443Cyc),符合家族性高胆固醇血症(familial hypercholesterolaemia, FH)。先证者、父亲和弟弟遗传了FH,先证者使用PCK9抑制剂维持胆固醇水平。该家族首个神经和/或神经肌肉退行性疾病迹象是父系姑妈(Lab21)45岁诊断为早发性PD。由于缺乏DM1相关表型特征,PD被认为是独立表现。首个DM1迹象来自父系同父异母姑妈(Lab23),表现为肌肉无力,28岁遗传确认。父系传递通过母系排除(Lab24)确定。50岁时父亲(Lab20)无明显或虚弱特征,但出现显著额部秃顶,这是男性轻度DM1最常见的特征。DM1表型姑妈(Lab22)40岁出头表现出经典DM1的所有症状,包括肌强直和跌倒、面部无力和声音改变、全身疲劳。先证者的弟弟(Lab19)和母亲(Lab17)神经学检查无临床特征。通过靶向ONT诊断方法,估计了无中断的CTG重复长度:先证者13/777次重复,弟弟11/47次重复,母亲11/13次重复,父亲12/83次重复,PD姑妈12/16次重复,DM1姑妈5/178次重复。这确认了来自原突变或小扩增携带者的父系传递,导致先证者中扩增加剧,以及预突变弟弟中收缩。

**使用OGM及长读长碱基估计探索DM1位点**:OGM生成了家族成员的有效平均覆盖度(母亲83.54×,先证者83.68×,弟弟170.29×,父亲224.26×,PD姑妈76.13×,DM1姑妈77.11×)。针对500碱基以上的片段重排,OGM确认了先证者chr19 DM1位点的临床显著扩增。在DM1位点外,家族成员间共享的大规模chr19 SVs包括:后代共享的母系遗传2.2 kb非基因影响插入,父系姑妈共享的约5 kb TMIGD2影响插入,以及父亲和PD姑妈共享的约5.2 kb TDRD12影响缺失。值得注意的是,两位父系姑妈均显示显著chr19拷贝数缺失,包括PD姑妈的整倍体缺失。跨越DM1位点的基因组图谱显示先证者中存在估计2,089碱基的杂合插入,位于DMPK上游并包括邻近基因SIX5、MEIOSIN、DM1-AS和AC074212.1。由于OGM不是碱基特异性的,基于三组的浅层PacBio测序提供了重复长度估计:先证者13/849次重复(三对一读段),父亲12/79次重复(各两个读段),母亲12/13次重复(一对四读段),进一步通过靶向特异性短读打断点验证了先证者。

**OGM衍生的全局结构变异及长短读长验证**:在过滤常见群体OGM SVs后,家族成员分别呈现17(母亲)、26(先证者)、23(弟弟)、30(父亲)、23(PD姑妈)和33(DM1姑妈)个独特OGM衍生SVs。无论DM1/PD状态如何,缺失占绝对优势(96/153, 62.7%),插入(47/153, 30.7%)次之,大重复罕见。大小估计范围从1 kb到1.8 Mb。先证者与其传递父亲共享比例更高的重叠独特SVs(61.53%, 16/26),高于其预突变弟弟(56.52%, 13/23),两者之间有6个共享。此外,先证者与其DM1姑妈共享50%(8/16)的父系遗传独特SVs,而与其PD姑妈仅共享12.5%(2/16)。两个新生SV均未直接影响已知临床相关基因。母系遗传的8个SVs中,3个(VAF范围0.32–0.59)影响基因区域,其中SEC23B和SLC43A2分别与先天性红细胞生成不良性贫血或Cowden综合征以及脱发(秃顶)伴掌跖角化病相关,但与神经肌肉退行性疾病无关联。然而,在超过230 kb的DOCK8–KANK1包含性chr9p24.3重复(VAF=0.47)中,尽管DOCK8与传染病相关,KANK1与神经发育障碍(包括自闭症)相关。有趣的是,当将置信度阈值降至-1以揭示非遗传或获得性SVs时(VAF <0.3),研究人员发现先证者存在一个易位,导致体细胞嵌合体9p24.3缺失(VAF=0.17,母系缺失),起始于DOCK8–KANK1上游,伴侣断点在替代链上。在16个父系遗传的SVs中,7个SV影响了6个显著临床相关基因,所有(100%)通过PacBio长读长检查验证,4个(57%)通过Illumina短读长断点检查验证。潜在致病性父系遗传OGM SVs包括:约3.4 kb插入和6 kb缺失(外显子10重叠)影响SPAG16;2 kb插入影响GPHN(外显子8);4.8 kb CASC15内含子缺失;9 kb SDK1外显子2缺失;6 kb CBFA2T3缺失(外显子2-12);6.9 kb H3F3A插入。除了先证者特有的H3F3A外,SPAG16的两个SV与DM1预突变弟弟和成年发病DM1姑妈共享,GPHN和CBFA2T3仅与弟弟共享,而CASC15和SDK1由DM1和PD表型姑妈共享。

**OGM衍生的全局拷贝数变异**:虽然先证者及其直系亲属未显示显著全局CN变异,但两位父系姑妈均显示升高CN缺失。最显著的是,这些缺失包括chr16、chr17和chr22,其中22q11.2区域缺失与早发性PD相关,而chr17完全单亲丢失(等二体性)与肢带型肌营养不良相关。

**PacBio衍生的位点特异性和全局甲基化概率**:约800次重复的少年发病DM1先证者在CTCF1和CTCF2结合位点均超甲基化,而其约80次重复且基本无症状的父亲仅显示CTCF2超甲基化概率阈值,非DM1母亲在两个位点均显示低甲基化。此外,研究人员观察到先证者DMPK基因间区域广泛低甲基化。进一步检查H3.3相互作用因子的甲基化概率发现,先证者独占的低甲基化包括影响DAXX和TPRA1基因的广泛基因间区域。在H3.3组蛋白伴侣MCM2下游和先证者TPRA1低甲基化块上游,先证者和父亲均显示超甲基化。其他潜在相关的先证者超甲基化跨越相互作用基因H4C1和H4C11。全基因组CpG位点绝大多数被甲基化,但先证者相比母亲(50岁出头)和父亲(50岁中)分别多出约259,000和约94,000个未甲基化位点。先证者(20岁出头)显示出显著全局低甲基化(所有p<0.0001)。

**讨论与结论**

讨论部分:该研究通过高分辨率深覆盖度OGM,在一个表现出不同程度DM1临床表现和独立早发性PD的不寻常两代家族中,检测了共享与新生的大规模遗传性SVs。传统方法估计DM1重复长度并确认两代父系传递。先证者携带13/777(ONT)或13/849(PacBio)DMPK CTG重复等位基因,其传递父亲(12/83 ONT, 12/79 PacBio)基本无症状。父系原突变传递导致先证者中9.4倍(ONT)至10.8倍(PacBio)扩增,而第二个出生的预突变弟弟出现1.8倍收缩。PD姑妈呈现chr19非整倍体缺失。全球范围内,先证者中检测到多个父系遗传的大规模插入/缺失,影响具有临床关联的基因,如SDK1(与心动过速相关)、SPAG16和GPHN(与自闭症谱系障碍相关)、CASC15(与基底细胞癌相关)、CBFA2T3(与神经发生相关)和H3F3A(与神经退行性疾病相关)。与母系遗传或新生SVs相比,第三代表现出显著偏向父系遗传具有潜在致病性的神经肌肉基因破坏性SVs(p=0.0158)。PacBio甲基化分析确认先证者DMPK CTCF位点超甲基化,父亲显示CTCF2超甲基化,先证者还有DMPK位点广泛低甲基化和全局低甲基化。PD表型姑妈存在chr19非整倍体以及chr16、17、22的CN缺失,支持染色体水平异常在PD中的作用。

研究结论翻译:在这项研究中,研究人员应用高分辨率全基因组成像来表征一个具有两代DM1表现(包括非典型代际重复动态)和单个非DM1相关PD病例的家族中遗传性和新生大规模基因组变异的完整全景。与无症状预突变弟弟相比,经典型到严重型DM1先证者遗传了1.5倍更多的父系而非母系全基因组大规模(>1,000 bp)SVs。值得注意的是,对于父系遗传的基因影响SVs,先证者显示出1.3倍更高的与神经肌肉功能相关基因的比例。该家族中不同DM1相关临床表现间共享不同组合的显著基因影响候选物,虽然研究人员无法做出任何直接临床相关性,但这些复杂的遗传性基因组异常是否协同作用(至少部分地)影响遗传早现的变异性仍有待阐明。总的来说,在这个不寻常的DM1家族中揭示了超出主要重复位点的更高水平的遗传结构和表观遗传复杂性,这为进一步研究大规模全局破坏在神经肌肉疾病广谱中的临床意义提供了机会。该论文发表在《The Journal of Pathology》。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号