解码非编码变异在人类视网膜细胞类型特异性调控中的功能角色
《Scientific Reports》:Decoding cell-class specific roles of non-coding variants in human retina
【字体:
大
中
小
】
时间:2025年12月12日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对遗传性视网膜病变(IRDs)中非编码变异功能难以解析的挑战,利用单核ATAC-seq(snATAC-seq)数据构建了18个视网膜细胞类型特异性的机器学习模型,通过gkm-SVM/deltaSVM方法预测非编码变异对顺式调控元件(CREs)的影响。模型准确率(AUROC>90%)高且具强细胞类型特异性,变异影响预测(VIP)评分可识别关键转录因子结合 motif,并经MPRA验证有效。该研究为IRDs致病非编码变异的优先筛选提供了新工具(csVISIONS资源),推动了眼病精准医疗发展。
在人类基因组中,高达98%的序列为非编码区域,这些区域蕴含大量调控基因表达的顺式调控元件(CREs),如启动子、增强子等。遗传性视网膜病变(IRDs)影响全球超过200万人,虽然已有超过300个基因被证实与IRDs相关(RetNet数据库),但约半数病例无法仅由蛋白质编码基因的变异解释。越来越多的证据表明,非编码变异在Blue Cone Monochromacy、先天性视网膜非附着等疾病中起关键作用,甚至在年龄相关性黄斑变性(AMD)等常见眼病中也被广泛关联。然而,由于视网膜组织具有高度异质性,包含光感受器、双极细胞、 Müller胶质细胞等多种细胞类型,传统基于bulk组织(混合细胞)的表观基因组学研究难以精确解析非编码变异在特定细胞类型中的功能影响,这严重阻碍了IRDs的遗传诊断和机制研究。
为了突破这一瓶颈,由Leah S. VandenBosch、Amy S. Leonardson和Timothy J. Cherry领导的研究团队在《Scientific Reports》上发表了最新研究成果。他们利用先进的单核ATAC-seq(snATAC-seq)技术,首次在人类视网膜发育和成体的18个特定细胞类别中,构建了一套细胞类型特异性的机器学习模型,成功解码了非编码变异的功能角色。
本研究主要采用了以下关键技术方法:研究数据来源于团队此前发表的发育和成人人类视网膜snATAC-seq数据(GEO: GSE183684)以及成人黄斑视网膜色素上皮(RPE)的ATAC-seq数据(GEO: GSE99287)。利用这些数据,研究人员为每个细胞类别筛选出前25,000个高可信度的染色质开放区域(peak),并采用gapped k-mer支持向量机(gkm-SVM)方法训练了18个独立的机器学习模型。通过deltaSVM算法对模型进行虚拟饱和突变分析,生成变异影响预测(VIP)评分。此外,研究还整合了JASPAR数据库的转录因子(TF)motif信息,并与已发表的单细胞大规模并行报告基因分析(scMPRA)数据以及视网膜疾病全基因组关联研究(GWAS)数据进行了对比验证。
Models Built From snATAC are Accurate and Specific
研究人员首先利用来自人类视网膜发育多个时间点及成体的snATAC-seq数据,定义了18个细胞类别(包括光感受器、双极细胞、Müller胶质细胞等)的特异性染色质开放区域。将这些区域作为正训练集,并匹配GC含量的背景基因组序列作为负训练集,训练gkm-SVM模型。五折交叉验证显示,所有模型的曲线下面积(AUROC)均超过0.90,表明模型具有极高的准确性。进一步让每个细胞类别特异的模型去评分其他细胞类别的开放区域(作为测试集),发现模型能清晰地“识别”自身来源的细胞类别序列,同时将发育或功能相近的细胞类别(如视杆细胞、视锥细胞和双极细胞)聚类在一起,证明了模型具有很强的细胞类型特异性。通过分析模型权重最高的11-mer序列(即模型的“词汇”),研究人员发现了一些在视网膜发育中已知的关键转录因子(如OTX2、PITX、MEIS家族)的结合motif被显著富集,且这些TF的表达已通过snRNA-seq数据在相应细胞类别中得到验证。
Variant Impact Predictions Identify Critical Sequence Motifs
为了评估模型预测变异功能的能力,研究团队对预留的测试集CREs进行了虚拟饱和突变分析,为每一个可能的单核苷酸变异(SNV)计算了VIP评分。负分表示变异可能破坏CRE功能,正分则表示变异可能增强功能。通过聚焦于特定TF结合motif(如SOX2、LHX2、ONECUT、OTX2、CRX等)及其侧翼序列,研究人员观察到VIP评分能精准地反映出motif核心区域对突变的高度敏感性,且这种敏感性呈现出显著的细胞类型特异性。例如,对视网膜前体细胞和Müller胶质细胞命运至关重要的SOX2和LHX2 motif,其核心区域的SNV在相应细胞类别的模型中被预测为强烈的负面影响;而光感受器和双极细胞关键调控因子OTX2和CRX的motif突变,则主要在这些细胞类别的模型中显示出高负面影响。相比之下,一些在多种细胞中广泛表达的通用转录因子(如SP家族)的motif突变,其VIP评分的细胞类型特异性则较弱。研究还将本方法的VIP评分与深度学习模型DeepSEA的预测结果进行了比较,发现基于同质细胞类别数据训练的模型在预测视网膜特异性序列(如视紫红质启动子区域变异)时,比基于异质bulk组织数据训练的模型与功能性MPRA实验数据有更好的相关性,凸显了细胞类型特异性建模的优势。
Models Predict CRE-Directed Expression Changes in a Class-Specific Manner
为了在功能性实验中验证VIP评分的可靠性,研究人员分析了已发表的scMPRA数据。该实验通过在小鼠视网膜中系统突变Gnb3基因启动子内的CRX结合位点,并测量报告基因的表达变化。尽管本研究的模型是基于人类序列训练的,但其对人类GNB3同源启动子区域相同变异的VIP评分,与小鼠视网膜中scMPRA测得的表达变化在特定细胞类别中表现出高度一致性。在自然表达Gnb3的双极细胞和视杆细胞中,VIP评分与报告基因表达变化的Pearson相关系数分别达到0.575和0.49;而在不表达或低表达Gnb3的Müller胶质细胞中,相关性则非常低(0.072)。此外,对于CRX motif的单碱基突变乃至组合缺失,VIP评分都能很好地预测其导致的表达水平变化趋势,特别是成功识别出五个CRX motif中第二个对调控功能最为关键。这证明了模型不仅能预测SNV,还能评估更复杂的序列变异(如小片段缺失)的功能影响,并具有一定的跨物种预测能力。
A Resource for cell-class-specific Human Retinal Regulatory Variant Predictions
基于上述验证,研究团队将VIP评分扩展应用至更广泛的39,437个推定的视网膜CREs(包括ATAC-seq和TF ChIP-seq定义的区域),构建了一个名为“细胞类别特异性眼非编码序列变异影响评分”(csVISIONS)的公共资源。该资源已整合至UCSC基因组浏览器,供全球研究人员查询和比对人类视网膜DNA可及性及基因表达数据,旨在助力非编码视网膜疾病变异的识别与解读。
csVISIONS Can Be used to Screen Variants of Interest for IRDs
为展示csVISIONS的实用性,研究人员检索了文献中已报道的与视网膜色素变性(RP)相关的6个非编码变异(位于TMEM216和EYS基因的启动子区)。浏览器视图显示,这些变异所在的区域在疾病相关细胞类别(如视杆细胞)中确实具有染色质开放性,且VIP评分预测这些变异会产生负面影响,与它们的致病性假设相符。通过比较不同细胞类别的VIP评分,可以进一步区分变异影响的细胞类型特异性。
GWAS Predictions Narrow Variant Search Windows
面对GWAS识别出的海量疾病相关非编码变异,如何优先筛选出最可能具有功能性的变异是一大难题。研究以AMD为例,分析了ARMS2基因内含子区的一个可及区域,该区域包含5个AMD相关SNV。通过虚拟饱和突变获得该区域所有SNV的VIP评分后,可以直观地识别出基因组序列中对扰动特别敏感的区域(即VIP负分较深的区域)。对比两个相邻的AMD相关SNVs(rs36212732和rs36212733)发现,尽管两者都位于可及区域且可能影响预测的TF结合位点,但只有rs36212733被VIP评分预测为具有强烈的负面影响,提示它更可能是功能性的致病变异。这表明VIP评分能够为GWAS发现的候选变异提供功能优先级排序,显著缩小需要后续实验验证的变异范围。
综上所述,这项研究成功利用人类视网膜单核表观基因组数据,建立了一套高精度、细胞类型特异性的非编码变异功能预测模型。这些模型不仅能识别关键调控序列和TF结合motif,其产生的VIP评分经验证能有效预测变异对CRE活性的影响。所构建的csVISIONS公共资源为视网膜疾病研究领域提供了强大的生物信息学工具,有望显著加速IRDs致病非编码变异的发现和功能阐释进程,推动精准医疗在眼科学的发展。尽管模型在细胞覆盖度和整合多组学数据方面仍有提升空间,但本研究无疑为在复杂组织中解析非编码遗传变异的细胞特异性功能开辟了新的道路。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号