《Scientific Data》:Adaptive immune response to West Nile virus infection in the Collaborative Cross mouse model: A database of cellular phenotypes and Quantitative Trait Loci
编辑推荐:
为破解西尼罗病毒(WNV)感染后“同毒不同命”的免疫异质性之谜,编辑特别推荐本文:作者利用协作交叉(CC)小鼠,对2 969种脾脏与脑组织T细胞表型进行系统QTL定位,锁定155个高可信候选基因,并发现CXCR3、CD40LG等已知靶点及17个邻近热点的新基因;数据与代码全公开,为疫苗与细胞治疗提供可验证的遗传标靶。
西尼罗病毒(West Nile virus, WNV)每年在全球引发数万例神经侵袭性疾病,但人类感染后临床表现差异巨大:同样是免疫正常的成年人,有的毫无症状,有的却陷入致死性脑炎。为何“同毒不同命”?答案藏在宿主遗传背景与免疫系统的对话里。过去十年,人类队列研究已发现CCR5Δ32等少数基因与严重程度相关,却始终无法解释细胞免疫应答的广泛差异;而小鼠近交系因遗传单调,难以模拟人类群体异质性。于是,一个大胆设想浮现:能否用“遗传拼图”最丰富的小鼠群体——协作交叉(Collaborative Cross, CC)——重现WNV感染后从无症状到慢性脑炎的全谱表型,并把每一种T细胞的每一次“呼吸”都量化成可定位的性状?
为回答上述问题,Steven Chamberlin领衔的跨国团队于2022-2025年开展了迄今最大规模的WNV-CC研究。他们构建110个CC-F1杂交系,每系18只雄性小鼠,统一皮下接种100 PFU WNV-TX毒株,在感染后7、12、21、28天及mock对照时间点,分别取脾脏与脑组织,用高维流式细胞术(27色面板)测定Treg、CD4、CD8及其亚群(初始、效应记忆、组织驻留记忆、短寿命效应细胞等)共2 969种细胞表型;随后利用MegaMUGA 76 600个SNP概率模型进行QTL定位,并结合Oas1b等位基因状态校正。为突破“QTL区间太大、基因太多”的瓶颈,作者开发四步计算管道:①基于DOQTL的加性单倍型回归;②95%贝叶斯可信区间筛选<15 Mb显著区间;③整合VEP与SIFT注释,保留“高/中度”或“有害”SNP;④以2 Mb窗口检测QTL热点,并用随机游走重启(RWR)网络分析,将候选基因与已知WNV宿主因子、TCR信号、IFN-γ、TNF家族等蛋白互作网络靠近,最终锁定155个高可信基因,其中17个同时满足“位于热点区”与“网络邻近已知免疫基因”双重标准。全部原始FCS文件、预处理表型矩阵、QTL结果与代码已上传至ImmPort(SDY2210)与Figshare,实现数据-算法-结论的完整可复现链。
关键技术方法(≤250字):
基于CC-F1遗传参考群体的大规模WNV感染模型;脾脏与脑组织27色流式细胞术高维免疫表型;DOQTL R包进行单倍型概率回归QTL定位;贝叶斯可信区间与排列检验确定显著性;VEP+SIFT功能注释筛选编码区有害SNP;2 Mb滑动窗口QTL热点检测;STRING PPI网络随机游走重启(RWR)基因优先排序。
研究结果
免疫表型呈现广泛遗传变异
对473只mock小鼠的基线分析显示,同一细胞亚群在不同CC-F1系间差异可达10倍,证实CC模型能重现人类样异质性;感染后差异进一步放大,尤其在脑组织CD8效应记忆细胞与脾脏Treg活化标记上,峰度系数>3,提示存在主效基因。
QTL定位锁定X染色体“免疫调控带”
2 969次扫描共检出87个显著或提示性QTL(p≤0.1),全部集中于X染色体,形成5大簇;其中47个QTL与≥2种表型共定位,构成13个2 Mb热点区,最大热点(62-64 Mb)同时调控脑与脾脏CXCR3组织迁移T细胞。
候选基因功能验证与网络整合
在155个优先基因中,CXCR3与CD40LG已报道可影响WNV神经侵袭;新发现的P2RY10、ARHGEF6、HUWE1等11个基因分别与T细胞迁移、成熟、病毒逃逸相关;RWR显示17个基因位于网络前10%近邻,且其PWK单倍型均对应低表型值,提示功能缺失型变异驱动免疫抑制。
数据资源构建与可复现性
作者提供30组预处理表型CSV、4套分析Notebook(GitHub:chambest/WNV_QTL_Resource),涵盖从FCS到最终候选基因的全流程;所有QTL区间、SNP注释与RWR得分已整合至可交互ShinyApp,方便用户输入新表型快速复现。
研究结论与讨论
该研究首次将“遗传多样性-细胞免疫-病毒致病”三轴整合于同一开放数据库,证明X染色体而非常染色体是调控WNV适应性免疫应答的核心枢纽;提出的“QTL热点+网络邻近”双重筛选策略,可将数百个候选基因压缩至十余个可验证靶点,为后续CRISPR功能验证、人源化小鼠疫苗评价及个性化风险预测奠定遗传基础。随着更多病原体-表型数据汇入,该计算框架亦可扩展至寨卡、埃博拉等新发病毒,加速“精准感染病学”时代的到来。