《Functional & Integrative Genomics》:Genetic regulation of major immunogenic protein accumulation in peanut seeds
编辑推荐:
花生是美国主要的油料作物,全球产量排名第三,南卡罗来纳州国内排名第六。尽管花生具有经济和营养价值,但由于包括过敏性休克在内的过敏反应,美国约有1-2%的人群不宜食用花生,因此培育低过敏原花生成为优先任务。该研究旨在鉴定Ara h1、h2、h3和h6含量降低的花
花生是美国主要的油料作物,全球产量排名第三,南卡罗来纳州国内排名第六。尽管花生具有经济和营养价值,但由于包括过敏性休克在内的过敏反应,美国约有1-2%的人群不宜食用花生,因此培育低过敏原花生成为优先任务。该研究旨在鉴定Ara h1、h2、h3和h6含量降低的花生品系,并利用全基因组关联分析(GWAS)阐明其遗传调控机制。研究人员对美国花生微核心种质库的92份种质进行了酶联免疫吸附测定(ELISA)和十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)筛选,并将所得数据与5,532个单核苷酸多态性(SNP)标记进行关联分析。研究观察到显著的表型多样性。进一步通过反相超高效液相色谱(RP-UPLC)对23个具有极端蛋白质表型的品系进行评估,其中9个品系通过液相色谱-质谱联用(LC-MS)进行分析。GWAS在原始数据集和对数转换数据集中共鉴定出165个标记-性状关联(MTAs),其中13个MTAs在两种分析中共同存在。这些MTAs被归类为蛋白质数量性状位点(PQLs),揭示了五个Ara h基因中两个基因的六个反式PQLs和顺式PQLs。研究鉴定了种子表达的候选转录因子(TFs),包括MYB、MYC、ERF和bZIP,以及多效性PQLs。对相关Ara h基因启动子(转录起始位点TSS上游1 kb)的分析揭示了这些TFs在这些PQLs中的结合位点。研究人员推测这些TFs直接或通过调控级联反应反式调控Ara h基因。这些发现为Ara h基因的调控格局提供了初步见解,并将促进花生低过敏原含量的育种工作。
该研究聚焦于花生主要过敏原蛋白积累的遗传调控机制,旨在为低过敏原花生的分子育种提供理论基础与遗传资源。花生作为全球第四大油料作物,其种子富含油脂和蛋白质,具有重要的经济和营养价值。然而,花生过敏(Peanut Allergy, PA)在普通人群中的患病率约为1-2%,且花生是导致北美和英国食物相关过敏性休克死亡的首要原因。目前,过敏原特异性免疫疗法和单克隆抗体等预防性治疗手段成本高昂,因此开发低过敏原花生品种成为一种具有成本效益的替代策略。花生种子中已鉴定出32种蛋白质,其中18种(Ara h1至Ara h18)被认定为过敏原,而Ara h1、Ara h2、Ara h3和Ara h6作为 major allergens,可在至少50%的致敏个体中诱发免疫反应。尽管已有研究报道了花生种子中过敏原蛋白含量的自然遗传变异,但尚未利用这些定性和定量差异作为性状来定位调控蛋白水平变异的基因组区域,即蛋白质数量性状位点(Protein Quantity Loci, PQLs)。美国花生微核心种质库(U.S. peanut mini-core collection)包含112份种质,代表了美国花生种质资源约1%的遗传多样性,已被广泛用于研究抗病性、脂肪酸组成、耐热性及过敏原含量等性状,适合进行基于连锁不平衡(Linkage Disequilibrium, LD)的全基因组关联分析。
研究人员以美国花生微核心种质库中的92份非冗余种质为研究材料,样本来源为美国农业部农业研究服务种质资源保护单位(USDA-ARS Plant Genetic Resources Conservation Unit)。研究采用多种蛋白定量技术:通过SDS-PAGE和ELISA进行初步筛选,基于结果选择23个极端表型品系进行RP-UPLC分析,再从中选取9个品系进行LC-MS/MS验证。蛋白质组学分析采用基于总蛋白法(Total Protein Approach, TPA)的无标记定量策略,使用Orbitrap Fusion Tribrid质谱仪进行数据采集。GWAS分析使用BLINK和FarmCPU两种多位点模型,对原始数据和经对数转换的数据分别进行分析,以5,532个过滤后的SNP标记进行关联。通过LD分析将MTAs归类为PQLs,区分顺式PQLs(cis-PQLs,与Ara h基因物理位置邻近)和反式PQLs(trans-PQLs,位于Ara h基因LD区域之外)。候选基因鉴定采用Ensembl Plants的BioMart工具,并通过ArachisMine数据库进行种子表达谱分析,同时利用PlantCARE数据库对Ara h基因启动子区域的转录因子结合位点进行预测。
遗传变异分析结果:SDS-PAGE和ELISA分析揭示了92份种质中四种主要过敏原蛋白的显著变异。描述性统计显示,密度测定值的变异系数(CV%)范围为8%(Ara h3)至31%(Ara h6),而ELISA测定值的CV%范围为2.5%(Ara h2)至5.6%(Ara h3)。多数蛋白质性状呈近似正态分布,但Ara h3(ELISA和密度测定)和Ara h6(ELISA)呈现偏态分布。系统发育分析将种质分为两大聚类,高免疫原蛋白含量品系与低含量品系分别聚类。Pearson相关分析表明,同一方法测定的不同蛋白类型间正相关更为显著,而不同方法间的相关性较弱,但UPLC方法测定的蛋白间相关性较强(r = 0.43-0.87)。四种方法共同鉴定出三个稳定表达品系(PI 343384、PI 497395和PI 259658),其中PI 259658在至少三种方法中表现出较低的Ara h3和Ara h6含量。
标记-性状关联分析结果:GWAS共鉴定出165个MTAs,其中124个仅见于原始数据,28个仅见于对数转换数据,13个在两种数据类型中共同存在。BLINK和FarmCPU方法分别鉴定出90个和118个MTAs,43个为两种方法共有。按蛋白分布:Ara h1有95个MTAs,Ara h3有55个,Ara h2有15个,Ara h6有8个。染色体分布上,第6号染色体携带最多MTAs(22个),第13和17号染色体最少(各1个)。Ara h1与Ara h2共享6个MTAs,Ara h2与Ara h6共享4个MTAs(均位于第2号染色体),Ara h1与Ara h3仅共享1个MTA。这种共同MTAs模式暗示了相关蛋白可能存在协同调控机制。
顺式与反式PQLs定位结果:通过与已知Ara h基因位置比对,研究鉴定出两个顺式PQLs:位于第6号染色体的Ara h3顺式PQL(LD范围1.79 Mb)和位于第19号染色体的Ara h1顺式PQL(LD范围1.52 Mb)。其余三个Ara h基因(第8号染色体的Ara h2和Ara h6,以及第16号染色体的Ara h3)虽邻近MTAs但未落入LD区块内。值得注意的是,Ara h2和Ara h6位于同一染色体且处于LD中,提示其可能受同一PQL协同调控。此外,研究鉴定出六个反式PQLs:pqArah223-Ch2、pqArah3-Ch4、pqArah1-Ch5、pqArah12-Ch14和pqArah123-Ch18,其中三个具有多效性,可同时调控多个Ara h基因。
候选基因与转录因子分析结果:在PQL区域共鉴定出13个候选基因,编码转录因子或Ara h类似蛋白。这些基因位于第4、5、13、14和18号染色体,包括FAR1、翼状双螺旋DNA结合蛋白、两种乙烯响应转录因子(ERF)、NAC转录因子、两种碱性螺旋-环-螺旋转录因子(bHLH)、bZIP转录因子、cupin蛋白(Ara h类似蛋白)、同源异型域-亮氨酸拉链蛋白、TATA结合模块和GATA转录因子。表达谱分析显示,MYB转录因子在种子中特异性高表达,而FAR1、两种ERF、bHLH、TATA结合模块和GATA等五个基因在生殖器官(荚果和/或种子)中相对高表达。
启动子调控元件分析结果:对Ara h1、Ara h2和Ara h3基因启动子区域(TSS上游1 kb)的分析揭示了MYB、MYC、bHLH、ERF和bZIP转录因子的结合位点。其中bZIP结合位点为G-box基序。Ara h3(第6号染色体)启动子区含有最多的结合位点(9个),而Ara h3(第16号染色体)最少(3个)。总体而言,MYB结合位点最为丰富(12个),其次为MYC(8个)和G-box/ERF(各5个)。
讨论部分总结:该研究首次系统解析了花生主要过敏原蛋白的遗传调控网络,填补了该领域的知识空白。研究人员特别强调,育种低过敏原花生面临多重挑战:多靶点 involved、表型的生化复杂性、种子发育末期表达特性,以及缺乏DNA标记辅助选择等问题。尽管Ara h基因家族结构复杂且存在多个同源拷贝,但通过GWAS分析仍成功鉴定出了顺式和反式调控元件,验证了研究方法的可靠性。
研究讨论深入分析了不同蛋白定量方法的技术差异:SDS-PAGE基于分子量分离,ELISA依赖抗原-抗体三维结构识别,UPLC依据疏水性分离,LC-MS则基于质荷比鉴定。这些方法论差异导致绝对值存在偏差,但总体趋势一致,为GWAS结果的解读提供了依据。研究人员指出,仅4个标记在ELISA和密度测定方法间共同存在,但多数独特MTAs定位于相同LD区域的PQLs,表明不同方法收敛于共同的基因组区域。
关于遗传调控复杂性,研究人员指出Ara h1和Ara h3的MTAs数量远多于Ara h2和Ara h6,暗示前两者受更复杂的遗传调控。Ara h2与Ara h6的序列相似性(59%)及共同MTAs的存在,支持了它们可能受相同调控机制控制的假设。同时,三个多效性PQLs(pqArah1236.Ch2、pqArah123.Ch2和pqArah23.Ch18)的发现,表明不同Ara h蛋白可能共享转录调控网络。
研究人员将本研究与小麦谷蛋白调控研究进行了比较,指出种子贮藏蛋白的调控在物种间具有保守性机制,但具体转录因子和调控网络存在差异。小麦研究中已证实TaSAD、PBF、SPA等转录因子通过结合启动子顺式元件调控谷蛋白基因表达,而本研究鉴定的MYB、MYC、ERF、bZIP等候选转录因子可能通过相似机制调控花生Ara h基因。
该研究的结论为:首次鉴定了调控花生主要过敏原蛋白积累的PQLs,包括顺式PQLs(Ara h1第19号染色体,Ara h3第6号染色体)和六个反式PQLs;发现种子特异性表达的候选转录因子(MYB、MYC、ERF、bZIP)及其在Ara h启动子区的结合位点;提出这些转录因子可能直接或通过调控级联反式调控Ara h基因的工作假说;筛选出PI 259658等低过敏原含量种质作为分子育种资源。该研究为后续通过CRISPR等基因编辑技术验证转录因子功能、开发低过敏原花生品种奠定了重要基础,但反式PQLs尚需进一步验证方可应用于育种程序。