多组学分析揭示家蚕茧壳表型多样性及欧洲品系演化历史
《Scientific Data》:Multiomics analysis of the Silkworm cocoon shell
【字体:
大
中
小
】
时间:2025年10月10日
来源:Scientific Data 6.9
编辑推荐:
本研究针对欧洲家蚕(Bombyx mori)品系起源模糊的问题,结合表型组学、蛋白质组学、代谢组学和脂质组学方法,对148个历史与现代茧壳样本进行多组学分析。研究人员通过LC-MS/MS技术鉴定出茧壳平均含98±13种蛋白质、141种代谢物和981种脂质,并利用多种降维方法和聚类算法验证数据集可靠性。该研究为无基因组数据条件下的非分子系统发育分析建立了框架,为博物馆标本的文化价值提升提供了新范式。
丝绸,这一奢华织物的源头,可追溯至数千年前被人类驯化的家蚕(Bombyx mori)。尽管家蚕的驯化历史已有深入研究,但欧洲家蚕品系的起源和演化路径仍存在诸多谜团。传统上,家蚕品种被划分为中国种、日本种、热带种和欧洲种四大地理群系,然而欧洲品系的祖先来源及其分化时间一直缺乏清晰的分子证据。
近年来基因组学研究显示,欧洲家蚕品系可能起源于一个在中国已不存在的早期分支,但由于缺乏中东地区品系的采样,这一推论仍需进一步验证。更棘手的是,许多历史标本仅存茧壳,无法获取基因组数据,使得传统分子系统发育分析难以开展。与此同时,博物馆中珍藏的蚕茧标本虽具有丰富的历史价值,却往往因缺乏科学分析数据而未能充分发挥其文化教育功能。
为解决这些问题,来自希腊、意大利、德国等多国研究机构组成的团队开展了一项创新性研究,他们对148个历史(最早可追溯至19世纪初)和当代(2020-2023年生产)的家蚕茧壳样本进行了综合多组学分析。这些样本源自欧洲、亚洲等多个地区,包括76个当代样本和72个历史样本,其中50个为有色茧,88个为白茧。
研究团队采用了一套综合的技术方法体系:通过表型组学分析获取茧壳的生物计量数据、吸光度和荧光光谱;利用LC-MS/MS(液相色谱-串联质谱)技术进行非靶向蛋白质组学、代谢组学和脂质组学分析;运用多种统计学和生物信息学方法(包括PLS-DA、决策树分析、层次聚类、k-means聚类以及t-SNE、UMAP、PCA、MDS、ISOMAP和LLE等多种降维算法)对数据进行深入挖掘;并通过免疫印迹(Western blot)和生化测定方法对组学结果进行实验验证。
研究人员首先对茧壳的颜色表型进行了详细分析。历史茧壳样本因年代久远,原有颜色已发生改变,呈现淡白色至灰白色。为此,团队通过多元线性回归分析,基于当代茧壳样本的RGB(红绿蓝)和HSB(色相饱和度亮度)值,建立了颜色重建方程,成功近似重建了历史茧壳的原始颜色。
通过结合绿色色素存在与否、荧光特性以及颜色类型三个参数,所有148个茧壳样本被划分为8个簇。值得注意的是,第4簇(白色且发荧光)不含任何历史样本,而第7簇(无绿色色素、非白色、无荧光)包含了大多数历史茧壳。这种聚类结果为后续的多组学数据分析提供了重要的表型基础。
蛋白质组学分析在81个茧壳样本中鉴定出233种蛋白质,其中23种在所有样本中均被检测到,39种在≥95%的样本中存在,构成了家蚕茧壳中保守的核心蛋白质组。当代茧壳平均含有102±12种蛋白质,历史茧壳含有96±13种蛋白质,平均每个茧壳鉴定出98±13种蛋白质。
基因本体(GO)富集分析显示,许多蛋白质属于免疫相关类别,包括酶类、小肽、水解酶和蛋白酶抑制剂。为验证蛋白质组学结果的可靠性,研究团队还针对在家蚕翅盘生长因子(imaginal disk growth factor)制备了单克隆抗体,Western blot分析结果与蛋白质组学数据完全一致,仅在蛋白质组学已鉴定出该蛋白的样本中检测到特异性条带。
代谢组学分析鉴定出141种代谢物,其中游离氨基酸占主要部分。决策树分析显示,富马酸(fumaric acid)含量是区分历史与当代茧壳样本的关键代谢物,当代茧壳中含量较高。
类黄酮含量测定显示,不同簇的茧壳样本类黄酮含量存在显著差异,其中Daizo品种(携带+Lg/+Lg基因型)含量最高,而Baghdad品种(携带黄色抑制基因I/I)含量最低。游离氨基酸分析验证了代谢组学结果,18种测试氨基酸在所有20个分析样本中均被检测到,历史与当代茧壳间无显著差异。
脂质组学分析鉴定出981种脂质,主要为神经酰胺和植物神经酰胺,其次是鞘脂类。决策树分析表明,CAR 22:1(一种酰基肉碱)的信号强度分数可区分历史与当代茧壳样本。
生化验证显示,20个分析样本平均含有267.5±192.2μg油酸当量的总脂质,磷脂含量平均为12.5±5.8μg每茧壳,约占总脂质含量的4.6%。历史与当代茧壳在总脂质含量上存在显著差异,而磷脂含量无显著差异。
偏最小二乘判别分析(PLS-DA)显示,当使用茧壳年龄作为变量时,当代和历史样本在代谢组学和脂质组学数据中均能清晰分离;而当使用颜色或起源作为变量时,聚类重叠较大。
局部线性嵌入(LLE)作为一种非线性降维技术,在蛋白质组学、代谢组学和脂质组学数据集的分析中均提供了最清晰的结果。二维投影显示,历史样本形成一个连续体,并融入当代样本所在的空间。在脂质组学数据集中,当代样本形成一个紧密的聚类,位于中东和中国/印度次大陆的历史样本之间。
层次聚类分析进一步验证了这些分组。在蛋白质组学数据中,聚类大致按历史/当代界限形成,但存在当代样本与历史样本混合的情况。代谢组学数据的层次聚类同样将不同地理起源的当代样本归为一类。脂质组学的层次聚类则将历史与当代样本分离,并在历史样本中解析出三个不同的簇。
k-means聚类分析以k=2作为最稳健的分组方案,80个茧壳样本中有56个在蛋白质组学簇0、代谢组学簇1和脂质组学簇1中保持一致分组。该簇包含所有当代茧壳和几个历史样本,其中样本No.43(意大利科森扎)和No.61(法国瓦尔)最接近簇质心。当包含蛋白质组学簇1时,样本No.44(伊朗)最接近簇质心。
k-means聚类结果与历史文献记录高度一致。三个代表性茧壳样本(189年产自意大利科森扎、1959年产自法国瓦尔、约1820年产自伊朗)的地理起源与文献记载的蚕种交易和养蚕中心区域吻合。历史文献描述南意大利是一个养蚕业中心,而卡拉布里亚地区的品种被描述为源自波斯;法国瓦尔地区在19世纪和20世纪是包括北意大利和南法国在内的更大养蚕区的一部分;伊朗在19世纪早期文献中被描述为获取家蚕品种的地区。
历史文献还验证了茧壳样本的聚类结果,19世纪的手稿记录了欧洲家蚕品种的存在,这些品种通常被赋予地名,并与19世纪末20世纪初引入欧洲的中国和日本品种一起被记录。这些文字记录为研究中历史和当代茧壳样本的标签提供了支持证据。
本研究通过综合多组学分析方法,成功建立了在缺乏基因组数据情况下研究历史生物标本的系统发育关系的新框架。研究不仅提供了家蚕茧壳的全面分子特征描述,还开发了适用于历史标本颜色重建和分子分析的可靠方法。多组学数据与历史文献的交叉验证,为欧洲家蚕品系的起源和迁移历史提供了新的见解,展示了多组学方法在文化遗产研究和博物馆标本价值提升方面的巨大潜力。
这项发表于《Scientific Data》的研究为家蚕茧壳在多个科学领域的进一步开发利用提供了宝贵的基础数据集,同时也为其他历史生物标本的非分子系统发育分析建立了可借鉴的分析框架。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号