粪便整体异质性:对代谢组学研究中均质化与点采样策略的启示

《Metabolomics》:The faecal bulk heterogeneity: implications for homogenisation and spot-sampling strategies for metabolomic investigations

【字体: 时间:2026年05月25日 来源:Metabolomics 3.3

编辑推荐:

  粪便代谢组学(faecal metabolomics)是研究粪便中小分子代谢物的领域,旨在阐明代谢通路并识别潜在的生物标志物。然而,单个粪便标本内部的空间异质性给数据一致性带来了挑战。尽管这一问题已得到广泛认识,但针对粪便特定区域、采样深度与全粪均质样本之间的

  
粪便代谢组学(faecal metabolomics)是研究粪便中小分子代谢物的领域,旨在阐明代谢通路并识别潜在的生物标志物。然而,单个粪便标本内部的空间异质性给数据一致性带来了挑战。尽管这一问题已得到广泛认识,但针对粪便特定区域、采样深度与全粪均质样本之间的定量比较仍然有限。本项先导性研究旨在量化五个区域(从头部至尾部)及不同深度粪便整体中的代谢物变异,并评估点采样能否作为全粪均质化的代表性替代方案,用于基于质子核磁共振(1H NMR)波谱的粪便代谢物分析。研究人员对76种代谢物进行了定量分析,采用主成分分析(PCA)、重复测量方差分析同步成分分析(RM-ASCA+)、线性混合效应模型(LMMs)以及类内相关系数(ICC)等多变量统计方法,比较了不同区域与全粪均质样本之间的代谢谱差异。结果显示,粪便整体两端存在明显的代谢特征差异:尾部(代表新近排出的物质)中3-(3-羟基苯基)丙酸酯(3-(3-hydroxyphenyl)propionate)和3-苯丙酸酯(3-phenylpropionate)含量显著升高(分别增加57-58%和50%);而头部则富集更多与蛋白质水解相关的代谢物,如异戊酸(isovalerate,增加30%)和甲硫氨酸(methionine,增加54%)。采样深度未检测到一致性差异。尽管存在这些代谢物特异性差异,各区域与均质化样本的整体偏差仍较小,平均绝对差异保持在约1%或以下。研究结论表明,粪便代谢物组成沿粪便长轴存在明显的纵向异质性,在本先导队列中,尾部区域的点采样最接近整体粪便代谢组,可作为全粪均质化的实用、低劳动强度替代方案。
本研究围绕粪便代谢组学中的核心方法论问题展开,即粪便标本内部的空间异质性如何影响代谢物检测的一致性,以及点采样策略能否有效替代劳动密集型的全粪均质化处理。

研究背景与现存问题:粪便代谢组学作为功能基因组学(functional genomics)的重要分支,通过检测分子量通常低于1,500-2,000 Da的小分子代谢物,反映宿主代谢、饮食摄入、环境暴露及微生物活动的综合效应。短链脂肪酸(short-chain fatty acids, SCFAs)、支链脂肪酸(branched-chain fatty acids, BCFAs)、氨基酸、糖类、胆汁酸衍生物、吲哚类及脂质等化合物共同构成了复杂的粪便代谢组,为理解肠道微生态与宿主健康关系提供了功能读数。在分析平台方面,1H NMR波谱与质谱联用技术(如气相色谱-质谱、液相色谱-质谱)被视为互补方法,其中1H NMR以其定量性强、重复性好、能提供代谢组整体视图的特点而备受重视。然而,粪便物质内部存在显著的地形异质性(topographical heterogeneity),即沿粪便长轴(从头部到尾部)的代谢物组成呈现梯度变化。这种异质性主要源于消化过程在胃肠道不同阶段的渐进性变化:头部物质在结肠中停留时间更长,导致水分吸收更充分、微生物降解更彻底;尾部物质则因排出时间较近而质地更软、颜色更鲜明。此前虽有研究报道了粪便代谢物的空间异质性,但缺乏针对特定纵向区域、采样深度与全粪均质样本之间系统性的定量比较。此外,点采样(spot sampling)作为大规模研究中最常用的采样策略,其能否准确反映整体粪便代谢组仍不明确,这对研究设计的标准化和数据可重复性构成重要挑战。

研究目的:本先导性研究设定两个核心目标,一是量化五个定义区域(R1头部至R5尾部)及不同深度(表面、中层、核心)的代谢物变异;二是评估点采样相对于全粪均质化在1H NMR代谢物分析中的代表性。

研究方法与技术路线:研究纳入5名健康成人受试者(年龄26-43岁,2名男性,3名女性,高加索人种),要求无胃肠道疾病、近三个月未使用抗生素、采样时无急性疾病。每位受试者在常规饮食条件下提供两次完整粪便标本,间隔至少一周。标本收集使用厌氧粪便采集器(Fecotainer),并在采集后一小时内处理以最小化氧暴露引起的代谢物改变。每个粪便整体被目视划分为五个区域(R1-R5),每个区域从三个深度(表面、中层、核心)采集样本;剩余部分经机械均质化处理后从中心采集三个重复样本,总计180个样本纳入分析。

代谢物提取采用200±50 mg粪便样本与1 mL超纯水进行水相萃取。1H NMR波谱在Bruker Avance III HD波谱仪上采集,使用500.18 MHz质子频率的宽带氟观测SmartProbe?探头,采用预饱和的一维核奥弗豪泽效应波谱(1D NOESY)脉冲序列,以3-(三甲基硅基)丙酸-2,2,3,3-d4酸钠盐为内标,定标于0.0 ppm。波谱处理使用NMRProcFlow在线软件进行基线校正和变尺寸分段积分(bucketing),代谢物定量通过Chenomx软件v.8.6完成,结合内置谱图库和课题组自建数据库进行峰归属。

统计学分析方面,研究采用多种多变量方法:主成分分析(PCA)用于探索性数据分析和样本聚类模式识别;基于Bray-Curtis相异度的置换多因素方差分析(PERMANOVA)评估分组差异;重复测量方差分析同步成分分析(RM-ASCA+)处理受试者内重复测量结构,以粪便区域为固定效应、受试者为随机截距,通过1000次Bootstrap重抽样验证模型稳健性;线性混合效应模型(LMMs)分析代谢物特异性纵向变化,以尾部R5为参照水平计算估计边际均值和95%置信区间,采用Benjamini-Hochberg程序进行多重检验校正;类内相关系数(ICC)量化区域样本与均质样本的一致性程度,划分为差(<0.40)、中等至良好(0.40-0.75)和优秀(≥0.75)三个等级。此外,研究还进行了基于模拟的样本量估计,为后续确证性研究提供设计参考。

主要研究结果:PCA分析揭示显著的个体间变异是粪便代谢组的最大变异来源,占61.2%的总方差;粪便区域贡献2.2%的方差(P=0.011),采样事件贡献2.3%(P=0.001),而采样深度仅占0.2%且无统计学意义(P=0.895)。RM-ASCA+分析清楚显示沿粪便长轴的组成梯度,第一主成分解释58.2%的方差。头部区域(R1-R2)相对富集氨基酸相关及含氮代谢物,包括甲硫氨酸、葡萄糖-6-磷酸、N-乙酰谷氨酸、二甲胺、甘油、色氨酸、戊二酸、甘氨酸和尸胺;而中部(R3)及尾部区域(R4-R5)和均质样本则显示更高的微生物降解产物水平,如3-(3-羟基苯基)丙酸酯、3-苯丙酸酯、乙酸酯、β-丙氨酸、酪胺和组氨酸。

线性混合效应模型识别出13种沿粪便长轴浓度显著变化的代谢物。以尾部R5为参照,芳香族化合物3-(3-羟基苯基)丙酸酯在R2和R1分别降低57.0%(q=0.017)和58.3%(q=0.016),3-苯丙酸酯在R2降低49.5%(q=0.025);5-氨基戊酸酯在R2显著升高86.0%(q=0.023)。二甲胺在R2和R1分别增加92.5%(q=0.002)和68.7%(q=0.017)。支链脂肪酸异戊酸在R1增加29.9%(q=0.012),甲硫氨酸在R1增加53.4%(q=0.009)。葡萄糖-6-磷酸在R1强烈升高143.5%(q=0.040)。尾部区域内部亦存在差异:R4相对于R5,肌酸酐增加58.6%(q=0.011),半胱氨酸增加45.0%(q=0.014),异亮氨酸和亮氨酸分别增加75.3%(q=0.039)和60.2%(q=0.030),N,N-二甲基甘氨酸增加71.5%(q=0.009),N-乙酰葡糖胺增加2.1%(q=0.009)。短链脂肪酸(乙酸、丁酸、丙酸)未显示显著区域差异,但乙酸在RM-ASCA+模型中为重要贡献变量,在R1呈9.1%的边际下降趋势(P=0.044,q=0.248)。

在区域采样与全粪均质样本的代表性比较中,ICC分析显示尾部R5与均质样本的一致性最高:79.7%的代谢物显示优秀一致性(ICC>0.75),18.8%显示良好一致性(ICC 0.50-0.75),仅葡萄糖-6-磷酸为差一致性(ICC=0.36)。R3和R4也表现良好,而R1和R2的一致性较差,分别仅39.1%和43.4%的代谢物达优秀水平。中短链脂肪酸在各区域通常表现良好至优秀一致性,但R1的乙酸为差一致性。多数氨基酸及其衍生物一致性良好至优秀,但R1和R2的谷氨酸、甲硫氨酸、N-乙酰谷氨酸和色氨酸,以及R1的赖氨酸和甘氨酸为差一致性;R4的甘氨酸和N-乙酰谷氨酸也为差一致性。从平均绝对偏差来看,R1(1.03%,95%CI 0.38-1.69%)和R2(1.02%,95%CI 0.38-1.65%)与均质样本偏离最大,R3(0.49%,95%CI 0.00-0.98%)、R4(0.55%,95%CI 0.18-0.92%)和R5(0.59%,95%CI 0.12-1.07%)偏离较小。丁酸在各区域尤其R1-R3呈最强负向偏离,乳酸、甘氨酸、丙酸酯、乙醇、胆酸盐、谷氨酸、牛磺酸和葡萄糖则多呈正向偏离。

样本量估计显示,基于当前5名受试者,检测区域与均质样本差异的检验效能仅为19.0%,模拟表明约需50名受试者方可达到80%的常规检验效能;而采样深度比较即使在大样本模拟中仍检验效能不足,与其效应量极小一致。

讨论部分的核心观点:研究人员首先将本研究发现置于更广泛的肠道微生态研究背景中。粪便异质性是代谢组学研究的公认挑战,其根源在于胃肠道中发酵底物可用性、微生物活性、宿主分泌及水分重吸收的空间和时间差异。近端结肠以糖酵解(saccharolysis)为主,得益于充足的 fermentable carbohydrates,主要产生乙酸、丙酸和丁酸等短链脂肪酸,该过程主要由普雷沃菌属(Prevotella)、罗斯氏菌属(Roseburia)和乳杆菌属(Lactobacillus)等驱动;远端结肠则因底物耗竭而以蛋白质水解(proteolysis)占优,产生氨、硫化氢、支链脂肪酸、酚类、吲哚类和腐胺类多胺,微生物组成也相应转变为丙酸杆菌属(Propionibacterium)、梭菌属(Clostridium)和拟杆菌属(Bacteroides)等占优势。除微生物分层外,粪便长轴的纵向代谢梯度还受直肠滞留时间延长、黏膜表面氧暴露增加、宿主分泌梯度及水分重吸收等局部因素影响,这些因素共同造成了空间变异性,给无靶向代谢组学的数据解读带来复杂性。

本研究通过结合百分比浓度变化、ICC和多变量分析,在1H NMR代谢组学框架内首次对粪便采样策略进行了结构化定量评估。尾部作为新近形成部分,富集了3-(3-羟基苯基)丙酸酯和3-苯丙酸酯等膳食多酚的微生物分解产物,这与较新的消化和微生物加工过程一致;而头部作为直肠滞留更久的物质,则显示氨基酸(缬氨酸、甲硫氨酸)和蛋白质水解相关代谢物(异戊酸、异丁酸、5-氨基戊酸酯、N-乙酰谷氨酸)的富集,头部较高的葡萄糖-6-磷酸可能反映更大的上皮细胞周转和细胞裂解程度。短链脂肪酸浓度在各区域间保持相对稳定,仅乙酸有轻微趋势性下降,这进一步支持了短链脂肪酸作为微生物活性和膳食纤维摄入稳健生物标志物的价值,及其与代谢健康改善、2型糖尿病风险降低和肥胖减少的一致关联。

与既往研究相比,本研究未发现采样深度相关的显著差异,这与部分文献报道的氧暴露或黏膜 proximity 相关的深度梯度不同,表明在本队列中纵向位置而非径向深度是主要的变异来源。尽管均质化被公认为最小化样本内变异的金标准,但在大规模或家庭为基础的研究中往往难以实施。研究发现尾部点采样与均质样本的代谢谱高度一致,各区域与均质样本的整体偏差均低于1%,这为标准化粪便代谢组学工作流程提供了实用策略。研究人员同时注意到相邻尾部区域间(如R4与R5)存在轻微但意外的变异性,这可能与排便过程中的混合作用或乙状结肠至直肠的过渡有关。

研究的局限性包括:样本量较小且受试者同质性高(健康成年高加索人),个体间变异占主导地位,结果的普适性需谨慎对待;1H NMR的检测范围主要覆盖低分子量、高丰度代谢物,对胆汁酸、吲哚类和多数脂质类化合物的覆盖不如质谱法全面;缺乏微生物组成和功能活性的直接测量,使得某些推断(如头部蛋白质水解优势)仍为间接推测;胃肠道通过时间在更广泛人群中的变异未在本研究中捕捉。基于模拟的样本量估计提示,当前数据集应被视为先导性研究,约需50名受试者以确认区域与均质样本的总体差异。

研究结论:粪便整体异质性是组学分析前处理变异性的相关来源。在本健康成人先导队列中,该贡献相对于较强的个体间变异较为适度,但沿粪便长轴存在一致的纵向梯度。头部标本显示较长时间的微生物降解迹象,蛋白质水解相关代谢物更为丰富。虽然全粪均质化仍是最全面的方法,但劳动密集且在大规模研究中往往不切实际。研究发现,在本先导队列1H NMR可检测的粪便代谢物谱中,尾部点采样提供了与均质样本最接近的近似,可作为实用的标准化策略,前提是能够明确识别该区域。这些发现需在更大、更多样化的人群(包括胃肠通过时间或粪便一致性改变的人群)中进行验证。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号