基于拉曼光谱与机器学习揭示糖尿病大鼠血清大分子失衡的代谢组学研究

《ANALYTICAL AND BIOANALYTICAL CHEMISTRY》:Raman spectroscopy supported by machine learning reveals changes in balance of macromolecules in diabetic rat serum

【字体: 时间:2025年10月14日 来源:ANALYTICAL AND BIOANALYTICAL CHEMISTRY 3.8

编辑推荐:

  本研究针对2型糖尿病(T2DM)早期诊断难题,采用拉曼光谱结合机器学习算法,系统分析了糖尿病模型大鼠血清中代谢物的分子振动特征。研究发现T2DM会导致蛋白质构象、芳香族氨基酸及脂质组成的显著改变,通过AdaBoost算法实现了94%的准确率区分糖尿病与对照组,为糖尿病代谢紊乱机制研究提供了新的无创检测策略。

  
随着全球糖尿病患病率的急剧攀升,2型糖尿病(T2DM)已成为重大公共卫生挑战。据预测,到2030年全球糖尿病患者将突破7亿人。这种代谢紊乱疾病以胰岛素抵抗和β细胞功能障碍为特征,导致持续性高血糖状态。然而早期T2DM缺乏明显临床症状,常规血糖检测难以全面反映器官层面的代谢变化,致使患者往往在出现视网膜病变、肾病等严重并发症时才被确诊。这种诊断滞后性促使科研人员寻求能够早期捕捉代谢失衡的新型检测技术。
在此背景下,拉曼光谱技术展现出独特优势。该技术通过分析分子振动产生的特征光谱,能够无标记地检测生物样本的化学组成变化。当单色激光照射样品时,光子与分子发生非弹性碰撞产生的能量偏移,形成包含分子结构信息的指纹图谱。这种高灵敏度特性使其特别适合检测疾病引起的细微代谢改变。
发表于《ANALYTICAL AND BIOANALYTICAL CHEMISTRY》的最新研究创新性地将拉曼光谱与机器学习相结合,旨在揭示T2DM大鼠血清中大分子代谢物的失衡规律。研究团队通过高脂饮食联合链脲佐菌素(STZ)注射成功构建T2DM大鼠模型,采集血清样本进行拉曼光谱检测。关键技术方法包括:使用532nm激发的拉曼成像显微镜获取血清光谱,通过主成分分析(PCA)提取差异特征,并采用决策树(DT)、随机森林(RF)、k近邻(kNN)和AdaBoost四种机器学习算法进行模式识别。特别采用留双样本交叉验证确保模型可靠性,最终通过特征重要性分析确定关键生物标志物。
研究结果
光谱特征揭示代谢物变化
对比糖尿病与对照组血清拉曼光谱发现,虽然两组均显示相同的特征峰,但强度存在显著差异。糖尿病组在745-763 cm-1和985-1027 cm-1处的氨基酸振动,1199-1258 cm-1、1574-1600 cm-1和1653-1712 cm-1处的酰胺带,以及1442-1472 cm-1和2831-3041 cm-1处的脂质特征峰均发生明显改变。这些变化提示T2DM影响了蛋白质构象、芳香族氨基酸水平以及脂质组成与含量。
主成分分析有效区分两组样本
PCA分析显示PC1和PC3成分能有效区分糖尿病与对照组。加载图分析表明,PC1分离主要归因于氨基酸(745-763 cm-1)、酰胺III(1199-1258 cm-1)、脂质(1442-1472 cm-1)等区域的振动变化;而PC3的分离则与酰胺I(1676-1716 cm-1)和脂质CH伸缩振动(2831-2914 cm-1)密切相关。这一结果从统计学角度证实了糖尿病引起的代谢物组成改变具有显著性。
相关性分析揭示代谢网络紊乱
皮尔逊相关性分析揭示了T2DM导致的代谢物相互关系改变。糖尿病组中,1330-1388 cm-1脂质带与1599-1627 cm-1酰胺I和1517-1573 cm-1酰胺II的相关性显著增强,而1422-1494 cm-1脂质带与1629-1712 cm-1酰胺I的相关性从0.68降至0.38。更值得注意的是,2818-3041 cm-1脂质带与477-608 cm-1蛋白质三级结构带的相关性从0.68急剧减弱至0.25。这些变化表明T2DM破坏了脂质-蛋白质相互作用的稳态平衡。
机器学习实现高精度分类
在四种机器学习算法中,AdaBoost表现最优,F1分数达0.84,准确率85%,灵敏度80%,特异性90%。决策树分析确定544 cm-1(二硫键)、865 cm-1(酪氨酸)、1648 cm-1(酰胺I)和1736 cm-1(酯类C=O)为关键判别特征。当仅使用AdaBoost筛选出的22个重要波段时,所有算法的分类性能均显著提升,AdaBoost的F1分数达到0.94,准确率、灵敏度、特异性和精确度均超过94%。
研究结论与意义
本研究通过拉曼光谱与机器学习的有机结合,成功揭示了T2DM大鼠血清中大分子代谢物的失衡规律。研究发现糖尿病不仅引起单个代谢物水平变化,更导致脂质、蛋白质和碳水化合物之间相互关系的广泛重构。特别值得注意的是,酰胺I带(1640-1680 cm-1)和脂质CH伸缩振动(2800-3100 cm-1)成为最显著的判别特征,这与临床已知的糖尿病蛋白质糖基化和脂代谢紊乱病理机制高度一致。
从方法学角度,本研究突破了传统生化检测的局限性,实现了基于分子振动特征的糖尿病无创诊断。AdaBoost算法筛选出的22个关键波段不仅提供了高精度分类模型,更指明了最具病理意义的生物标志物区域。这种"光谱特征-机器学习"双驱动策略为代谢性疾病研究提供了新范式。
该研究的临床意义在于为糖尿病早期诊断和并发症预警提供了潜在的新方法。拉曼光谱检测具有快速、无标记、需样量少等优势,结合机器学习算法后可实现自动化分析,有望发展为临床筛查工具。此外,研究所揭示的脂质-蛋白质相互作用失衡机制,为理解糖尿病多器官并发症的分子基础提供了新视角。
未来研究可进一步拓展到人类样本验证,并结合靶向代谢组学分析,深入解析特定代谢通路在T2DM发病中的作用。这种多组学整合策略将有力推动精准医疗在糖尿病管理中的应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号