探索多变量曲线拟合方法——交替最小二乘法(MCR-ALS)在数据挖掘中的应用,用于处理动态变化的复杂细胞光谱数据(光谱组学)

《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》:Exploration of multivariate curve resolution- alternating least squares (MCR-ALS) for datamining kinetically evolving complex cellular spectroscopic data (Spectralomics)

【字体: 时间:2025年11月08日 来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3

编辑推荐:

  本研究探索MCR-ALS方法在解析细胞动力学演化拉曼光谱中的潜力,发现传统方法如PCA和PLS-DA无法有效区分代谢条件,而结合初始估计约束与动力学硬模型的MCR-ALS策略可分离糖酵解与非糖酵解过程光谱,但其定量速率常数受高细胞背景干扰,定性趋势仍具参考价值。研究证实拉曼光谱耦合谱学方法在动态生物监测中的应用前景及局限性。

  
Nitin Patil|Zohreh Mirveis|Hugh J. Byrne
FOCAS研究所,都柏林理工大学,城市校区,Camden Row,都柏林8,爱尔兰

摘要

本研究探讨了利用多变量曲线分辨率-交替最小二乘法(MCR-ALS)对细胞拉曼光谱数据中的复杂光谱特征进行数据挖掘的方法。主成分分析和偏最小二乘-判别分析表明,在不同代谢状态(对照、刺激和抑制)下,代谢变化随时间的变化得到了捕捉;然而,MCR-ALS无法准确分辨这些光谱成分。因此,生成了模拟数据集来测试分辨率的极限,这揭示了在MCR中初始估计光谱成分的重要性,并研究了ALS中相等性约束的影响。尽管在较高细胞背景噪声下,对组分时间演变的速率常数进行定量分析的准确性不高,但它们在各种调节条件下仍表现出一致的定性趋势。因此,对细胞数据进行了定性分析,并得出结论:在MCR中应用初始估计约束以及在ALS中应用动力学硬模型约束是数据挖掘复杂细胞光谱的最佳策略。无论是糖酵解还是非糖酵解的细胞过程,其光谱特征在所有调节条件下都能被分辨出来,这突显了无标记方法的高内涵信息量。该研究展示了拉曼光谱与光谱组学结合在数据挖掘方面的潜力,同时指出了其局限性。这种方法在高通量药物筛选、药物发现、疾病诊断以及生物过程分析技术中具有潜在应用价值。

引言

振动光谱包括拉曼光谱和红外光谱,这两种技术通常被认为是互补的,能够检测所有分子振动[1]。近年来,由于它们具有高特异性(能够区分密切相关的生物样本[1]),这两种技术在生物学应用中得到了广泛研究。与常用的传统高通量技术(如质谱、核磁共振等)相比,振动光谱提供了高内涵信息,并且是无标记、非侵入性和非破坏性的[1]。它记录了采样区域所有分子振动的综合信息,可以提供关于物理、化学或生物过程随时间变化的动力学见解[1]。因此,除了区分密切相关的生物样本外,还可以研究它们的动态变化[1]。该技术在生物医学(用于疾病诊断[2])和基于细胞或衍生自细胞的药物的过程工程中有着广泛的应用[3]。
然而,由于缺乏适合处理生物系统复杂光谱数据的数据挖掘方法,使用振动光谱实时探索生物系统还存在不足[1]。一些统计技术(如主成分分析及其变体)被广泛用于区分密切相关的光谱,但它们难以直接应用于动力学分析[4,5]。回归技术(如偏最小二乘回归)可用于数据挖掘演变中的光谱,但要求数据呈共线性[4,6]。
多变量曲线分辨率–交替最小二乘(MCR-ALS)算法是一种组合方法,由MCR和ALS两种技术组成[7]。MCR部分用于估计组分的数量及其浓度,而ALS部分则根据动力学约束对数据拟合这些响应[7]。之前已有研究描述了使用MCR-ALS方法通过细胞外介质挖掘细胞代谢动力学的应用[4]。本研究模拟了通常在简单盐溶液中进行的糖酵解实验,尝试利用无标记拉曼光谱来挖掘细胞外介质中的代谢途径动力学[4]。此外,还使用了两种途径调节剂——寡霉素(刺激剂)和2-脱氧葡萄糖(抑制剂)来影响糖酵解途径,并识别该过程的光谱特征[4]。在本研究中,将使用相同的案例研究来探索MCR-ALS工具箱在挖掘复杂、动态变化的细胞数据方面的能力,但监测的是细胞光谱而非细胞外介质。
为了更好地理解该技术在识别细胞光谱微小变化方面的局限性,利用实验测量的细胞光谱数据生成了模拟数据,并在其上叠加了已知动力学变化的调节信号。分别单独和组合测试了MCR-ALS工具箱中的不同约束,以确定从简单到复杂细胞数据中挖掘光谱特征的最佳方法。在多次试验中,测试的约束包括:MCR中对组分光谱的初始估计、ALS过程中的动力学硬模型约束以及相等性约束(应用于组分光谱或其动力学演变)。将每次试验得到的光谱成分、它们的时间演变和速率常数输出与不同权重下的预期输出进行比较。试验还包括了在某些情况下无法获得过程动力学信息的情景,并用一个对细胞动力学了解较少的细胞数据集来展示试验结果。
本研究展示了MCR-ALS在利用光谱组学方法挖掘光谱特征及其随时间动力学变化方面的潜力,并讨论了其局限性。

章节片段

细胞培养

A549(人类肺癌)细胞在Dulbecco改良Eagle培养基(DMEM;Sigma Aldrich,爱尔兰)中培养,培养基中添加了10%的间充质干细胞专用胎牛血清(FBS;Sigma Aldrich,爱尔兰)和1%的青霉素-链霉素(Penstrep;GIBCO,Thermo Fisher,爱尔兰),培养温度为37°C,培养箱内CO2浓度为5%。当细胞密度达到60%-80%(通过目视估计)时,每三到四天进行传代培养。传代过程中,简要移除生长培养基。

细胞光谱数据的主成分分析和偏最小二乘判别分析

图S2显示了对照组、抑制组和刺激组在180分钟后的细胞光谱的平均值和标准差。这些光谱具有典型的特征,例如胺类(约1640 cm?1)、脂质(约1440 cm?1)和苯丙氨酸(1004 cm?1),从视觉上看,这些光谱无法区分。图1展示了比较所有(重复实验和不同时间点)代谢条件光谱的主成分分析(PCA)结果。所有不同

讨论

在相同的实验条件下,定期(20分钟)监测了对照组、刺激组和抑制组的细胞拉曼光谱的动力学演变,这些条件是通过简单的细胞外介质来监测细胞代谢变化的[4]。然而,主成分分析(PCA)无法区分复杂细胞光谱中的不同代谢状态(见图1),这与简单情况下的观察结果不同

资金致谢

本研究由Science Foundation Ireland Frontiers for the Future Award资助

CRediT作者贡献声明

Nitin Patil:概念构思、撰写——初稿。Zohreh Mirveis:概念构思。Hugh J. Byrne:概念构思、撰写——初稿、监督、资金获取。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号