PCA AutoExplorer:生物医学振动光谱中类别分离主成分子空间的自动识别新方法
《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》:Automated identification of class-separating principal component subspaces in biomedical Raman and Fourier Transform Infrared Spectroscopy
【字体:
大
中
小
】
时间:2025年11月02日
来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3
编辑推荐:
本文推荐一种开源工具PCA AutoExplorer,它通过穷举评估所有主成分三元组(PCA triplets),结合马氏距离(Mahalanobis distance)和线性判别分析(LDA)精度,自动识别生物医学振动光谱(包括拉曼光谱(Raman Spectroscopy)和傅里叶变换红外光谱(FTIR))中最大化类别分离的主成分子空间。该方法引入标记强度图(marker strength plot)和加载热图,优先诊断波段(如1522 cm?1、1649 cm?1),并经t-SNE可视化验证,为临床光谱生物标志物发现提供可重复、统计严谨的框架。
本研究亮点在于开发了PCA AutoExplorer这一开源工具,用于自动识别生物医学振动光谱中能够最大化类别分离的三组分主成分子空间(简称"PCA三元组")。该算法通过穷举评估所有主成分三元组,结合马哈拉诺比斯距离(无监督)和线性判别分析准确率(有监督)对子空间进行排名,并比较预处理模式和光谱范围。工具引入了标记强度图——通过累加顶级三元组中主成分的绝对载荷值——以及集成的主成分载荷热图,以全局优先排序诊断波段。类别分离还通过2D/3D t分布随机邻域嵌入进行可视化展示。
本研究的FTIR指纹区标记(1649 cm?1)与Paja、Jakubczyk等人鉴定的酰胺I带(1636 cm?1)高度一致,证实了酰胺I振动在区分疾病状态中的核心作用。类似地,2951 cm?1处的CH2伸缩标记(拉曼光谱)对应Paja、Jakubczyk等人也观察到显著判别特征的谱区(2963 cm?1)。精确波数位置的微小差异可归因于预处理差异或队列异质性。重要的是,PCA AutoExplorer框架能够系统地识别这些一致的生物标志物,克服了传统方法的主观局限性。
PCA AutoExplorer提供了一个可重复、统计严谨的框架,用于识别诊断相关的主成分子空间并优先排序光谱生物标志物,增强了临床振动光谱中生物标志物发现的可靠性,并可适用于其他组学相关的光谱分析。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号