结合人工智能的Vis-SWNIR光谱和高光谱成像传感器,用于乳腺癌的早期诊断
《Biosensors and Bioelectronics: X》:Vis-SWNIR spectroscopic and hyperspectral imaging sensor integrated with artificial intelligence for early diagnosis of breast cancer
【字体:
大
中
小
】
时间:2025年12月16日
来源:Biosensors and Bioelectronics: X CS4.6
编辑推荐:
本研究采用便携式可见-短波近红外光谱(Vis-SWNIR)和超光谱成像(HSI)技术分析143份干燥血浆斑点样本(73健康对照,70乳腺癌患者),结合MCR-ALS算法提取光谱特征,并利用DD-SIMCA、SVM、ANN等机器学习模型进行分类。结果表明,HSI结合ANN的准确率达86%,Vis-SWNIR SVM模型准确率62%,检测到胆红素、血红蛋白、脂质和蛋白质等生物标志物的显著变化。方法具有快速、低成本和非侵入性优势,但需进一步临床验证。
乳腺癌早期诊断技术的研究进展:基于便携式光谱与高光谱成像的多维度分析
近年来,随着便携式光谱技术和人工智能算法的快速发展,非侵入式癌症筛查方法取得了突破性进展。本文通过整合便携式可见-短波近红外光谱仪(Vis-SWNIR)和高光谱成像(HSI)技术,结合多维生物标志物分析,构建了基于 dried plasma spots(DPS)的新型乳腺癌筛查体系。该研究在伊朗沙里夫理工大学医学化学实验室完成,样本量达到143例(73例健康对照,70例乳腺癌患者),覆盖了从样本制备到机器学习建模的全流程创新。
一、技术原理创新
研究团队开发了独特的样本处理流程,采用直径1厘米的圆形培养皿进行血浆干燥,有效控制样本扩散形态。通过分析12小时和24小时干燥方式的方差特性(ASCA方法),证实两种干燥方式在光谱特征上具有高度一致性(p值>0.05),为后续统一处理流程奠定了基础。在光谱采集环节,创新性地将便携式光谱仪与高光谱成像系统联用:前者采用单像素硅基传感器(波长范围400-1000nm),后者配置12位高灵敏度摄像机,形成多维数据采集体系。
二、数据分析方法论突破
1. 多源数据融合策略
通过MCR-ALS算法实现高光谱数据的二维解耦(光谱维度×空间维度),将原始116×36×992的三维数据矩阵转换为143×25056的二维特征矩阵。这种处理方式不仅分离出9个关键光谱组分(480nm、560nm、630nm等),还保留空间分布特征,使后续机器学习模型能同时捕获生物标志物的浓度变化和空间异质性。
2. 机器学习模型优化
对比研究显示,不同算法在便携式光谱(Vis-SWNIR)和高光谱(HSI)数据中的表现存在显著差异:
- 便携式光谱:SVM模型在测试集上达到62%准确率,kNN和ANN模型表现相近
- 高光谱数据:ANN模型在预测集准确率达86%,较其他算法提升10-15个百分点
值得注意的是,DD-SIMCA方法在HSI数据中展现出91%的灵敏度,85%的特异性,突破了传统分类模型在复杂光谱数据中的局限性。
三、生物标志物发现与验证
1. 关键光谱特征区
研究识别出三个核心诊断波段区间:
- 400-500nm区:胆红素特征峰(450-500nm)
- 540-580nm区:血红蛋白吸收带(氧合/脱氧状态)
- 750-950nm区:脂质/蛋白质振动特征(750nm芳香氨基酸,830nm脂质C-H振动,890nm CH2特征峰)
2. 代谢物关联分析
通过MCR-ALS解耦得到:
- 组件6(噪声背景)和组件7(血红蛋白变体)在患者组中浓度显著升高(p<0.01)
- 组件3(脂质过氧化物)与健康组相比存在12.7%的统计学差异
- 组件5(结合胆红素)的AUC值达到0.92,成为最佳生物标志物
四、临床应用价值评估
1. 诊断性能对比
不同技术体系的检测效能对比如下:
| 方法体系 | 准确率 | 灵敏度 | 特异性 |
|----------------|--------|--------|--------|
| 传统乳腺X光 | 68-72% | 62-67% | 85-90% |
| 便携式光谱仪 | 62% | 67% | 70% |
| HSI+ANN组合 | 86% | 88% | 85% |
| 液相色谱-质谱 | 94% | 95% | 93% |
2. 操作流程优化
研究建立的标准操作流程(SOP)包含:
- 样本采集:8-12小时空腹静脉采血(1mL)
- 处理标准化:-80℃冻存(≤6个月),37℃复溶后立即检测
- 光谱采集:3次重复测量,每次采集时间<60秒
- 数据预处理:SNV校正(信噪比提升40%),Savitzky-Golay滤波(15点窗口,二次多项式)
五、技术局限性及改进方向
1. 现有技术瓶颈
- 样本体积限制:1mL血液只能制备3个DPS样本
- 光谱干扰:背景噪声(LOF达10.11%)影响特征提取
- 空间分辨率:HSI系统空间分辨率仅116×36像素
- 临床验证不足:目前样本量局限于单中心研究
2. 改进建议
- 开发微流控芯片集成光谱仪(目标尺寸<5cm3)
- 采用压缩感知算法处理高维数据(HSI数据维度压缩目标<10%)
- 构建多中心队列(目标样本量≥1000例)
- 集成外周血单核细胞分离技术(提升特异性至92%+)
六、行业影响与转化前景
1. 临床诊断流程重构
该技术体系可嵌入现有乳腺筛查流程:
- 初筛:便携式光谱仪10分钟快速检测(成本<5美元/例)
- 确诊:高光谱成像复核(成本15-20美元/例)
- 优化点:开发多任务光谱仪(同步检测胆红素、血红蛋白、脂质谱)
2. 经济效益分析
基于现有成本模型:
- 传统实验室检测:平均成本$45/例(含样本运输)
- 便携式光谱检测:$8/例(耗材成本可降至$3/例)
- HSI系统:$120/例(单次检测)
3. 应用场景拓展
除乳腺癌筛查外,该技术平台可延伸至:
- 肿瘤标志物动态监测(每例成本$15/次)
- 多癌种联合筛查(检测时间<3分钟)
- 药物疗效评估(治疗前后光谱对比)
七、研究启示与未来展望
1. 多组学整合方向
建议融合空间转录组(spatial transcriptomics)和代谢组学数据,建立"光谱指纹+基因表达谱"的联合诊断模型。已有前期实验显示,联合分析可使乳腺癌检出率提升至97.3%(p<0.001)。
2. 技术迭代路径
- 硬件升级:研发纳米孔透镜阵列(目标分辨率提升至512×512)
- 算法优化:开发基于图神经网络的样本空间关联模型
- 软件平台:构建Web端诊断系统(目标响应时间<2秒)
3. 临床转化挑战
需要重点解决:
- 仪器小型化(目标重量<200g)
- 诊断标准统一化(建立ISO 13485认证体系)
- 数据隐私保护(符合HIPAA/GDPR标准)
本研究为便携式光谱技术的临床转化提供了重要参考,其核心创新在于建立"样本制备-光谱采集-特征提取-机器学习"的完整技术链条。特别是通过MCR-ALS解耦技术,将高光谱的复杂数据转化为可解释的生物学参数(胆红素、血红蛋白变体、脂质代谢产物等),使诊断模型具有明确的病理生理学意义。
后续研究应着重解决样本异质性问题,开发基于微流控的标准化处理模块。同时需要建立跨机构验证平台,确保不同实验室间检测结果的可比性。在算法层面,建议引入迁移学习技术,提升新检测场景的泛化能力。
该技术体系已通过伊朗国家科学基金会(INSF)的伦理审查(项目编号4030523),下一阶段计划开展多中心临床试验(预计纳入3000例样本),目标实现乳腺癌早期筛查的ISO认证。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号