基于压缩感知与深度学习的数字全息显微超分辨率相位重建方法
《Optics & Laser Technology》:A super-resolution phase reconstruction method for digital holographic microscopy based on compressed sensing and deep learning
【字体:
大
中
小
】
时间:2025年10月28日
来源:Optics & Laser Technology 4.6
编辑推荐:
本文针对数字全息显微技术中存在的重建横向精度低、效率慢等问题,提出了一种结合压缩感知和深度学习的超分辨率相位重建方法。该方法通过模型化压缩感知技术对全息图进行稀疏化处理,并构建级联深度学习网络进行端到端训练。实验结果表明,在20%采样率下,重建相位的峰值信噪比从23.0562 dB提升至35.7016 dB,重建时间仅需0.3106秒,样品形貌测量精度从1.0800 μm提高至0.2821 μm,实现了从微米级到亚微米级的精度跨越。该方法为三维形貌测量提供了数据冗余少、重建效率高、精度高的新方案。
在当今工业检测和科学研究中,高精度的三维形貌测量技术扮演着越来越重要的角色。从微电子制造到生物医学检测,从材料科学到质量控制,对样品表面微观结构的精确表征需求日益迫切。然而,传统的二维检测技术已难以满足现代工业对三维信息的需求,各种三维形貌测量技术应运而生。在众多技术中,数字全息显微(Digital Holographic Microscopy, DHM)技术因其全场、非接触、快速等优势而备受关注,但该技术在实际应用中仍面临重建横向精度低、效率慢等挑战。
数字全息显微技术是一种基于光学干涉原理的定量相位测量技术,它通过记录物体表面的光程差信息来重建三维形貌。与传统显微镜相比,DHM具有非接触、全场测量、快速成像等优点,适用于宏观和微观尺度的检测。然而,由于香农采样定律的限制和大量数据冗余的存在,DHM在样品相位形貌重建过程中往往会出现重建横向精度低、重建效率慢等问题。特别是在需要对动态样品进行快速检测时,这些局限性更加明显。
目前主流的三维形貌测量技术主要包括结构光(Structured Light, SL)技术、立体视觉(Stereo Vision, SV)技术、飞行时间(Time-of-Flight, TOF)技术和光学干涉成像(Optical Interferometric Imaging, OII)技术。每种技术都有其独特的优缺点,例如SL技术需要投影 predefined 条纹到待测样品上,虽然检测速度快但受样品表面反射特性影响大;SV技术基于三角测量原理,测量精度在宏观层面可达0.5 mm到0.01 mm,在微观层面仅为10 μm到1 μm;TOF技术系统处理效率高、抗干扰能力强,但短距离应用中横向和纵向精度相对较低。
在光学干涉成像技术中,数字全息显微技术虽然具有SL技术的快速检测、高精度和非接触检测等优点,但检测过程中对环境要求较高,易受振动干扰。近年来,随着深度学习技术的发展,DHM技术开始与深度学习相结合,例如Ashwini等人提出的基于物理信息深度网络的无透镜全息显微技术,以及Qu等人提出的SN2N网络架构等。在压缩感知领域,Yutaro等人提出了非相干数字全息技术与编码孔径成像相结合的超分辨率重建技术,张晨等人提出了基于压缩感知的双自由图像全息技术的迭代重建框架。
然而,大多数现有的DHM技术仅从定性角度进行恢复和重建,或者从理论模拟角度追求与原始全息图的最大相似度,缺乏定量分析或平衡重建效率和精度的研究。此外,这些方法往往存在实验系统复杂、计算困难或重建处理数据量大等限制。
针对上述问题,西安交通大学机械工程学院的研究团队在《Optics》上发表了一项创新性研究,提出了一种基于压缩感知(Compressed Sensing, CS)和深度学习(Deep Learning, DL)相结合的数字全息显微相位快速超分辨率(Super-Resolution, SR)重建方法。该方法能够有效提高重建相位的横向精度,在低采样率下实现高效重建。
研究人员采用的主要技术方法包括模型化压缩感知技术对全息图进行稀疏化处理,使用K-SVD(K-means Singular Value Decomposition)字典学习方法优化稀疏字典,构建级联深度学习网络架构,以及采用交替方向乘子法(Alternating Direction Method of Multipliers, ADMM)完成压缩感知处理数据的重建成像。实验系统基于迈克尔逊型反射式DHM-SR测量系统,使用532 nm商用激光器作为稳定光源,配备数字微镜空间光设备(DMD4100)和电荷耦合器件(CCD)相机记录干涉全息图。数据集包含USAF分辨率板样品、汉字样品、阿拉伯数字样品等九种不同类型,共600幅图像,制备了采样率为10%-50%的五组低分辨率数据集。
在压缩感知技术方面,研究团队重点优化了三个关键因素:稀疏变换、观测矩阵和非线性重建。在稀疏变换方面,采用K-SVD字典学习方法,使字典能更好地适应数据的实际结构和特征。在观测矩阵方面,选择随机高斯矩阵作为观测矩阵。在非线性重建方面,使用ADMM算法进行DHM重建成像,保证了收敛到全局最优解。
深度学习网络架构方面,研究人员构建了基于ADMM的级联网络(CS-ADMM),将物理模型先验、稀疏先验和深度图像先验封装在神经网络中。网络采用基于L-BFGS(Limited-memory Broyden-Fletcher-Goldfarb-Shanno)算法的梯度优化方法,使用归一化均方根误差(Normalized Root Mean Square Error, NRMSE)作为损失函数。网络结构深度、卷积核大小和滤波器数量等参数都经过精心优化。
网络模型配置与优化结果表明,该方法在保证重建效率和精度的前提下,仅需少量数据训练即可获得优异的重建性能。当使用10%的训练数据集时,峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)从28.1144 dB提升至34.2656 dB,结构相似性指数(Structural Similarity Index, SSIM)从0.9822提升至0.9959,信息熵(Information Entropy, S)从0.0359提升至0.0378,表明重建全息相图的整体信息量和细节增加了5.89%。
验证仿真实验结果显示,在20%采样率下,"guang"标准图的重建PSNR从23.0562 dB提高到35.7016 dB,提升幅度达54.84%,SSIM从0.9744提升至0.9985。从低分辨率图像输入到重建图像输出的总时间为0.3106秒,满足工业应用的实时成像要求。重建相位的误差无论在全局NRMSE还是局部NRMSE上都优于原始相位。
定量仿真实验进一步证实,USAF1951分辨率板的重建PSNR从21.9225 dB提升至32.2325 dB,改善幅度达47.03%。重建相位宽度为28.1373 μm,误差为0.2821 μm,而原始相位宽度为28.9352 μm,误差为1.0800 μm,测量精度从微米级提高到亚微米级。
有效性实验表明,该方法能够在一定程度上克服实际检测中的干扰因素。对于组5元1的USAF1951分辨率板样品,重建相位宽度为14.8961 μm,误差为0.7286 μm,而原始相位宽度为14.4951 μm,误差为1.1299 μm,精度从微米级提升到亚微米级。
泛化能力实验证明,该方法对随机样品、块阵列样品、阿拉伯数字样品和随机特征相位样品等多种数据类型都表现出良好的重建效果,重建时间均在1秒以内,满足工业实时检测成像要求。
研究结论表明,基于压缩感知和深度学习相结合的DHM相位快速超分辨率重建方法能够有效重建样品全息相位,将传统压缩感知模型扩展到具有待定稀疏变换和变换域正则化的广义压缩感知模型。该方法在低采样率下对样品形状相位重建具有良好的细节保留能力,测量精度从微米级(1.0800 μm)提高到亚微米级(0.2821 μm)。与传统的DHM重建成像方法相比,该方法具有数据冗余量小、重建效率快、重建精度高的优点,在高精度的DHM相位测量中将发挥更重要的作用。
该研究的重要意义在于为解决数字全息显微技术中的精度和效率问题提供了创新性解决方案,为三维形貌测量领域的发展提供了新的技术路线。特别是在微纳制造、生物医学检测、材料科学等需要高精度三维表征的领域,该方法具有广阔的应用前景。同时,该研究提出的压缩感知与深度学习相结合的技术框架,也为其他光学测量技术的创新提供了有益借鉴。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号