
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Eigenhits嵌入与无监督学习的宇宙射线异常信号检测方法研究
【字体: 大 中 小 】 时间:2025年09月10日 来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
本文创新性地提出Eigenhits方法,通过主成分分析(PCA)生成宇宙射线(CREDO)CMOS探测器图像的嵌入特征,结合DBSCAN/OPTICS等聚类算法实现异常信号检测。该方法在13168张图像数据集中表现稳定,为暗物质(DM)、标准模型外现象等前沿研究提供新工具。
亮点
本研究开创性地将Eigenfaces思想应用于宇宙射线图像分析,开发出Eigenhits嵌入方法,为探索超出标准模型(Beyond Standard Model)的物理现象提供全新工具。
方法学
本节详细描述CREDO实验数据集、异常检测问题定义及解决方案。如图1所示,我们通过Eigenhits嵌入结合聚类算法(如DBSCAN、OPTICS)实现异常检测。关键步骤包括:图像对齐(Section 2.3)、背景噪声消除(Section 2.4)和基于PCA的特征降维(Section 2.5)。
结果
实验采用Python 3.8环境,使用scikit-learn 1.0.2和scipy 1.8库。所有代码和CREDO数据集已开源。经图像对齐处理后,我们首次量化评估了坐标系基向量与完整数据集的距离(公式10),发现——(此处保留原文技术细节省略)
讨论
由于无标签数据特性,我们创新性地通过特征子集重建误差间接评估方法性能。实验证明,即使仅使用前50个主成分,仍能保持90%以上的图像信息完整性,这为暗物质候选体(如轴子夸克团块AQNs)的识别提供可靠技术支撑。
结论
Eigenhits方法成功实现宇宙射线图像的异常检测,将复杂物理问题转化为可计算的离群值检测问题。该技术不仅适用于单探测器事件分析,未来更可扩展至分布式探测器网络的多信使(multi-messenger)关联研究。
生物通微信公众号
知名企业招聘