基于视觉Transformer的本地体积矮星系识别算法VIDA在中国空间站望远镜巡天中的应用
《Monthly Notices of the Royal Astronomical Society》:ViT-based Local Volume Dwarf Galaxy Identification (VIDA) in the CSST survey
【字体:
大
中
小
】
时间:2025年11月07日
来源:Monthly Notices of the Royal Astronomical Society
编辑推荐:
本刊推荐:为解决本地体积(Local Volume)内矮星系探测效率低的问题,研究团队开发了基于视觉Transformer(ViT)的矮星系识别算法VIDA。该研究利用中国空间站望远镜(CSST)模拟图像数据,通过扩展源检测预处理和预训练ViT-Base模型分类,实现了真阳性率超过85%、假阳性率仅0.1%的探测性能。该方法在2-5 Mpc范围内达到表面亮度阈值μ~25 mag/arcsec2,在5-10 Mpc范围内达到~26 mag/arcsec2,探测极限达MV=-7,为扩展本地体积矮星系普查提供了有力工具。
在浩瀚的宇宙中,矮星系如同繁星般散布在星系周围,它们是宇宙中最基本的建筑模块之一。这些微小的星系承载着解开暗物质性质和宇宙结构形成之谜的关键线索。特别是在我们所在的本地宇宙中,对矮星系的完整普查能够为卫星星系光度函数的微弱端提供重要约束,从而检验不同暗物质宇宙学模型的有效性。
然而,探测本地体积(Local Volume)内的矮星系一直面临巨大挑战。传统的基于星表的匹配滤波技术(matched-filter technique)虽然对距离较近(5 Mpc内)、完全解析的极低表面亮度星系有效,但随着距离增加,星系中心恒星难以分辨,使得这种方法效率大大降低。虽然目视检查能够识别一些延伸源,但面对中国空间站望远镜(CSST)等新一代巡天望远镜产生的海量数据,人工检查变得不可行。
在此背景下,由曲涵(Han Qu)、袁珍(Zhen Yuan)等研究人员组成的团队在《Monthly Notices of the Royal Astronomical Society》上发表了最新研究成果。他们基于CSST模拟成像数据,开发了VIDA(ViT-based Local Volume Dwarf Galaxy Identification)算法,这是一种专门为探测本地体积矮星系设计的基于视觉Transformer(Vision Transformer, ViT)的识别方法。
研究团队采用了几项关键技术方法:首先构建了包含人工LV矮星系的基准星表,利用CSST图像模拟器(CSST Image Simulator)生成高保真模拟图像;接着开发了扩展源检测(extended source detection)预处理流程,通过信噪比(S/N)阈值和尺寸标准筛选候选源;然后使用预训练的ViT-Base模型对候选源进行分类;最后引入后处理步骤,通过评估中心过密度进一步提升检测完整性。
研究人员首先构建了接近真实观测的模拟图像。基准星表包含来自TRILEGAL种群合成模型生成的银河系恒星种群和基于九天-1G(Jiutian-1G)宇宙学模拟的背景星系。人工LV矮星系采用PARSEC模型构建,恒星质量分布从103到106 M⊙,半光半径从10到316 pc,距离范围从316 kpc延伸到20 Mpc。CSST图像模拟器集成了完整仪器模型,包括点扩散函数(PSF)、各种噪声源和仪器效应,生成了高质量的模拟图像。
预处理阶段采用扩展源检测流程,首先识别高表面亮度(HSB)系统并掩模,然后检测低表面亮度(LSB)系统。该流程通过不同尺寸的高斯核卷积生成信噪比平滑图,应用特定的S/N和面积阈值筛选候选源。从四个天区共检测到约24000个扩展源,作为后续分类的负样本。对1953个合成LV矮星系的检测测试显示,1143个星系被成功检测,为构建正样本提供了基础。
分类阶段采用基于Transformer架构的ViT模型,将输入图像分割为固定大小的块,通过自注意力机制建立全局上下文关系。研究人员使用"vit-base-patch16-224-in21k"模型,该模型在ImageNet-21k数据集上预训练,包含1400万张图像 across 21000个类别。
4.2 Classification results
评估结果显示,ViT模型在假阳性率(FPR)固定为0.001时,真阳性率(TPR)达到约85%。与传统的卷积神经网络(CNN)相比,ViT表现出显著优势,在相同FPR约束下TPR达到约90%,而CNN仅为70%左右。模型在不同天区间表现出良好的一致性,证明了其泛化能力。
4.3 Effects of imbalanced data sets
研究还探讨了数据集不平衡对训练结果的影响。通过调整每个LV矮星系的最大切割数(Nmax)和训练集规模,发现适当平衡的数据集配置对维持对微弱系统的敏感性至关重要。当训练集包含600个LV矮星系、验证集包含400个时,测试集上的TPR超过87%。
后处理阶段针对ViT模型误分类的样本,通过评估中心过密度进行重新分类。使用Source Extractor在g和i波段识别源,构建天体密度图,通过不同尺度的高斯核卷积识别中心过密度信号。
后处理步骤成功恢复了约45%最初被ViT误分类的LV矮星系,而误报率仅增加0.02%。这一补充方法特别有利于检测较亮、较近、空间延伸更大的系统,这些系统具有更多可解析的成员星和更密集的空间分布。
5.2 Overall detection rate
综合预处理、ViT分类和后处理三个阶段的检测和分类完整性,研究得出了LV矮星系检测管道的整体探测效率。在10 Mpc范围内,50%探测率对应的极限绝对星等为MV?-7,2-5 Mpc距离的表面亮度阈值约为25 mag/arcsec2,5-10 Mpc约为26 mag/arcsec2。
与Qu23研究的传统匹配滤波技术相比,VIDA算法在探测距离较远或未完全解析的系统方面具有优势,特别是在5 Mpc以外区域。虽然Qu23在5 Mpc内能达到更低的表面亮度极限,但本工作在MV探测极限方面表现更优,在500 kpc以外超越Qu23超过一个星等。
这项研究的意义在于首次将先进的ViT模型系统应用于本地体积矮星系检测,建立了一个完整的、全自动的探测管道。该管道不依赖高级数据产品,可直接应用于单次曝光图像,为CSST巡天早期实时检测和候选源识别提供了可能。VIDA算法与传统的基于星表的方法形成互补,结合两种技术有望实现对本地体积矮星系更完整的普查,为约束卫星星系光度函数的微弱端、检验宇宙学模型提供重要数据支持。
未来,随着真实CSST观测数据的获取,该管道可通过调整扩展源检测阈值、在混合数据集上重新训练等方式进一步优化,以应对真实观测环境中更大的背景星系密度、仪器和大气噪声等复杂因素。整合星-星系分类、光度红移或多波段测光等补充信息,也将进一步提升探测性能,特别是在识别边缘或超弥散系统方面具有巨大潜力。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号