基于智能优化算法的接触双星系统参数快速反演方法

《New Astronomy》:Rapid inversion method for parameters of contact binaries based on intelligent optimization algorithms

【字体: 时间:2026年02月11日 来源:New Astronomy 2.1

编辑推荐:

  接触双星系统通过深度学习生成模型与差分进化(DE)结合的方法实现物理参数高效反演,DE方法较MCMC快90%且精度更高。

  
曾向云|李宇博|何慧玲|郑胜|徐高桂|常正学|张荣军|阿里·埃萨姆丁
中国三峡大学天文与空间科学中心,湖北省宜昌市443002,中华人民共和国

摘要

关于接触双星系统的广泛研究已经发表了大量的光变曲线数据。目前的一个关键挑战是从这些光变曲线中高效地推导出接触双星的基本物理参数。本文提出了一种方法,该方法结合了基于深度学习的光变曲线生成模型和差分进化(DE)算法,以快速获得这些参数。该方法利用神经网络直接将接触双星的物理参数与其光变曲线联系起来。差分进化(DE)和马尔科夫链蒙特卡洛(MCMC)算法分别用于探索最优参数组合。实验结果表明,DE算法在参数反演方面的速度比MCMC算法快约90%,同时保持了更高的精度。

引言

接触双星是指在宇宙中相互紧密绕行的恒星对,它们的引力相互作用使它们围绕一个共同的中心旋转。接触双星的研究涵盖了多个学科,包括天文学和物理学。这一领域取得了重要的科学发现,增强了我们对恒星形成、演化以及宇宙中恒星系统动态过程的理解(Csizmadia和Klagyivik,2004;Tylenda等人,2011;Merrill等人,2024)。
接触双星可以通过多种方法进行分类,主要有两种方法。一种方法是根据两颗恒星是否都填充了它们的洛希瓣来分类,从而分为分离系统、半分离系统和接触系统(Kopal,1955;Kopal,1978)。另一种方法是根据观测到的光变曲线形状进行分类,例如Algol(EA)、β Lyrae(EB)和W UMa(EW)双星(Avvakumova和Malkov,2014)。这两种分类方案可以认为是相互对应的(Kuiper,1941;Latkovi?等人,2021)。
随着现代天文观测技术的进步,通过全球范围内的各种光度测量调查,已经探测到了大量的接触双星(Qian等人,2017;Sun等人,2020;Gazeas等人,2021;Southworth和Bowman,2022)。确定接触双星的基本物理参数对于理解它们的演化状态和几何结构至关重要。对接触双星调查数据的统计分析通常依赖于研究人员的经验支持来反演双星系统的基本物理参数。Wilson-Devinney方法(Wilson和Devinney,1971;Wilson,1979;Wilson等人,2010;Wilson,2012)和PHOEBE(Physics Of Eclipsing BinariEs)(Pr?a等人,2016)已被用于解决接触双星参数反演的问题。PHOEBE是一个用于食双星的建模工具包,基于Wilson-Devinney程序构建。它利用已知变量来模拟双星光变曲线,并结合Emcee软件中的MCMC方法来获得双星参数的后验分布(Ding等人,2021;Ding等人,2023)。这种方法通常需要大量的计算资源和时间(Ding等人,2021;Ding等人,2022;Xiong等人,2024)。
近年来,深度学习方法在各个研究领域引起了广泛关注,并取得了显著的成功,为加快参数反演提供了潜力。Ding等人(2021)开发了一个神经网络模型,能够根据包含100,000个实例的数据集,将合成光变曲线有效地映射到相应的光变曲线和基本参数。通过将MCMC方法与先验知识和深度神经网络模型相结合,可以得出测量光变曲线参数的合理后验分布。Pr?a等人(2008)利用33,235个食双星的光变曲线样本来训练神经网络模型,建立了从光变曲线到参数集的映射。Delli Veneri等人(2023)提出了一个深度学习模型,用于在模拟的阿塔卡马大型毫米/亚毫米阵列(ALMA)数据立方体中检测和表征天体源,从而推导出双星参数。Rezaei等人(2022)引入了一个名为DECORAS的网络模型,用于从非常长基线干涉测量(VLBI)观测中检测点和扩展源,该模型采用编码器-解码器神经网络架构,并结合了几层卷积层,为源检测提供了可扩展的解决方案。Hu等人(2017)提出了一个改进的长短期记忆(LSTM)模型——多变量长短期记忆全卷积网络(MLSTM-FCN),其中融入了挤压-激励网络(SE)的注意力机制。
在这项研究中,我们使用了MLSTM-FCN来训练双星基本参数与其光变曲线之间的高度非线性映射。我们利用DE和MCMC从观测到的光变曲线中推断出双星的基本物理参数的后验分布。实验表明,这种混合算法对于接触双星的基本物理参数反演非常实用。
本文的结构如下:第2节介绍了所提出的方法;第3节详细描述了实验及其结果;第4节对本文进行了总结。

章节片段

长短期记忆

LSTM是一种特殊的循环神经网络(RNN)(Tylenda等人,2011;Ordó?ez和Roggen,2016;Donahue等人,2014)。与传统的前馈神经网络不同,LSTM能够有效利用时间序列进行输入分析。基本上,在使用前馈神经网络时,假设时间t的内容输入与时间t+1的内容输入完全无关。在许多情况下,这种假设是合理的,例如图像分类。然而,在某些情况下

数据集

为了增强光变曲线生成模型的训练效果,我们使用了Phoebe软件包生成了大量数据。由于接触双星系统中的主星和伴星都可能带有黑子,这些黑子会显著影响光变曲线,因此我们分别考虑了主星和伴星上的黑子情况。

结论

深度神经网络在拟合相互作用双星的光变曲线方面表现出有效性,无论主星或伴星上是否有黑子,都能获得良好的拟合结果。马尔科夫链蒙特卡洛(MCMC)方法和差分进化(DE)方法在优化神经网络参数方面都显示出有效性。
差分进化和MCMC方法可以用于反演相互作用双星的基本物理参数。

CRediT作者贡献声明

曾向云:撰写 – 审稿与编辑,撰写 – 原稿。李宇博:软件开发,方法论。何慧玲:撰写 – 审稿与编辑,监督。郑胜:监督,研究。徐高桂:撰写 – 审稿与编辑,方法论。常正学:撰写 – 审稿与编辑,研究。张荣军:软件开发,方法论。阿里·埃萨姆丁:监督,研究。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文的研究工作。

致谢

这项研究得到了国家自然科学基金的支持,资助编号为1220302912303027。此外,这项工作还得到了湖北省自然科学基金的支持,编号为2025AFB551。埃萨姆丁还得到了国家重点研发计划的支持,涉及政府间科技创新合作项目,项目编号为2022YFE0126200,以及天山人才培训计划,项目编号为2023TSYCLJ0053
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号