ExoATom数据库:基于ExoMol格式的原子光谱数据资源新拓展

《RAS Techniques and Instruments》:ExoAtom: A Database of Atomic Spectra in ExoMol Format

【字体: 时间:2025年12月25日 来源:RAS Techniques and Instruments

编辑推荐:

  本文推荐ExoATom数据库,该工作针对天体物理、行星科学及实验室研究中对原子光谱数据标准化访问的迫切需求,将ExoMol分子数据库成功扩展至原子领域。研究人员系统整合了NIST(美国国家标准与技术研究院)的高精度实验数据和Kurucz数据库的完备计算数据,为80种中性原子和74种单价离子提供了统一的ExoMol格式(包括.states, .trans, .pf等文件)线列表。研究成果解决了原子与分子光谱数据在统一框架下协同应用的难题,为高分辨率系外行星大气光谱分析等前沿研究提供了关键数据支撑,显著提升了复杂天体环境下光谱模拟的准确性和效率。相关数据已通过https://exomol.com/exoatom开放获取。

  
在探索宇宙奥秘的征程中,天文学家们如同侦探,通过捕捉来自遥远天体的光线来解读其构成、温度乃至运动状态。其中,光谱分析是最强大的工具之一。当星光穿过行星大气层时,特定波长的光会被大气中的原子和分子吸收,在光谱上留下独特的“指纹”——吸收线。通过解读这些“指纹”,科学家能够反推出大气中存在的化学成分。近年来,随着观测技术的飞跃,尤其是对炽热的类木系外行星(如超热木星WASP-121 b)的高分辨率光谱研究,人们发现其中不仅包含分子特征,更有大量中性原子和电离原子的谱线信号。例如,Prinoth等人(2025)在其研究中就考虑了89种中性或单价电离原子的光谱,并成功识别出其中17种原子的特征。
然而,一个现实的挑战摆在了面前:尽管分子光谱数据已有ExoMol这样的大型标准化数据库提供支持,但原子光谱数据却分散在多个不同的数据库中,如NIST原子光谱数据库、Kurucz线列表、VALD3(维也纳原子线数据库第三版)等。这些数据库各有侧重,NIST侧重于基于精密实验室测量的高精度参数,而Kurucz则追求通过量子力学计算实现的完备性。数据格式的不统一为同时使用原子和分子数据进行综合光谱模拟带来了巨大不便。面对用户将ExoMol数据库扩展至原子领域的强烈需求,并且考虑到原子数据在物种数量和数据结构上的一些特殊性,研究团队决定创建一个名为ExoATom的新数据库分支,专门提供原子线列表,同时保留原ExoMol品牌用于分子数据。
为了回答天体光谱建模中对统一格式原子数据的迫切需求,研究人员开展了ExoATom数据库的构建工作。他们系统地从NIST和Kurucz两大权威原子数据库中提取数据,并将其转换为与ExoMol分子数据库完全兼容的结构化格式。本研究的核心在于建立一套标准化的数据管道,实现多源异构原子光谱数据的提取、清洗、转换与集成。研究得出的主要结果是成功构建了ExoATom这一全新的原子光谱资源,目前包含来自NIST数据库的79种中性原子和71种单价离子,以及来自Kurucz数据库的38种中性原子和37种单价离子的线列表。这项研究的意义在于首次在ExoMol框架下实现了原子光谱数据的大规模、标准化整理,为进行更精确、更便捷的天体大气光谱合成与分析奠定了坚实基础,相关成果发表在《RAS Techniques and Instruments》上。
本研究主要采用了以下几项关键技术方法:1)基于Django网页框架和Python编程语言的数据库架构技术,用于实现ExoATom数据的网络发布与管理。2)数据抓取与转换技术,针对NIST和Kurucz两个源数据库的不同数据结构和文件格式(如NIST的HTML页面数据、Kurucz的gfxxyy.lines/.agafgf/.gam等文件),设计了特定的解析规则,将其统一转换为ExoMol标准格式(.states, .trans, .pf等文件)。3)基于PyExoCross程序的数据后处理与验证技术,用于生成光谱、计算截面、验证寿命等,并对NIST和Kurucz来源的数据进行了交叉比较。研究所用数据均为公开数据库的二次开发利用,不涉及新的实验样本队列。
数据覆盖范围
通过系统性地收集和整理,ExoATom数据库目前涵盖了154个原子物种(80种中性原子和74种单价离子)的光谱数据。其中,79种中性原子和71种单价离子的数据源自NIST,38种中性原子和37种单价离子的数据源自Kurucz,部分元素的数据在两个数据库中均有体现。以铁(Fe)为例,NIST数据集提供了837个能级和2542条跃迁线,而Kurucz数据集则提供了高达37504个能级和7498317条跃迁线,充分体现了NIST的“高精度”和Kurucz的“高完备性”的互补特性。数据覆盖从氢(H)到镤(Pa)的多种元素,为研究不同元素丰度的天体环境提供了广泛支持。
数据库结构
ExoATom数据库的结构设计延续并适配了ExoMol分子数据库的核心框架。它采用.all, .def, .states, .trans和.pf等文件类型作为组织原子数据的基本单元。关键的.states文件包含了原子能级的能量、总角动量量子数J、简并度gJ(采用天体物理学家惯例,gJ= 2J + 1,不包含核自旋简并度)、不确定性、寿命(部分数据)和朗德g因子(Kurucz数据)等信息。.trans文件则详细记录了每条谱线对应的上下能级索引、爱因斯坦A系数和波数。.pf文件提供了在一定温度网格上的配分函数数值。这种一致性的层级结构确保了数据机器可读性和程序化处理的便利性。数据库通过https://exomol.com/exoatom网站提供访问,并提供了exoatom.all.json主文件来概述整个数据库的内容。
ExoMol格式在原子数据中的应用
研究团队对ExoMol数据标准进行了适应性调整以容纳原子数据。在.states文件中,除了标准字段,还针对原子光谱特点引入了组态(configuration)、谱项(term)和宇称(parity)等量子数标签。对于NIST数据,采用了LS耦合(罗素-桑德斯耦合)、jj耦合和Racah符号等标准术语类型;而对于Kurucz数据,由于其术语标注偏离标准惯例,暂时统一标记为“Kurucz”。在配分函数的计算上,对于NIST数据,研究人员采用直接求和法(Q(T) = Σ giexp(-c2Ei/T), c2=1.438776877 K/cm)基于提供的能级数据重新生成了1K到6000K的精细网格数据。对于Kurucz数据,则直接使用了其提供的分区函数文件(partfnxxyy.dat)中的数值。对比显示,两种来源的配分函数在相同温度下吻合良好(如Al I、Fe I、Mg I的最大差异均小于0.2%),验证了数据处理的可靠性。
后处理与数据验证
利用PyExoCross这一专为处理ExoMol格式数据设计的Python程序包,研究人员对ExoATom数据进行了后处理验证。通过生成铁(Fe I)在3000 K和6000 K下的发射光谱,对比了NIST和Kurucz数据集。结果表明,在3000 K时,两个数据库都能再现关键光谱特征,峰位一致性较好;而在6000 K的高温下,Kurucz数据库因其完备性显示出更多NIST数据库中未收录的谱线。这也直观地展示了在不同应用场景下(如低温天体精确测量 vs. 高温环境全面模拟)选择不同数据集的必要性。这些后处理工具也一并提供给用户,便于其进行自定义的光谱模拟和分析。
本研究成功构建并发布了ExoATom数据库,将ExoMol平台的应用范围从分子光谱显著扩展至原子光谱领域。通过整合NIST和Kurucz两大权威来源的数据,并将其统一于经过实践检验的ExoMol数据格式之下,ExoATom为解决天体物理、行星科学等领域中原子与分子光谱数据协同使用的难题提供了高效、可靠的解决方案。数据库明确提供了“高精度”(NIST)和“高完备性”(Kurucz)两种特性的数据集,允许用户根据具体研究目标(如系外行星大气成分精确鉴定或炽热恒星大气连续谱模拟)灵活选择,而非强制推荐单一数据集,这种设计理念更具实用价值。
ExoATom的意义不仅在于数据量的简单增加,更在于其通过标准化实现的互操作性和易用性。它使得研究人员能够像使用分子线列表一样,便捷地将原子数据融入复杂的光谱辐射传输模型中,从而更全面地解读詹姆斯·韦伯空间望远镜(JWST)、极高分辨率光谱仪(如ESPRESSO)等先进设备带来的海量观测数据。尽管当前版本尚未包含谱线加宽参数等信息,且主要限于中性原子和单价离子,但研究团队已规划在未来版本中增加更多电离阶段的数据以及谱线加宽参数,持续完善数据库功能。
总之,ExoATom数据库作为一个精心设计、严格处理且完全开放的原子光谱资源,必将成为未来高分辨率天体光谱学研究不可或缺的基础工具,推动我们对从系外行星大气到恒星化学组成等众多宇宙现象的理解走向深入。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号