最新科研进展

NADC

伽马射线暴(Gamma-Ray Bursts)简称伽马暴(GRBs)是宇宙中最剧烈的恒星级爆发现象之一,其爆发能量可以达到太阳终生释放能量的数百万到数十亿倍。伽马暴的辐射主要集中在千电子伏特(keV)到几十万电子伏特(MeV)的伽马射线能段,持续时间可以从几毫秒到几千秒不等,光度极高,这就是我们常说的瞬时辐射(prompt emission)。

探测伽马暴的主要途径是天基的伽马射线望远镜。五十多年前,即1973年的4月,克莱贝萨德尔和奥尔森等人首次公开发布了船帆座(Vela)系列卫星探测到的来自宇宙空间的伽马射线剧烈爆发现象。

早年,一部分天文学家认为伽马暴是银河系内的爆发现象;另一部分天文学家认为伽马暴是银河系外大质量恒星核心塌缩爆炸或中子星-中子星/黑洞系统并合后产生的爆发现象。1990年开始,搭载在康普顿伽玛射线天文台(CGRO)上的BATSE探测器总共记录了约3000个伽马暴,他们在天球上各向同性分布强烈地支持了伽马暴的宇宙学起源。

BATSE的系统观测也为伽马暴的系统研究与分类提供了重要基础。根据它测出的大量伽马暴的瞬时辐射的持续时间,人们将伽马暴分为两类:持续时间小于两秒的称为短暴,持续时间超过两秒的则为长暴。前者能谱相对偏硬,后者能谱则相对偏软。

大多数伽马暴在瞬时辐射后依然能在射电、红外线、可见光、X射线甚至伽马射线能区发出持续几天到数周不等的电磁辐射,这就是多波段余辉辐射(afterglow emission)。1997年,意大利与荷兰合作的BeppoSAX卫星首次观测到伽马暴的X射线余辉,从而准确证认宿主星系并测出红移,并直接确认了伽马暴的宇宙学起源。

伽马暴的物理起源、爆发机制和辐射特征一直是研究人员广泛关注的研究课题。尽管伽马暴的宇宙学起源已经确定,但其前身星系统却在更长的时间内是一个谜。2003年,天文学家明确证实一个长暴与一颗Ic型超新星(supernova)成协,这直接证认了至少一部分长暴起源于大质量恒星的核心塌缩爆炸。2017年,天文学家观测到伴随中子星-中子星并合产生的引力波的短暴与千新星(kilonova),证实了至少一部分短暴起源于双中子星或中子星-黑洞并合。后者是多信使天文学领域的最重要的进展之一。此后,中子星-黑洞模型也得到较高置信度的证实。除了自身物理的重要性之外,伽马暴还被作为有效的探针而广泛地应用于研究粒子加速和高能物理过程、早期宇宙形成及演化、恒星演化,以及理解极端条件下的引力、磁场和物质等。

当前,伽马暴的余辉的标准模型早已成熟,前身星系统也已经被基本确定,但伽马暴的瞬时辐射机制、中心引擎、极高能光子起源等问题依然未得到解决,理论预测的伴随瞬时辐射的中微子也尚未被观测到。这些未解之谜还有待探索。近些年,天文学家还发现了一些特殊的、令人困惑的现象,例如,长暴GRB 060614、GRB 211211A和GRB 230307A被观测到与千新星成协,而短暴GRB 200826A则被观测到与核塌缩型超新星成协,这意味着伽马暴持续时间的长短与能谱软硬并不一定与前身星系统一对应。这些现象说明了伽马暴具有多样而复杂的多维度特征。那么在更多的维度上,伽马暴是否有哪些特征能帮助我们揭开谜底?

无论是伽马暴潜在的物理研究价值,还是探针应用探索,都促使人们持续地关注它们。科学家们希望通过对更多的、不同类型的、特征丰富的伽马暴的研究,来进一步揭示其背后的物理和统计规律。研究人员还希望通过快速地识别及精确的定位伽马暴来引导多波段的后随观测,特别是引力波电磁对应体(如千新星)的观测,进而更深入地理解其起源、爆发机制以及相关联的爆发现象。这些同样也给观测伽马暴提出了更多挑战。

在轨运行超过20年的雨燕(Swift)卫星和在轨超过16年的费米(Fermi)等伽马射线探测器几乎每天都能探测到伽马暴。现如今,我国科学家主导的引力波电磁对应体全天监测器(GECAM)系列卫星因为较高的探测灵敏度和近乎全天的监测视野,平均每天可以探测到2个伽马暴。研究人员尽力尝试从不断积累的伽马暴数据中挖掘更丰富的信息,而这些工作依赖于广泛的领域知识和经验,并可能受到人为的简化或假设的限制,近而难以捕捉到复杂的非线性关系。另外,多星联合的宽波段观测和定位是研究伽马暴的有效手段。从观测数据中快速且准确地识别伽马暴并将信息通告给其他探测设备,是开展多波段、多信使研究的重要环节,也是困扰观测运行人员的重要问题之一。

常用的伽马暴识别方法可概括为星上盲搜、地面盲搜和目标搜索,然而这些方法或多或少因为人工设置阈值的影响,使得人们难以发现一些低阈值的爆发事件,或者由于爆发识别流程的复杂性而使得时效性欠佳。这些促使我们想通过更高效和智能的,甚至具有更多维度感知能力的方法来识别伽马暴。如今,深度学习方法在天文数据分析和研究方面已经有较多成功的应用实例,特别是基于卷积神经网络(CNN)的爆发特征分类、识别等应用案例,例如在海量的观测数据中鉴别引力波、快速射电暴等信号。

最近,中国科学院高能物理研究所伽马暴团队的张鹏等人提出了一种新方法,即应用深度学习来高效、精准地识别伽马暴。该研究采用训练好的CNN模型,可直接在观测的事例的数据中准确区分伽马暴和非伽马暴,这不同于传统的基于光变曲线的信噪比来判别、以及通过能谱和入射方位来筛选的伽马暴搜索算法。

打开网易新闻 查看更多图片

图1. 光变结构复杂的长时标伽马射线暴(GRB 160901)的全能段计数-图(上)、光变曲线(中)、以特征热力图表示的模型识别结果(下)。图中红色虚线和灰色区域分别表示Fermi标注的触发时刻和持续时间。

深度学习需要大量的、多样性的样本来构建特征丰富的训练集和验证集,进而实现网络架构模型的充分训练和验证,最终实现智能和高效的分类、识别和预测等功能。目前伽马暴观测样本最丰富的是Fermi卫星,它搭载的GBM探测器在13年间观测到3200多个伽马暴,但这对于训练和验证模型而言还远远不够。

张鹏等人基于GBM在轨运行前13年的时间标记事例(TTE)数据,进行了合理的数据扩充,以计数-图数据作为输入,最终构建了3个不同时间尺度的、蕴含丰富特征的数据集,每个数据集都包含6330正样本(伽马暴样本);以CNN、Net及CBAM等框架和模块为基础,构建了Plain-CNN、ResNet、ResNet-CBAM等3类模型,并通过充分的训练和验证来确定模型的超参数设置,找到了鉴别精度、准确率、召回率等性能指标较优秀的模型,即ResNet-CBAM@64ms,该模型包括了残差模块和注意力机制,其准确率可达96.57%。借助特征可视化(Grad-CAM)及降维分析(t-SNE)方法,张鹏等人还尝试探索模型所提取深层次特征的物理解释,表明这些多维度的特征有助于重新审视和研究伽马暴的形态学。此外,将最佳模型应用到Fermi/GBM临近一年期的观测数据中进行直接实践,其结果与Fermi公布的爆发目录比对,最优模型自动识别伽马暴的准确率可达98%以上,并有较强的能力识别低阈值触发事件、低阈值伽马暴以及磁星爆发等信号。

打开网易新闻 查看更多图片

图2. 对测试集样本的计数-图直接降维(左)和模型提取的特征的降维分析结果对比,并嵌入了正样本的持续时间。可清晰地表明深度学习模型提取的特征可成功地将伽马暴和非伽马暴区分开。模型识别错误的伽马暴样本大都具有较短的持续时间,这表明持续时间是模型所提取的伽马暴隐含关键特征之一。

该研究表明深度学习方法能够有效、可靠和快速地鉴别观测数据中的爆发信号,还表明其在科学数据快视、科学值班等地面科学运行工作流程中有潜在的应用价值。未来,通过迁移和训练,把模型嵌入到我国的HXMT、GECAM系列卫星的观测数据分析中,将有助于快速、准确地识别伽马暴事件,进而更好地引导多波段后随观测。

打开网易新闻 查看更多图片

图3. 模型能较好地识别出低阈值暴发,以GRB 210725B为例,将模型提取的该暴的特征映射到光变曲线,颜色表示特征的显著程度。

相关论文在线发表于《天体物理学杂志增刊》(The Astrophysical Journal Supplement Series),第一作者为张鹏,通讯作者为李兵。该研究得到了国家自然科学基金青年基金和国家天文科学数据中心青年数据科学家计划等基金项目的资助。国家天文科学数据中心为研究计划提供了技术服务。

* 特别感谢王善钦博士的对稿件的校对。

论文链接:

Zhang Peng, Li Bing*, Gui Ren-Zhou, Xiong Shao-Lin, Zou Ze-Cheng., Wang Xiang-Gao, et al., 2024, ApJSS, 272, 4.

https://iopscience.iop.org/article/10.3847/1538-4365/ad2de5

https://ui.adsabs.harvard.edu/abs/2024ApJS..272....4Z/abstract

国家天文科学数据中心

为天文观测设备和研究计划

提供数据与技术服务

中国虚拟天文台(China-VO)是以国家天文台为代表的中国天文界及合作伙伴共同打造的一个网络化科学研究和科普教育平台。它架构在国家天文科学数据中心雄厚的数据资源基础之上,得到中科院、科技部、国家基金委、北京科委等机构的资助,以及中国科技云、阿里云、微软研究院、浪潮集团、中科曙光、锐捷网络、华为等合作伙伴的大力支持。

微信公众号ID :China-VO