天文学家们刚刚训练了一个神经网络,使其能以比大多数人类更清晰的方式观测宇宙。
想象一下,尝试给天空中每一颗恒星、每一个星系或遥远的类星体贴上标签 —— 那可是数以百万计的天体。直到现在,这项工作主要依赖一种精确但缓慢的方法 —— 光谱分析法。这种方法虽然准确,但根本跟不上现代巡天项目产生的海量数据。
如今,中国科学家取得了一项重大飞跃,他们构建了一个人工智能(AI)模型,能够快速且以惊人的准确性完成这项工作。他们的工具已经在广阔的天空区域中对超过2700万个宇宙天体进行了分类。
然而,这不仅仅是节省时间的问题。该AI可能彻底改变我们探索和理解宇宙的方式,使其能够处理海量数据集,并揭示以前被忽视的隐藏模式和罕见天体。
AI利用形态与光谱
由云南天文台研究人员领导的团队,解决了天文学中一个长期存在的问题。许多恒星和类星体在图像中看起来相似 —— 都是微小而明亮的光点。星系根据其距离远近,也可能显得同样微小。
仅依赖天体的外观(形态或结构)常常会导致混淆。利用光模式(称为光谱能量分布,SED)会有所帮助,但仅凭它本身,仍然存在出错的空间,尤其是对于暗淡或遥远的天体。
因此,研究人员设计了一种神经网络(一种从数据中学习的人工智能)。它能够同时处理两种类型的输入:形态特征(天体的外观)和其SED特征(其亮度在不同波长下的变化)。
这种双输入方法让该模型能够更好地区分恒星、星系和类星体之间微妙的差异。他们使用斯隆数字巡天(Sloan Digital Sky Survey)第17次数据发布中经光谱确认的天体源来训练模型,这是一个包含已知天体类型的可信数据库。
随后,他们使用千度巡天(Kilo-Degree Survey, KiDS)的图像对模型进行了测试,重点关注亮度高于23星等(r = 23)的天体。该模型处理了覆盖约1350平方度天空的数据,成功分类了超过2700万个天体源。
研究作者指出:“这个多模态神经网络(MNN)成功利用了形态和SED信息,从而能够在大规模测光巡天中对恒星、类星体和星系进行高效且稳健的分类。”
为了检验模型的可靠性,他们在其他数据集上进行了测试。当应用于盖亚任务(Gaia mission)的340万个天体源(主要是已知距离或运动的恒星)时,模型正确地将99.7%标注为恒星。在使用GAMA巡天数据时也观察到了相似的成功率,该模型准确分类了99.7%的星系和类星体。
此外,该AI甚至发现了过去的错误。一些在先前星表中被标记为恒星的物体实际上是星系,模型成功地将它们正确地重新分类。这表明它还可以改进现有的天文数据库。
面向未来巡天的工具
这款AI工具来得正是时候。随着未来几年新的巡天项目将观测数十亿个天体,天文学家需要快速、准确的系统来处理如此庞大的数据量。该模型并非要取代光谱分析法,但它极大地扩展了我们仅凭图像数据(photometric data)所能做到的事情。
它可能有助于发现稀有类型的恒星或遥远的类星体,追踪星系结构,并研究宇宙的演化。然而,该工具也有其局限性。例如,其准确性依赖于训练数据的质量,当应用于观测天空不同区域或使用不同仪器的其他巡天数据时,其性能可能会有所不同。
研究人员现在的目标是提升模型处理更暗弱天体的能力,并使其适应未来的巡天项目。简而言之,他们为天文学界提供了一位得力助手 —— 这位助手不仅看得更快,而且看得更清晰。
该研究已发表在《天体物理学杂志》上。
如果朋友们喜欢,敬请关注“知新了了”!