系外行星的研究领域正在经历一场巨大的转变。迄今为止,天文学家们已经在3711个行星系统中确认了4940颗系外行星,另有8709颗候选行星正在等待确认。由于有如此多的行星可供研究,以及望远镜灵敏度和数据分析的改进,重点正在从发现过渡到定性。天体生物学家不是简单地寻找更多的行星,而是检查“潜在的宜居”世界,以寻找潜在的“生物特征”。
这指的是与生命和生物过程相关的化学特征,其中最重要的一个是水。在最近的一项研究中,天体物理学家Dang Pham和Lisa Kaltenegger解释了未来的调查(当与机器学习相结合时)如何能够分辨出遥远的系外行星上是否存在水、雪和云。
Dang Pham是多伦多大学David A. Dunlap天文学和天体物理学系的一名研究生,他专门从事行星动力学研究。Lisa Kaltenegger是康奈尔大学天文学副教授,卡尔-萨根研究所所长,也是对潜在的宜居世界进行建模并描述其大气层特征的世界领先专家。
水是地球上所有生命都依赖的东西,因此它对系外行星和天体生物学调查非常重要。正如Lisa Kaltenegger通过电子邮件告诉《 Universe Today 》的那样,这种重要性反映在NASA的口号中--“只要跟着水走”--这也是他们论文标题的灵感所在。
“行星表面的液态水是潜在生命的证据之一--我在这里说潜在是因为我们不知道还需要什么来启动生命。但液态水是一个很好的开始。因此,我们使用了NASA的口号‘只要跟着水走’,并问道:‘我们如何才能在宜居区的岩质系外行星的表面找到水?’做光谱分析是需要时间的,因此我们正在寻找一种更快的方法来初步确定有希望的行星--那些上面有液态水的行星。”
目前,天文学家只限于寻找莱曼-阿尔法线的吸收,这表明系外行星的大气层中存在氢气。这是大气层中的水蒸气暴露在太阳紫外线辐射下的副产品,导致它在化学上分解为氢和分子氧--前者流失到太空,而后者被保留下来。
这种情况即将改变,这要归功于詹姆斯·韦伯太空望远镜和南希·格雷斯·罗曼太空望远镜这样的下一代望远镜,以及起源太空望远镜、宜居系外行星观测站(HabEx)和大型紫外/光学/红外测量仪(LUVOIR)这样的下一代观测站。还有一些地面望远镜,如极大望远镜(ELT)、巨型麦哲伦望远镜(GMT)和三十米望远镜(TMT)。
由于它们的大型主镜和先进的光谱仪、计时仪、自适应光学装置套件,这些仪器将能够对系外行星进行直接成像研究。这包括研究从一个系外行星的大气层或表面直接反射的光线,以获得光谱,使天文学家能够看到存在哪些化学元素。但正如他们在论文中指出的,这是一个时间密集的过程。
天文学家首先观察数以千计的恒星,观察其亮度的周期性下降,然后分析光曲线,寻找化学特征的迹象。目前,系外行星研究人员和天体生物学家依靠业余天文学家和机器算法来整理他们的望远镜获得的大量数据。展望未来,Pham和Kaltenegger展示了更先进的机器学习将是多么关键。
正如他们所指出的,ML技术将使天文学家能够更迅速地进行系外行星的初步特征分析,使天文学家能够优先考虑后续观测的目标。通过“跟着水走”,天文学家将能够把天文台宝贵的调查时间更多地用于更有可能提供重大回报的系外行星。
Kaltenegger说:“下一代望远镜将寻找行星大气中的水蒸气和行星表面的水。当然,为了在行星表面找到水,你应该寻找(水的)液态、固态和气态形式,正如我们在论文中所做的那样。”
“机器学习使我们能够快速确定最佳过滤器,以及在各种信噪比下的准确性权衡,”Pham补充说。“在第一个任务中,使用(开源算法)XGBoost,我们得到了一个排名,哪些过滤器对算法检测水、雪或云的任务最有帮助。在第二项任务中,我们可以观察到,在噪声较小的情况下,算法的表现要好得多。有了这一点,我们可以画出一条线,在这条线上,获得更多的信号将不会对应于更好的准确性。”
为了确保他们的算法能够完成任务,Pham和Kaltenegger做了一些大量的校准工作。这包括创建53130个具有不同表面成分的寒冷地球的光谱图,包括雪、水和水云。然后,他们在大气和表面反射率方面模拟了这些水的光谱,并指定了颜色轮廓。
正如Pham所解释的:“大气层是用Exo-Prime2-Exo-Prime2建模的,通过在各种任务中与地球的比较得到了验证。雪和水等表面的反射率是由美国地质调查局在地球上测量的。然后我们从这些光谱中创建颜色。我们在这些颜色上训练XGBoost,以执行三个独立的目标:检测水的存在、云的存在和雪的存在。”
这个经过训练的XGBoost显示,云和雪比水更容易识别,这是预期的,因为云和雪的反照率(对阳光的反射率更大)比水高得多。他们进一步确定了五种对该算法非常有效的最佳过滤器,所有这些过滤器都是0.2微米宽的,并且在可见光范围内。最后一步是进行模拟概率评估,从他们确定的五个最佳过滤器的集合中评估他们关于液态水、雪和云的行星模型。
“最后,我们(进行)了一个简短的贝叶斯分析,使用马尔科夫链蒙特卡洛(MCMC)对五个最佳过滤器做同样的任务,作为一种非机器学习方法来验证我们的发现,”Pham说。“我们在那里的发现是类似的:水更难检测,但通过光度测量识别水、雪和云是可行的。”
同样,他们惊讶地看到训练有素的XGBoost仅根据颜色就能识别岩质行星表面的水。根据Kaltenegger的说法,这就是过滤器的真正含义:一种将光分离成谨慎的"仓"的手段。“她说:"想象一下,一个用于所有红光的仓(‘红色’过滤器),然后一个用于所有绿光的仓,从浅绿到深绿(‘绿色’过滤器)。”
他们提出的方法并不能识别系外行星大气中的水,而是通过光度测量在系外行星的表面上识别。此外,它不会与凌日法一起使用,后者是目前最广泛使用和有效的系外行星探测手段。这种方法包括观察远处的恒星,以寻找归因于系外行星相对于观察者在恒星前面经过(又称凌日)的周期性亮度下降。
有时,天文学家可以从一个系外行星的大气层中获得光谱,因为它正在凌日--这个过程被称为"凌日光谱学"。当太阳光穿过系外行星相对于观测者的大气层时,天文学家将用光谱仪对其进行分析,以确定那里有哪些化学物质。利用其敏感的光学系统和光谱仪套件,詹姆斯·韦伯太空望远镜将依靠这种方法来描述系外行星大气的特征。