科学家们在做什么 ?揭示地上生命的奥秘,探索天上星尘的演变,解开万物万事之理……众所周知,自上世纪初,物理学家始终在追寻是否能用简单的理论描述宇宙中所发生的一切物理事件。


一百年后,科学家们继续大胆发表新理论,最近有两篇理论文章分别发表在《自然》与《美国国家科学院院刊》上。前者试图成为统一生物学和物理学的理论框架,但也引发巨大争议;后者宣布发现一条“缺失”的自然法则,可解释演化系统,似乎更获得同行认可。


一、组装:从非生命到生命的组装过程


长久以来,苏格兰格拉斯哥大学的化学家Lee Cronin一直在思考这样一个问题:不同原子之间的组合方式之多,多如天上繁星,那为什么自然界创造出这样一些分子,而不是其他分子呢?与此同时,地球另一边美国亚利桑那州立大学的天体生物学家、理论物理学家Sara Walker则思索着生命起源的问题。这一问题与复杂分子的创造有着异曲同工之妙,因为鲜活生物有机体内活跃着过于复杂的分子,这绝非偶然而成,在达尔文自然选择理论接管生物过程之前,她猜测一定有什么在发挥指引作用。[1]    

2012年,两位科学家在美国国家航空航天局(NASA)的天文生物学研讨会上相遇。会议期间俩人一直讨论着信息论、生命以及构建自主复制机等各种话题。趣味相投的俩人随后便成立课题组,带领团队深入探索复杂生物体,尤其是复杂生命涌现过程的机制,试图建立一套自洽、在数学上能够做出精确描述的理论,这是非常经典的理论物理学家思维模式。[1]    


2021年,这个团队在《自然·通讯》(Nature Communications)期刊上发表论文,首次正式提出了组装理论(assembly theory)[2]作者假定,生命系统与非生命系统的区别在于前者能生成复杂分子,数量之多、丰度之高,后者无法企及。而复杂分子却由许多简单分子,如同搭积木般,通过生物化学反应,步步组装而成。


因此,作者推断应该存在构建给定复杂化学分子的最少组装步骤数,作为足以让生命出现的阈值——即作者定义的组装指数(assembly index);反过来说,复杂程度超越该阈值的任何化学分子,背后都存在生命或者类生命过程在运作。由此可见,该理论的初衷是提供一套理论范式和测量方法,从生物化学角度设定新的生物特征,帮助人类在搜寻地外生命过程中判断所发现的踪迹,是否为生命现象或至少是类似于地球上已知的生命过程。[3]    


两年之后,研究人员进一步扩充了组装理论,今年10月在《自然》期刊上发表了题为《组装理论解释并量化选择和演化》(Assembly theory explains and quantifies selection and evolution)的文章[4]。用作者自己的话来说,进一步发展后的组装理论始终将化学置于舞台中心,“提供了一个跨越物理和生物学的统一框架来描述自然选择,理解演化。”以此为基础,团队构建了一套全新的组装宇宙观,包含四个不同“宇宙”概念的嵌套层级结构:


作者发表在arxiv.org上预印本论文稿件中的“宇宙”结构示意图。来源:arxiv.org


首先范围最大的是组装宇宙(Assembly Universe)中,基本构造模块的所有排列都是允许的。其次是可能组装宇宙(Assembly Possible)中,物理定律对这些组合施加约束,因此只有一些物体是可行的。然后,偶然组装宇宙(Assembly Contingent)通过挑选那些实际上可以沿可能路径组装的物体,对物理上允许的大量物体进行削减。第四个宇宙是观测组装宇宙(Assembly Observed),它只包括那些生成我们实际看到的特定对象的组装过程。


为了理解组装过程如何在作者的概念宇宙中运作,作者引入了达尔文演化论作为分界线。在达尔文演化论发挥作用之前,必须从可能组装宇宙中选择高组装指数对象的多个拷贝。普通化学反应在所有可能排列中“选择“出某些产物,因为它们有更快的反应速度。


前生命环境中的特定条件已经在可能组装宇宙中筛选构成生命的分子前体池,这些前生命环境偏好被如今的生物分子记住:分子编码了自己的历史。随后,一旦达尔文的演化论和自然选择开始接管生命运作过程,生命就会倾向选择那些能更好自我复制的物体。在这个过程中,这种对历史的编码愈发强力,这也就是为什么科学家可以通过蛋白质和DNA分子结构来反推生物的演化关系。[3,4]    


接下来,设定一套精准测量的数学方程很重要。在21年论文提出的组装指数基础上,团队在新文章中还创造了另一变量:给定物体的丰度或者拷贝数。Cronin表示这一变量非常关键:“具有相似拷贝数的复杂物体绝对是选择的黄金标志物。”因为物体越是复杂,如果不选择制造出它的信息驱动机制,那么相似拷贝存在的可能性就越小,这也就是为什么复杂物体并非随机生成,而是选择介导,通过其形成历史来定义[3]


一个物体被组装的步骤越多,就需要经历越多的自然选择才能出现。因此,将组装指数和拷贝数组合起来便得到了一个方程,该方程确定了生成对象集合所必要的选择量,也就是说,从无选择到选择的过渡,例如无生命物质到有生命这一关键转变时刻,这是以一种数学上可定义的方式改变了组装中的路径,可通过该方程来体现。实质上,同时具有高组装指数和高拷贝数的对象物体便是“选择”发生作用的证据[5]


论文预印本中描绘的组装空间中演化、选择与拷贝数的关系示意图。来源:arxiv.org


当然,实验验证理论有效性也是不可或缺的重要一环。研究人员表示通过该理论,可以量化包括邻苯二甲酸二乙酯、短多肽和细胞结构在内的系统中的选择和进化。尽管目前该理论是在可观测的分子水平上得到了发展,但也有潜力用于更广泛的模型,来模拟各种复杂性的演化,不仅是复杂的生命,还涉及语言和技术等。[3]    


这篇试图统一复杂生命和非生命的“野心之作”在顶尖权威期刊上一经发表,便收获了相当复杂的反响。一方面,《自然》还发表了由南非开普敦大学复杂系统科学家George Ellis撰写的评论文章[5],支持组装理论是统一物理学和生物选择的普适框架,但如何应用于复杂环境,比如解释涌现的生物层级结构,则需要继续探索。科技媒体也称赞组装理论是“大胆突破的新万物理论”[6]


另一方面,学界专家似乎并不能接受这一理论,论文发表之后没多久,科学家们很快在论文评论区、在媒体上打起了“笔仗”,热闹非凡。有些人觉得自己的专业受到了冒犯,另外一些人则很困惑,大家都是同行,竟然看不懂同行的文章到底想说什么。


演化生物学家尤为愤怒,科廷大学副教授Bill Bateman从论文摘要出发,对自己所理解的论文内容展开批评,表示“作为一个旨在统一演化和物理学的广泛新范式,组装理论似乎——对于我和许多其他人来说——是在解决一个并不存在的问题。”[7]    首先,在学界专家看来,这篇文章充满着对已有生物概念的误解。


丹麦技术大学的Kasper P. Kepp教授在论文评论区从论文标题、摘要以及文章开头部分逐字进行批驳,措辞相当严厉。以标题为例,Kepp立马纠错:“一套不适用演化论生物学单位(核酸和氨基酸)的理论是无法量化选择和演化的。” 而且标题还有夸大其词之嫌,容易误导读者。对于选择论,论文作者认为“它(选择)揭示了物体通过一个向前的动态过程,考虑到其组装,而得到表征。” 


但Kepp立刻指出:“选择不是一个向前发展的动态过程,而是在给定的固定时段内种群中表型适应性程度高低的结果”。接下来,作者继续表示,如果要理解在没有预先蓝图设计情况下,物理世界如何涌现出无穷无尽的形态,就必须要有一套理解并能量化选择的新方法,而Kepp则阐明了真实情况:


“我们早就理解了选择,并且无需‘设计’(基因、氨基酸等)就能量化选择。而局限性在于数据复杂性。论文中还描述了最初一批组装体早期涌现过程中的选择压力,写得模棱两可,与真正作用于分子组装的生物化学作用力毫无关系。”


总而言之,在Kepp看来,这篇论文对演化论和生物化学有这么多误解,语言晦涩,最后竟然还通过了编辑和审稿人的审核,由此可见即便如《自然》这样的期刊,同行评审也不尽善尽美。


在该评论发出两天后,Walker博士同样逐段详细回复,并反驳了Kepp教授的批评。以针对标题的讨论为例,Walker博士表示,在演化论、选择说被提出的时代,人们还不知道核酸和氨基酸,尽管目前以生物形式展开的大部分演化理论最终都提到了核酸和氨基酸,但生物学内许多现有理论也不仅仅依赖于这些特定分子。课题组所想要挑战的是目前没有任何理论(基于演化论或其他思想)能够解决生命起源这一问题,所以,组装理论是团队所能提出的最佳方案。


其次,从技术层面来说,对于论文中所采用的测量方法和数学方程,也不全然是作者的创新。


剑桥大学化学工程和生物技术系的研究员Hector Zenil教授在自己的博客上[8]撰写长文,指出组装指数可以用简单的统计编码方案所取代,因为组装指数与霍夫曼编码等工作很相似。霍夫曼编码指无损数据压缩算法,根据预测到的符号重复出现的频率来编码,频率越高,编码该符号的长度越短。Zenil还通过实验指出用传统的一维 Run Length Encoding(RLE)、霍夫曼编码等方法得出的相关性比组装指数高。所以在Zenil看来,组装理论用组装指数来作出判断生命和非生命的标准,不仅像重复发明轮子,还有一定误导性[9]


北京师范大学珠海校区-复杂系统国际科学中心特聘副研究员刘宇也补充表示[6],组装理论和柯式复杂度面临着同样的问题,即最随机、最无规律的序列是“复杂度”最高的。所以组装理论定义组装指数为生成分子的最少步骤数,但文章中计算该指数用的是一个称为split-branch的算法,本质上是在迭代地数重复亚分子结构的个数,并不能给出“生成分子的最少步骤数”。[10]    


最后,在论文正文内容中,科技新闻网站Ars Tchnica的资深科学编辑,同时也具有生物学高等教育背景的John Timmer在通读全文之后,就指出其中的若干问题[11]:首先作者自己提出的“选择与物理学统一”,只不过是干扰因素,干扰了读者对组装理论的理解,而且作者在正文中对于组装理论也没有给出很好的解释。


相反,华盛顿大学的演化生物学家Carl Bergstrom一针见血地指出,如果仅从化学角度展开讨论,组装理论的统一效果确实很好。然而在正文中,其实作者并没有做到将其与物理学统一起来。作者甚至承认:“组合空间在当前的物理学中不发挥突出作用,因为其对象被建模为点粒子而且组合对象。”而且,“从某种意义上来说,该定义与标准物理学完全对立,后者将所感兴趣的对象作为最基本且牢不可破的。”但是,这些都无法阻止作者在摘要中写下完全相反的陈述。


尽管争论纷纷,悉尼新南威尔士大学化学学院教授Palli Thordarson在个人推特上一口气发了19条推文[12],他的观点则比较中立,态度更开放一些,他表示:“在我看来,组装理论显然有其优点,推进了我们对复杂化学系统的思考,尤其是设计生命起源研究和天体生物学研究。但是我感觉我们仍然需要更好地在实验条件下确认生命起源之前的化学背景,之后才能接受组装理论,让其在化学、生物、物理三大学科交叉领域内发挥更加深刻的作用。”


二、发现“缺失的”自然演化法则:从生命到宇宙


组装理论提到了达尔文的演化论。众所周知,该理论用来揭示地球上的生命现象,而不适用于更加错综复杂的系统,例如行星、恒星、原子等。今年9月发表在《美国国家科学院院刊》上的论文[13]描述了一条“缺失的自然法则,首次承认自然世界运作的一条重要准则,该新准则明确了复杂的自然系统演化成更模式化、更多样且更复杂的状态。”


这篇论文出自美国天文学家、行星科学家、矿物学家和哲学家团队之手,内容集中于探讨在演化论选择以及其他复杂系统构建过程之间的并行关系。自然界中普遍存在着各种系统演化,文章例举的现象包括恒星中元素混合构建、行星中矿物复杂性的发生等,这些正对天文学家和行星科学家的胃口。


作者将演化中的系统间的并行关系视作概念上等价,因为它们都表现出以下三大显著特征:第一,它们都有大量组成元件组成,能够组合形成大量不同属性的构型;第二,存在大量不同构型的形成过程;第三,构型基于功能而获得优先选择。”



以生物学为例,达尔文将生物功能等同于生存,即活得足够长久以生育后代的能力,而该研究进一步扩充了达尔文的这一观点,指出自然界中存在的至少三种功能:最基本的功能便是稳定性,即选择出原子或分子的稳定排列得以续存,同时,静中也有变,即持续存在具有持续能量供应的动态系统。而第三个功能也最为有趣,用作者的话来说就是“创新功能”,演化系统倾向于探索新的构型,有时候会出现令人意外的新行为或者特征,例如光合作用。


同样的演化也发生在矿物王国中,最早期的矿物尤能代表原子的稳定排列这一特征,而这些原始矿物为下一代矿物的演化奠定基础,后者参与了生命起源活动。生命与矿物的演化相互交织,动物的外壳、牙齿和骨骼都是生命利用矿物的创新成果。


让我们现在仰望宇宙,在大爆炸之后,两大主要元素:氢和氦很短时间内就形成了首批恒星,而最早的恒星继续利用氢和氦制造出了20种更重的化学元素,以如此多样性为基础,下一代的恒星继续生成了100多种元素。[14]    


不同系统演化的细节可能各不相同,但作者认为,无论系统是有生命的还是非生命的,当新的构型运作顺利,功能得到增强,那就说明演化正在进行中。此外,虽然从未明确定义过,但作者还承认生物拥有所谓的“功能信息”。


换言之,当什么东西“发挥功能”时,生物有能力保持继续生成该东西,同时还生成其变体。尽管这有点儿类似于稳定的原子核或者矿物,但是后者缺少由DNA提供的外部信息储存。作为结论,作者提出了“功能信息增加定律”(law of increasing functional information):如果系统的许多不同构型面对一个或多个功能的选择,那么系统的功能信息将增加(即系统将演化)


当然,还有许多事物不是并行关系。演化持续不断地探索新构型,与此同时,元素和矿物的形成分别受限于物理学和化学。尽管这些系统能经受不同压力和温度范围,与生物学相比,它们极端受限。研究人员也承认:“近期研究已经评估出,地球如今生物圈的组合相空间早已远远超出了非生物宇宙的组合相空间。”


尽管如此,这篇论文的主要目的在于为在宇宙中搜寻地外生命提供理论框架,来自康奈尔大学天文系、同时也是卡尔萨根学院成员的Jonathan I. Lunine是这篇论文的一作之一,他解释说:“如果演化中的物理或者化学系统功能性因自然法则驱动而增加,那我们就可以期待生命是行星演化的常见结果。”[14]    


同样是跨越非生命和生命的新理论,在Timmer看来,《美国国家科学院院刊》的论文写得要比《自然》论文好一些,毕竟文章内容中的论证逻辑更清晰易懂,不过在范围上要比组装理论限制更多些。与此同时,目前也尚不清楚这些论点是否能真正证明上述实例中的并行关系,因为它们有比概念相似更深层次的内容值得挖掘。


此外,任何一个理论最终是否有用途,都要经过实验检验才能确认,无论是争吵得沸沸扬扬的组装理论,还是在天文学家圈子内比较容易接受的新自然法则,目前可能暂时还没有办法使用这些理论驱动实验项目的展开,但这不意味着最终没人能办到。


至于新理论究竟是新范式还是伪命题,目前尚无定论,但新理论有争议在科学界也是非常常见的现象,这反而能够敦促研究人员进一步反思理论的合理性、有效性,发现自己看不到的“盲点”,从而建立更加经得起同行最严苛批评、实践考验的可靠理论。无论最终结果如何,这都是人类为揭开万物最深处奥秘做出的每一步努力的证明。


本文来自微信公众号:返朴 (ID:fanpu2019),作者:小叶