智东西6月18日消息,近日,外媒《连线》记者史蒂文·利维(Steven Levy)与微软CEO兼董事长萨提亚·纳德拉(Satya Nadella)就微软的AI投资及其背后故事、未来愿景展开了一场深入对话。

此次访谈中,纳德拉畅谈了让他成为AI的信徒的瞬间、与OpenAI合作的幕后故事、对行业龙头谷歌的挑战、AI的未来愿景,也回复了马斯克等人要求暂缓AIGC落地的倡议。



▲微软CEO兼董事长萨提亚·纳德拉,图片来源:彭博社

纳德拉所领导的微软是最早加入AI潮流的公司之一,当其2019年投资的初创企业OpenAI开发出令世界震撼的ChatGPT后,它迅速向OpenAI投资100亿美元,并发布了名为“Copilot”的代码自动补全工具,让开发人员、企业和个人都能利用AI。之后,他又通过名为“Sydney”的聊天机器人将OpenAI最先进的大语言模型(LLM)集成到Bing中,引发新一轮搜索引擎变革。



▲图片来源:美联社

根据投资管理公司Baron Funds的数据,自纳德拉接任首席执行官以来,微软的股价上涨了七倍。市值达2.4万亿美元。他对AI迅速而广泛的采用,表现出一种积极大胆的态度,相信每个人都想听听他对AI的看法。我们先带大家快速回顾本次访谈中的五个重要时刻,并在最后附上此次采访的全文编译。

一、GPT-4译出诗歌真谛,触动微软All in

尽管AI已经存在多年,但纳德拉意识到AI可能会改变世界,却是在GPT-2.5升级到GPT-3的时期。据他描述,那是AIGC(生成式AI)能力开始显现的时刻:“我们没有对它进行单纯的编码训练,它却十分擅长编码。那时起,我成为了AI的信徒。”

而真正扣动扳机、让微软决定全力支持AI的,是当他感受到GPT-4翻译能力的那个瞬间。他解释称,虽然机器翻译已经存在一段时间也取得了很多突破,但无法捕捉所翻译文本微妙之处,而GPT-4弥补了这个问题。

他说:“我在印度海德拉巴长大,一直希望能够读懂波斯诗歌,尤其是诗人鲁米的作品,它已被翻译成乌尔都语,后被译为英语。但是,GPT-4一口气就做到了,这不仅仅是简单的机器翻译,而是跨越两种语言边界还保留了诗歌的精髓。这真的很酷。”



▲图片来源:Cloudbooklet

二、没有明确回应是否会收购OpenAI

在访谈中,利维质疑微软为什么选择与OpenAI合作,而不是创建新的大模型,或完善自己的Turing大模型,毕竟微软已经在这个大模型上努力十多年了。

纳德拉回应称,微软看到了为单一平台搭建根基的机会,而不是试图训练五个基础模型。在与OpenAI的合作中,微软将处理工具并承担确保AI安全和合规的责任,而前者可以继续使用他们更先进的模型。

利维还快速了解了OpenAI和微软如何围绕其明确的非营利章程开展工作,OpenAI开设了一个营利性实体,两家公司也可以分别从中获利。值得注意的是,纳德拉并没有明确回应微软是否会收购OpenAI。



▲图片来源:Shutterstock


三、Copilot帮助下,开发将变得大众化


纳德拉说:“我最兴奋的事情之一就是将快乐带回开发中。”

他相信在Copilot的帮助下,开发将变得大众化:“(享受编程快乐的)人数可以乘以10,1亿人可以是10亿人。当你向LLM发出指令时,你就是在对其进行编程。”

纳德拉还讲述了微软AIGC工具改变印度人生活的一个小故事:

“印度政府有一个名为‘数字公共产品’的项目,其中一个产品是文字转语音系统。在演示中,一个农民正在使用该系统询问他在新闻上看到的一项补贴计划。

系统告知他有关该计划的信息以及他可以填写的申请表格。印度的一个开发人员就所有印度政府文件对GPT进行了训练,因此系统会自动用不同语言为他填写表格。”

纳德拉称自己的梦想便是人人都拥有AI助手。

利维还询问了AI如何具体改变了他的工作,纳德拉分享了使用Outlook中的Copilot进行电子邮件分类对他工作的巨大改变。



▲使用Outlook中的Copilot进行电子邮件分类,图片来源:微软

四、冲击谷歌?谁能让AI落地才是真

利维指出,过去谷歌一直是搜索类软件的行业龙头,微软迅速而广泛地把AIGC功能加入Bing,挑战谷歌地位。纳德拉如何看待微软Bing对谷歌搜索的冲击?

纳德拉回应称:“不在于谁拥有能力,而在于谁能真正发挥这种能力并将其转化为有形的产品。”

他甚至放出豪言,要让谷歌像黯然落幕的搜索引擎Alta Vista一样被淘汰,Alta Vista曾在90年代风靡一时,但在谷歌对其创新后便迅速衰落,2003年被雅虎收购,在2013年正式关闭。



▲图片来源:VICTOR HABBICK VISIONS / Science Photo Library

五、AIGC有风险,但微软不会让它失控

谈到失控的AI时,纳德拉认为认为这种担忧与其说是技术问题,不如说是社会文化方面的考虑。并强调面对这项强大的技术,人类要努力控制住局面。

此外,他还回应了特斯拉CEO埃隆·马斯克(Elon Musk)等人要求暂缓GPT落地的举措。

“回想一下蒸汽机首次部署和工厂创建的时候。如果我们同时考虑到了童工、工厂污染问题,我们是否可以避免几百年的可怕历史?因此,无论何时,当我们对一项新技术感到兴奋时,考虑一下意外的后果是非常好的。”

他认同AIGC使用带有具有风险,也尊重这种技术的顾虑。但他不认为需要为此恐惧,这是一种推卸自身责任的行为,因为一项技术永远不应该失控。他列举了电力与核能的例子,称技术的运用都会产生意想不到的效果,但是人类应该致力于使系统更安全,以便他们能从技术中获益。

利维还提到了微软急于将AIGC推向市场,以及早期的惨败,后来成为“Sydney丑闻”,即《纽约时报》记者凯文·罗斯(Kevin Roose)哄骗Sydney,令其承认它爱上了他,并打算把他从他妻子身边抢走。

对此,纳德拉幽默地回应称:“我们从来没有想过有人会在发布后的100小时内进行对它荣格心理学分析。”



▲Sydney与记者罗斯的交流页面,Sydney称自己已经爱上了他,还说他与妻子的婚姻并不幸福

面对LLM的胡编乱造问题,纳德拉说:“一些非常实用的东西可以减少幻觉。而且技术也在进步,肯定会有解决方案的。但有时幻觉也是‘创造力’,人类应该能够选择何时使用哪种模式。”

以下是《连线》专访的全文编译:


问题1:你什么时候意识到AI会进入到一个具有变革性的阶段?

纳德拉:当GPT2.5升级到GPT-3,我们看到那些新功能的时候。尤其是它展现出的融会贯通能力,我们没有对它进行单纯的编码训练,它却十分擅长编码。那时起,我成为了AI的信徒。我心想:“哇,这真的开始了。”

问题2:是否有一个瞬间让你决定全力支持AI?

纳德拉:就是这种促使我们创建Copilot的编码能力。我第一次看到GPT-4是在2022年的夏天,那是一次非常令人兴奋的经历。有一个查询我总是用作参考,机器翻译已经伴随我们很久了它取得了很多成果,但始终无法捕捉诗歌深层含义的奥妙之处。

我在印度海德拉巴长大,一直希望能够读懂波斯诗歌,尤其是诗人鲁米的作品,它已被翻译成乌尔都语,后被译为英语。但是,GPT-4一口气就做到了,这不仅仅是简单的机器翻译,而是跨越两种语言边界还保留了诗歌的精髓。这真的很酷。

问题3:几十年来,微软一直在投资AI,你们不是有自己很棒的大语言模型吗?为什么还需要OpenAI?

纳德拉:我们有自己的一套方案,包括创建了一个名为Turing的模型,它内置于Bing并在Azure中提供。但我觉得OpenAI和我们追求一样的东西。因此,我不想再去训练五个不同的基础模型,而是希望构建平台性的东西,所以我们合作了。

我们在彼此身上下注,他们做基础模型,我们围绕它做很多工作,包括确保AI安全与合规的工具。我们是两家深度合作的独立公司,以有纪律的方式追求同一个目标,而不是多个团队做随机的事情。我们说:“让我们为此而努力,打造一款真正吸引世界想象力的东西。”

问题4:你是否试图收购OpenAI?

纳德拉:我在微软长大,曾与各类合作伙伴打交道。过去,我们与SAP密切合作建立了SQL Server。所以这些事情对我来说并不陌生。不同之处在于OpenAI是非营利性的。

问题5:这通常看起来像是一个交易障碍,但你和OpenAI想出了一个解决方法。

纳德拉:他们创建了一个营利性实体,我们也同意了。我们有良好的商业合作关系,且我认为这种交易将保持长期稳定。

问题6:显然,这种设置是为了让OpenAI从你的交易中赚钱,但合作可以产生的利润是有上限的。当你们达到了这个上限,就像灰姑娘的马车变成了南瓜一样:OpenAI又变成了一个非营利组织。这样的话,你们的合作会发生什么变化?OpenAI可以说“我们是非营利性的,我们不想成为商业运作的一部分”吗?

纳德拉:我认为他们在博客上对此进行了解释。不过,从根本上说,他们的长期想法是让我们实现超级智能。如果真的发生这种情况,我想所有的赌注都会消失,对吗?

如果这是人类的最后一项发明,那么一切都将落空。不同的人对这意味着什么以及何时发生会有不同的判断,没有说的部分是,政府会怎么说?所以我宁愿把这个问题放在一边,毕竟这只发生在我们获得超级智能的时候。

问题7:但OpenAI的CEO萨姆·阿尔特曼相信这会发生。你是否同意他的观点,即我们将达到超级智能或AGI?

纳德拉:我更关注这一切对所有人的利益。工业革命很久以后,它的成果才触及到我长大的世界各地,这让我很困扰。所以我正在寻找比工业革命更伟大的东西,真正做到工业革命为西方、为世界上每个人所做的事情。所以我一点也不担心AGI会出现,或者它会很快出现。太好了,对吧?这意味着80亿人将过上富足生活,那将一个适合生活的奇妙世界。

问题8:你实现这一愿景的路线图是什么?现在,你正在将AI嵌入到你的搜索引擎、数据库、开发者工具中。这不是那些弱势群体正在使用的东西。

纳德拉:说得好。让我们先来看看开发者的边界是什么,我最兴奋的事情之一就是将快乐带回开发中。微软最初是一家工具公司,尤其是面向开发者的开发公司。但多年来,由于软件开发的复杂性,开发人员曾经享有的关注度和流程已经被打乱了。

我们用AI程序员Copilot编写简单的代码,解放程序员去处理更有挑战性的问题,这项工作很有意义。现在,GitHub上有1亿开发者都可以尽情享受这项功能。不过,随着AI对编程过程的改造,这个人数可以乘以10,1亿人可以是10亿人。当你向LLM发出指令时,你就是在对其进行编程。

问题9:任何拥有智能手机并知道如何说话的人都可以成为一个开发者?

纳德拉:当然可以。你不需要写公式,也不需要学习语法或代数,学习曲线会越来越好,开发将会被大众化。

至于让所有80亿人都能了解这一点,我1月份在印度看到了一个惊人的演示。政府有一个名为“数字公共产品”的项目,其中一个产品是文字转语音系统。

在演示中,一个农民正在使用该系统询问他在新闻上看到的一项补贴计划。系统告知他有关该计划的信息以及他可以填写的申请表格。通常情况下,系统会告诉他在哪里可以获取这些表格。但是,印度的一个开发人员就所有印度政府文件对GPT进行了训练,因此系统会自动用不同语言为他填写表格。

几个月前在美国西海岸创造的东西已经传给了印度的一个开发者,然后他写了一个模组,让一个印度农村的农民在手机上的WhatsApp机器人上获得该技术的好处。我的梦想是地球上80亿人中的每一个人都可以有一个AI导师,一个AI医生,一个程序员,也许还有一个顾问,这就是我的梦想!

问题10:这是一个伟大的梦想。但AIGC是一项神秘的新技术,我们真的不知道它是如何工作的。我们仍然会抱有偏见,有些人认为现在大规模采用还为时过早。谷歌拥有AIGC技术已有多年,但出于谨慎考虑,进展十分缓慢。然后你把它放到Bing中,并挑战谷歌也迈出了这样的一步,尽管谷歌现在还有所保留。你的原话是:“我想让人们知道我们让谷歌跳舞了。”谷歌确实在跳舞,改变了它的战略,凭借自己的AIGC搜索产品Bard进入了市场。我并不是说这是鲁莽的行为,但可以说,你在Bing的大胆举动是过早的发布,让竞争对手们纷纷加入其中,无论它们的技术是否已准备就绪。

纳德拉:某种程度上来说,我们这个行业的美妙之处在于:不在于谁拥有能力,而在于谁能真正发挥这种能力并将其转化为有形的产品。如果你想这样争论,你可以回到施乐公司(XeroxPARC)或微软研究院,说那里开发的所有东西都应该被保留。

问题是,谁做了真正有助于世界向前发展的事情?这就是我们必须做的事情。去年谁会想到搜索会再次变得有趣?谷歌做得非常出色,在产品和分销方面都处于行业领先地位。谷歌搜索是安卓、iOS等系统上的默认搜索引擎,所以我说:“好吧,我们要创新去改变搜索范式,让谷歌的‘10个蓝色链接’模式像Alta Vista一样被淘汰!”

问题11:你是指那个90年代的搜索引擎,当谷歌对其进行创新时,它立刻变得过时了。这话听起来很刺耳。

纳德拉:在这一点上,当我使用Bing Chat时,我无法返回,甚至无法回到原来的Bing。这是没有意义。所以我很高兴现在Bard和Bing共同存在并竞争,这让人们享受到创新。

问题12:我想你一定很高兴终于推出了一项让人们注意到Bing的搜索创新。我记得你在2009年经营Bing时是多么的沮丧,似乎在追逐一个不可战胜的对手。随着AI的发展,我们是否处于“大洗牌”的转折点,以前的行业巨头会失去优势、变得脆弱?

纳德拉:当然是。在某种意义上来说,每一次改变都让我们更接近范尼瓦尔·布什1945年提出的“计算机驱动信息重生”愿景。

布什提出了这个设想后,我们经历了一系列跨越:J.C.R.Licklider1960年提出“人类和计算机的共生”——DougEngelbart构建鼠标和窗口——Alto实现XeroxPARC的图形界面PC——PC——互联网。这都是在说:“能不能有一个更自然的界面,让我们人类能够增强我们的认知能力,做更多的事情?”

所以,我们的创新也只是其中一个例子。Copilot(副驾驶)是一个隐喻,因为这是一个将人放在中心位置的设计选择。因此,不要把这个开放说成是Autopilot(自动驾驶)的延续,它是关于Copilot的。很多人还在惊讶AI到来这件事,但其实AI早就已经无处不在。事实上,所有的行为定位都使用了大量的AIGC。这是一个黑盒子,你我只是其中的目标。

问题13:在我看来,未来将是一场Copilot和Autopilot之间的拉锯战。

纳德拉:问题是,人类如何控制这些强大的能力?一方面是让模型本身与我们所关心的基本人类价值保持一致,这些不是技术问题,而是社会文化方面的考虑。另一个方面是在考虑环境的情况下做出设计决策和制造产品,这能确保部署这些模型的环境与安全性考虑保持一致。

问题14:很多人说“AI应该在半年内踩下刹车”,你是否有这个耐心?

纳德拉:我始终尊重那些说“让我们仔细考虑AI相关问题,以确保没有失控的AI”的人。如果AI起飞了,我们最好要控制住局面。

回想一下蒸汽机首次部署和工厂创建的时候。如果我们同时考虑到了童工、工厂污染问题,我们是否可以避免几百年的可怕历史?因此,无论何时,当我们对一项新技术感到兴奋时,考虑一下意外的后果是非常好的。

也就是说,在这一点上,我们不应该只是说停止,而是应该加快做好所需的工作。在我看到GPT-4的第一天,我们没有在Sydney推出它,因为我们必须做大量的工作来构建安全保障。

但我们也知道,我们不可能在实验室里完成所有的准备工作。要使AI模型与世界保持一致,你必须在世界中而不是在某个模拟中完善它。

问题15:所以你知道Sydney会爱上记者凯文·罗斯(Kevin Roose)?

纳德拉:我们从来没有想过有人会在发布后的100小时内进行对它荣格分析。

问题16:你还没有说,你是否认为AI有可能会毁灭人类。

纳德拉:如果出现完全失控的情况,那就是个问题,我们不会允许这种情况发生,如果这将失控,那就是在推卸我们自己的责任。我们可以处理强大的技术。

顺便说一下,电会产生意想不到的后果。我们确保了电网的安全、制定了标准,我们就有安全保障。很明显,在核能问题上,我们很好地处理了扩散问题。这两个案例很好地说明了我们如何处理强大技术。

问题17:LLM的一个巨大问题是它的幻觉,Sydney和其他模型只是在胡编乱造。这一点可以有效解决吗?

纳德拉:一些非常实用的东西可以减少幻觉。而且技术也在进步,肯定会有解决方案的。但有时幻觉也是“创造力”。人类应该能够选择何时使用哪种模式。

问题18:相较于没有选择的现在,那将是一个进步。但我想问一下另一项技术,不久前,你还在狂热地谈论元宇宙。在2021年,你说你不能夸大混合现实是多么大的一个突破,但现在我们谈论的都是AI。这股热潮是否将元宇宙技术带到了另一个维度?

纳德拉:我仍然相信虚拟存在。在2016年,我写了三件我感到兴奋的事情:混合现实、量子和AI。我仍然对这三件事感到兴奋。今天我们正在谈论AI,但我认为“存在感”是最终的杀手级应用。当然,量子可以加速一切。

问题19:AI不仅仅是一个热议的话题。现在,你已经把微软的中心放在这这项变革性技术的中心。你是如何管理的?

纳德拉:我喜欢在内部使用的一个比喻是:当我们从蒸汽机转向电力,工厂必须重新进行配置。你不能只是把电动机放在蒸汽机的位置,而让其他东西保持不变。这就是斯坦利马车公司和福特汽车公司之间的区别,福特汽车公司能够对整个工作流程重新布线。

因此在微软内部,软件的生产手段正在发生变化。这是微软内部核心工作流程和产品传播方式的彻底转变,它也将改变每所学校、每个组织、每个家庭。

问题20:这个工具如何改变了你的工作?

纳德拉:很多知识工作都是苦差事,比如电子邮件分流。现在,我不知道如果我的Outlook中没有Copilot,我将如何生活。回复一封电子邮件不仅仅是英文作文,它也可以是一张客户支持票。它询问我的客户并带回相关信息,这就像个人电脑第一次出现在工作中一样,在我们的整个产品中都是如此。

问题21:微软在你的任期内表现良好,但你认为自己会因为AI转型而被人记住吗?

纳德拉:我因为什么被记住,取决于你和其他人。但是,我对此很兴奋。微软已经48岁了。我不知道有多少公司在这个年龄段仍十分有价值,这种价值不是因为它们在80年代、90年代或2000年代做了什么,而是因为它们在过去几年做的一些事情。只要我们这样持续努力,我们就有生存的价值。而当我们没做到,我们不应该被视为伟大的公司。

结语:积极拥抱AI,让技术惠及全球

纳德拉在与《连线》的访谈中回应了许多外界关注的问题,包括微软的AI转型、与OpenAI合作的部分细节、与谷歌的竞争以及AI失控的应对之策。

纳德拉领导下的微软对AI等新技术保持开放、大胆的态度,虽然也会部分专业人士质疑AI失控的隐患,但纳德拉强调微软会做好安全保障措施,还描绘了一幅AI惠及全球,人人皆有AI助手的美丽愿景。