本文来自微信公众号:醋话集(ID:cuhuaji),作者:醋醋,题图来自:视觉中国
2015年初夏,我前往北京参加第一届联想科技大会,亲眼目睹联想、英特尔、微软三大CEO首次同台演讲。
当时,三大公司均失意于移动互联网,三大CEO站在台上,犹如三个陷入中年危机的男人互诉衷肠。尤其是微软CEO萨提亚·纳德拉(Satya Nadella)刚上任一年,与比尔·盖茨和鲍尔默这两位前辈完全不在一个量级,沦为场上配角。
让人眼前一亮的是百度李彦宏,他展示的人工智能技术能看、能听、能说,顿时成为全场最靓的仔。
一晃8年过去,全场最靓的仔变成了纳德拉,他一手促成“微软+OpenAI”黄金搭档,开发出了震惊世界的ChatGPT,连比尔·盖茨也赞叹,这是继图形用户界面以来最重要的技术进步。
直到今天,业界也没有出现比肩ChatGPT的产品,李彦宏说百度文心一言比ChatGPT落后两个月,周鸿祎立马纠正是两年。就连马斯克也慌了,他一边打着人类安危的大旗呼吁ChatGPT放慢脚步,一边悄悄囤积算力芯片奋起直追。
这意味着ChatGPT不仅超过中国同行,也让美国同行措手不及。纵观IT发展史,几乎每一次技术升级,都会伴随对手的出现,有Windows就有Linux,有安卓就有iOS,像ChatGPT这种独孤求败的现象极其罕见。
在ChatGPT横空出世之前,OpenAI长期掩盖在DeepMind的光环之下,微软更是因错失移动互联网被谷歌力压一头。
为什么引领这一次科技革命的,是“微软+OpenAI”,而不是“谷歌+DeepMind”?
4月28日中央政治局会议首提通用人工智能,指出要重视通用人工智能发展,营造创新生态,重视防范风险。
厘清“微软+OpenAI”的科技创新机制,有助于我们在打造中国版ChatGPT的道路上走得更快更稳。
一
有人认为,微软是因为运气好,才能投中OpenAI。也有人认为,OpenAI是因为受通用人工智能信仰驱动,才能专注人工智能语言大模型开发出ChatGPT。
这些看法都忽略了微软与OpenAI合作背后的商业逻辑和战略目标。事实上,微软与OpenAI的合作,不是运气也不是信仰,而是战略。
比尔·盖茨透露,早在2016年他就在与OpenAI团队会面。不过当年OpenAI刚成立一年左右,发展方向尚未定型,还无法纳入到微软的人工智能战略框架。
起初OpenAI有三条人工智能路线:一是服务人类的实体机器人,二是挑战人类的游戏机器人,三是模仿人类的聊天机器人。现在我们都知道 OpenAI 专注第三条路线并取得了巨大成就,但对于OpenAI而言,这在当时是一个艰难的决定,以致让公司产生了分裂。
作为创始人之一,马斯克主张做实体机器人,这符合他在自动驾驶和人形机器人方面的战略布局,而另一位创始人阿尔特曼则坚持要做人工智能语言大模型。至于游戏机器人,对其他两条路线都有助力,游戏能够训练人工智能的强化学习能力,ChatGPT正是在补上基于人类反馈的强化学习这一步后正式上线。
2018年初马斯克借口OpenAI已经严重落后于DeepMind的竞争,要求接管公司并亲自运行,被阿尔特曼和OpenAI的其他创始人拒绝。如果放在《流浪地球2》,马斯克属于正方移山计划派,阿尔特曼则属于反方数字生命派。然而,电影角色在现实中发生了反转,阿尔特曼取得了OpenAI的控制权,马斯克只能出局。
2018 年 2 月,马斯克宣布离开OpenAI董事会,后来公布了三条理由:一是精力有限,他要专注于特斯拉和 SpaceX;二是 OpenAI 可能会与特斯拉产生竞争;三是他不赞同 OpenAI 将要做的某些事情。一个体面的离职者,通常都会先说自己的问题,比如追求理想去创业,真正的原因要么不说要么放后面,马斯克最后一个理由暗示了他离职的真正原因是战略分歧。
随着马斯克的离开,OpenAI的实体机器人团队逐渐边缘化,2021年7月OpenAI干脆解散了机器人团队。
阿尔特曼接管OpenAI后与微软打得火热。他在2019年3月将OpenAI从非营利组织改为有限营利公司,并在5月成为CEO。很快,阿尔特曼就与微软达成了合作,于当年7月获得了微软10亿美元的投资。结果大家都看到了,“微软+OpenAI”一起开发出了ChatGPT,并取得了巨大的成功,这让马斯克很不爽。
前不久,马斯克在推特上写道:
“我仍然很困惑,我捐赠了约 1 亿美元的非营利组织如何以某种方式变成了市值 300亿美元的营利性组织。如果这是合法的,为什么不是每个人都这样做呢?”
这也是让大家感到困惑的地方,我曾经和一位知名人工智能企业创始人聊过这个话题,他说在ChatGPT之前很少人看好语言类人工智能,因为即便人与人沟通都难免鸡同鸭讲,更何况跨物种交流,而缺乏实际应用就难有商业价值,大多人工智能公司选择了视觉识别等有明确商业模式的领域,所以ChatGPT出来之后打了大家一个措手不及。
那么,当年OpenAI为何如此有先见之明,敢于将赌注全部压在人工智能语言大模型这条路上?
二
对于这个问题,惯常的说法是理想主义的胜利——OpenAI坚信人工智能语言大模型是通往通用人工智能(AGI)之路。
我毫不怀疑OpenAI追求理想的诚意,只是理想之路需要铺设现实的阶梯。当OpenAI牵手微软之时,就意味着人工智能语言大模型打开了商业化大门。
我在微软官网查阅其历年来涉及人工智能战略的内容,发现这场姻缘早在2016年就已注定。
Rangan Majumder是微软搜索和人工智能副总裁,他透露微软当年启动了一个以人工智能之父命名的图灵计划,最初的动机是将人工智能融入bing搜索,用户通过提问来获得答案,这将颠覆传统的搜索引擎运作模式。
微软在2017年公布了图灵计划更多细节,明确人工智能还会扩展到多个办公软件,如Word、Outlook、Teams和SharePoint。植入了人工智能的办公软件能够根据用户的请求,自动生成文本、图像、表格等内容。
这些内容本质上都是语言或其延伸形态,因此要实现图灵计划,微软必须构建一种大型语言类人工智能模型,即图灵模型。
将图灵模型改成ChatGPT,就是今天的局面。只是因为微软的图灵模型不争气,没有引起太大的轰动,而OpenAI则给了微软一个机会。
据微软官博文章,早在2018年OpenAI就向微软表明了他的目标——创建一个能够永远改变人机交互方式的人工智能系统,这无疑也是微软正在做的事情。
回顾微软的发展史,我们可以发现一个共同的特点,那就是微软最擅长把专业的技术大众化。它把原本需要编写代码才能操作的DOS操作系统,改进为人性化的图形界面,让普通用户也能轻松使用。它也把复杂的文档、表格、演示等功能,集成为方便实用的办公软件,提高了工作效率和质量。
这其实就是一种典型的软件思维,高度重视可用性,所以软件总是跟着应用两字。
阿尔特曼也极具软件思维。“GPT-3、GPT-4、GPT-5……未来的历史书会记载哪个GPT版本?”阿尔特曼说,如果是他就选ChatGPT,因为它能够根据人类的反馈调整GPT模型符合人类的期望。“最关键的不是底层模型,而是它的可用性。”
理解了这一点,就能更好地理解比尔·盖茨的观点——ChatGPT是图形用户界面以来最重要的技术进步。无论是PC时代的Windows,还是智能手机时代的安卓与iOS,本质上都是图形操作系统。而ChatGPT通过语言人工智能控制计算机,创造了一种语言操作系统。
从图形操作系统到语言操作系统,这是比移动互联网更大的飞跃。这种交互方式大大降低了用户的学习成本,使得人工智能技术能够更广泛地应用于日常生活和工作场景中。
这符合计算机操作系统的本质——更简单的输入,更有效的输出。
语言作为一种信息载体,具有极大的普适性。而且,语言交流是人类社会中最基本、最核心的交流方式,通过将自然语言处理技术引入人工智能系统,有望实现人机交互的自然、流畅和智能化,从而推动人工智能在各个领域的广泛应用。
所以,OpenAI关注人工智能语言大模型并非偶然,而是基于对语言交流普适性、人机交互重要性和商业价值的深刻认识。
OpenAI的理想目标是创建通用人工智能,现实策略是推动人工智能通用。
换一个角度看,我们对OpenAI的战略选择就会豁然开朗。
三
错失移动互联网时代后,微软终于在人工智能时代牵手OpenAI扳回一局,这也是中国的大机会。
众所周知,我国在信息技术领域长期受制于他国,特别是在关键核心技术上面临着“卡脖子”的困境,核心原因是我们的顶层应用建立在美国的底层平台上。PC时代有Wintel联盟,微软操作系统与英特尔芯片构建的软硬件平台号令天下。移动互联网时代有安卓操作系统+高通芯片。人工智能时代,“微软+OpenAI”的ChatGPT正在与英伟达GPU构建新的软硬件平台,期望打造新的Wintel联盟。
如今美国故技重施,去年向中国禁售英伟达A100、V100等高端GPU芯片,试图拖慢中国的人工智能进程,再次把中国的顶层应用绑定在美国的底层基础上。
ChatGPT推出后短短几个月内,中国涌现了众多语言类人工智能大模型,这与之前的PC时代和移动智能手机时代形成了鲜明的对比。
因为在人工智能时代,新的软硬件平台架构更加依赖于软件的创新和优化,而不是硬件的制造和集成,而软件开发恰恰是中国人的强项。即使在硬件芯片方面存在一定的差距,也可以通过规模化部署和并行计算来弥补。
我曾经跟一个从事人工智能大模型训练的创业团队交流过,他们对英伟达A100的禁售并不太在意。
“即使我们的芯片性能只有它的一半,但价格却远低于一半,通过并行训练,我们仍然可以实现很高的效率和效果。语言类大模型的Transformer架构本身就非常适合并行训练”。
此外,终端形态越统一,软硬件平台架构垄断就越强。而在人工智能时代这不是一个问题。
我们可以发现,过去无论是PC还是智能手机,都有很明确的终端形态。PC时代被微软的操作系统和IBM的PC制造标准所主导,苹果只占很小的一部分,所以说Wintel联盟几乎垄断了整个市场。
而到了移动智能手机时代,出现了安卓和苹果两大操作系统,以及多种智能手机制造标准,这也给了中国的机会。华为通过麒麟芯片一度突围,后来虽然遭到美国的封杀,禁止台积电供货,但现在又在通过鸿蒙操作系统寻求突破。
人工智能大模型是一个在云端运行的系统,它可以通过不同的终端来交互和应用,而不是依赖于某一个终端的形态和性能。这样的特点,更加有利于中国在人工智能时代的创新和突破。
四
在中国,有许多企业具备了系统软件的创新开发能力和云计算的规模化部署能力,这些能力是他们在互联网时代积累和培养的,他们都是人工智能时代的有力竞争者。
继3月16日百度文心一言发布后,阿里和商汤分别于4月7日和4月10日发布了类ChatGPT产品“通义千问”和“商量SenseChat”,其背后对应的分别是阿里的通义大模型和商汤的日日新SenseNova大模型。目前国内至少已经有30多家大模型亮相,其中不乏参数规模甚至超过ChatGPT规模的大模型。厂商涵盖了互联网巨头、AI上市公司、服务器龙头企业、科研院所与一级市场创业公司。
目前让人期待具有较大想象空间的中国版ChatGPT,各大巨头中还剩腾讯一家。
腾讯于2022年12月推出了万亿中文NLP混元AI大模型,为类ChatGPT产品构建坚实基础。据腾讯高级执行副总裁汤道生透露,腾讯正在研发类ChatGPT聊天机器人,将集成到QQ、微信上。
一旦这两个国民应用植入了AI聊天功能,将会给几亿网民带来前所未有的沟通和娱乐体验。
需要注意的问题是,我国长期以来在社会层面形成了一种看法,硬科技创新就是硬件层面上的创新,软件创新受到重视程度偏低。
加强硬科技的硬件投入开发,解决当前紧迫的“卡脖子”问题,是弥补我国科技短板的必要措施。但也要看到,硬件芯片受制于全球供应链,我国以及包括美国在内的所有国家,都不可能大包大揽。
这个时候我们要放大软件长板,要充分认识到,软件定义硬件,软件赋能硬件,软件是应用是需求,有什么样的软件,就配置什么样的硬件,这符合以需定产的经济规律。
只有这样,才能摆脱跟随别人亦步亦趋的被动局面,重新掌握主动权,彻底告别“卡脖子”的尴尬。
建议以国家力量建强算力基础设施,同时联合具备系统软件思维以及人工智能大模型开发能力的公司,创建属于中国自己的软硬件平台基础,打造并丰富人工智能时代的生态体系。
我们需要在硬科技创新中加强“软”思维,这是一个关乎国家未来发展和竞争力的重大战略问题,也是一个需要全社会共同努力和参与的创新性工程。
本文来自微信公众号:醋话集(ID:cuhuaji),作者:醋醋