ChatGPT是一款由OpenAI研发的生成式人工智能模型,微软是它最大的投资方。有关于它的神乎其神,市面上有着各种各样不好确证的传言和解读,而媒体也注意到,在它的研发团队成员中,有不少年轻的华人面孔,其中不少人的大学阶段或研究生教育是在中国国内完成的。
图片由受访者提供
黄学东先后在湖南大学和清华大学读本科和研究生,1987年前往英国爱丁堡大学深造,攻读博士学位,后又前往美国卡内基梅隆大学从事研究工作。1993年,他加入微软公司,一呆就是30年,成为一位全球人工智能领域顶尖的华人工程师。
微软先后走出过多位知名业界的华人高管,如李开复、张亚勤 、沈向洋、张宏江、洪小文、陆奇等人,黄学东相对低调很多,早在上世纪90年代,他就推动和策划了微软公司管理层在北京组建微软中国研究院(后来的微软亚洲研究院),于幕后做了不少工作,包括具体到面试研究院的管理者,帮助微软公司引进和面试了李开复、张亚勤、张宏江等业界大牛。
今年,黄学东先后当选了美国国家工程院院士和美国艺术与科学院院士,成为计算机领域大陆改革开放后培养出的第一位美国双院院士。采访他时,我才知道,整个微软的认知服务,从创建到落地到推出,他一直是领导者和灵魂人物,他也是微软公司最接近ChatGPT项目的人之一。
关于ChatGPT与微软现有人工智能产品的关系,黄学东向我解释说,微软认知服务,包括了微软语音,微软计算机视觉、机器翻译和Azure OpenAI services,而Azure OpenAI services就包括ChatGPT、GPT4.0、DALL.E等,它们都是同样的API(Application Programming Interface,微软应用程序),而这些都是黄学东领导的团队在过去几年推出来的。
他说,“微软认知服务是微软从人工智能研究到落地以来一个经典的产品,影响了众多的客户。Azure OpenAI的ChatGPT也是微软认知服务框架下的一个产品”。
一,你只看到ChatGPT一枝独秀,却没有看到另外90%的失败
《科学大师》:ChatGPT在中国大火,各种公司和主体纷纷进入这个研发和投资赛道,我们担心会存在某种非理性的狂热,最终把泡沫吹大吹破。您怎么看这个问题?美国也有这种情况么?
黄学东:我对中国国内的情况不太了解,所以不敢随便发言。在美国,我觉得谷歌、 Meta、微软公司和OpenAI做得都差不太多,美国现有三家大的云平台在做这个事,市场上已经有的是微软和OpenAI合作推出的ChatGPT,谷歌有他们自己的东西,扎克伯格的Meta也做了一个开源的大模型,基本上就是这几家了。那Amazon (亚马逊)也正在开发他们自己的东西。还有一些初创公司,有几家也在做类似的东西,大概总共是10家左右。我觉得这样很好,有竞争才有进步。
至于你关心的最后谁能跑出来,成为王者,现在从技术层面来讲,我觉得微软和谷歌无疑是处在领跑者的位置,两家的优势都是比较明显的。
《科学大师》:为什么微软这么有眼光,它能够下重注来投资OpenAI,甚至马斯克都退出了,在这个阶段,微软却走在了前面?
黄学东:这得要感谢我们的CEO萨提亚·纳德拉 ,他为什么能做上CEO是有原因的。他有这个眼光,这完全是他的功劳,同时,微软一直有这种前沿探索的眼光和理念、理想,这是一种内驱力,所以才能做出这一类投资决策。
微软一直以来其实也投资了很多东西,不仅仅只是投资了这一个ChatGPT,只不过大家看到的是今天ChatGPT跑出来了,跑在前面了,看到我们在这一阶段的成功,但是还有其他90%的项目是还没有成功,大家没有看到那90%的故事。
《科学大师》:陆奇最近在国内演讲中说到,像GPT这种语言大模型,微软内部也有好几千人在做,但是最终还是不如Open AI做得好,您认同他的看法吗?
黄学东:我们跟Open AI一起合作做的这件事,它是在微软的云平台Azure上,一起做的,所以你不能说微软就没有做好,我们有这个基础,而且创新也是基于这个基础,这是第一点。
第二点,也不能说微软人工智能团队就无所作为,在智能语音、计算机视觉、机器翻译等方面,这些微软现有的认知服务,它的性价比还是业界第一的。
很多人没有看到微软的人工智能研发是一个多维的东西,在这个多维的组合中,微软现有的这个API,它是一个模型可以做一件事情,你要做语音识别,它就是一个语音识别的模型,要做机器翻译,机器翻译就有一个模型,要做文本总结,就有文本总结的模型,你要做计算机视觉,也都有一个这样的大模型,但是目前这个大语言模型,它不一样的地方是,很多事情可以通过提示来做而且做得非常好,这是之前没有的。但随之而来,是它的成本也上去了,它并不是十全十美的,就像一个豪华的汽车和一个很便宜的汽车,这两者都有它的应用价值,你不能说现在有了一个豪华汽车,就把经济实用型的汽车说成是没有什么用。
图片由受访者提供
二,ChatGPT算迈向超级人工智能的一小步,但还没达到这个目标
《科学大师》:GPT出来后,大家试用过觉得这个东西挺不成熟,是在一本正经的胡说八道,比如说,黄学东院士当选美国两院院士的时间,这个知识点它就说得不对,它给出的时间要早于您当选的确切年份,这挺让人尴尬的。
黄学东:这是我们应该关注的问题,当前生成式人工智能还不够成熟。如果一个人的鉴别力不是很好,那他就容易被人工智能忽悠了。这就跟人一样的,人虽然是地球上最高等级的智能体,但有时候也会不可靠,他大部分时间是对的,但是不靠谱的时候也会胡来,而怎么样能够让这种生成式人工智能变得越来越靠谱,这是我们人工智能发展中需要实现的事情。只有把成熟的人工智能用于教育和宣传,才是对社会有益的。
大语言模型在上世纪70年代就有了,IBM当时的语音识别研发团队就已经推出,但当时它的识读能力有限。现在这个大模型,是从机器翻译这个领域抽出来的,用的是机器翻译的一个方法确精准变换器,它没有超越机器翻译实现新的突破,但是它看了很多很多的东西,然后预测下一个词汇怎么样,就相当于把整个搜索引擎所有文本全看了一遍,用更多的数据训练它,并加上了奖励建模和强化学习与人类的预期对齐等技术,然后通过不同的提示可以突然涌现一些令人惊奇的能力。确实能做到一本正经,显得很有智能,但是它还没法做到完全精确精准,不能完全把错误剔除,它的稳定性目前还没有办法实现的。
它用的是深度学习的基础架构,最主要的一个特点就是自学习并加上奖励建模,把所有的数据全拿过来,所有的语言都拿过来,根据这个它可以自己学习,就是说看了一个文章以后你下面要讲什么东西,可以不用标注的数据,它看了前面一段文章(问题),它就能知道后面一段文章,可以翻译出来(给出答案和对策),这是GPT4.0,就是自己跟自己“翻译”。
这是一个大力出奇迹的事情,你用的训练数据达到一定地步以后,就会涌现很多看似惊人的东西。
现在的问题是,怎么改进它?使它变得更加的精确,让它给出的信息不会似是而非,对人产生误导。
我认为它需要带着知识奔跑(running with the knowledge),不是通过GPT自己来解决,而是在GPT给出结果以后,还需要再加一层防护罩,对它的结果用外部知识进行核实,这涉及到对许许多多垂直领域知识和信息的整合和鉴别能力,只有实现这一点,人们对于人工智能的使用才会更加科学和保险。
《科学大师》:可以说它还不是一个超级人工智能?
黄学东:超级智能,有一个阶段性的定义。
我举个例子,搜索就是一个最大的人工智能系统,可以说它是超级智能,为什么?因为不管你搜什么东西,它都能给你回答。没有任何人具有搜索功能那么强大的记忆力。我们就从记忆力这一点来讲,今天的搜索引擎已经超越了我们每一个人。
也许大家会说,它这不能算是人工智能。但是我必须说,记忆是智能的一部分。从记忆这个维度来看,它已经有了超级记忆的智能。它记得比我们多,算得比我们快。
现在ChatGPT又是怎么一回事呢?我认为它是原有计算机搜索技术运用的一种阶段性提升,是很大的一种提升。它把传统搜索引擎给到我们的信息,压缩成一段一段的总结、归纳,你问它什么问题,它可以完美地通过一段文章给你描述出来,不是通过传统的搜索引擎形式给你一堆不经加工的信息,而是通过对这些翻译结果的奖励排序与人们的预期对齐。你说它是不是超级智能?从记忆维度来看,它确实是。它自动生成的东西,有时候看起来还写得很“漂亮”。但是它真正有深度理解和推理能力吗?没有,它只是一种记忆压缩,然后再释放,重新展现在大家面前。
图片由受访者提供
三,GPT有自己的“脾气”,但它不可能取代人类
《科学大师》:很多人说得很夸张,认为GPT会带来失业潮,好多工种会被替代,搞得人心惶惶的,您认为这种担心有必要吗?
黄学东:每一种新的技术出现以后,总会对社会旧有的局面产生冲击,但是我们也应该注意到,新技术的出现同时也会带来更多的机会,带来更多可能性。
就像汽车出来之后,司机取代了马车夫,电脑的普及以后,打字员的岗位也就没有了,ChatGPT出来,会取代很多白领,但我认为它不会是简单的对白领实现取代,它让他们可以往上发展,使他们可以从很多重复性的琐碎的工作中脱身出来,能去做更有创造性和更有价值的事情。就像微软办公软件Office可以帮人提高生产效率,现在GPT这套东西整合进去之后,全新的Office会重新定义什么叫做生产力软件及相应的应用场景,这并不是说会让好多人都找不到饭碗。
既使没有这种技术,我认为任何时候都会存在职业可取代的情况。要问的是,什么样的人是不可取代的?就是创造型的人才,不会失败、不会过时的,永远是人的思想,人的原创性思维,你必须确保自己有独到的见解,而不是人云亦云,把人家的东西拿过来装饰一下,这种工作的价值会越来越低。当然我不能说他绝对就没有空间,社会是多样的,各种需求都存在,不可能人人都成为精英,非精英的普通人永远是大多数,这些人也应该会有自己的生存空间。我认为需要乐观看待新技术的出现。
《科学大师》:另一个让人疑惑的问题是,不少人鼓吹说这种人工智能模型,会具备独立的自我意识或者自主意识,然后会对人类实现反超,这有科学上的依据吗?
黄学东:看你怎么解释和定义这个自我意识,它作为一个语言模型,当然有它的脾气。如果说它有自主意识,那当然也没问题。我记得有纽约时报的一个记者就跟它调侃,结果这个语言模型就跟他说,唉呀我爱上你了。这个记者就说我不行,你别爱上我,我结婚了。这个模型就说,你老婆不好,我更好。这种对话,你说它是不是属于自主意识?它确实是的,就是因为看了很多这种资料,通过训练后,记住了很多东西,一不小心它就可能干这种事情。
我觉得它就是一个很大的压缩器,把过去所有看到过的信息全部压缩下来,然后存放起来,一旦被触发或引导,就有这种表现。这时候你觉得它是真的爱对话者吗?不是,它只是用文字表述出来,好像它真的爱他一样。这当然不是真实的人格型情感的表露。
四,ChatGPT的成功不是偶然,一流创新需要土壤
《科学大师》:ChatGPT面世后,大家发现,OpenAI这个研发团队中有不少华人面孔。包括您这样杰出的人工智能专家,也是从我们中国走出来的,华人杰出人才的涌现,在美国是一个特别的现象么?
答:我觉得中国人和其他国家的人在美国都做得非常好,都很出色,绝对不能说中国人有什么缺陷,大家都不会有这样的认识。
不管你是什么样的种族,什么样的教育背景,只要有能力,在美国发展的机会是很大的,它本来就是一个移民国家,这里不仅仅有华人面孔,各种各样的面孔都有。比如英伟达的CEO黄仁勋和Zoom的CEO袁征都是美籍华人。
美国的开放性,对全球优秀人才有着极强的吸引力,这成为他们的创新动力,五湖四海的人聚集在这里,都有一个美国梦,这也是美国强大起来、发展很快的最主要的原因之一。
我先后在英国和美国留学、工作,有切身的比较。美国和英国或欧洲传统的社会不太一样。英国比较传统,大家更加重视传统也比较循规蹈矩,很多不愿服从当地社会文化规范的人,早就选择来到美国。我上世纪80年代在英国爱丁堡大学读博士期间,没有毕业前就去了美国的卡内基梅隆大学。我英国的博士老师对我说,美国人做的研究就是世界一流的,你应该去更大的世界看看,开开眼界。他觉得英国那边人的天地还是比较小的。在我论文选题确定前,老师就资助我到美国游历,这可以讲对我一生的发展起了决定性的作用。我相信在这边工作和发展的各种族裔的人,包括许多杰出的华人,都会有这种感受。
《科学大师》:国内就有人问,ChatGPT为什么会出现在美国,而不是出现在中国?一流的科研创新,目前是美国居多,别人只能是跟跑,为什么出现这个局面?
黄学东:这个因素太多了。第一,我刚才讲美国是一个非常有吸引力的开放型国家,很多元化,不管你是什么种族,只要是优秀人才,你都可以在这里找到一席之地,他不会排斥异类,所以优秀的人比例很高,可以讲美国聚集了全球最聪明的头脑。
第二,美国的经济基础和财力也非常强大,它现在还是世界第一大经济体,它有充分的物质条件支持科研投入,支持大家去搞研发创新,它养得起这些人。
第三, 美国也是一个比较年轻的国家,还不到三百年,它没有历史上的很多包袱,没有太多的束缚,做事情能放得开手脚 ,也不去束缚大家的思想和创新活力。而欧洲很多国家,由于历史原因,遗留下来很多东西,有太多传统的框框,他们有很多的约定俗成。
第四,美国的企业和高校交流互动非常好,人才的流动比较通畅 ,我就是从卡内基梅隆大学去的微软,大学和企业的合作关系是很密切的,微软的研发团队,有很多人都是从全球顶尖大学出来的,相互结合,这也支撑了企业的研发创新,使得像贝尔实验室、 IBM当年的沃森研究中心(Watson Research Center)、微软研究院,这些研发团队一代接一代,长江后浪推前浪,都非常优秀,都对社会做出了大的贡献。
第五,美国的文化中,没有成王败寇这回事,他们的价值观反而是鼓励失败、宽容失败的。创新之路必然有失败,而且会有很多的失败。你只有从失败中才能走出一条可行路径。这是所有成功者都必定经历过的。
我说的这些因素,还不完全充分,但我认为,归根结底,一种自由、多元、开放、包容的文化土壤,对于原始创新和应用研究活力的激发,是不可或缺的。美国的科技实力能够全球领先,我想是得益于这一点。
五,如果你想成为优秀的人才,不妨听我一言
《科学大师》:如果要您对中国的大学生和年轻人一些建议,帮助他们更好地成长和发展,您会对他们说些什么?
黄学东:我读的第一所大学是湖南大学,后来考到清华读研究生,然后是到英国读博士和在美国做博士后。先后经历了四所大学,再进入卡内基梅隆大学和微软工作。我就觉得,人的一生,一定要读万卷书行万里路。我们中国传统文化里面其实都有讲这个,但在实践中可能会受到各种条件和因素的限制。
我领悟到了中国的传统、欧洲(英国)的传统、美国的传统,正因为我受到那么多不同文化的熏陶,有些东西可以讲是终身受用。我给中国同学的一个建议是,你千万不要固定在一所学校读下去,本科、硕士、博士最好是读3个学校,这样至少你就有3个学校的校友群,然后你博士后也要换1个地方,至少有4个学校的校友,那你校友多朋友就多了,你的思维、视野就开阔了。
很多学生本科、硕士、博士都在一个学校读,我不是说一个学校不好,但是你为什么不换几个学校呢?中国那么多优秀的学校,或者你到欧洲、美国等国外学校读,全球有那么多的好学校,读万卷书行万里路,这是一个很好的办法。
我曾跟我的本科母校湖南大学的学生座谈中还提到这么几点,我愿意分享给更多年轻人:
1, 创新很难教会,也没有普遍的适用原则,从今天开始你就要找更好的人交流,并进行更多的脑力激荡,然后在创新中快速迭代。
2, 出色的执行力比好的点子难很多。我们需要既有执行力又有好点子。一个坏主意能让最优秀的执行力一事无成。毅力源于你学会了在被打倒后重新站起来。专注是提高创新力和执行力的倍增器。
3, 要勇于冒险,不敢冒险只会取得平庸的成就,在你个人的职业和生活中,每年都要尝试一些重大、新颖和冒险的决定。有很多人精于算计,不敢冒险,我是湖南人,我觉得湖湘文化非常好,就是做人做事要敢为天下先,敢于冒险和尝试,同时要实事求是,追求经世致用。
4, 出色的创新力和执行力可以让你变得富有,要想富有你必须培养自己拥有价值并且能够迅速增长的东西。这可以是企业、房地产、自然资源、知识产权或其他一技之长,仅仅出卖自己的时间,这只是线性增长,而且随着逐渐老去这会不可持续。
5, 不要一味追逐身份地位,空有这些而缺乏实质内容是不会长久的。当你取得想要的成就后内驱力就是唯一的动力,它会推动你向更高的地方攀登,内驱力会让你努力学习新的东西,增加你的幸福感,使生活更有趣,而能防止思想僵化和老年痴呆。
我当年在清华读研的时候,就觉得跟计算机交流太困难了,要是能用自然语言的方式就能解决这个问题,多好。今天不管是ChatGPT还是语音识别,这个愿望已经达到了,但这还不够。要知道,这个地球上有7000种不同的语言,我们要让这个世界变得更好,让交流更理想,我们就要支持这7000种语言,何况这世界上每天都有某些小语种消亡,因为大的语言讲的人多,不会有问题,怎么让不同语言的人自由交流,是个很大的挑战,所以这就是我的内驱力,要让人工智能帮助大家实现更好的无障碍的交流。我们生而为人,一定要有理想有追求。