千万不要小瞧理工科毕业生。搞技术的大佬们一旦开始认真搞钱,整条华尔街都找不到几个对手。



不过搞技术的,特别是搞开源技术的人去搞钱,也是个极具争议的事。

这方面的一个典型,就是 OpenAI 这家公司。这家公司搞的聊天机器人 ChatGPT 坊间传得是神乎其神,技术也的确撑得起来,鲜少看到负面评价。可它的创造者,OpenAI 这家公司,在争议里陷了四年。

有人说它已经沦为了微软的掌中玩物,也有人痛陈它已经堕落成了 CloseAI。

OpenAI 到底做出来了什么成绩?它为什么又要遭到质疑?这种质疑到底有没有道理?

我是林亦,今天咱们唠唠鲜衣怒马的 ChatGPT 和它背后负重前行的 OpenAI。



AI浪潮下的OpenAI

2015 年 12 月,OpenAI 成立了。这家公司成立之初,就两个字,“理想”。目标很“理想”,形式也很“理想”。OpenAI 的目标非常远大,他们要做 AGI。

AGI 只比 AI 多了一个字母,但 AI 和 AGI,它俩是“科技”和“科幻”的区别。

AGI 是 Artificial General Intelligence,直译是通用人工智能,但更准确的译法应该是强人工智能,专指 AI 领域的巅峰技术,一个模型就能做所有人类能做的事,而且在每件事上不仅达到人的平均水平,还要超越。

这时候有朋友要问了:“这么厉害的AI会不会不安全啊?”

在成立宣言里,OpenAI 设定了一个很“理想”的目标,他们不仅要追求实现这样一个强人工智能,还要确保它是安全的、对全人类有益的。

为了实现这个目标,最初 OpenAI 采取了一个很“理想化”的组织形式,就是非营利公司,不谈钱,只谈理想。

其实赚钱本身没什么不对的,但为了赚钱一定会出现商业竞争,而在强人工智能的研究上,竞争除了提供动力,还会带来隐患。

当商业公司纷纷加紧投入简化流程、速度最优先的时候,不能直接帮公司挣钱的安全问题就可能被忽视。

而强人工智能出问题,不想着帮助人类、而是算计人类,或者是被居心叵测的个人或组织利用,绝对是人类承受不起的。



所以 OpenAI 选择成为一家非营利公司,有效回避了竞争的问题,但同时也给公司埋下了大坑,一会儿就会讲到。

在公司章程里,OpenAI 还给出了一个放弃竞争条款,当有人比 OpenAI 更接近实现强人工智能的时候,OpenAI 会从竞争转向合作,用自己的资源和经验帮助对方实现目标。

这是什么人间大爱啊?

就这样,为了避免在强人工智能的研发竞争中没人去考虑安全性的问题,OpenAI 决定去做这个最后的守门员,还是能进球得分的那种。

实际上进球可能还更重要一些,如果别人真的领先了,愿不愿意听别人唠叨那些安全性的问题还真不好说。所以 OpenAI 在保持非营利形式的同时,还得具备竞争力,这就太理想化了。

OpenAI发展史

不过成立之初的 OpenAI 也可以说有这个底气。

OpenAI 的成立公告里,除了列出一众顶级研究人员以外,还有一份堪称全明星阵容的投资人名单,包括做汽车造火箭的 Elon Musk,LinkedIn 联合创始人 Reid Hoffman,PayPal 联合创始人 Peter Thiel,还有 Y Combinator 当时的总裁 Sam Altman。



最后这家公司有的朋友可能不知道,但它在硅谷科技投资圈可是名声煊赫。

在 OpenAI 成立的 2015 年,Y Combinator 带出来的公司总市值已经超过了 650 亿美元,比较有名的包括 Airbnb、Dropbox,还有程序员朋友们比较熟的 Docker。

而这家公司彼时的总裁,早年从斯坦福计算机科学专业辍学、在 Y Combinator 练就了一身运营融资本领的 Sam Altman,在 2019 年正式成为了 OpenAI 的 CEO,自此也把 OpenAI 带上了一段高歌猛进却又极富争议的旅程。

在这个转折点之前,OpenAI 发展得四平八稳,但也有点过于稳了,相对于它的体量来说几近平庸。

OpenAI 众星云集的投资人阵容,带来了 10 亿美元的资金支持,但回头翻看成果列表,会发现一件很让人纳闷的事。

在这种貌似吃穿不愁的研究条件下,OpenAI 前三年的成果不仅和后来的 DALL·E、ChatGPT 有明显的声量差距,和同期谷歌旗下的 DeepMind(也就是 AlphaGo 的创造者)也没法比。

2016 年,AlphaGo 击败顶级围棋选手李世石,在全世界范围掀起了 AI 热潮。



连我这么个还没走出大学校园的小老弟都感受到了冲击,把机器学习定成了研究生的方向,整个人生轨迹都受到了影响。

可同一时间,同样是明星 AI 企业的 OpenAI 却名不见经传。

2018 年前,OpenAI 真正搞出来点知名度的,只是 2017 年下半年单挑打赢了刀塔顶级选手,而且仅限 1v1 中路父子局,两边还都只能选影魔这一个英雄,热闹了一阵就过去了。



16、17 年的惨淡开局,主要原因就是前面说 OpenAI 给自己挖的这个大坑,也就是非营利这套模式。

号称手握 10 亿美元,看起来吃穿不愁的 OpenAI,还真就只是“看起来”。

首先这 10 亿美元就是个虚数,2017 年底李开复在给量子位的读者信里提到,这 10 亿美元只是个目标数字,并不是直接一整笔就打到账上了,所以说 OpenAI 的实际资金并没有看上去那么充裕。



在这样的情况下还要搞非营利公司,那就是难上加难。

其实非营利并不是说不能赚钱,但它不以赚钱为目标,像 OpenAI 这种老实公司,还在章程里赫然写着“如果比不过别人就退出竞争,给对手帮忙”。翻译过来就是:

“施主,为了世界和平,投给我的钱就随它去吧”

这就基本上给后续融资判了死刑了,而融资才是这类初创公司最重要的资金来源,更是士气的来源。

同样是 AI 初创企业,2014 年被谷歌收购的 DeepMind 拿到了超过 5 亿美元,75 名员工雨露均沾,而除了这种可遇不可求的机会,大公司的 AI 岗位砸起钱来也一点都不手软。

17 年初的美国,顶级 AI 研究员的薪酬能赶上橄榄球球星,一年 500 万美元往上,甚至达到千万级。而其中很大一部分是股票期权奖励,这就是 OpenAI 这种非营利公司给不出来的,它很难融资,股权也不值钱。

2016 年三月,著名的对抗生成算法的提出人 Ian Goodfellow 加入了 OpenAI,签约奖金加上首年九个月的工资是 80 万美元,这个金额不小,但对于这种级别的 AI 学者来说,可以说是全美最低。



如果换个地方,乘个 5 甚至乘个 10 都不在话下,而其它的顶级学者来到 OpenAI,也同样要面临收入骤降的问题。

虽说有理想的人是可以不谈钱的,但是钱不够也同样会威胁到理想本身。

搞 AI 研究是很烧钱的,前面说的明星 AI 企业 DeepMind,2016 年亏损了 1.54 亿美元,2017 年亏损了 3.41 亿美元,这还是扣掉了收入之后的亏损数字。

2016 年 DeepMind 已经在为谷歌和医疗卫生系统提供服务,获得了一些收入,所以实际的总开支还要更高。

回到 OpenAI 这边,资金根本不在一个体量上。

OpenAI 作为非营利公司,每年要公开自己的财务信息。同样是 2016 年,OpenAI 的总支出是 1100 万美元,其中 700 万是员工薪酬开支,刨除场地和杂七杂八的费用,所有项目加起来经费不超过 400 万美元。

再对比 DeepMind,仅仅 AlphaGo 的训练这一项就得花掉差不多 3500 万美元。

没米下锅,再怎么谈理想、也实现不出来,有理想的人可以接受钱少拿一些,但事情做不出来浪费生命,谁也受不了。

所以前两年 OpenAI 的很多位明星学者都是来了又走。

前面提到的 Ian Goodfellow,从谷歌跳槽到 OpenAI 待了不到一年,就又回到了谷歌研究院。



同样是在 2017 年,三位机器人领域的学者也离开 OpenAI 独立创业。最离谱的是连 OpenAI 的赞助人之一,Elon Musk 马先生,也出来添乱。

2017 年 6 月,Andrej Karpathy,斯坦福大学李飞飞教授的博士生,在 OpenAI 工作了两年半之后被马斯克挖走,去特斯拉做了 AI 负责人领导自动驾驶的研发。

当然这是没法避免的,AI 领域的顶尖人才就那么多,特斯拉大举投入 AI 研究之后,也挤进了和 OpenAI 相同的赛道。

缺少融资渠道和股权激励的 OpenAI 这边研究进展缓慢,人才有意向出去寻找机会,Elon Musk 自然就近水楼台先得月了。

不过这儿就出现了明显的利益冲突,OpenAI 顶级人才出走,Elon Musk 作为董事会成员肯定知道,不招舍不得,招了又会被骂是挖墙脚。

所以 2018 年 2 月,OpenAI 宣布引入 Gabe Newell 等一众新赞助人的同时,也正式宣告了与 Elon Musk 和平分手。



紧接着,一个月之后,前面提到的 OpenAI 创始人之一,Y Combinator 的总裁 Sam Altman 辞掉总裁之职,成为了 OpenAI 的首任 CEO。

在新领导人的带领下,OpenAI 彻底改头换面,也迅速陷入了争议。

其中的两大争议,一个是从非营利公司到“半营利”公司的转型,另一个、就是和微软勾肩搭背换来的一百亿美元投资。

“钞能力”与ChatGPT的诞生

是的,你没有听错,这家在 2016 年所有研究项目加上运营经费不到四百万美元的小清新非营利公司,成了一家估值 290 亿美元的 AI 巨头。

怎么回事?OpenAI 的人设怎么突然就从普渡众生唐三藏换成了斗战胜佛孙悟空?

这就还是要从 OpenAI 的新 CEO,Sam Altman 说起。



这位企业家从小吃素食长大,但在商业上他绝对不是吃素的。

前面说 2015 年 OpenAI 成立的时候,他担任总裁的 Y Combinator 培养出来的初创企业,总市值已经超过了 650 亿美元。

到 2018 年他辞职那年,这些企业里最大的一百家,加起来总市值已经超过了一千亿美元。



Y Combinator 孵化新公司的方式就是指导它们如何烧钱,首先最明显的一个变化就是,OpenAI 搞研究出手变阔了。

2018 年 6 月,OpenAI 发布了关于刀塔 2 的新研究,这回也不缩手缩脚地 1v1 了,直接打 5v5 正式比赛,相应地就是研究成本的激增。

AI 的训练需要通过不断地对战来实现,而 5v5 AI 的训练难度明显比 1v1 高出一个数量级,为了加快速度,OpenAI 在许多台服务器上同时运行 5v5 对局,对 AI 进行并行训练。

具体来说,就是 12 万 8000 个 CPU 核心和 256 块 GPU 加速器。



在这样的设备规模上,一天就可以让 AI 累计相当于 180 年的游戏对局时间。到 2019 年 4 月,OpenAI 的机器人以 2 比 0 的成绩正式击败了刀塔 2 顶级战队 OG。

不过跟后来的成果比起来,这也只能算个小插曲,真正的大菜,还是 OpenAI 在语言模型方面的研究。

接下来就是今天最后一段的主角,大名鼎鼎的 GPT。

2018 年 6 月,OpenAI 发布了一篇关于通用语言模型的研究。虽然全文都没有出现过 GPT 这个名词,但其实它就是 GPT-1。

这篇文章提出了一个叫作 Generative Pre-traing 的概念,生成式预训练。

和传统的以任务为导向的训练方法不一样,生成式预训练不需要人工标注。

比如说你想训练一个可以做中英文翻译的 AI,你就需要提前准备好大量的中英文对照的句子给 AI 去学习,如果你想训练一个 AI 聊天机器人,你就需要准备大量的一问一答对话,这些都需要人工制作。

生成式预训练的思想就不一样了,我直接拿着人类已有的现成的文字资料去训练 AI。

怎么训练呢?我让 AI 根据上文去续写下文。

比如一句话,“张三每天都很认真地学习,老师们都夸他是好”,“好”字后面我让 AI 去写,如果 AI 写出来的是“学生”,这就和原文一样,那就判断正确了,要是不对,就继续训练它朝着对的方向去走。



这种训练方式的好处,就是研究人员不再需要花大量的资源去人工准备答案,每句话里下一个词就是上一段话的答案。

理论上人类现有的所有文字资料都可以作为训练数据直接喂给 AI 去学习,这就远远大于现有的任何人工制作的数据集。

这样就是在训练 AI 讲人话,让 AI 从浩如烟海的文本里、去学习遣词造句这件事本身。

OpenAI 的研究人员发现,这样训练出来的 AI 潜力极强。你用中英文对照的数据集去进一步训练它,它就能做到比现有任何的翻译 AI 都更准确。

你用问答对话数据集让它进一步学习,它就能成长为聊天 AI 里的顶级选手。

而提高它的能力所需要的,就是“钞能力”。

因为这个预训练过程不需要人工编写答案,所以人类现有的所有文字信息,小说、典籍、歌词、论坛里的回帖,甚至是软件代码,只要硬盘装得下,都可以喂给 AI 模型去学习。



不断地增大神经网络模型的参数量,不断地增加训练数据里的文本量,预训练模型的能力就会继续增长,用标注好的数据引导它去做各类具体任务的水平也会相应提升。

这种生成式预训练,与一种叫做变形器 Transformer 的模型结构相结合,就成了 Generative Pre-trained Transformer,取三个字母缩写,就是 GPT。

此后 2019 年的 GPT-2、2020 年的 GPT-3,核心迭代思路都是利用“钞能力”扩大模型规模,GPT-2 的参数总量是 15 亿,GPT-3 更是提高到了惊人的 1750 亿。

而截至今天,这条“钞能力”路线依然没有摸到天花板,还在往下继续。

由此衍生出的作画 AI DALL·E、聊天机器人 ChatGPT,让 OpenAI 真正成了全球闻名的明星 AI 企业。



可是这个“钞能力”是怎么说来就来的呢?这就又要说回 Elon Musk 出局之后、OpenAI 的首任 CEO Sam Altman。

虽说在 Y Combinator 带出来了一千亿美元的生意,但 Sam Altman 培养的主要都是硅谷的科技企业。

他从斯坦福辍学之前,学的也是计算机科学,与其说是个生意人,更像是技术人。

他在 OpenAI 拉起来的这条“钞能力”路线,起点也是一篇学术研究。新 CEO 上任两个月之后、GPT 这篇研究成果发布一个月之前,2018 年 5 月,OpenAI 发布了一项关于 AI 算力需求的研究,

结论是:接下来 AI 方面的算力需求会爆炸式增长,而且速度比摩尔定律快得多,3.4 个月就会翻一倍。

所以公司亟需提升“钞能力”。

理论基础奠定之后,Sam Altman 就开始了技术操作。

微软入局与ChatGPT的崛起

2019 年 3 月,OpenAI 成立了一家叫做 OpenAI LP 的有限合伙公司,受原来的非营利的 OpenAI 的董事会控制。

新加入的投资方要签署协议,同意把 OpenAI 的章程放在首位,同意原来那个非营利的 OpenAI 董事会拥有 OpenAI LP 的决策权。

但争议也随之而来,人们质疑大公司投资 OpenAI LP 之后,还是有很多办法可以吃掉大块利益、甚至直接独享研究成果。

质疑很快就有了更坚实的证据。

OpenAI LP 成立刚刚三个月,微软来了。从 2016 年起,微软就是 OpenAI 模型训练的云服务供应商,自然对 OpenAI 的研究实力和技术动向心知肚明。

OpenAI LP 成立之后,微软几乎是第一时间就投了 10 亿美元,当然其中有一部分是 Azure 云服务器的代金券。印度人还挺会算账的,投出去的钱还能再流回来。



如果纯看接下来 OpenAI 的研究进展和项目转化,双方的合作绝对是有积极意义的。

OpenAI 获得了“钞能力”,GPT-2、GPT-3 快速迭代升级,然后在微软云服务能力的支撑下,这些实验室里的强大模型又迅速落地、转化成了人人都能用上的应用服务,快速破圈。

比如 GPT-3 衍生出的作画 AI DALL·E 和 DALL·E 2。

不过如果和 22 年底爆炸式发展的 ChatGPT 相比,前面这些都是小巫见大巫。

ChatGPT 是基于 GPT-3.5,模型尺寸和 GPT-3 相比没有变化,但专门针对对话进行了加强、减少了不恰当回复,产生了魔法一样的效果。

人类历史上从来没有出现过增长速度这么快的应用产品。

达到一百万用户,推特用了两年,Facebook 花了十个月,ChatGPT 只用了五天。



两个月之后,ChatGPT 在全球收获了一亿用户,而当年同样算得上是爆火的 Tik Tok,花了九个月才达到这个里程碑。

来自各行各业的人和它聊天,用它写邮件、翻译文章,甚至是写代码、给代码查错。

在这种全球性的热潮、前所未有的增长中,ChatGPT 这种推导运算量不算小的 AI 竟然能维持相对实时的回复速度,是非常不可思议的。

微软算是结结实实地给自己的 Azure 云服务打了一波广告,再加上 Azure 近水楼台独占的 Azure OpenAI Service,接下来 Auzre 肯定会收获一大批新用户。

同时ChatGPT 本身更隐含着对谷歌搜索服务的正面冲击,2月7日微软宣布ChatGPT接入Bing后,谷歌股价累计已经暴跌20%。

据专家预计,微软将抢占大量搜索引擎市场份额。



实际上除去这些未来的隐性收益,微软从 OpenAI 获得的直接收入也已经相当可观。

GitHub Copilot 对学生和开源项目的维护人提供免费服务,但其他普通开发者订阅要付费,按月付是每月 10 美元,按年付是每年 100 美元。

除此之外,图片生成 AI DALL·E 2、被微软集成进了必应 Image Creator 和设计软件 Microsoft Designer,未来也都会产生直接收入。



至于爆火的 ChatGPT,也被微软集成进了协作软件 Teams 月费 10 美元的高级会员服务,可以快速生成会议总结、自动划分任务。

同时 ChatGPT 本身也推出了月费 20 美元的 ChatGPT Plus,可以优先连接服务器、优先获得回复、优先使用新特性。

作为 OpenAI LP 的投资人,这部分收益,微软也同样可以分一杯羹。

从这一个又一个营收点上来看,微软接下来的一百亿美元投资也一点都不亏,但这也让前面提到的的质疑更加有理有据。

对OpenAI资本化的质疑与展望

OpenAI 成立之初的目标,是确保强人工智能为全人类服务,因为一旦这种强大的智能体被任何个人或组织独占,就必然会导致贫富极化、社会动荡、最终导致灾难性后果。

最初的 OpenAI 就是想通过非营利的模式,在紧跟研究前沿的同时,把研究成果向全社会公开,确保强人工智能这项技术不被任何一方所垄断,这也是它名字里 Open 的含义。

可现在强人工智能还远在天边,但 GPT 的收益却已经源源不断地流进了微软一家的口袋里。

从 GPT-2 开始,OpenAI 在模型公开上明显放缓了脚步,从一次性公开、变成了按参数数量从小到大分阶段公开,OpenAI 给出的理由是担心安全性问题。

而到了 GPT-3,模型干脆不公开发布了。

OpenAI 只提供一个付费 API 接口,想使用的话就把输入发给 OpenAI,内部运算完再把结果返回来,至于里面的具体模型,无可奉告。

这次 OpenAI 给了三个理由:

第一条 直接开诚布公地说需要通过商业产品赚钱。

第二条 因为模型太大,即使公开了、普通开发者运行GPT-3 的性价比也很低。

第三条 基于安全性上的考虑,API 的形式可以更好地控制滥用问题。

这三条理由,前两条不拐弯抹角的态度还是值得肯定的,先让大家听得明明白白,才有获得理解和认同的可能。

而第三条的安全问题才是核心,也和 GPT-2 一脉相承。

实事求是地讲,OpenAI 对安全性的顾虑并不为过,现在已经有大量证据表明互联网中存在着相当比例的机器人。

我们看的文章,读的评论,刷到的消息,甚至那些以“小花”、“大壮”为主角的电影解说,还有语音听起来并不自然的很多短视频,都是由 AI 批量生产的内容。这个比例到底有多大无人知晓。

甚至有一种比较极端的理论认为网上机器人的比例早就超过真实人类,互联网已经死掉了。

实际用过 ChatGPT 的朋友可以想一想,假如成百万上千万的虚假账号、集体发送这种完全能以假乱真的社交内容,那会是多么恐怖的一个水军阵容。

如果这么多账号同时以千百种角度论证太阳是围着地球转的,而且互相点赞评论应和,热搜上全是支持的声音,那么再坚定的知识分子,多少也会犹豫一下。

那如果不是这么非黑即白的基础客观知识呢?如果是谁声音大谁就有理的公共议题讨论呢?



所以 OpenAI 的顾虑是很有道理的。

从实际结果来看,OpenAI 把研究成果商业化,并且把大部分利益输送给了微软一家巨头。虽然还算不上是正式违背了 OpenAI 自己订下的章程,但至少可以说实践中已经出现了不和谐的因素。

不过目前来看,OpenAI 依然举着章程,在商业与公益这条钢丝绳上竭力维持着平衡,三代 GPT 模型都发表了公开论文,ChatGPT、Copilot 这些商业化了的服务,也依然在提供免费版本。

我们今天讲了这么长的一段故事,有一件事是不言自明的。如果 OpenAI 不去沾染商业,那确实够纯粹,但理想也不可能有了。

如果没有微软的 10 亿、和接下来的 100 亿,那也就不会有风靡全球的 ChatGPT和未来的 GPT-4。

所以我的结论还是,有 OpenAI 这样一家公司,终归是比没有好。

虽然它的形象越来越不像最初那么完美,但它现在确实是那个带球冲到最前面的守门员,而且至少到目前为止,它依然在为“AI 应该服务于全人类”的理想而努力。

在一项既需要金钱又需要良心的事业上,能做到现在这一步,已经是一件很了不起的事了。

无论人类追求强人工智能的结局是什么,有这么一家公司曾经做过现在这些事,人类至少可以说、我们曾经努力过。