就在今天,OpenAI联创Karpathy突然官宣离职!



大家好,没错,我昨天刚从OpenAI离职。


首先要澄清的是,这并非因为任何特殊的事件、问题或纷争导致(不过,那些阴谋论真的很有趣,欢迎大家继续提出)


实际上,在OpenAI度过的最后一年真的很精彩——团队非常出色,同事们也非常棒,而且未来的发展路线图也充满了激动人心的可能,我相信我们都有很多值得期待的事情。


我目前的计划是专注于我的个人项目,看看能碰撞出什么火花。对那些一直关注我的人来说,或许能猜到我接下来可能会做些什么。


据Information独家报道称,Karpathy正开发一个全新的“AI助手”,而且与OpenAI的研究主管Bob McGrew保持着密切合作。


虽然ChatGPT受到许多人的青睐,但OpenAI还希望推出一款可以自动执行复杂任务的AI,比如填写费用报告,并将其输入会计软件。


Karpathy曾在特斯拉担任AI高级总监、自动驾驶负责人,并于2022年7月宣布离职。5年以来,他主要负责Autopilot半自动驾驶软件的研发工作。


紧接着在2023年2月,他再次官宣“重新加入OpenAI”。



而现在,整整一年后,他再次官宣离开了OpenAI。


OpenAI的发言人Kayla Wood在一份声明中表示:“Andrej离开是为了追求个人项目。我们对他的贡献表示深深的感激,并祝福他未来一切顺利。”目前,他的工作已经交由一位与他有着密切合作的资深研究员接手。


自去年OpenAI董事会解雇Sam Altman之后,便引发了数名高层员工辞职。在董事会撤回其决定后,这些员工随Altman一起返回了公司。


现在,Karpathy成为OpenAI首位离职的核心人物。


那么,他所说的专注个人项目,会是什么呢?


一、AI智能体?投身AI教育?


大概在去年7月份的时候,Karpathy在一个线下分享活动中,就曾强调了AI智能体的前景。


当他刚开始在OpenAI工作时(2016年左右,业界潮流就是研究如何用强化学习的方法来改进AI智能体。


比如,很多项目都在基于类似雅达利游戏来制作AI玩家。


Karpathy想做的,则是一个适用范围更广泛的产品。


不过受制于当时的技术,效果并不理想,于是他和OpenAI就改变了方向,开始做大语言模型了。


如今,AI智能体重新成为了一个非常有前途的方向


最简单的例子就是,现在没有人再像2016年那样用强化学习的方法来研究AI智能体了。


而从OpenAI离职,可能是他重新看到了现在的技术突破,可能给AI智能体带来的全新机会。


有趣的是,Karpathy近段时间讨论最多的话题,除了Vision Pro之外,就是一篇关于“学习”的长文。


在这篇文章中,他深度探讨了什么是有价值的学习,包括斯坦福HAI中心主任manning等人都进行了转发。


加上他Youtube频道中的内容几乎都是在教网友如何理解大模型和相关技术的内容。


所以他之后的内容也许和AI教育有非常大的联系。



二、OpenAI硬核网红


在他的个人主页上,自制了一个工作经历时间线,可以清楚地看到从2017年成为OpenAI联创之后,加入特斯拉,再回归OpenAI的所有过程。



过去一年来,离职特斯拉的Karpathy通过博客、发帖、讲课等方式,逐渐在社交媒体上成为网红。



他还在自己的YouTube平台上发布了多种学习课程,目前已上线了8个视频。


就在他官宣离职的评论下方,网友关心道,是不是意味着未来有更多的YouTube视频上线?


Karpathy本人表示:“两天前我已经开始制作下一期视频了”!



著名AI机器学习研究员Sebastian同样称,“听起来肯定还有更多的教育内容正在筹备中”。



看来离职后的Karpathy,将会有大把的时间更新视频了。


此外,在社交平台上,Karpathy本人也经常会关注一些热点研究,并发表自己的评论,有时也会提出自己的观点。


比如,他曾把大模型比作成一种操作系统,因其能检索文件、编写代码、运行程序,以及理解音频、图像和人类指令。



再比如,提出对“语言模型幻觉问题”的看法等等。



三、李飞飞高徒、“用爱发电”的技术大牛


不仅是技术网红,Andrej Karpathy更是一个不折不扣的技术大牛。


他先是在2009年于多伦多大学获得计算机科学和物理学双专业学士学位,而后在2011年于英属哥伦比亚大学获得硕士学位,研究的是物理模拟数字的控制器。



在斯坦福读博的时候,Karpathy和导师李飞飞共同研究卷积/递归神经网络架构及其在计算机视觉、自然语言处理及其交叉领域的应用。


师徒二人还一起设计了斯坦福大学的视觉识别卷积神经网络的新课(CS231n),Karpathy亲自担任首任主讲。


而这正是斯坦福开设的第一门深度学习课程!



学生人数也从2015年的150名增长到2016年的330名,再到2017年的750名。如今,斯坦福大学的CS231n已经成为深度学习初学者,尤其是CV方向的初学者必看的一门基础课。


除了大牛李飞飞的“明星效应”,Karpathy从课程设计到主讲,亲力亲为,贡献良多。



上学期间,他还跑去谷歌实习了——两次,还是出国的那种,在谷歌参与了深度学习与计算机视觉项目。



2015年,他又去DeepMind的深度强化学习团队实习了一波。


毕业之后,Karpathy于2016年入职OpenAI并担任研究科学家,负责计算机视觉、生成建模和强化学习方面的深度学习。


“斯坦福博士生、李飞飞高徒、前OpenAI研究员及创始人之一”,这些头衔也让他在硅谷声名鹊起。



果然,在OpenAI只干了一年半,他就被马斯克挖去了特斯拉,接替苹果前高管Chris Lattner,担任特斯拉人工智能和自动驾驶视觉总监(Director of AI and Autopilot Vision)



由于Karpathy本人十分喜欢研究神经网络,他在闲暇之余写了不少技术博客,并在Javascript中开发了多个深度学习库(如ConvNetJS、RecurrentJS、REINFORCEjs、t-sneJS)


甚至,还被戏称为ImageNet的“人肉参考”。



此外,他一有时间就会去维护自己“用爱发电”的arxiv-sanity,一个可以在过去6年里搜索和整理近10万篇关于机器学习arXiv论文的网站。



参考资料:

https://www.theinformation.com/articles/openai-researcher-andrej-karpathy-departs?rc=epv9gi


本文来自微信公众号:新智元 (ID:AI_era),作者:新智元