本文来自微信公众号:奇绩创坛 (ID:founders-first),题图来自:视觉中国


近期,朱珑博士受邀在奇绩创坛分享《科技创新:从科学家到创业者》。朱珑博士是依图科技创始人,人工智能科学家,加州大学洛杉矶分校统计学博士,曾在麻省理工学院人工智能实验室、纽约大学Courant研究所担任博士后研究员。


朱珑博士谈及了从企业、远见、战略、市场和产品这 5 个维度,看科研项目如何转化为创业公司,在商业化层面需要什么准备。朱珑博士认为,AI 新黄金时代已来临,即将开启物理材料构建智能体的篇章。


一、科技和创业


Enterprise = Vision | Strategy | Product × Market



第一部分是关于科技和创业。用一横一纵的图来描述企业。


纵轴 Vision | Strategy | Product 是不同时间跨度关心的事情,分别是远见看十年,战略看五年和产品看三年,从远到近,从模糊的正确到具体的执行。企业基本上以V | S | P 为轴,把长短期目标连接起来。


横轴展现企业以什么组织形式,其重心以产品×市场张成组织结构的底,具体结构取决于什么样的产品阵列以及服务什么样的客户,大体分为 ToB、ToC 市场。


横轴从右到左是由表及里的拆分,其中比较重要的是财务和人事。财务以数字化指标来指导企业运营,有几个值得关注的基础指标:收入、利润、现金流和增长率,用来衡量企业运营效率和产品竞争力。人事关心以什么样的组织薪酬结构匹配业务需求,在A轮B轮等不同发展阶段,定制不同KPI激励团队达到更好的财务指标。


最右侧也是最表层容易被感知的企业运营。最左侧最底层的是创始人的使命、价值观和方法论,支撑远见的达成。


创新路径有很大不确定性,作为CEO,相比于管理层,更需要的是兼容不确定性的能力(Be compatible with uncertainty)


远见是看大事件的独特视角


远见(Vision)是一个非常独特的看行业变革的视角,本质上只要有不同的角度,就会产生不同的远见。但远见要讨论 Big Thing 是什么。比如英伟达的联合创始人兼 CEO 黄仁勋(Jensen Huang)30年前对图形卡的展望,隔十年对图形卡和计算卡的演进关系是怎么构想的,对摩尔定律在不同时代与同行有什么独到的见解。


独到的远见非常珍贵,深刻的行业洞察有帮助,但很多时候还靠企业家的直觉和偏执,很难短期训练形成。远见指导创始人形成差异化的战略。


Strategy = Maximize ROI = Maximize Efficiency


商业领域非常关心战略。战略就是用方法论把模糊的远见具体成产品路径的过程。在早期,战略等同于产品策略,最开始要去找特定的小众市场,尽量在其中寻求高占有率,极度专注地通过产品获得差异化竞争力,且能够随着时间扩大,而不是衰减。


但值得特别注意,技术往往不是时间的朋友。从商业来讲,技术的价值不在于第一个的出现和领先,而是在于优势的持续性,最奢侈的是最后一个技术拥有者。


另外,人们可能容易混淆技术的整体社会价值和特定机构的商业价值,比如,AI 对社会的价值大不大,很大!那特定的公司在 AI 领域里分到的价值大不大?这其实是两个命题。技术必须和市场、商业化过程相结合,才能构建竞争力和壁垒。反之,科学家因为很难持续领先甚至垄断,往往拿着相对很低的报酬。


战略最重要的是预测市场规模。Scale is everything. 市场最好有规模效应,占有者容易形成对比优势。但容易忽略的是节奏。半导体领域有众所周知的摩尔定律,18 个月翻一倍。这个定律本身不是在谈一个物理规律, 其实是在谈行业的供需周期或者竞争规律。比如说手机、芯片、服务器、汽车都有各自不同的行业节奏。


很多创业团队从最快节奏的互联网领域来。但技术渗透到其他行业,像是制药,医疗,企业服务等行业,智能化的改造节奏没有那么快,但多年训练习惯是快节奏,与行业的慢节奏产生错位匹配。所以太快和太慢都会成为问题,节奏是战略中非常重要的一环。


创业要面对很多创新。但没有讨论风险的创新往往是假的。只有管理团队把风险计算清楚,才可能对创新的本质和边界有更好的把握。风险的计算是重要的基本技能,需要培训和练习。


快速的试错并以非常低成本试错是创新的重要方法,战略需要具体执行,就需要量化。有一个基础但很重要的量化概念叫投入产出比 ROI。美团非常好的把战略等价于在某一时空下最大化 ROI。凭借商业直觉衍生出的看似抽象的战略变得可量化,可推导,可比较,可验证。但战略可选择的空间强依赖于企业自身的组织能力,需要有耐心成长组织能力等待与之匹配的战略窗口。


商业领域另一个解读战略的经典视角:唯一有效的企业战略就是提高经营效率。效率是用利润率加增长率这样的财务数字来量化企业的竞争力,也叫效率公式:效率=利润率+增长率。效率指数 40% 是值得参考的基线准则,比如说追求高增长率,可以的配比是利润率 -20% + 增长率 60%,或者平衡一些 20%+20%。


总之,两项相加作为指数度量企业竞争力,这在财务数字上把企业的宏观战略连接到微观运营。效率公式在数学本质上和ROI相同,例如保持 20% 的利润率 6 年约等于 ROI=3。利润率 20% 或 ROI=3 恰好都是行业巨头业务决策的指导标准。


利润率可以根据产品毛利率减去运营成本计算获得。毛利率是非常重要的度量产品竞争力的指标。虽然不同行业的产品会落在不同的毛利率区间,软件、服务、系统、硬件,芯片等产品形态有些差异,


但总的来说,60% 毛利率是全球市场很好的经验指导值,行业第一的毛利率大概都会在此之上,例如微软、谷歌、苹果、英伟达、英特尔等。如果是比全球市场小些的中国市场,指导值相应调低到 50%。第二名会相差 10%。再往下接近 30% 就是一个产品公司能够盈利的底线。毛利率下降也意味着竞争加剧了。生产制造占比比较重的行业,例如汽车,毛利率会显著低很多,这也说明该市场竞争激烈,产品本身没有很高的壁垒抵挡创新者进入。


最近科技创业的商业化受到广泛关注。分析一下毛利率,就可以理解为什么市场对很多技术企业的担心和质疑,因为很多产品并没有体现出差异化的竞争力。当然,从另一角度看,技术找到市场规模化的支撑是艰辛的历程,也需要更多的耐心和理性的支持。


Market = SaaS | PaaS | IaaS x Cloud | Edge


创业很重要的一个环节是市场产品匹配(Product-market-fit)越是创新的商业模式或产品品类,意味着刚开始找不到客户。根据上下文的语境,分析行业格局有助于帮助产品定位。


以 IT 这个大行业为例,拆解格局,仍然生成一张图,分为横轴和纵轴,横轴左侧是云中心,右侧是边缘端。有代表性的公司的产品形态以及产品所构成的产业链条,从上到下依次从偏软的应用服务到操作系统,到偏硬的服务器、芯片,最后到生产制造。


整个 IT 行业演化了几十年,大概遵循的就是横轴和纵轴或分裂或整合的过程。合纵连横的历史中,一拆解开,就会看到横向的有云和端的竞争,纵向的有软和硬的竞争,内部有操作系统的竞争,有芯片架构的竞争,有计算机控制权的竞争,还有垂直整合系统和开放平台的模式竞争。


总的来说,机会往往出现在创新的重心转移(Gravity of innovation shifts)的时候。创始人要从产业格局图分析裂变和整合的规律,预测重大时点和条件,指导市场切入的时机和形式。


产品是权衡性能和成本的艺术


当创始人给定一个行业市场后,非常重要的就是产品定位和路线。


产品策略图用两个轴展示两个重要维度:横轴是性能即先进性,纵轴是成本。根据产品定价和成本即可计算毛利率,反之亦然。红线是用户能够接受的最低成本,这是一个非常重要商业化的指导线。


越过这条红线的右下区间,就是可盈利区间。最右下的这一条绿线,是科学原理指导下极致成本的底线,也可以称为第一性原理线,类似 Elon Musk 谈到的新能源车、SpaceX 火箭发射等。


红线和绿线之间的金线是商业历史大概率会发生的线。金线的右下区间就是世界超一流公司的高毛利率区间,上文讲的毛利率是 60% 指导线,金线上方和红线中间是盈利区,但比 60% 毛利率低一点的频谱。


三类产品模式——A、B、C,分别对应不同产品策略。其中 A 是最成功的主流模式,表征是极强的产品功力支撑着稳健的商业盈利能力,代表产品有苹果的手机,英伟达的图形计算卡,特斯拉的新能源车。路线就是从 A 到 A’ 这个过程,用极高的技术实力贴近工程极限做出超高性价比产品,用户能接受,商业上也很赚钱。


B 是划时代的颠覆式创新者的早期历程,例如苹果、英伟达、特斯拉,还有当前的 Waymo,追求极度超前的性能区间而先忽略成本约束,后续目标是走进 B’ 的区间。从用户不能接受到用户接受,再转入高利润的A区间。B 模式显然风险极高,原因来自该区间蓝线极其陡峭的研发成本曲线以及不可预见性,需要极高的前瞻性、资源整合能力和偏执狂的毅力。B 是极难模式,很容易进入生死边缘,最考验创新者的勇气。正因为此,它是划时代的,能重复讲述激荡人心的英雄故事。


大部分的产品在哪个区间呢?就是 C 区间,技术不是最先进的,但整体运营能力很强,达到很不错的盈利能力。C 相比 A,产品性能因为自身能力,策略性的选择落后一些,但因为技术更可预见,该区间蓝线对应的研发风险和成本相比 A 模式也大大降低。C 持续增长的市场占有转换成研发投入也能侵蚀并转入 A 区间。


台积电是全球最大的半导体制造商,这家公司除了是无厂半导体模式(编者注:Fabless manufacturing,指台积电只从事硬件芯片的电路设计和销售,产品交由晶圆代工厂制造)的远见者,更是靠扎实的运营积累从 C 向 A 突破的极佳案例。华为是另一个在商业史上极其成功,且从 C 迁跃到 A 的范例,能推广应用到多个行业。


创业团队可以根据这样的产品路线图谱,分析各自站位,路线以及动态博弈,推演并制定产品应对策略。


二、AI 新黄金时代


IT 时代变迁



  • 1970~1990年 小型机时代,个人无感。


  • 1985~2005年 PC时代,让个人拥有十核算力在桌面——High frequency&multicore;


  • 1995~2015年 互联时代,让个人拥有无穷数据在云间——Search;


  • 2000~2020年 移动时代,让个人拥有百核算力在掌间——Touch Screen&Battery;


  • 2005~2025年 云时代,让个人拥有万核算力在云间——Distributed Computing;


  • 2015~2035年 智能时代,让个人拥有智能体在身边——Intelligent Computing;


  • 2025~2050年 梦境时代,让个人拥有真实梦幻——Simulation Computing……


  • 眼前的虚拟世界是过去真实世界的映射。


纵观 50 年,算力跃迁是信息革命的内在驱动力。当前正处于 AI 的新黄金时代,将开启物理材料构建智能体的篇章!


十年序曲


Al过去十年大概分三个阶段——


从 2012~2015 年处于起步阶段。以深度学习在对大规模数据上的性能结果被工业界所认可作为起点, 会下围棋的 AlphaGo 成为全社会讨论的热点。这是一个重要里程碑。


从 2016~2018 年为热点时期。AI 在中国被列为国家战略,在各行业场景的应用蓬勃发展。


从 2019~2021 年,AI 为代表的高科技进入核心竞争领域。恰好在同一时期,也出现了对 AI 行业的质疑,无论技术商业化探索过程的曲折,还是市场合理的挑剔,在国际大背景下,AI 技术创业背负了超越一般商业化挑战的艰辛。


创新者困境往往可以用四象限刻画。右上角是勇敢且执着的创新者;右下角是自以为狮子的猫;左上角是自我怀疑者;左下角是泡沫中自我否定的沮丧心态。


技术和市场的发展周期在不同阶段,节奏上和行业内外的预期有巨大分歧时,总会分出这四象限人格。越是热门行业,创始人越有极端的表现。


新黄金时代



AI 发展了十年,当市场产生疑问时,让我们来看看世界前沿的科学家和从业者到底在思考什么。


借用三位大师的名言描述一下我对未来十年的展望。


第一位是数学家 David Mumford,1974年的菲尔兹奖得主,曾是美国总统顾问。2020 年他写了一篇文章,《Al模型和人类大脑结构惊人的相似》,力挺以新一代 Transformer 为主的算法架构。


第二位是计算机架构理论学家 David Patterson,图灵奖获得者,RISC 开创者,也是 Google TPU 的设计者。同年,他为 AI 专门写了一篇文章《计算机架构的新黄金时代》。


第三位是极负盛名的工程师 Jim Keller,曾是英特尔、苹果、AMD的主流芯片以及特斯拉自动驾驶芯片的架构师。他用职业生涯的切换来证明:“这是 AI 新时代的开启,变革大大超过移动和互联的时代。”


世界最前沿的大师一致相信 Transformer 能把 Al 带向新篇章。两年来,各个领域巨大进展也验证了他们的展望。比较热门的有 OpenAI 的 GPT-3 的成果,大概是由 1300 亿个参数构成的大模型。GPT-4 在此基础上可能再翻 200 到 500 倍,有理由想象,生物和化学的奥赛竞赛题 Al 基本能做了,下一个攻克的难题是数学奥赛竞赛。最近 DeepMind 关于矩阵数学计算的进展,都是令人振奋的。


新时代 Al 的模型会超越人类大脑(大脑是 20 来瓦的能量消耗),不受这么严格的能量约束,通过超大规模模型和计算,颠覆智能目前可以达到的边界。


可能不会短期一两年之内有举世瞩目的产品,但我们预测,以十年为周期,会是翻天覆地的变化,深刻影响各行业以及各科学领域,包括大家比较熟悉的 DeepMind 做的蛋白质三维结构预测(AlphaFold),物理的混沌系统,数学的偏微分方程等等,都会有重大进展,甚至超过深度学习的开创者 Geoff Hinton 本身的想象。


算力变革核心在于密度


AI 新变革的技术核心在于“算力密度”。在大数据时代,数据是量大,云计算是计算量大,但是密度都不大。新Al的特点是高密度的运算和传输,超过过去百倍。IT 行业 40 年的变迁,就是由算力的密度产生巨大的变化,引导着互联、移动、云以及现在的智能产生巨变。以下有一个不算严谨的算力分类——CPU、GPU 和 AI,分别对应单位指令下的计算密度或是单位数据下计算密度百倍级的频谱划分。新的计算体系结构将围绕着算力密度的演变来设计。


学习范式的跃迁


新 AI 是一个学习范式的变迁。传统 AI,即机器学习时代,以规则驱动,其高级形态是人类专家设计的模型。新 Al 的变革就是从这种规则驱动或模型驱动变成了大数据驱动,人把超大规模的数据喂给算法。


当前的趋势是进入到基于大模型的大算力驱动。单个模型的训练需要上亿美金的算力成本,极大地拉开模型的规模以及表示能力。


再往后展望,是以大算力为基础的大仿真驱动。数据不再局限于物理世界时空约束,而是仿真数据,就是仿真和学习训练交替进行的一个自学习系统,进入全新的、无穷的虚拟和真实物理世界边界模糊的境界,极大提升学习效率,催生超级巨无霸的智能体。


三、现场 QA 交流


Q:过去几年,Al特别火,我很好奇 AI 公司怎样跟友商竞争?从外部的感觉来说,视觉这个赛道很卷,做的好像都差不多,现在都在做智慧城市。刚才您也说过,毛利比较低,那就说明了产品的差异化不大。在这种竞争极大的情况下,怎样去找市场,或打出差异化,怎样去定战略?


A:首先,不是所有 AI 公司的毛利率都很低,各家差异是很大的。假定智慧城市是热门的应用市场,市场传闻跟实际差别是什么呢?往往真实的市场里有很典型的竞争者,只是他们不被外界当作比较对象而已。


按照上图的行业格局图,对应的有世界著名的 ICT 通讯和计算公司华为,IoT 端侧智能公司海康,云公司阿里,再往上才是热门的 AI 公司、各类行业系统应用公司以及集成商。他们以各自产品矩阵参与竞争,虽然擅长的产品供给不太一样,但或多或少都有AI能力。


首要的竞争还是巨头间的竞争,即海康和华为、阿里的竞争。创新势力需要找到合适的定位参与。回到行业图,我们需要理解是什么方向在竞争,比如有横向的,是端侧为主还是云为主的演进路线的竞争;有纵向的,那是 AI、云、基础硬件的主导价值竞争。如果想打出差异化,需要按图谱上下文分析各自的优势,这方面有很多行业史上的“合纵连横”案例供参考。


Q:您提到,未来会出现超越人类智能的人造智慧体。从您现在目前的思考来看,怎么样在法律、社会,让人类来接纳这样一个东西?或者说,假设直接立法不允许这方面的工作,类似于我们不能做人的基因编辑,您会怎么看这个问题。


A:在顶级学术圈都出现了重大的贫富差距,技术大阶跃设立了一个排他性门槛。假设这个趋势成立,什么样的环境才能应对这个挑战呢?治理的底层前提有个主导权问题。打个比方,倚天剑屠龙刀应该放在哪里?放在少林安全吗?少林有了倚天剑还能克制不作恶吗?这更需要政治和法治专家来解答。


Q:基于芯片的制造工艺已经差不多接近物理极限了,摩尔定律受到了挑战。因为一个是量子的碎穿效应,一个是受硅的原子大小限制,这个会怎样影响 Al 算力的增长,我们可以怎么克服这个问题?


A:大师 Jim Keller 在新创业公司做的事情给了很好的解法,不走英伟达 GPU 的计算卡路线,也不只是享受制程演进的红利,而是基于强互联技术的一种可扩展的计算形态,例如上百万计算核心形成一个超级计算装置。这些架构上的变革对应着算法侧超大模型训练这一全新形态。特斯拉的Dojo系统也是很好的实践。前沿进展是令人期待的。


Q:我们是做量子加密技术的,直观上认为我们防的主要是量子计算机的威胁,但是我们认为可能 Al 模型可以更快地把现有的密码学体系攻破。AlphaFold 没出现之前,搞量子计算的都认为蛋白质折叠更应该是量子计算机的“菜”,但是 AlphaFold 把它解决得很好了。所以我非常关心,从 Al 的视角来看,后面还有多少路可以走,特别是 AI 可能会怎么和量子计算机竞争。


A:量子计算我不是专家,不敢去比较。但分享一个不同于技术层面的感悟:新一代AI是一个超级无限大的大模型,完成了一个类似于条件反射的机理,条件反射意味着大脑没有思考,意味着是没有意识的智能体!深度学习


这个感悟给人非常大的认知震撼。科学家一直有好奇心,研究大脑、智慧和意识。意识是确切地知道看见了什么, 感受到了什么, 思考着什么。但超级智慧的新物种只是应激性的反应,且在很多领域做出了超越人类智能的反应。在哲学层面上,这个解读让人 shock。基于这个感悟,瞬间理解了最前沿的 DeepMind CEO 的访谈中提到“大脑只是客观世界的一种仿真”


原来觉得这是挺玄幻的描述,现在理解起来是如此朴素。大脑是一种几十瓦能量约束下的一种仿真。新 AI 是一个能量约束放宽千倍的,另一种对客观世界的仿真。而且在很多领域,大部分人类的经验、直觉和创造开始显得没有价值,对人类意义提出根本的挑战。


Q:现在大家会觉得说这个模型变得越来越大之后,会有这种智能的涌现。现在看到的趋势会有 Transformer 架构一统天下的感觉。对于我们来说或者是对于小机构来说,不是一个非常好的现象。可以训练万亿数据参数的 model,全世界有几家呢?如果在这种情况下,国内外最顶级的机构该怎么样发展Al呢?


A:这是一个现实的挑战,大部分学术圈对比 DeepMind 和 OpenAI 的进展,算法模型上和数学上的调整在结果层面都不够显著。从商业现实看,小公司不适合在最前沿探索。像 DeepMind 和 OpenAI 都没有完成商业化证明,是非典型的“另类”存在。出路可能也得像他们的创立渊源一样,有中国的 Billionaire 站出来捐助最前沿的探索。


Q:AI 从业者对 Al 都有很强的热情,我自己也喜欢看很多科幻片。如果二十年之后,无论是人工智能还是机器人,都没有走进每个人的生活,我觉得技术是停止进步的。假设如果您现在是 OpenAI CEO 或者是 Google 的老大,不缺钱不缺算力的情况下,我想知道就是您怎么看十年乃至二十年之后的 Al,比方说它跟人的交互会达到一个什么样的状态。


A:OpenAI 放弃的一个方向就是机器人,因为很难具备大模型需要的大数据的研究条件,但我觉得最简化的智能形态需要 Motor+Vision。生命之所以能演化出智能,很重要的条件是会”动“,类似植物和动物之间的区别,不管智能体的智能水平高低,都有与外界的交互能力。


特斯拉其实已经给出了智能研究的路线图,先以自动驾驶的汽车为初级智能体形态,然后下一代智能体是直立行走的人行机器人。虽然比汽车自动驾驶更难很多,但相信他们基于最前沿的进展做了充分考虑后的节奏布局,未来五年会有巨大的进展。


本文来自微信公众号:奇绩创坛 (ID:founders-first)