ChatGPT和AI大模型，下一个时代的跳板？| 502回顾 - 葱头胖友圈

作者｜雨林下

出品｜虎嗅智库

最近，号称史上最强AI对话系统的ChatGPT为广大网友带来了诸多欢乐，这是AI通用大模型在自然语言处理（NLP）领域的一次阶段性发展的直观体现。

12月14日，虎嗅智库举办了502线上同行主题研讨活动，来自商汤集团高级研究总监刘宇、北京智源人工智能研究院成果转化部向其奇、电子科技大学计算机科学与工程学院教授顾实、中科闻歌产研中心副总经理王璋盛、新加坡国立大学校长青年教授兼潞晨科技创始人尤洋、边无际联合创始人秦小禹、华兴资本董事奚星捷针对ChatGPT和AI大模型进行了行业前沿观点分享。

以下为各位嘉宾的观点摘要：

ChatGPT预示着新的商业机会涌现？

· 梳理GPT的发展，大致可分成三个阶段：第一个阶段是2018年以前，绝大多数的学术机构和团队的重心在研究模型结构上；第二个阶段是2018年到2021年，从GPT1开始不断迭代增大参数量，训练题量、概念定义出现了新的变化，很多小机构已经承受不了训练这么大的模型了；第三个阶段就是现在的ChatGPT，属于模型的继续优化演变。相比于前一代GPT3，纯技术上没有本质区别，更多是数据资源和交互、标注工程上的改进。它目前还缺少一些常识，需要大量标注样本继续喂养。

· ChatGPT是否会引领现有的搜索引擎产生颠覆？从商业视角来看，搜索引擎做的更多是信息搜索、集合、匹配，强项在于快速把结果检索呈现给用户。ChatGPT的核心能力是对整体文字信息的理解和创造，但受制于本身的信息时效性问题，很多时候对一些新闻无法在数据库里体现，所以两者还有挺大差异。而且大量搜索的背后也是一个商业化考量，需要支持高并发，且能实时反馈信息，但大模型在效率和成本上还没取得平衡，达不到规模使用要求。

· 下一步的商业机会，它在更涉及语义理解的领域，比如文字翻译，会比原来传统的小模型更有优势，相较过去逐字逐句的硬翻，它可以先对整段话形成理解再翻成对应语言。再比如，在内容生成方面，图像，视频的生成能力未来可能取代一部分相对中低端的密集型人力，在效率和成本上有更好的表现，海外已经有像 stability AI这样很火的先例，这是今后对大模型的商业化期待。

· ChatGPT更重要的是为投资人带来了对AI的信心。拿医疗领域应用来说，辅助端塑疗法过去几年并没有看到特别革新的项目，都是在原有状态下做迭代内卷，类似ChatGPT这些产品的出现让人耳目一新。

AI未来是否可能突破人脑结构限制？

· ChatGPT虽然在 AI学习过程中加入了人类的反馈系统，但它还不具备情感和心理学的表达能力，这也是机器跟人的边界。

但如果能从神经学上非常明确的揭示情感的生成机制及认知规律，其实赋予机器情感并没有本质难度，不过，目前瓶颈卡在神经科学的研究上，人们还无法理解和揭示自己的情感情绪以及高级复杂认知功能的机理。

· 还有另一条路，就是我们能否去设计一些不一定是局限于人类表达情感的一一种范式，让机器算法，借助这种笼统称之为情感的机制，去辅助它的学习。就是说，我们把具体的情感抽象成一个模型层次，去塑造学习方式，这一块的探索目前还是比较少。

· 关于突破人脑结构限制的可能性，如果只是从AI它能够有自己的全新理解，比如对相同问题，人的理解跟它的理解不一样，甚至它比人类更强，这在10年前的人脸识别，5年前的AlphaG就已经发生了。

人类的学习方式也是通过从出生对外界的各种知识，听觉、触觉、视觉去进行所谓的无监督学习，最终对世界形成认知建模，AI本质上也是这样。毕竟人类的机理都没有完全被生物学界理解，AI的能力每年也在不断的提升，所以未来会怎么样？是一个开放的问题。

AI大模型在具体场景下的多样价值

· AI大模型相当于是通过积累大量知识，最后形成的一个有泛化知识的个体。它跟原来传统意义上的小模型之间的差异，就相当于一个经过了大量通用题库训练的大学生，和一个只在特定专业受训练的技校生的差异。

放眼整个AI大模型，不论是整体创建还是训练的成本都非常高，也是为什么国内外都是以研究院机构在主导技术推进。

· 自然语言处理（NLP）和计算机视觉（CV）这两块大模型是细分领域发展得最快的，技术上是因为相比其他情感或者逻辑推理等功能，结构更简单；应用上的原因主要是因为数据相对充分和廉价易得，大量的视频和文字资源可以近乎零成本扒取，另外也有直接可以应用的落地前景，比如对话系统推进系统、CV安防、智能产品的图像识别。

· 大模型的整体价值在于解决场景碎片化，在具体应用场景中，传媒影视用的比较多，做动漫游戏背景需要大量的素材，除了少部分核心的原画需要插画师创作，很多篇幅都可以通过机器生成；在科研领域，它也有可能驱动产生全新的研究范式，像生命科学以前基本上是靠纯手工的方法去做实验，现在结合大模型，演变出了干湿结合的新实验方法；智慧工业场景或者偏柔性的产线里也会产生各式任务和各种指标，像生产线传送带的温度、速度、压力以及生产数据本身，都可以通过大模型分析数据趋势，修正产线缺漏。

· 在产业端，大模型更像一种基础设施，达到一定规模后，它的重置成本就会非常高，如果最终只剩下少数几家取得优势地位的大模型供应商，并且在大多数行业上又有较好牵引力的话，那么就可能出现我们设想中的“AI超级大脑”。

· 眼下当务之急还是要找到更多行业结合点，让大家首先知道有大模型这种工具来尝试，现在陆陆续续有传统行业和互联网团队在积极对接了解大模型，这是好的信号。

... ...

活动尾声，嘉宾还与近百位线上参会观众进行了热烈互动，并在“中国是否有可能诞生自己的OPEN AI公司？” “NLP大模型的通用能力是否会对特定场景的小模型公司造成冲击？” “模型用到的训练数据的所有权后期会不会有争议？” “web3.0和大模型有结合点吗？”等问题的讨论中圆满结束了本次502线上同行研讨活动。

虎嗅智库致力于推动产业数字化，为参与这个进程的中国企业高管、政府相关决策服务，提供研究洞察报告、产业调研、数据库及线上线下活动，更多精彩欢迎大家多多关注。