清华大学教授沈阳最近又“火”了。

不久前第五届江苏青年科普科幻作品大赛公布获奖名单,署名“@硅禅”的《机忆之地》获得二等奖。

@硅禅和《机忆之地》的由来不一般:作为国内最早开始元宇宙研究的学者之一,沈阳教授指定了卡夫卡风格,经过66次对话,由AI输出了约43061个字符,他再从中复制出5915个字符,完成了该作的参赛版本——@硅禅这个名字,也是AI起的。

这可能是最与众不同的二等奖:第一次,AICG(生成式人工智能)作品和人类作品一起参赛并获奖。



图片转引自现代快报

今年科技届最大的“搅局者”当属大模型。

一方面,ChatGPT的大火,让人们意识到AI技术进步带来的颠覆性,各类通用大模型和行业大模型如雨后春笋般涌现;另外一方面,AIGC(生成式人工智能)正在成为越来越多产品的“标配”,它们正融入到信息搜索、处理和输出的各个环节,走向生活的方方面面。

关于国内外大模型能力的讨论,也从来没有停止过。

是抓模型研发的基础能力,还是抓贴合实战的应用落地,中国大模型行业也存在着“城市包围农村”和“农村包围城市”的路径之分。不少人认为,中国大模型应该扬长不避短:大模型底座能力要奋起直追,但将大模型和智能搜索、智能制造和特色文旅产品相结合,同样有爆发力。

AI作者,混入人类之中

在此前的一场活动上,沈阳教授向观察者网等媒体分享了《机忆之地》的创作历程。

“之前,我用人工智能写了一篇小说的开头,发到朋友圈。有记者就留言建议我说:沈老师,可以用这个混在人类小说大赛中投稿,看看能不能拿奖——而且让评委察觉不到?”据沈阳透露,小说甚至没有人为设定大纲,从大纲、正文、配图,连笔名都是AI自己生成的。

据《扬子晚报》此前报道,《机忆之地》是江苏省科普作家协会科幻专委会主任付昌义邀请沈阳来投稿的。两人相识,该大赛征稿通知也没有备注不允许使用AI。付昌义回忆称,六位评委中有三位投票同意推荐这篇小说,但还是有人发现了异样,“有一位在评选完了之后跟我说,感觉这篇文章有点像AI写的,读起来感觉还是有差距”。

在付昌义看来,这篇作品还有进步的空间。“第一个版本出来的时候我就看了,感觉不像个小说,像剧本大纲,后来做了修改要比第一稿好多了,但还是有欠缺的,只能说达到了高中生或大学一年级学生初写作的状态,技巧性等方面和真正的作家还是有差距的。”



ChatGPT刚问世时,就曾展示过小说创作的能力 2023年4月测试截图

AI写小说并获奖,会带来什么影响?

“AI创作文学作品,我想现在只能说是一个起点。”在付昌义看来,现在还很难说这一次AI创作作品的获奖会对未来产生怎样的影响。”付昌义称,“AI的进步也是促进我们人类创新,人类相较于AI最大的优势在于人类有着更强大的创新能力、好奇心和想象力,这也许会成为一个开端,未来会怎样我们保持观望状态。”

有趣的是,人们很久以前就设想过,会有新的“执笔者”出现。

例如关于无限猴子定理(Infinite monkey theorem)的讨论——无限次在打字机上随意敲击键盘,最终能打出任何作品——甚至是莎翁全集。这个想法可以追溯到1913年,法国数学家埃米尔·博雷尔关于概率学的讨论。后来有人写了一个“猴子模拟器”,专门用来模拟这件事发生的概率。

这个概率相当小。



“猴子模拟器”屏幕截图

包括小写字母(26个),空格、逗号、句号、分号和连字符在内,“猴子模拟器”能够随机生成31种字符。不考虑区分字母大小写和特殊标点的情况,那么首个生成字符匹配原文的概率是1/31,头两个字符都匹配的概率是1/961(31x31)……以此类推,莎翁全集共计约500万个字符,那么猴子敲出莎翁全集的概率是1/31^5000000。

《Math Plus Magazine》刊文计算过:拿中彩票做类比,中头奖的概率约1/14000000≈10^7.1,那么猴子敲出莎翁全集的概率,相当于连续赢得约100万个彩票头奖——假设每周都中彩票头奖,差不多要连着中两万年;用时间来计算,如果模拟器生成字符的速度为每秒50个,且不停地生成字符,那么预计约132亿年后,人类将有99%把握读到莎翁全集——可宇宙诞生至今也不过138亿年。

不仅仅是复制和重现,现在的人工智能已经展现出了一定的创作能力。技术进步,如今似乎正在以另外一种方式,模糊着文学和技术的边界。当ChatGPT等大模型通过图灵测试,人类的生活将面临真正意义上的重构。

从1到100:在应用中发展大模型

熟悉沈阳教授的人,会发现他最近越来越“宅”了。

观察者网上一次见到沈阳教授,还是在10月的一个活动现场。沈阳最近不太喜欢跟人聊天,反倒是每天要跟AI聊4个小时——他甚至还会跟AI聊未来,聊GPT5、GPT6、GPT7未来会怎么样。

不过,沈阳也长期保持着一种观点:人工智能的基本原理是概率模型,概率模型一定会犯错误。

在沈阳看来,现在大模型的错误主要分几类:

一类是AI幻觉,“一本正经地胡说八道”;一类是学习不够,形成了知识盲区,比如问GPT4某某药物的功效是什么,它没有学习过,它就答不上来——还有一类是引用谬误,“你问一部电影的男主角和女主角是谁?AI说男的叫小帅,女主角是小美。这个信息哪里来的?从大量短视频里来的。这些信息误导了大模型。”

如何降低大模型的错误率?在沈阳看来,和搜索引擎的结合是一个机会。

其一搜索引擎数据量大,天然具备各种公开数据;其二在内容安全上,它们经过了长时间的考验;其三,搜索引擎为用户提供数据查询,大量的点击和反馈本身就是一种互动。大模型可以对搜到的结果进行聚合——大模型头部玩家中,很多也都是谷歌和百度等拥有搜索业务的公司。

今年以来,包括微软在内,头部企业都试图打通搜索和AI智能对话的链接。在沈阳看来,这也会倒逼搜索引擎的进步,“根据我的判断,经过5到10年以后,可能就没有搜索引擎的概念,只会有大模型的概念。因为你有任何问题,会习惯于问大模型,不再用搜索引擎。这也是我们最近关注比较多的部分。”



微软将AI大模型能力加入bing浏览器

中国大模型还有哪些可以继续提升的地方?在沈阳看来,中国大模型要把文本、图片和视频融会贯通,实现多模态能力。“从识图到生图完全打通,这样能做的事情就会多很多。”

此外,搜索引擎和大模型要深度融合,特别是要把做搜索引擎的优势,充分内化到大模型的研发中——这或许能让中国人走出一条跟美国人不一样的道路来。哪怕中国人0到1的能力创新弱一点,但1到100的能力不弱于美国人。

“在移动互联网,中国短视频做到世界第一;直播带货,中国在全世界也是第一。在大模型的广泛应用中,我们做了研究,特别希望国产大模型能够跟中国的智能制造和文化数字化、跟中国已有的移动互联网全球领先产品做深度融合,这样就能在这个过程中体现出中国特色。”

(发言由现场录音整理,未经当事人审订)