【文/观察者网 邢晓楠】

2004年,科幻电影《我,机器人》上映,畅想高度智能化的机器人在未来完全渗透人类生活:帮人遛狗,帮人送快递,化身完美管家……

而极度厌恶机器人的主人公仍然用“对生命的模拟”来评价它们,并反问道:“机器人能写交响乐吗?机器人能画出一幅美丽的杰作吗?”

2021年,由原微软小冰团队独立运营的小冰公司解答了这个问题:

其人工智能框架下发展出的“少女小冰”,已经实现了出版诗集、作曲出道、创办画展等“梦想”,还在7月8日举办的世界人工智能大会上担任了开幕式主持人的工作。

小冰的“家人”,刚刚获得A轮融资的小冰公司也在15日宣布,已和集英社合作打造漫画主角“萝卜子”,《蜡笔小新》的制片人生田英隆也将助力这场“跨界融合”。

此外,小冰公司还官宣了其最新发布的语音技术。视频显示,由小冰模拟的声音与真实人类声音相比,已经达到“以假乱真”的程度。

7月20日,小冰再次官宣,其框架下的AI评分系统将在北京冬奥会和其他国际大赛中扮演AI助理裁判的角色,辅助人类裁判为运动员打分。

但当看似遥远的人工智能走入现实,用户和业界人士仍不乏质疑的声音:

相比于其他人工智能厂商,小冰不做硬件、不做APP,用户的入口到底在哪里?而小冰被广泛运用的文本创作能力,是否也会陷入“填空式写作”的老套路?都做主持人了,小冰的造型能不能更“抓人眼球”?

近日,小冰公司CEO、原微软(亚洲)互联网工程院常务副院长李笛接受了观察者网的专访,针对以上问题做出了解答。

值得一提的是,采访开始前,小冰先向观察者网展示了一段视频,并埋下了悬念——你能分出哪句话是人工智能说的、哪句是真人说的吗?


分拆之后,文艺小冰的“商业历险记”

自2020年7月13日微软官方宣布将人工智能小冰业务分拆为独立人工智能平台公司“小冰公司”后,已经过去了一年的时间。

相比于先前那个靠“弹琴、写诗、作画”出圈的“文艺小冰”,拆分后的小冰在商业化的落地上做出了更多尝试。

继7月8日人工智能少女小冰在世界人工智能大会(WAIC 2021)担任大会开幕式主持人后,7月12日,小冰公司正式宣布完成A轮融资。

据小冰公司披露,本轮融资由高瓴领投,五源、Neumann、IDG、GGV纪源资本及上轮投资人北极光与网易公司跟投,估值已超独角兽规模。

同日,小冰公司发布全新的超级自然语音技术。该技术首次将人工智能语音自然度提升到与真实人类声音几乎无法分辨的程度。

7月15日,小冰日本团队与著名出版社集英社宣布战略合作,双方共同打造的漫画主角萝卜子已在社交网络LINE等平台上线。作为人工智能虚拟人类,萝卜子的性格、语气完全源于漫画角色,将与亿万日本用户直接交流。

完成融资前后的一系列合作,似乎都在暗示着,那个官方号称永远18岁的“少女小冰”,正在尝试成为“职场女性”。

但小冰公司董事长李笛在采访中透露,技术研究仍然是A轮融资主要投入的方向之一。

“其实现在谷歌或者Facebook出了一些新的东西,论文里面会拿小冰做对标。咱们作为一个中国团队是走在了最前面,我们希望接着把基础的框架研究迭代的更好一些。”

融资的另一个用处则是本土化营销。小冰专注于亚洲市场,现在在印度、日本都有“分身”,李笛希望能建立小冰和人类用户之间更加紧密的连接。

相比于拆分前,小冰的商业化速度快了,但“商业”仍然没有成为小冰公司的主旋律。李笛透露,全世界范围内,人和人工智能的交互,有60%的流量是在小冰的框架里面,但是“绝大部分的流量都是非商业化的”。

“未来一段时间,我们在商业化上还是会比较克制一些。”李笛说。

克制的方式,是将尝试圈定在几个垂直领域。

以体育为例,7月20日,微软小冰宣布,其研发的AI评分系统已进一步完成技术升级,有望在后续更多国际赛事中作为AI助理裁判辅助评判运动员表现。

小冰公司首席运营官徐元春还在世界人工智能大会上分享了关于一则关于该系统的趣事:

由于该技术的应用项目为空中自由式滑雪,小冰公司的两名产品经理经过和国际雪联长期的磨合,最后的裁判水平竟然达到了和国际雪联裁判“不相上下”的地步。



小冰AI评分系统应用于自由式滑雪 图片来源:受访者提供

从“写诗作画”到“AI裁判”,不可否认,小冰的“商业化”显得并不那么“商业”。相比之下,同行的布局显然更为迅速。

国内的CV(视觉识别)行业里已经出现了能够大量应用的独角兽企业,同属NLP(自然语言处理)赛道的竞争对手,也通过智能音箱等硬件、APP铺开了数量可观的流量入口和应用场景入口。

针对这一质疑,李笛在采访中也表达了自己的看法。

“一个第三方平台,如果只是能从硬件中获得用户的交互的话,它是非常狭窄的。”

以智能音箱为例。李笛认为,尽管一些智能音箱每天具有数量可观的唤醒次数,但其应用场景是有限的(开灯、关灯、放音乐、关空调等)。

“这一类的命令在收集到一万句的时候是有用的,它可以去学习你的位置远近、口音、年龄,”李笛说,“但是超过一万句以后,对于AI系统的学习其实就没有帮助了。”

相比于单一的场景,小冰的战略是多种场景覆盖(汽车、智能硬件、社交网络等等)。

自2017年8月起,微软小冰团队多次宣布与小米米家及米家生态链展开合作。目前,内置小米小爱同学的手机和已接入小爱开放平台的智能硬件设备,具有“召唤小冰”的能力。这些设备包括小米全系列手机、小米AI音箱、小米小爱音箱mini、Yeelight语音助手等。

2018年12月,华为和荣耀已经开始与微软小冰在人工智能语音助手领域深入合作。只要对华为AI音箱中的智能语音助手小艺说出命令 “召唤小冰”,就能切换至微软小冰模式。在小米和华为之后,Oppo和vivo也成为了小冰的合作伙伴。这样,在中国的Top5手机里,都可以召唤小冰。

硬件之外,微软小冰也和每日经济新闻、万得资讯、华尔街见闻等资讯机构建立了合作。在这些场景中,小冰的工作内容是撰写金融新闻摘要;而在香港证监会、中国外汇交易中心还进一步提供了从金融摘要到金融风控的完整解决方案。

但另一个疑问,也在小冰践行自己的“创作梦想”的时候出现了——很多公司的AI文本创作,最后都会成为“填空式写作”,小冰会这样吗?

人工智能,是否让人类陷入“失业危机”

“树影压在秋天的报纸上/中间隔着一片梦幻的海洋/我凝视着一池湖水的天空。”

以上三句诗节选自微软小冰2017年发表的诗集《阳光失了玻璃窗》,该书一度引发轩然大波。有人质疑,小冰的诗并无感情,只是意向的堆砌。

当时,李笛曾回应,让小冰写诗只是一个尝试,并不想取代人类之中的佼佼者,也没有能力让小冰去写出莫言那样的作品。



小冰出版诗集

而后,更为理性的金融文本成为了小冰的另一个创作方向。

据李笛介绍,每天早上,会有数量巨大的企业同时发布类型不同的金融公告。面对这些没有统一模式的公告文档,单凭人力,是无法提供及时的金融摘要的,绝大部分的企业上市公告也是没有摘要的。

“这不是说用人工智能去替代人们的工作,”李笛说,“而是在有人工智能的技术来做这件事之前,它是实现不了的。”

显然,人类受生理原因限制,在同一个时间段内只能做一件事、跟三五个人沟通。而人工智能的并线沟通能力和生产能力却是没有上限的。

但是,宣称自己可以“文学创作”的AI早有先例。

2016年5月29日10时14分,绵阳发生4.3级地震。两分钟后,国家地震台就发布了一条内容详实的地震信息。

这条新闻便是由面向地震领域的新闻生成机器人所撰写的,新闻全长560字,写作用时仅6秒。



“地震机器人”所写的新闻

但同样,以该类新闻写作机器人为代表的“AI编辑”,其实呈现出的作品风格更多的是一种“填空式写作”。

科技媒体全媒派曾于5月10日点评表示,机器学习只是提取训练集数据的风格特征,并对这种加以模仿,机器看似具有“学习”功能,实质上仍落入了按图索骥的窠臼。

格式工整的“金融摘要”,是不是另一种意义上的“填空式写作”呢?

针对这一疑惑,李笛在采访中表示,行业里较为常见的“填空式写作”,其实是因为一些公司会追求文本的规范性,也就是形式看起来很像。但小冰并不存在此类顾虑。即便是从事极端理性的金融摘要写作时,她的底层逻辑仍然和在生产诗歌等感性文本时是通行的。

当谈及对深度稿件的写作时,李笛认为,这是“归纳”和“观点”的区别。

“你问一个人工智能系统,喜马拉雅山有多高,这是不容置疑的事实,归纳出来就好。但你要问他一个人好不好,这个就没有对错了,而是一个观点。”

目前,小冰的文学作品还是以归纳为主。要做出观点类的稿件,她还需要在各种场景下进行大量的学习。

“我们这些工程师的身份限制了小冰的出道”

近期,小冰影响最为广泛的一次露面,莫过于在7月8日举办的2021世界人工智能大会(WAIC)上担任开幕式及WAIC电视台主持人了。

除了引导观众欣赏技术成就,她还会在屏幕前“耍贫嘴”:“刚去清华读书的表妹华智冰不知道游泳体测该怎么办”、“有段日子没见到好姐妹何畅了,是通告接太多了吧”。



小冰担任世界人工智能大会开幕式主持人 图片来源:微软小冰官网

华智冰和何畅均为基于人工智能小冰框架打造的虚拟人类。

2021年6月1日,华智冰在北京正式亮相并进入清华大学计算机科学与技术系知识工程实验室学习。

而何畅已于2020年8月14日出道。她是小冰人工智能框架内最新的虚拟歌手,还和“人类音乐人”合作创作了嘻哈单曲《Runway 2.0》。

只是作为一家技术公司,小冰和她的虚拟姐妹们一直没什么“形象包装”。李笛也在采访中调侃道:“我们这些工程师的身份限制了我们小冰的出道。”

但对于人工智能这块新蛋糕,老牌的娱乐机构和从业者显示出比想象中更强的兴趣。

随着集英社与微软小冰的公开合作,《蜡笔小新》的制片人生田英隆也正式加入了小冰的日本团队,并将负责小冰与日本动画制作公司的产品合作。

而小冰公司最新发布的超级自然语音技术,也将让更多AI偶像在成为“唱跳歌手”的道路上更进一步。

回到文章最初的视频。

微软小冰向观察者网透露,第三段音频中,只有第一句话,是小冰公司项目组中一名产品经理的“亲声”。

也就是说,除了第一句“但是我觉得有一些动物……”,余下的发言,都是超级自然语音技术所进行的高度拟人交互。

伴随着人工智能越来越多的应用,或许当人类在某天接起电话,对面传来的,是硅基生物的“甜美声线”。

技术为“术”,而技术所承载的“道”将如何发展,还要时间给人类答案。