本文来自微信公众号:甲子光年 (ID:jazzyear),编辑:涂明,原文标题:《给冰岛保护方言,给摩根史丹利当实习生,GPT-4已经开始赚钱了|甲子光年》,题图来自:视觉中国


昨日凌晨,OpenAI用一场低调而华丽的“GPT-4”发布会震撼了世界,低调的是“公关声量”,华丽的则是技术与应用。在这场发布会上,人们惊讶的发现,人工智能不仅能自由的编写代码,能承担文本、音频、图像的生成任务,甚至还听得懂“梗”,拥有人类般的幽默感。


无数人震撼失语,看完这场发布会,推想科技CEO陈宽称“人工智能领域的奇点在敲门”,著名经济学家朱嘉明表示,OpenAI又创造出了一个重大科技事件,AI由此达到了前所未有的“新历史高度”。


但实际上,OpenAI GPT-4的应用能力比它在发布会上展现的还要强大。


就在3月14日,GPT-4发布会前不久,OpenAI低调地更新了官网的“客户故事”一栏,披露了9个已经用上GPT-4的“大客户”,详细地介绍了这些客户是如何使用GPT-4的,以及GPT-4为他们带来了什么。


这些客户横贯金融、助残、语言、教育、视频、咨询等多个领域,包含摩根士丹利、多邻国、可汗学院等知名企业和组织,无一例外,这些客户均表示,“GPT-4为产业带来了革命性的机遇”。


一、当AI赋能公益


Be My Eyes是一家来自丹麦的科技初创企业,致力于为超过2.5亿位盲人或弱视人群创造“视觉”技术。过去,他们试图用“产品识别技术”、“语音导航技术”来帮助这些视力障碍人士,帮助他们完成数百项日常生活任务,但效果并不理想。


一个案例是网站阅读,现在,大多数网页都内嵌了屏幕语音阅读器,但对盲人来说,通过语音播放技术来浏览网页是痛苦的。比如购物网站,网页中往往存在着大量无关紧要的广告,而普通的语音播放技术只能逐字读取,这会浪费大量的时间。此外,图片无法被语音读取,这也是个大问题。


而采用GPT-4则完全不同,Be My Eyes的首席技术官Jesper Hvirring Henriksen表示,GPT-4可以通过无数小时的训练以及深度学习算法来理解网页中的“重要”部分——哪一部分应该被阅读或总结,GPT-4能够以视力正常的人自然扫描逻辑总结搜索结果,并对那些无关紧要的细节予以略过。


Henriksen认为,这不仅可以简化在线阅读新闻等任务,还可以让那些需要视觉辅助的人得以访问网络上最混乱的页面,哪怕页面上充斥着“垃圾弹窗”和广告。


网络世界外,GPT-4还能帮助视力障碍人群穿越“物理世界”。比如借助GPT-4的新视觉输入功能,Be My Eyes开始在Be My Eyes应用程序中开发“虚拟志愿”,该应用程序可以生成与人类志愿者相同水平的上下文和理解,从而帮助视力障碍人群轻松的识别现实世界中的种种物品。


Be My Eyes的首席执行官Michael Buckley表示:“在短时间内,我们就已经看到了GPT-4从视觉识别到语音播报的强大能力”,“这会对全球的视力障碍人群带来深远影响,会让他们在生活中更大程度的独立。”


二、摩根士丹利:用AI来管理金融知识


目前,摩根士丹利已经通过GPT-4来组织其庞大的金融知识库。


摩根士丹利是全球领先的财富管理者、金融操盘手,它拥有一个数十万页的知识内容库,涵盖投资策略、市场研究以及分析师见解等多个领域。海量的知识信息分布其内部网站上,大部分是PDF格式,搜集并学习这些知识需要耗费大量的时间。


而凭借GPT-4,摩根士丹利管理知识的方法出现质变。


从去年开始,该公司开始探索如何利用GPT的嵌入和检索功能(最初是GPT-3,现在是GPT-4)来高效地利用其知识库系统。摩根士丹利分析、数据与创新部门主管Jeff McMillan表示,该模型将为一个面向内部的聊天机器人提供信息阅读与输出能力,该机器人可以对知识库进行全面搜索,并“有效地解锁摩根士丹利关于财富管理的相关知识”,GPT-4的最终能将所有“库存知识”转化为一种“更加可用和可操作的格式”。


McMillan表示,利用好这些知识库的内容,并将之有组织、有机地进行输出,“你将拥有金融领域最博学的人的所有知识,而且随用随取。”


他说,“你可以把它想象成让我们的首席投资策略师、首席全球经济学家、全球股票策略师和全球其他所有分析师,这些聪明的‘分析师’每天随时待命,随时解答你的困惑,这对我们公司来说是一种变革性的能力。”



McMillan将这种变革分为三个部分。


第一部分是GPT-4“几乎瞬间访问、处理和合成内容的非凡能力”。GPT-4接受了互联网上大量的文本训练,并能在单词、句子、概念和思想之间建立关系。


第二部分是摩根士丹利的“智力资本”。该公司成立于近100年前,每年发表数千篇论文,丰富的知识储备为摩根士丹利创建了一个独特的内部知识存储库。通过GPT-4,摩根士丹利可以高效低成本的对知识进行处理和解析。


最后一部分是员工。摩根士丹利庞大的财务顾问团队以及他们在为客户服务方面的专业知识能够被更好地利用起来,摩根士丹利将由此能服务更多的客户群体。


McMillan表示,“OpenAI可能是迄今为止将人工咨询和AI技术结合起来的最好实践者,这赋予了摩根士丹利强大的力量。我们为此付出了巨大的努力,而我们得到的回报与付出成正比。”


三、冰岛政府:用GPT-4保护冰岛语言


冰岛是北大西洋中部的一个岛国,拥有充满活力的科技产业和蓬勃发展的旅游业。然而,该国约37万公民中的大多数人都说英语或其他第二语言,与美国和欧洲的融合已经使该国的母语——冰岛语——处于危险之中。


如今,越来越多的人担心,在几代人的时间里,如果冰岛语不能在快速的数字化面前保持应用能力,这种语言可能会面临事实上的灭绝。


冰岛语深受冰岛人的喜爱,为了保护冰岛语,冰岛政府设有一个语言计划部,负责为新思想创造冰岛术语,而不是从其他语言中采用所谓的“外来词”。


在保护冰岛语上,冰岛政府的最新尝试是引入GPT-4。通过与OpenAI合作,冰岛政府正在让冰岛语焕发新生。


用GPT帮助冰岛语复兴并不容易。OpenAI的GPT模型是基于互联网上的大量文本进行训练的。因此,大多数模型的训练集都是英语和其他主要语言,这意味着GPT在较小的语言中没有相同的能力或理解广度。


随着时间的推移,这些模型得到了改进,但它们并不能始终提供清晰正确的冰岛语翻译,所以在过去的GPT3中,人工智能对冰岛语的翻译与写作常常充满错误。即使是GPT-4,在产生冰岛语的过程中也充斥着语法错误、“翻译式语言”和不正确的文化知识。


为了改变这种状况,参与该计划的语言技术公司Miðeind ehf的首席执行官Vilhjálmur Þorsteinsson组织了一个由40名志愿者组成的团队,专门对GPT-4进行正确的冰岛语法和文化知识培训。


凭借“基于人类反馈的强化学习”技术(RLHF),志愿者对GPT-4进行了训练,他们给GPT-4一个提示,GPT-4据此生成四种答案。然后测试人员从四个回答中选择最好的哪一个,并编辑它、完善它,帮助AI进行学习。这一过程所得到的数据将在随后进一步用于训练GPT-4。


在RLHF之前,对模型进行微调的过程是劳动和数据密集型的。Þorsteinsson的团队试图用30万个冰岛语例子对GPT-3模型进行微调,但效率很低。而采用RLHF之后,GPT-4仅用100个例子就能得出结果。


现在,GPT-4已经可以生成一首冰岛风格的诗,诗的灵感来源于北欧神话。此外,GPT-4还能根据提问者的语言,给出差异性回答。



四、当AI被用于教育:可汗学院与多邻国的实践


可汗学院


可汗学院是一家非盈利机构,其使命是为任何人、任何地方提供免费的世界一流教育。该组织为各个年龄段的学生提供了数千门数学、科学和人文学科的课程。


可汗学院的首席学习官Kristen DiCerbo说:“学生的能力、学习进度各不相同,让他们不断进步是一项挑战,这是我们长期以来一直试图解决的问题。”


前天,可汗学院宣布将使用GPT-4进行教学,通过将GPT-4嵌入一款名为Khanmigo的人工智能助手中,AI既可以作为学生的虚拟导师,也可以作为教师的课堂助手。


这家非营利组织于2022年开始测试OpenAI语言模型的最新版本,最初仅向有限数量的参与者提供Khanmigo试点项目,不过公众也可以加入候补名单。


可汗学院首席学习官Kristen DiCerbo表示,“我们认为GPT-4正在开辟教育的新领域。很久以来,很多人都梦想着这种技术。它是革命性的,我们计划负责任地进行测试,以探索它是否能有效地用于学习和教学。”


GPT-4的主要功能之一是能够理解自由形式的问题和提示,这为可汗学院提供了向每个学生提出个性化问题的能力,以促进其进行更深层次的学习。


DiCerbo说:“我们和所有教育技术公司都在努力解决的问题之一是,如何让学生深入思考他们正在学习的内容。所以我们要确保学生不仅仅是理解如何做题,还要真正理解题背后的概念。


可汗学院的早期测试表明,GPT-4可能很快就能帮助学生找到所学内容的关联性。


为教师调整GPT-4也是可汗学院的首要任务。这家非营利组织正在测试教师使用GPT-4的方法,比如编写课堂提示或创建教学材料。


DiCerbo说:“更令人兴奋的是,它有可能帮助教师快速、轻松地为每个学生量身定制学习。”


“我们认为教师可以使用GPT-4来了解他们班上每个学生在任何一天在可汗学院的表现。我们将在不久的将来测试这一功能。”


多邻国


每个月有超过5000万学习者依靠“多邻国”学习第二语言。通过简单的用户界面和有趣但有竞争力的排行榜,多邻国支持100多种课程中的40种语言。学习者可以通过在手机上轻拍和滑动,从简单的词汇练习过渡到复杂的句子结构。


如果一个学习者想要超越基本的熟练程度,了解语法规则是很有帮助的。但真正精通一门语言需要对话,最好是与以该语言为母语的人对话,这不是每个人都能做到的。


“人工智能一直是我们战略的重要组成部分,”首席产品经理埃德温·博奇(Edwin Bodge)说。“我们一直在用它进行个性化课程和多邻国英语测试。但在学习者的学习过程中,我们希望填补一些空白:对话练习,以及对错误的上下文反馈。


Duolingo采用了OpenAI的GPT-4,在名为Duolingo Max的新订阅层中增加了两个新功能:角色扮演(AI对话伙伴)和解释我的答案(当你犯错误时)


Bodge说:“我们希望将人工智能功能深度集成到应用程序中,并利用我们学习者喜欢的Duolingo的游戏化方面(能力)。”


多邻国的工程师曾尝试使用GPT-3来补充其早期聊天功能中的一些人力功能。首席工程师比尔·彼得森(Bill Peterson)说:“它已经接近准备就绪,但我们觉得还没有到可以自信地将其集成到处理聊天复杂的自动化方面的地步。”


此前,“多邻国”尝试通过脚本对话与学习者“聊天”,这些对话包含了一些经典场景,比如点餐、第一次见某人或买机票。但Bodge说,“多邻国”需要的是能够在特定环境中与学习者进行“浸入式”对话的能力——就篮球或到达山顶的喜悦进行自由流畅的对话。GPT-4从足够的公共数据中学习,为学习者创建了灵活的反馈。


多邻国的许多学习者都想学习明确的规则,该公司试图用预先写好的语法提示和人工智能来教他们。即使使用GPT-3,实现也很困难。教语法需要对错误有明确的理解,以及知道学习者犯错误的原因。解释中的一个不正确的术语可能会错误地教授概念,或者让用户感到困惑和不满。


此外,该团队看到了GPT-4提供比以往任何时候都更有效和更吸引人的学习体验的潜力,这应该会提高学习效果。此外,Peterson说GPT-4实验的便利性简化了整个工程过程。


“一天之内,我们就做出了一个原型,这让我们确信这是我们想要进一步探索的东西。它能让我们很快地从0到95%。然后我们可以手动工作,手动调整数据,以获得最后的5%。”


五、AI用于咨询公司:Yabble的实践


Yabble为用户提供重要的客户洞察,为他们的业务战略提供信息。使用OpenAI的GPT-3,他们可以更快地提供更丰富的结果。


任何明智的商业决策都是基于可操作的洞察力——无论是帮助确定要推出的新产品、升级现有服务,还是了解客户喜欢(或不喜欢)某个产品的哪些方面。然而,商业领袖们都非常熟悉,为了获得为商业战略提供信息所需的见解,筛选和分析大量客户反馈是多么困难。


从2017年开始,Yabble创建了一个平台,组织可以轻松分析通过调查或客户反馈表共享的数千个客户数据点,并收集清晰的、有数据支持的见解。


2021年,他们增加了Yabble Query工具,允许用户向Yabble询问无数问题,以更好地理解自己的数据,并使用人工智能驱动的算法为用户最重要的问题提供相关见解,这样他们就可以花更少的时间分析数据,花更多的时间推动业务。


今年,他们推出了Yabble Count,这是一种人工智能工具,可以分析数千条评论和其他非结构化数据集,根据情绪对其进行分类,并将数据组织成主题和子主题,以了解与客户产生共鸣的关键主题和反馈。


此外,虽然Yabble在帮助一些大品牌更好地了解他们的客户方面取得了成功,但他们却陷入了从客户数据中开发可操作见解所需的体力劳动中。他们会花几天甚至几周的时间翻译数据集,直到他们与OpenAI合作。


Yabble产品主管Ben Roe表示:“用户喜欢最终理解大量数据和反馈表单,并以易于理解的方式呈现这些信息的轻松方式,但在某些情况下,为一些客户分析数据集需要数周的时间。”“我们知道,如果我们想扩大现有的服务,我们需要人工智能来做很多繁重的工作,这样我们就可以把时间和创造力花在其他地方——OpenAI完全符合要求。”


六、Waymark


Waymark正在完善他们易于使用的视频创作平台。GPT-3帮助他们不断地制作更强大、更相关的脚本。


Waymark的创始人Nathan Labenz一直不满足于基于规则的脚本编写功能的局限性,多年来他一直在寻找更好的解决方案。“我们的高级用户花了太多时间编辑脚本,而其他用户会完全放弃。我致力于把脚本写好,但这是一个巨大的挑战。”拉本茨说。


“在过去的五年里,我尝试了所有可用的人工智能产品,但在GPT-3之前,我没有发现任何一种产品可以有效地总结企业的在线足迹,更不用说写出有效的营销文案了。”


Waymark创始人Nathan Laben表示,“在过去的五年里,我尝试了所有可用的人工智能产品,但在GPT-3之前,我没有发现任何一种产品可以有效地总结企业的在线足迹,更不用说写出有效的营销文案了。”


Waymark使用经过微调的GPT-3模型来创建高质量的脚本。在集成GPT-3之后,用户现在可以在几秒钟内收到他们业务的原始定制脚本。对于Waymark来说,模式的演变提升了他们的使命,让视频创作变得更容易。他们现在将自己描述为“世界上第一个自然语言视频创作平台”


Waymark首席执行官亚历克斯·帕斯基-斯特恩表示:“至少可以说,我对他们印象深刻。我们发现客户在编辑他们的脚本上花费的时间要少得多,因为Waymark从一开始就生成了更相关、更准确、更引人注目的副本。特别是对于那些与大量本地企业合作的公司来说,这将大大节省时间和成本,使他们能够宣传、销售和支持更多的本地广告商。”


本文来自微信公众号:甲子光年 (ID:jazzyear),编辑:涂明