一阵生成式人工智能(AIGC)的旋风,正在席卷众多领域。
2022年底,OpenAI发布自然语言对话应用ChatGPT,并在今年3月迭代推出GPT-4,迅速吸引了各行业与公众的关注。全球范围内大模型风云骤起,资金、技术、人才持续涌入,科技公司布局不断,纷纷推出自家的大模型。据估算,到2030年,AIGC市场规模有望突破万亿元。
几年前,AlphaGo击败围棋选手李世石的新闻引发了一轮人工智能的热潮,然而,AIGC的浪潮更为猛烈,因为除了技术突破外,其低门槛与实用性使得应用端的感知更为显著。因此,大众不仅仅停留在讨论阶段,而是可以直接体验生成式人工智能的强大。
每轮技术革新,都将勾勒出一个新纪元。“在AIGC时代,所有行业都值得用AI重塑”。受到影响的领域包括教育、金融、电商、影视、设计等,其中新闻业是受影响最为剧烈的领域之一,对于AIGC的回应也最为积极。
在国际上,许多媒体已经开展了相关尝试。新闻聚合网站BuzzFeed发布由AI作答的测试栏目quizzes,并表示将使用AIGC编写测试类内容,以替代部分人力。5月24日,《华盛顿邮报》宣布成立跨部门AI协同机制,包括战略决策团队AITaskforce和执行团队AIHub,以更好地适应AI创新实践。英国《金融时报》也首次任命AI线编辑,密切关注该领域的最新进展。
国内媒体如澎湃新闻、封面新闻、上游新闻等百余家媒体机构在今年2月宣布接入AIGC产品。腾讯研究院在今年6月份围绕“ChatGPT对新闻业的影响”话题展开了一项调研,结果显示,有80%的国内新闻从业人员已使用过ChatGPT或类似产品,其中超过一半(56%)受访者认为ChatGPT(或类似工具)对自己的工作带来了实际帮助。
在文字生成能力出类拔萃的同时,ChatGPT也具备多模态内容生成能力。对于以内容创作为核心的新闻行业而言,这将带来许多交汇点,并产生显著影响。这个“堪比工业革命”(微软CEO萨提亚·纳德拉语)的技术突破,以及不亚于“个人计算机或互联网诞生”(比尔·盖茨语)的技术形态,它将究竟促成什么样的改变?是否会为新闻业带来新的契机?
通过本报告,我们试图探讨以ChatGPT为代表的AIGC技术给新闻业带来的影响与挑战,以及它所创造的新可能。AIGC正开启一场“技术革命”,新闻业是其中一个切口。通过这个切口,我们或许能捕捉到这场革命对人类社会的真正意义。
大洗牌:新闻业的三重变革
千禧年以来的新闻业,既经历过充满希望的明亮时刻,也曾陷于悲观的泥淖。
全新的数字化生态赋予传统媒体蓬勃的发展活力,同时也催生了一批数字媒体新贵。然而,近年来流量逻辑的变迁、短视频等新媒介形态的冲击、线上广告收入的萎缩等种种因素,正在促使新闻业陷入新的困境。
1. “流量时代”终结,新闻媒体大洗牌,连接读者变得无比重要
内容分发的逻辑屡次演变。
2008年金融危机之后,广告商的广告投入从传统媒体转向在线媒体。以Google为代表的搜索引擎和以Facebook为代表的社交媒体彻底重塑了内容流量格局。源自这两个端口的流量,成为在线媒体最重要的曝光来源。
尤为值得关注的是Facebook,其创始人马克·扎克伯格曾深信新闻内容的积极价值:提升平台的声誉以及提高用户的留存和互动。因此,Facebook一度大力强化新闻内容的推荐比重,让相关内容获得更多曝光。在2006年至2016年的十年间,社交媒体与新闻业迎来了一段蜜月期。
皮尤研究中心2015年的一项调查显示,高达64%的网络用户通过社交媒体获取新闻。这是由社交媒体缔造的“新闻业的流量时代”,造就了一大批数字媒体新贵。21世纪最为知名的数字媒体BuzzFeed和VICE,业务模式就建立在社交媒体的病毒式传播之上,巨大的流量和用户注意力涌入这些媒体,随之而来的是大量风险投资。鼎盛期的BuzzFeed和VICE,估值分别达到17亿美元和57亿美元。
但对于媒体而言,这种模式的根基是脆弱的,它们的兴衰存亡完全取决于平台。一旦平台的算法和规则改变,商业模式就会遭受重创,完全不由自己掌控。故事的转折发生在2016年,美国总统大选期间,Facebook被外界质疑利用算法操纵选举结果,“剑桥分析”事件则直接将马克·扎克伯格送上听证会。面对各方抨击,Facebook宣布减少新闻内容的比重。2020年,Facebook进一步强化相关举措,大幅减少新闻内容和政治内容的推送。
这不只是Facebook一家平台的转向,而是社交媒体的整体趋势。算法的调整使新闻类内容得到越来越少的曝光,这对依赖社交媒体流量的媒体打击严重,由此造成行业性的集体困境。2023年,BuzzFeed创始人乔纳·佩雷迪宣布关停旗下新闻业务BuzzFeedNews,VICE宣布关闭新闻品牌VICEWorldNews,其主站也正在计划进行破产申请。VoxMedia、Insider、ABCNews等媒体都进行了不同程度的裁员。
这些媒体的共同问题在于,并没有通过强化付费墙和订阅业务来积累起用户基底。在大浪来临之时,面对巨额的流量和广告收入,没有人会认为这是一个问题。但当潮水退去,才能发现谁在裸泳。
作为对比,老牌媒体《纽约时报》在BuzzFeed等新贵风头正劲的时候,因对互联网适应迟缓而被业界看衰,甚至被视为要被革命的代表。在BuzzFeed的刺激下,《纽约时报》被迫转型,以适切数字化新闻的大背景。但这种步调并不急促,它把自己的内容置于付费墙之后,通过深耕内容来吸引订阅用户,反而成为能够熬过周期的资本。
在充满泡沫、浮光掠影的流量时代,以核心读者为基底,与读者建立更紧密的连接变得前所未有的重要。越来越多的新闻媒体认识到这一点,并由此催生出三种新趋势:
第一,利用新的媒介形式建立与读者的直接联系。近年来,播客和RSS阅读开始兴起,许多媒体推出自家的RSS订阅服务和播客品牌,旨在更直接有效地与读者建立紧密联系,强化媒体品牌并提升商业价值;
第二,更加专注本地内容,而非全球性的热点话题。例如,传媒集团MvskokeMedia将编辑策略调整为专注本地社区报道,体现对核心读者的关注;
第三,加强报道透明度和公开性,一方面帮助读者理解报道理念,另一方面也反向了解读者更需要怎样的新闻报道。比如檀香山公民报(Honolulu Civil Beat)在所在地区举办类似于快闪活动的“弹出式新闻编辑室”(pop-up newsrooms),加强与读者的沟通。
2. “短视频新闻业”兴起,受众注意力转移,传统新闻理念遭遇冲击
2023年,数据统计机构《新闻公报》(Press Gazette)发布了一份千禧年以来成立的25家媒体资讯公司排名榜单,其中Facebook位居榜首,TikTok紧随其后。社交媒体的影响力不言而喻,以TikTok为代表的短视频平台的崛起,对新闻业发展趋势产生了深刻影响。
TikTok正迅速成为这个世界上最大的内容平台和流量基地之一。不仅大量年轻受众在该平台聚集,不同年龄段的受众注意力也逐渐转向短视频,而不再是新闻媒体所擅长的图文内容或严肃新闻报道。与受众注意力同步转移的还有广告收入和风险投资,它们同样流向了年轻用户更为关注的TikTok和Instagram平台。
不仅如此,一种新的新闻业态正在兴起:“TikTok新闻业”。当新冠疫情、俄乌冲突等重大新闻事件发生时,人们发现,主要信息源不再是新闻媒体,而是TikTok。大量即时、一手的视频内容在TikTok迅速传播,后者逐渐从一个娱乐性短视频平台,转型成为包含音视频内容的综合型内容平台,并成为互联网用户获取资讯的重要途径。对许多年轻受众而言,他们不是不看新闻了,只是不在新闻媒体上看新闻了。类似现象在国内也同样显著。
当新闻的主要载体从文字转向视频,这对绝大多数新闻媒体而言都是挑战。部分传统媒体积极求变,尝试融入短视频新闻生态。根据牛津大学路透新闻研究所发布的《2022年数字新闻报告》统计,约有一半(49%)的主流媒体机构会定期在TikTok上发布内容。作为老牌媒体代表,《华盛顿邮报》专门聘请第三方团队为自家TikTok账号制作内容;《洛杉矶时报》则组建了一个名为“404”的内容团队,基于年轻受众偏好进行实验性质的内容生产。
一些原生新闻媒体也从TikTok新闻业中涌现出来。例如,以短视频新闻起家的NowThis,已经拥有850万粉丝;西班牙内容公司Ac2ality以“在一分钟内讲述新闻”为核心理念,自2019年上线以来,在TikTok上已经积累了390万粉丝。
TikTok新闻业的崛起,意味着受众注意力焦点的转变。对新闻业造成的冲击一方面体现在广告收入流失,媒体生存环境恶化,尽管付诸努力融入短视频新闻生态,但传统新闻报道与视频媒介之间固有的不兼容性,使这种转型的成效受限。
另一方面,短视频新闻的广泛影响使传统新闻理念遭遇冲击,新闻业奉为圭臬的“客观性”“真实性”等价值观不再被强调,快速、耸动、视觉冲击力成为新的制作标准,点赞和转发等数据成为衡量新闻优劣的新指标。“黄色新闻”获得越来越多的流量与受众,传统新闻的生存空间进一步受到挤压。
从受众角度来看,人们逐渐习惯于通过短视频这样的渠道获取新闻和信息,这在一定程度上也是受日益显著的“新闻疲劳”和“新闻回避”等现象影响。新闻回避由认知和情感两个因素驱动:认知方面表现为人们认为某些主题或事件报道过多,阅读这些新闻会导致疲惫感,且难以获得信息增量,进而产生“新闻过载”;而情感方面则是指人们会主动回避那些会引发负面情绪的新闻,如关于疫情、暴力事件和自然灾害的报道。
根据路透新闻研究所与牛津大学发布的报告,2017年,29%的受访者表示他们会“经常或有时避开新闻”,到2019年,这一数字上升至32%。2020年新冠肺炎疫情爆发后,人们对新闻的需求短暂激增,但新闻回避的现象很快反弹,59%的人表示“有时或总是积极地回避新闻”。受众的信息接收习惯和心态变化,成为新闻业不得不考量的因素,也成为新闻媒体转型路上的阻碍。
3. 关停、裁员成为常态,新闻从业人员积极求变
三年的新冠疫情,对全球经济产生了巨大冲击,新闻业也无法置身事外。
新闻机构关闭成为常态。国外媒体包括BuzzFeed、VICE等一众数字媒体关闭旗下新闻业务,以及《利沃尼亚观察者报》(The Livonia Observer)这类纸质刊物实质性停刊。
国内的情况也不容乐观。清华大学新闻与传播学院等机构联合发布的《传媒蓝皮书:中国传媒产业发展报告(2022)》显示,新冠肺炎对传媒产业部分领域的影响仍在延续,传统新闻业广告收入持续下滑,广告主缩减对期刊、报纸等媒体的投放预算。国内报业广告和发行收入大幅下跌,电视广告市场发展疲软且下滑趋势严重。2020~2023年间,包括《城市画报》《东南快报》在内的数十家报纸宣布休刊或停刊。
新闻从业人员收入显著下降。根据《新闻公报》(Press Gazette)的统计,经济不确定性影响了约三分之二的新闻工作者的工作。超过80%的受访者是全职新闻工作者,其中大多数(71%)的年收入未达到10万美元,自由撰稿人的稿费更是平均不足300美元。
裁员成为媒体机构的主要基调。根据不完全统计,自2020年以来,数十家媒体宣布了裁员计划。BuzzFeed因计划采用AI生成测验类内容而裁减一定比例的员工,2023年4月20日,BuzzFeed创始人再度宣布关闭旗下新闻业务,裁退约180名员工,涉及内容、技术、行政等部门,占总数的15%。
根据福布斯的统计,自2023年1月至今,三十余家报纸及媒体机构进行了不同程度的裁员,最近一次发生在6月7日,《洛杉矶时报》宣布,由于“经济环境和新闻行业的独特挑战”,将裁减新闻编辑室的74名员工。
全球经济滑坡与技术冲击,正在使新闻业面临双重危机,而新闻记者的生存状况堪忧,也与新闻机构应用新技术密切相关。自动化报道和自动编辑系统的引入,在解放一部分人力的同时,也导致部分从业者成为冗员。媒介技术的迭代并未带来劳动关系的进步,这在内容产业中体现得尤为明显。
2023年上半年,一场罢工行动正在好莱坞持续上演,影响到多部在播剧集。罢工事件背后,即是以Netflix为代表的流媒体平台对剧集生产方式和播出形式的改造,挤压着编剧的生存空间。技术机制的替代效应,也同样冲击着新闻业。
面对有限的生存空间,许多新闻机构和新闻工作人员开始将重心转向社交媒体和短视频平台。例如,在TikTok和YouTube上开设频道、发布视频内容,以吸引年轻受众,同时通过广告分成模式增加收入。另一方面,新闻记者通过Twitter、Linkedln等社交平台,分享知识和见解,建立个人品牌和影响力。
涌现:AIGC正掀起一场新的技术和产业革命
AIGC,即利用AI自动生成内容(AIGeneratedContent)。它并非新兴事物,最早可追溯到1957年莱杰伦·希勒(Lejaren Hiller)和伦纳德·艾萨克森(Leonard Isaacson)完成的人类历史上第一支由计算机创作的音乐作品,之后几十年也不断有AI生成模型、AI生成作品出现,但2022年才真正算是AIGC的爆发元年。
AIGC的意义,并不仅仅是技术生成内容,而是AI具有了像人类一样的生成创造能力。得益于无限的创造潜力和未来应用空间,AIGC正在掀起一场新的技术和产业革命,推动人工智能迎来下一个时代。
1. 大模型是AIGC爆发的基石
随着2010年深度学习问世,人工智能的发展推进了第三次高潮,而大模型将这次高潮带到了新的阶段。2017年谷歌在《Attention is All You Need》一文中发布了具有里程碑意义的Transformer算法,虽然仍是深度学习的延续,但是它使得深度学习模型参数突破了1亿,Transformer取代RNN、CNN进入大模型时代,这无疑是一个重大的里程碑。
Transformer是一种基于自注意力机制的神经网络模型,最初用来完成不同语言之间的文本翻译任务,主体包含Encoder和Decoder部分,分别负责对源语言文本进行编码和将编码信息转换为目标语言文本。
而后基于Encoder和Decoder,大模型的发展大致走上了三条路:第一条是舍弃Decoder部分,仅仅使用Encoder作为编码器的预训练模型,最出名的代表就是Bert家族;第二条是通过舍弃Encoder部分而基于Decoder部分的GPT家族;第三条是Encoder和Decoder都使用的谷歌T5大模型路线。
AI大模型,又称为预训练模型、基础模型(foundation model),即基于大量数据训练的、拥有巨量参数的模型,可以适应广泛的下游任务。这些模型基于迁移学习的思想和深度学习的最新进展,以及大规模应用的计算机系统,展现了令人惊讶的涌现能力,并显著提高各种下游任务的性能。鉴于这种潜力,大模型成为AI技术发展的范式变革,许多跨领域的AI系统或产品服务将直接建立在大模型上。
具体到AIGC领域,AI大模型可以实现多任务、多语言、多方式,在各种内容的生成上将扮演关键角色。按照基本类型分类,预训练模型包括自然语言处理(NLP)预训练模型、计算机视觉(CV)预训练模型、多模态预训练模型。这三类模型在新闻业等领域,均有较为广泛的应用前景。
为什么说大模型是AIGC爆发的基石?是因为大模型引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷,但是使用门槛高、训练成本高、内容生成简单和质量偏低,远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。大模型解决了以上的诸多落地问题。
比如,ChatGPT可以同时为不同国家、不同文化背景、不同专业领域和年龄阶层的人群提供优质的文字内容生成服务,在此之前是难以想像的。ChatGPT也展示了大模型带来的超越文本生成本身的神奇能力。ChatGPT、GPT-4、Bard、PaLM、LLaMA等带来了当下的大模型盛世,也带来了AGI的曙光。
总的来看,AIGC在2022年的爆发得益于大模型技术。拥有通用性、基础性、多模态、参数多、训练数据量大、生成内容高质稳定等特征的AIGC大模型成为了自动化内容生产的“工厂”和“流水线”。
2. 产业生态是AIGC发展的保障
此前AI产业发展缓慢的状况,与没有建立较为成熟的产业体系密切相关。任何成熟的行业都有较为完整的上下游产业生态体系,比如汽车行业,全球的发动机、变速箱等核心零部件厂商只有那么几家,面向消费者的汽车厂商可以有很多家。而此前AI行业,从基础的模型研发到产品服务上线销售,每家企业似乎都要覆盖全产业链的事情,成本投入和利润回报很难平衡,行业发展陷入艰难困境。
此前AI模型缺乏通用性是核心问题,而目前基于大模型,AIGC产业生态体系已经初步形成,呈现为上中下三层架构。
第一层,为上游基础层,也就是由大模型为基础搭建的AIGC技术基础设施层。由于大模型的高成本和技术投入,因此具有较高的进入门槛。以2020年推出的GPT-3模型为例,AlchemyAPI创始人ElliotTurner推测训练GPT-3的成本可能接近1200万美元。因此,目前进入预训练模型的主要机构为头部科技企业、科研机构等。
在AIGC领域,美国的基础设施型公司(处于上游生态位)有OpenAI、Stability.ai等。因为有了基础层的技术支撑,下游行业才能如雨后春笋般发展,形成了目前的AIGC商业流。
第二层,为中间层,即垂直化、场景化、个性化的模型和应用工具。预训练的大模型是基础设施,在此基础上可以快速抽取生成场景化、定制化、个性化的小模型,实现在不用行业、垂直领域、功能场景的工业流水线式部署,同时兼具按需使用、高效经济的优势。
以大模型为基础,模型即服务(Model-as-a-Service,MaaS)成为现实,它实现了AI从“手工作坊”到“工厂模式”的转变。AI大模型具有更强的通用性和智能程度,MaaS为下游应用提供安全、高效、低成本的模型使用与开发支持,能够大规模地在产业中落地应用,更广泛地赋能各行业应用,带来全社会的生产效率提升。OpenAI的CEO山姆·奥特曼曾明确指出,中间层是未来AI创业的核心阵地。
比如基于ChatGPT开放的API接口,产生了很多应用于金融领域、医疗领域的大模型或应用工具。JasperAI便是依靠GPT-3自动生成创意营销内容,在18个月里从白手起家化身为独角兽。还有在StableDiffusion开源之后,有很多基于开源模型的二次开发,训练特定风格的垂直领域模型开始流行,比如著名的二次元画风生成的Novel-AI,还有各种风格的角色生成器等。
第三层,为应用层,即面向C端用户的文字、图片、音视频等内容生成服务。在应用层,侧重满足用户的需求,将AIGC模型和用户的需求无缝衔接起来实现产业落地。基于GPT-3大模型的NotionAI便是这样的产品,可以满足用户的专业文本内容生成需求。
以StableDiffusion开源为例,它开放的不仅仅是程序,还有已经训练好的模型,后继创业者能更好的借助这一开源工具,以C端消费级显卡的算力门槛,挖掘出更丰富的内容生态,为AIGC在更广泛的C端用户中的普及起到至关重要的作用。现在贴近C端用户的工具越发丰富多样,包括网页、本地安装的程序、移动端小程序、群聊机器人等,甚至还有利用AIGC工具定制代出图的内容消费服务。
目前,从提供大模型的基础设施层公司到专注打造AIGC产品和应用工具的应用层公司,AIGC生长出繁荣的生态,技术创新引发的应用创新浪潮迭起,并且技术赋能千行百业。随着数字经济与实体经济融合程度不断加深,以及互联网平台的数字化场景日趋丰富,人类对数字内容总量和丰富程度的整体需求不断提高。
AIGC作为当前新型的内容生产方式,已经率先在新闻传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展,市场潜力逐渐显现。与此同时,在推进数实融合、加快产业升级的进程中,金融、医疗、工业等各行各业的AIGC应用也都在快速发展。
3. 场景应用创新、具身智能、能力平权是AIGC的未来面向
场景应用创新是AIGC未来的发展路径。任何新兴技术只有在具体的场景中落地应用,产生经济和社会价值,才能获得广泛应用。同时在广泛的应用之中,技术才能不断迭代创新发展。这就形成了“场景应用和技术迭代”的飞轮效应。
2022年科技部先后发布《关于支持建设新一代人工智能示范应用场景的通知》《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,首批支持建设智慧农场、智能港口、智能矿山等十个示范应用场景。通过应用牵引推动人工智能技术落地已经成为行业共识。目前,OpenAI的战略也是尝试建立应用生态,将大模型落地到各行各业之中。
场景应用创新也代表着未来AIGC会更加垂直化和轻量化。第一,大模型虽然是通才,但它缺乏行业深度。其未来的发展趋势可能是六个方面的“垂直化”,包括行业深度化、企业个性化、能力专业化、规模小型化、部署分布化以及所有权私有化。
第二,未来AI要嵌入到社会生产生活的各个领域,尤其是移动端设备和嵌入式设备上,即要进行本地化部署。而目前,大模型对硬件的算力和内存有很高要求,而移动端设备或者嵌入式设备往往算力有限,因此,模型轻量化会是未来AIGC发展的一个重要方向。
具身智能是AI发展的必然形态。具身智能是指AI不仅仅是数字化或虚拟的,还在物理环境中具有实体形态的存在,例如机器人或其它能够与真实世界互动的装置。真正的智能和学习需要与物理世界的交互,这是因为大多数生物智能的进化都与它们的环境有直接的联系。具身智能可以通过与环境的交互来更好地学习感知和行为。
与此类似的观点,便是一些学者认为ChatGPT未来无法实现超人工智能,因为它们缺乏与真实世界的交互能力。因此,具身智能被认为是通往通用人工智能的关键钥匙,“具身智能”机器人更是人工智能的终极形态。
2023年7月,AI科学家李飞飞带领的团队发布了具身智能最新成果,他们将大模型接入机器人,把复杂指令转化成具体行动规划,人类可以用自然语言给机器人下达指令。更重要的是,通过将LLM(大语言模型)+VLM(视觉语言模型)结合在一起,机器人与环境进行交互的能力进一步提升,无需额外数据和训练便可完成任务。
能力平权是AIGC发展的必然结果。目前,AIGC的发展已经赋予了用户更多的创作权力和自由。比如普通人就可以借助AIGC创作小说、音乐作品、3D内容等,一切皆可基于输入词按需生成。不仅如此,未来人人都可能像钢铁侠那样拥有自己的“贾维斯”——个人智能助理。
2021年,微软在GitHub首次引入了Copilot(副驾驶)的概念。GitHubCopilot是一个辅助开发人员编写代码的AI服务。2023年5月,微软在大模型的加持下,Copilot迎来全面升级,推出Dynamics365Copilot、Microsoft365Copilot和PowerPlatformCopilot等,并提出“Copilot是一种全新的工作方式”的理念。工作如此,生活也同样需要“Copilot”。出门问问创始人李志飞认为大模型的最好工作,是做人类的“Copilot”。AIGC大模型或会成为每个人的智能助理,让每个人都能享受到AIGC技术红利。
“供给侧改革”之外:AIGC为新闻业带来了什么?
全球经济的整体衰退、新技术的替代效应、短视频的冲击、来自社交媒体的流量缩减等背景,致使新闻业面临困境。在这种情况下,AIGC的出现对新闻生产乃至整个新闻业来说可能是一道曙光。那么,AIGC会给新闻业带来哪些新的可能?它会是困境之中的一种出路吗?
1. AI辅助新闻生产不是新事物
在探讨AIGC所带来的变革之前,回顾新闻业的发展历史,可以看到AI介入新闻业尤其是新闻生产环节并非没有先例。过去十余年,由人工智能引发的新闻业创新浪潮可以分为三个阶段:自动化报道阶段、增强报道阶段和生成报道阶段。
第一阶段,人工智能自动化报道的阶段。在这个阶段,主要是利用AI的自然语言生成(NLG)能力,进行新闻的自动化报道。美联社、路透社、彭博社、法新社等媒体机构都有代表性的实践。自动化报道利用程序自动化生成文本内容,在报道效率和准确性方面具备优势,但由于缺乏思考能力和共情能力,难以写出与人类记者相媲美的报道,因此仅适用于特定领域,如财经、体育等可模板化生产的新闻类型。
在应用方面,例如路透社开发的名为“AI新闻生产线”的新闻自动生成系统,可以生成股票、体育和天气等类型的新闻;《华盛顿邮报》使用名为Heliograf的自动化写稿机器人,可以生成科学、政治和体育等领域的简单新闻报道;日本NHK电视台上线的自动写稿系统,在2011年3月的东京大地震报道中表现突出。
腾讯2015年推出的DreamWriter和新华社的快笔小新等产品,则是国内在自动化报道方面的代表性实践。2018年全国两会期间,新华社推出的“媒体大脑”从5亿网页中梳理出全国两会舆情热词,并生成发布全球首条由机器生产的两会视频新闻,仅耗时15秒。
第二阶段,人工智能增强新闻报道的阶段。这一阶段着重运用机器学习和自然语言处理(NLP)技术,分析数据并揭示相关趋势。例如阿根廷《国家报》(La Nación)自2019年起开始使用人工智能来支持数据团队,后与数据分析师和开发人员合作,建立AI实验室以进一步强化AI应用。
AI在舆情分析方面的应用,同样是人工智能增强新闻报道的例子。在舆情分析环节,AI可以辅助完成情感分析、主题检测、预测与趋势分析等任务,帮助组织更好地理解公众观点与态度,以应对复杂的舆情环境和市场环境。例如,美联社与NewsWhip合作开发的应用,可以帮助专业人员追踪内容传播情况,分析内容将如何推动会员和客户的社交参与,从而调整内容策略,以更好地满足用户需求。
也有媒体利用AI的数据能力进行内容优化,如福布斯于2019年推出AI内容发布平台Bertie,可以生成更具吸引力的标题,并针对报道内容进行自动配图,以优化传播效果;《华盛顿邮报》也持续探索将AI纳入业务的实践,比如推出ForYou推荐系统,以及用AI模型检测订阅倾向和用户流失情况。
第三阶段,生成式人工智能(AI Generated Content)以多模态生成能力,参与新闻生产的阶段。ChatGPT、谷歌Bard、微软NewBing等产品的技术基础是能够生成叙事文本的大型语言模型,相较仅适用于财经报道、体育报道等领域的自动化报道阶段,AIGC可以进行更长篇幅、质量更高的报道撰写,并可以根据指令模仿特定作品风格。
AIGC的多模态生成能力还带来了新闻报道可视化的诸多新可能。目前新闻业尚处于这一阶段,相关实践仍待深化,但可预见的是,AIGC将影响新闻采集、生产和呈现等环节,进而改变整个新闻业的格局。
2. AIGC将实现新闻业“供给侧改革”
文生文、文生图、文生音视频、文生代码等多模态内容,都属于AIGC,即人工智能生成内容的范畴。传统内容生产模式,如UGC、PGC等等,主要区别在于作者的专业程度和构成属性,但本质上都是人作为主体来产出内容,而AIGC则是由AI来产出不同形式的内容。
AIGC对于新闻业的影响主要集中于新闻生产阶段。随着ChatGPT等AIGC技术能力的提升以及应用程度的加深,它对于新闻业的影响也会日益深化。目前的应用实践表明,AIGC对新闻业的影响,主要包括以下几个方面:
首先,新闻信息的采集与处理,优化生产流程。
借助plugins等插件,ChatGPT可以快速抓取和采集海量数据,并进行自动处理,如快速浏览文本和生成摘要,供记者进一步分析。这种能力提供了一种提升信息获取效率的可能,在资料检索阶段,记者和编辑无需阅读大量全文资料,而可利用ChatGPT的数据分析和语义分析能力生成摘要,快速获取核心信息,以提高工作的效率。
ChatGPT的语言生成能力还可用于翻译跨语言文本,方便记者和编辑获取不同语种的资料与信息。同时,AIGC工具能辅助记者进行采访音视频内容识别与整理,提高生产力并优化创作流程。根据我们所做的调研,“进行资料检索”和“翻译内容”是目前媒体从业人员最多使用AIGC的两种用途,分别占54.8%和44%。
利用AIGC增强采集和处理信息的能力,将在新闻报道中发挥越来越关键的作用。英国《金融时报》总编辑RoulaKhalaf指出,新闻编辑室应当建立一支AI技术团队,协助记者完成数据挖掘、内容分析及翻译等任务,《金融时报》已经在部署系列课程,以提高记者利用生成式AI挖掘故事的能力。
其次,新闻内容的生成,提升报道效率。
ChatGPT具有较强的学习能力和文本生成能力,在联网之后,还能迅速采集互联网资料进行新闻内容的生成。通过提示词(prompt)的设置,ChatGPT还可以生成特定风格的新闻报道。除此之外,ChatGPT可以应用于生成访谈提纲、文章框架和标题等内容,还能将新闻报道翻译成多种语言,打破语言边界,将新闻传播给多样化受众。
部分媒体已将AIGC纳入到新闻内容的生产流程中。如BuzzFeed将ChatGPT用于测验类内容的生成;2023年情人节前,《纽约时报》使用ChatGPT创建了一个情人节消息生成器,用户只需要输入几个提示指令,程序就可以自动生成情书;德国出版集团AxelSpringer和英国出版商Reach,近期也在地方新闻网站上发布了由AI撰写的文章。
全球首个完全由人工智能生成新闻报道的平台NewsGPT.com也已经上线。根据声明,该网站没有人工记者,由NewsGPT实时扫描、分析来自世界各地的新闻来源,包括社交媒体、新闻网站等,并创建新闻报道和报告。其创始人声称,NewsGPT“不受广告主、个人观点的影响”,7*24小时提供“可靠的”新闻。
最后,新闻报道的多模态呈现,催生“互动新闻”等新闻类型。
随着技术能力的提升,GPT-4已经具备多模态生成能力,除了文生文、文生图,未来还可能生成更多媒介形式。同时,借助Midjourney等AIGC工具,目前也已经实现文本生成图片、音频、代码、3D内容等多模态内容,这为新闻内容的生成创造了新的可能。新闻业曾经追求的“媒介融合”以及“全媒体记者”,现在因AIGC的出现与应用而见到曙光。
《纽约时报》于2012年制作的多媒体报道专题《雪崩》,包含图片、影像、数据、3D内容等形式,耗时6个月时间,动用11人团队花费25万美元才完成,而AIGC的多模态生成能力,将极大降低类似内容的生产成本和门槛。
同时,得益于ChatGPT的即时互动能力,可以用于开发针对于新闻业的对话机器人,将其融入到新闻报道中,即时回答读者的提问并且根据数据资料提供补充信息。这可能拓展出一种“AIGC互动新闻”的内容形式,强调与读者互动性,通过不断的提问与回答,呈现完整的新闻图景。AIGC还可以增强“虚拟主播”等技术形态,优化新闻呈现效果。
在广告营销内容方面,AIGC也表现出强大的生成能力,例如使用ChatGPT编写广告文案或利用Midjourney等产品直接生成广告内容,提升创建效率。此外,ChatGPT还可用于分析数据集,帮助广告主了解消费者的行为模式和市场趋势,以优化广告的投放效果。AIGC有望实现数字营销领域的变革。
3. 客观认识AIGC对新闻业的作用
总体而言,以ChatGPT为代表的AIGC技术在新闻信息采集、内容生成以及多模态呈现方面,具有提升效率甚至实现变革的潜力。未来,随着技术能力的进一步提升以及在新闻业的应用深化,AIGC将替代部分常规的模式化内容生产环节,将记者和编辑从消耗时间与精力的繁琐工作中解放出来,专注于更具创意的工作。然而,在这个过程中,“技术替代”导致的人力缩减问题不可避免,因此新闻从业者在新技术环境下的生存状况值得关注。
AIGC凭借强大的内容生成能力,有望实现一场新闻业的“供给侧改革”。但就现实应用情况来看,“改革”还为时尚早,目前ChatGPT等工具主要用于提升内容生产的效率,是自动化报道的“升级版本”。由于其仍不具备共情、思考、常识判断等基础能力,AIGC并不能真正用于深度报道的撰写,而是在特定的领域如体育、股票方面,以及“边角料”如测验内容的生成方面有所应用。
正如中国信通院云大所人工智能部副主任曹峰所评价,ChatGPT目前仍然无法代替具有高要求、高限定场景下的写作需求。从业界实践也可以看出,在ChatGPT大火之后,虽然不少媒体机构都进行了相关尝试,但并没有哪家权威媒体真正将ChatGPT应用于新闻报道的生产流程中。包括我们的调研结果也显示,仅有38.1%的新闻媒体机构,正在积极使用类似ChatGPT这样的AIGC工具。
这其中存在几个方面原因,包括:
内容可读性差。ChatGPT虽然能够快速基于提示生成内容,但可读性较差,其生成的内容更像是说明文,不具备思想性和阅读趣味性。新闻是对新近发生事实的报道,读者虽然想快速了解身边环境动态,但相比起枯燥乏味的“说明文”,更愿阅读可读性较强的新闻报道。可读性差的部分原因在于,ChatGPT缺少分析能力和调查能力,也不能进行与人类同样的原创表达,因此无法提供对事件的深入看法,只能堆叠无深度的“片汤话”。
2023年4月18日,公众号《每日人物》发布了一篇题为《这是我们第一篇完全由ChatGPT写作的稿件》的文章,由记者输入提示词,内容全部由ChatGPT生成。但无论是从实际文本还是读者反馈来看,这篇文章都不能比拟人类作者的水平,“索然无味”“小学生作文”“套路感”“生硬”“翻译腔”等关键词在评论区频频出现。与ChatGPT合作的人类作者也表达了对于此次合作的感受:“绝对称不上愉快,甚至可以用痛苦形容。”
信息源混乱。AIGC的技术原理是大模型,由海量数据组成的数据集构成了AIGC的模型训练样本。但是,这些数据中往往包含了书籍、媒体报道、学术期刊,也包括了自媒体文章、广告营销文案、社交媒体内容,形式繁杂,甚至可以用“鱼龙混杂”来形容。
对于专业媒体来说,其发布的新闻报道既要对读者负责,也要为机构声誉负责,信息源混乱的AIGC显然不是理想的选择。如彭博传媒首席数字官JuliaBeizer所评价的,媒体的定位是为读者提供基于事实的信息,但AI并不足以作为准确的信息源。
胡乱编造信息。“机器的幻觉”这个概念,用以形容AIGC“一本正经地胡说八道”的能力。“幻觉”一词源于心理学上的精神疾病“虚构症”(Confabulation),指个体会因担心对方失望或避免显得自己愚蠢而编造内容来回答问题。由于程序的设定,ChatGPT等工具必须对用户的提问给出答案,如果遇到训练数据集没有包含这一问题或者数据集有误的情况,ChatGPT就会编造出一个错误的答案。同时,它缺乏基本的常识和判断能力,因而无法意识到给出的这个答案是错的。
如果将其应用于新闻报道,需要匹配人工校对和核查,这反而增加了人类的工作量。2023年,美国科技新闻网站CNET.com一度上线了几十篇由AI生成的文章,尽管网站编辑声称文章在发布之前都经过了“核查和编辑”,但是很快读者发现,这些文章中有大量基础性错误,并且其中一半都存在抄袭和剽窃的问题。
因此,我们需要客观认识ChatGPT对于新闻业的作用,AIGC将革新甚至是取代新闻业的说法,其实还为时尚早。作为内容产业,新闻业对于优秀的人才需求始终不会改变,基于一手采访的深度内容将会变得越来越重要。正如《金融时报》人工智能编辑马杜米塔·穆尔贾(Madhumita Murgia)所言,生成式AI工具虽然能够综合信息、进行编辑,但是并不能输出原创内容,也不具备分析能力,“没有什么能取代有原创能力的人”。
达克摩斯之剑:AIGC会是新闻业的丧钟吗?
对于新闻业来说,AIGC将在内容生产环节掀起一场供给侧改革。然而,鉴于当前的AIGC技术水准,“改革”还远未到来。AIGC相当有限地被纳入到新闻业的生产实践中,并没有真正开始发挥价值。因此,讨论AIGC对于新闻业的挑战其实也为时尚早。但技术一直在迭代,从技术发展史来看,我们不能轻视任何一种技术引发的变革效应。当未来更加先进的AIGC被纳入到新闻业并得到普遍应用时,将会给新闻业带来何种挑战?这是我们需要思考的问题。
1. 破坏新闻生产的场域效应,冲击“客观性”等新闻理念
AIGC介入到新闻业的内容生产环节,在提升效率的同时,势必带来破坏性的影响。
ChatGPT应用于新闻生产过程中,在新闻事件发生之后,程序将相关信息进行抓取、分析、汇总后,快速产出一篇拼贴的内容,效率被发挥到极致。
但是,对于新闻业而言,原本处于新闻场域的多方力量都会对新闻报道内容产生影响,因此一篇报道的诞生,并非仅仅是记者个人的灵感迸发,而是多方力量博弈平衡的产物,也是新闻媒体机构化运作的结果。在这个过程中,记者也接受新闻专业主义的规训,尽可能确保报道的平衡与真实。但是当生成主体变成ChatGPT,这种新闻生产的“场域效应”就逐渐消失。
与之对应,如华南理工大学吴小宁教授在论文《ChatGPT信息“革命”对新闻业的冲击与挑战》所提到的,在这个过程中,新闻事实在历史文本的重要性提高。由于ChatGPT的原理是利用现有内容作为训练数据集,一个现象或事件的影响时间越长,相关内容就越多,就更容易被抓取和汇集到机器生产的新闻内容中。同理,某些新闻人物和新闻事件,如果具有更高的知名度,也就更容易被人工智能抓取和再次呈现,由此可能会形成“信息极化”效应,并形成由人工智能制造的“信息茧房”。
同时,信息抓取过程本身就涉及到法律和道德问题,比如AIGC抓取网络内容并作为训练数据集是否符合法律要求?被抓取内容的主体(特别是新闻记者等内容创作者)是否应该得到经济补偿?2023年2月,图片供应商Getty就以“侵犯版权”的理由起诉了StabilityAI。这些问题,至少目前尚处于迷雾阶段。
除此之外,ChatGPT式的新闻生成模式,将会冲击既有的新闻理念。新闻专业主义强调真实性、客观性、公共性等维度,这些理念是在新闻实践中逐渐形成的一套操作规范,以确保新闻报道不偏离真相。在以人为生产主体的传统新闻业中,记者会受到专业主义和职业素养的规训,在个人的生产实践中奉行这些观念。但ChatGPT没有主观意识,无法理解这些新闻理念背后代表的含义,而这些理念也无法被作为一串prompt被转化为ChatGPT所能理解的“语言”。
有观点认为,ChatGPT摆脱了个人主体的主观性,似乎更能进行客观、公正的报道。如同NewsGPT所标榜的,这家网站将客观真实地呈现新闻。但问题在于,算法本身仍有价值观,算法也会延伸现实世界的歧视现象,这是无法规避并且比人作为主体更难解决的问题。
北京大学新闻与传播学院胡泳教授指出,新闻业的“客观性”由人和机构的声誉和口碑来背书,但算法的“客观性”把任何机构刨除,其背后的逻辑认为技术是中性的,不存在人的偏见,因此可以保证客观。但问题是技术从来都不是中性的,也缺乏人的判断,因此它并不是“客观性”的拯救者。
值得注意的是,ChatGPT对新闻生产的影响还体现在从业人员对ChatGPT的不规范使用,容易引发抄袭、信源不清等问题。而根据我们的调研,大部分(81.9%)媒体机构都没有出台ChatGPT等工具的使用规范和指导方针。这是需要重视的现实问题。
ChatGPT对于新闻生产的影响还将体现在新技术所带来的就业替代问题上。由于ChatGPT的内容生产效率更高,在特定报道类型上能够取代人工记者,这种现象正在密集地发生。例如,BuzzFeed在宣布用ChatGPT辅助生成测验类内容之后,紧接着就宣布了裁员计划。同时,在2023年5月发生的“好莱坞大罢工”运动中,如何避免AI取代人类编剧的工作,也成为参与运动者的核心诉求。虽然这两个例子不直接指向新闻业,但这种现象会很快随着ChatGPT更深入地应用于新闻生产中而发生。
2. “劫持”流量,AIGC改变内容分发格局
当前,AIGC生成的信息比重尚低,但随着AI生成内容的广泛推广以及AIGC技术得到深度应用,内容分发领域将面临重大冲击。
在数字时代,在线新闻媒体的很大一部分流量源于搜索引擎,而生成式人工智能正逐渐成为搜索引擎的主要信息源。微软的Bing浏览器整合了ChatGPT,升级为NewBing;谷歌也宣布在搜索结果中将优先显示人工智能(如旗下的Bard)生成的内容。根据谷歌在2023年3月的测试显示,Bard仅提供基本答案和摘要,但并未附上新闻来源链接。
对搜索引擎来说,这是一种自然而然的“市场行为”,因为它能直接呈现整理过后的搜索结果,极大提升用户检索信息的效率,优化用户体验。然而,一旦形成这样的模式,即搜索引擎将更多流量分配给生成式人工智能的生成结果,更为深度、长篇的新闻报道内容将无人问津。
这不仅会影响流入新闻媒体的流量,还会显著削弱新闻媒体的收入。由于越来越多的用户直接从搜索页面获取所需内容,而不再点击进入新闻媒体的主页,依靠广告收入分成的新闻媒体的生存空间将受到压缩。以广告为核心的收入模式将面临巨大冲击,同时,媒体的订阅收入也将直接受损。
社交媒体同样受到影响。2023年上半年,BuzzFeedNews、VICE等数字媒体的倒塌已经印证了社交媒体的重要性,一旦这样的流量源头被掐断,依赖于此的媒体将会受到重击。诸如《纽约时报》《华尔街日报》等新闻媒体也都在Twitter、Facebook等社交媒体平台开设账号进行内容分发,当AIGC内容涌入到社交媒体上时,类似“新闻bot账号”的出现,也会夺走用户的注意力,用户倾向于选择获取快速、易得的新闻摘要,从而影响新闻媒体内容的曝光。
3. 受众4.0的诞生:从“新闻消费者”成为“新闻制造者”
对于新闻业而言,AIGC不仅将改变内容生产方式,同时也重构生产关系。
原因在于,作为一项底层技术能力,AIGC门槛相对较低,只要解决网络问题和账户问题,不仅新闻从业人员可以使用,普通用户也可以使用。对于前者来说,由于其专业化水平较高,考虑到可读性、生产时间成本等因素,对AIGC技术的接纳程度可能并不深入。而对于后者,即普通受众来说,由于没有类似的“专业包袱”,会更愿意使用相关技术。
在这种情况下,利用AIGC的生成能力,普通人也可以进行新闻信息的生成。例如,针对某一新闻事件,让ChatGPT快速生成一篇交代前因后果的新闻报道,也可以让ChatGPT生成近期发生的系列新闻的摘要,方便快速了解新闻。此外,还可以直接生成新闻评论等内容。
在这个过程中,受众不再仅仅是新闻信息的消费者,而是成为了新闻信息的创作者和生产者,由被动转成主动,从而实现了身份主体的转换。回顾技术发展史,互联网的出现已经实现过一轮转换。Web2.0时代,个人博客(Blog)、社交媒体等媒介形式的应用,使得普通人获得了“发表权”,即可以在网络上发表自己的各类观点。这扭转了前互联网时代传统媒体对发表权的独占局面。
由于建立媒体机构、创建一份报纸或一家电视台的成本极高,从而形成了信息发布的高门槛,普通人很难有机会和足够的资本建立自己的渠道,而借助互联网和移动设备,每个人都成为了“新闻记者”,随时随地记录、随时随地发布。
如果说互联网改变了内容分发的格局,那么以ChatGPT为代表的AIGC技术则实现了内容生产的“平民化”,普通人借助AI的力量,跨越专业门槛,成为媲美专业人员的内容生产者,基于自身需求,进行定制化的新闻内容生成。而借助社交媒体,发行的成本同样可以忽略不计。
研究领域对于“受众”进行了分类,作为日常对话主体的受众是“受众1.0”,作为媒体内容读者和注意力商品的受众是“受众2.0”,在“人人都是新闻记者”的社交媒体时代,能够随时记录、随时发表的受众成为“受众3.0”。那么,步入AIGC时代,借助AI,获得媲美专业生产能力的受众,直接迈入了“受众4.0”时代。
这对新闻业的影响是深远的。受众拥有采集和生产内容的能力之后,可以更加独立自主地进行内容消费,对新闻媒体产出的讯息依赖程度降低,进一步降低后者的影响力和“把关人”地位。新闻业的边界将变得越发模糊,如何形成与普通创作者的差异化、强化专业边界,从业人员如何应对职业认同危机,将是新闻业必须直面的挑战。
4. 假新闻盛行引发的新闻业信任危机
AIGC实现了内容生产的平民化,但同时也可能导致谣言和假新闻的泛滥。
新闻记者作为内容生产主体,一方面受到所在媒体机构和生产机制的限制,另一方面受新闻专业主义的约束,在进行新闻生产的过程中,他们会注意遵循各种原则,以确保新闻报道尽量平衡、客观且真实。真实性是对于公开发布的新闻报道最基本要求,包括事实真实、细节真实和信源真实。
然而,在生产主体泛化之后,这些限制将不复存在,AIGC有可能成为生成假新闻和谣言的工具。2023年2月,关于“杭州市政府将取消限行”的“新闻稿”在网络上流传,后被发现是某小区业主利用ChatGPT生成,并被其他业主截图转发,导致错误信息被传播。类似的事件还有2023年4月18日流传的《杭州市政府关于调整楼市政策的通知》,该消息称杭州将于5月实行楼市新政,而后被证实是ChatGPT生成的假消息。
这些假消息可能带来极高的政治风险和经济风险,损害相关主体利益,例如2023年5月,一篇由生成式AI撰写的假新闻“科大讯飞出现重大风险的警示文”引起广泛关注,导致科大讯飞公司股价大幅下跌。
在这些事件中,AIGC已成为造谣者的得力助手,它的生成能力使虚假信息传播和生产的成本降低,若不加以控制,由其生成的未经核查的虚假信息将严重污染信息生态系统,造成严重的社会影响。
AIGC在创建网站方面的能力,也可能被用于假新闻的传播。借助ChatGPT,只要具备基础编码能力,任何人都能创建一个虚假新闻网站。这也将污染信息生态,造成极大风险。同时,由于AIGC的特性,假消息流入内容市场后,如果不加筛选,有可能继续构成大模型训练的语料,导致谣言进一步传播和强化,形成更严重且持续的后果。假新闻的传播,将影响受众对于新闻的认可度和信任度,可能压倒事实、制造混乱,甚至将带来新一轮的新闻业信任危机。
AIGC时代新闻业发展的6种可能
新技术的应用,往往会带来颠覆性的变化。正如媒介学者约书亚·梅洛维茨所言:任何一种媒介的介入,都会创造出全新的环境。尽管目前AIGC尚未在新闻报道中被大规模运用,但面对来势汹汹的AIGC浪潮,新闻业无法置身事外,势必也将被卷入其中,甚至被彻底重塑。
从历史发展角度来看,作为社会发展趋势的观察者和记录者,新闻业并不抵触新技术,反而会将其能力融入到自身发展之中,以实现自我革新。本报告认为,随着AIGC技术能力的提升以及应用的不断深化,新闻业将会出现以下6种可能性方向:
1. 媒体专用大模型将得到开发与应用
目前AIGC在新闻业的应用程度尚浅,关键原因在于其信息来源不明且内容参差不齐,既有权威期刊的文章,也有自媒体、营销号的文章,还有大量假新闻、假消息,这是因为目前大模型多采用通用的训练数据库,因而呈现出来的内容质量良莠不齐。对于注重细节严谨、信息准确、信息源清晰的新闻报道来说,这些都是阻碍应用的难点。
另一方面,新闻报道具有一定的表达规范和话语使用惯习。在这种情况下,开发针对新闻行业的专用大模型可能将成为一种趋势。其训练数据集均来自新闻媒体报道,并且可以追溯来源,以保证信息真实准确、来源清晰、减少偏见,并且在内容呈现方面更加符合新闻专业的表达规范。
目前大模型训练成本逐渐降低,大型媒体机构有可能将拥有自家专属的大模型。这种趋势可能不仅限于新闻业,对于行业边界清晰、对信息来源和内容呈现规范有要求的行业(如法律行业)来说,研发专用大模型而非使用现成的通用大模型将是一种发展方向。在这一方面已经有很多实践例证,比如7月20日上海AI实验室与中央广播电视总台联合发布的“央视听媒体大模型”,集合了媒体的海量视听数据与实验室先进算法和技术基础,提升视听媒体制作的质量与效率。
2. 事实核查与内容校对将成为关键角色
事实核查与内容校对在传统新闻行业具有举足轻重的地位,几乎所有的传统新闻编辑部都会设有专门的校验部门(copydesk)。然而,随着媒体数字化进程加速,核查与校对的重要性逐渐降低。一个很鲜明的例子是,近年来媒体进行大规模裁员时,核查与校对等部门往往是裁撤的重灾区,足以显示数字媒体时代对于核查与校对职能的忽视。
但是,随着AIGC的应用,事实核查与内容校对的角色将越来越关键。类似岗位将继续扮演“把关人”的角色,对AIGC生成的内容和细节进行校对与核查,以避免产生AIGC胡编乱造的情况,从而防止“机器的幻觉”等不可控的现象出现。面对愈加发达的技术,媒体也应加强与学术机构和科技公司的合作,提高识别错误内容的能力。
同时,由于AIGC的运作原理是对训练数据集中的内容进行重新组合拼贴,对于新闻业来说,报道的原创性是必须捍卫的底线。因此,核查与校对的指责也包括对AI生成的内容进行“查重”,对不规范引用的内容予以删除或进行来源标注,避免因“抄袭”引发的舆论风险,损害机构声誉,同时防止媒体伦理失范以及法律与道德等问题。
3. 新闻业的AIGC使用伦理、规范将建立
新闻业作为专业领域,有自身的专业主义和伦理、规范要求。针对AIGC这种新技术形态,相关的使用伦理、规范也应当建立,以在专业内形成统一的原则,便于从业人员遵守。
这些伦理规范既包括基础性原则,如“使用ChatGPT生成的内容必须进行标注,确保读者知情”“使用ChatGPT生成的内容,必须由人工进行核查与校对才可发布”,也包括一些具体性的操作规定,例如在一篇人类与AI共创的报道中,AI创作的内容不得超过一定的比例等等,以尽可能降低AIGC应用所产生的乱象。适用于AIGC时代的《新闻的十大基本原则》呼之欲出。
目前已有媒体开始推动此类实践,如科技媒体《连线》就制定了相关规定,对使用AI的目的及工作流程进行了明确界定,以确保内容质量。规范并非束缚,合理的规范将有助于技术更好地融入并发挥价值。规范确立的主体可能是行业协会,而每一家新闻机构结合实际经营状况,也会形成自身的相关规范与要求。除了伦理规范,帮助从业人员更好地了解与使用AIGC的指导手册和课程也同样重要。如何借助AIGC辅助自己的新闻报道实践,将成为未来新闻记者的关键能力之一。
4. 新闻分层,权威的专业新闻报道将更加重要
在AIGC时代,权威专业新闻报道的重要性将愈发凸显,重塑专业性将成为新闻媒体机构的重要使命和一条出路。AIGC在内容生成方面大大提升了效率,然而,机器生成的文字与人类撰写的内容存在差异,前者虽然快速且框架完整,却无法取代“好”的新闻报道,后者将始终拥有受众市场。这里所说的“好”,包含优秀的文笔、高度的可读性、极强的共情力……这些因素共同构成了触动读者的条件。
AIGC介入新闻生产,新闻事件发生时可以在第一时间迅速生成一篇要素完备的报道,将会满足受众基础的信息需求。然而,对于事件的深入挖掘及背景信息的补充,仍然需要人类记者深入现场,进行一手的采访和调查。因此,未来新闻类型会进一步发生分化,一方面,即时的事件性报道和资讯类报道将由AIGC完成,在这个领域,人类记者的空间将会越来越狭窄,另一方面,权威专业新闻报道和深度报道将变得更为重要,也将获得更多关注。
相应地,媒体机构、新闻记者与读者之间的联系也将愈发关键。AI作为生产主体的一个问题在于,它无法与读者建立起情感联系,大部分情况下,读者往往能清楚地意识到AI就是AI,是没有情感和意识的系统,这会削弱读者对内容的信任度,而这正是人类记者的机会所在。强化与读者的连接,打造机构品牌与记者个人品牌,将成为关键议题。
5. 新闻业会发生“本地化新闻”转向
由于AI大模型的训练原理,通用文本构成训练数据的主体,基于本地内容的文本量较小,即便纳入训练数据集,也容易被其它类型的信息淹没,因而AIGC在本地化内容生成方面表现欠佳。与此同时,受众对本地化报道的关注程度并未减弱,因此,AIGC时代的新闻业可能发生本地化转向的趋势。
数字媒体出现以来,对本地新闻的忽视日益明显。互联网的扁平化和低门槛特性,使得一个网站的潜在受众理论上是全世界的上网用户。对于在线媒体来说,为了提升网站内容流量和曝光度,在内容生产和呈现方面往往会采用全球化策略,尽可能将关注范围扩大,报道全世界范围内发生的重要事件。这种倾向反过来也影响到传统媒体,越来越多的地方性报纸在新闻采编中逐渐扩大全国性报道的比例。
与此同时,本地化新闻的报道逐渐被忽视。这也是受众产生“新闻回避”情绪的重要原因。受众对本地化新闻的需求未被满足,很多时候,受众只想了解自己身边在发生什么,并不想关注太多遥远的新闻事件。许多媒体注意到这一趋势,并将报道重点回归到本地化报道。这种转向趋势在AIGC时代将继续进行,越来越多的新闻媒体将专注于本地化新闻的报道。
6. AIGC应用深化催生新闻类型创新
新闻业对于新技术的接纳,相对而言比较积极。新闻业擅于将各种新的媒介形态运用到新闻报道中,实现更丰富的呈现效果。例如,借助大数据和算法技术,数据新闻兴起,以客观数据的可视化呈现为特色;再如,借助多媒体技术,《纽约时报》对华盛顿州喀斯喀特山脉隧道溪发生的雪崩进行了全方位报道,上线数字化专题报道《雪崩》,包含文字、图片、影像、数据内容等多种媒介形式,被认为“重新定义了新闻报道”。
同样,通过吸纳AIGC技术的特点与优势,全新的新闻类型也将会涌现。较有可能性的创新之一是“智能互动新闻”,即报道主体聚焦新闻事件的核心,而读者可以随时通过附着在报道页面的对话框进行互动,了解新闻的背景性信息、事件的前因后果与历史脉络,甚至是最新事件进展等,受众与新闻报道的互动性将得到前所未有的增强。当然,这只是可能性之一,随着AIGC在新闻业应用的不断深化,未来或许会出现更有想象力的新闻类型和业态。
结语:AIGC会取代新闻业吗?
德国学者斯托伯尔总结了技术进化的三个阶段:首先是“发明”,其次是“创新”,最后是“制度化”,即形成文化。概括而言,“发明”是从无到有的创造,“创新”则是基于发明的利用和改进。就目前的情形,AIGC还处于发明阶段,并正在迈向与各个领域融合的创新阶段。从技术发展史来看,任何技术被社会所接受、采纳并真正发挥作用,都需要一个漫长的过程。我们既不能低估AIGC可能引发的变革,也不能高估变革实现的速度。
AIGC正在推动新闻的采集、生产、呈现等环节实现创新,但是“颠覆”“变革”等还为时尚早。在我们的调研中,多数从业者(50.5%)也认定,对于新闻业来说,ChatGPT等工具更多是一种辅助型角色,只有10.5%认为这些工具是质量改进工具。
AIGC对新闻业最根本的影响,是引发了新闻生产方式的变革,从而实现生产关系的重构。具体一点来说,AIGC提高了新闻生产的效率,并且降低了新闻生产的门槛,利用ChatGPT等AIGC技术,受众可以基于自身的信息需求,生成定制化的新闻资讯和评论。由此,传统的受众完成身份转换,由被动的信息消费者,转变成主动的新闻生产者,这将改变新闻业的格局和既有认知。这才是新闻业最应该警惕并需要应对的趋势。
当然,先进的技术或许会改变生产方式,但却改变不了责任所在。尤其对于新闻业来说,即便所有稿件都由AIGC生成,人类也将一直是AI背后的道德行为人和最终把关人。从这个角度出发,人类的责任将更重要。强化主体责任,加强核查,形成AIGC的应用伦理与规范也将越来越重要。
“新闻”一词,不仅仅指代我们能够读到的“新闻报道”,也指代着新闻业及其所承载的新闻传统,包括价值理念、操作规范、伦理原则等等。作为没有意识的主体,AI始终无法传承并遵循这些传统,而这些传统是新闻业得以存在及延续的安身立命之本。
ChatGPT也不会取代新闻记者,只是取代了他们的部分工作。经验丰富的新闻记者对新闻事件有高度的敏感性、洞察力和共情能力,能够提炼新闻价值,并以流畅的文字付诸于笔端。这些主观特质,都是ChatGPT难以取代的能力。大浪淘沙之下,优秀的新闻记者与权威的新闻机构,将会越来越重要。工具理性滥觞,势必应该坚守价值理性。对于新闻业来说,强化专业性和权威性,重视调查性报道、解释性报道,将是AIGC时代的一条出路。
很多人觉得,ChatGPT已经出现,那就让GPT写稿,甚至能取代新闻业。但这种观点,显然忽视了新闻业的复杂性及其所存在的意义。真正的新闻业是“船头的瞭望者”,维护公共利益,为民众表达诉求,这是新闻业的责任所在,也是一代代新闻人奋斗的出发点。技术工具无法理解这种激情,我们也不能企图将责任感和专业性转化成一行行prompt传递给ChatGPT。在这一点上,AIGC永远无法取代新闻业。
本文来自微信公众号:腾讯研究院 (ID:cyberlawrc),作者:王焕超、胡晓萌,项目策划:杨健,统筹支持:张钦坤、付涛、周政华、刘琼、田小军、王强、井婷婷、刘金松、窦淼磊、郭晓静、石迪、张金平、曹建峰、陈孟、黄忻渊、王健飞、王枢、陈维、王维佳