近年来,以大模型为代表的新一代人工智能技术飞速发展。2022年11月,美国OpenAI公司推出ChatGPT,标志AI技术应用已进入人工智能生成内容(AIGC)新阶段。从ChatGPT所代表的“从文字到文字”内容生成,到Midjourney软件所代表的“从文字到图片”静态视觉内容生成,再到2024年2月OpenAI发布的Sora模型代表“从文字到视频”动态视觉内容生成,仅仅15个月时间,AIGC技术飞速迭代,能力不断增强,已开始被全世界各种媒体机构关注和尝试使用。
在1448年古登堡印刷术发明开启人类信息传播新纪元之后,当前人类再次走到一个新的传播拐点:处于碳硅文明融合的重要关口,我们的社会、我们的传播该何去何从?
本文以在全球新闻传播领域扮演重要角色的世界四大通讯社的人工智能应用实践为观察对象,浅析三个问题:主流权威的新闻机构对待人工智能技术的态度是什么?人工智能如何改变新闻内容生产和传播模式?新闻从业者有哪些能力暂时不会被人工智能替代?
一、人工智能如何改变新闻机构
为考察媒体应用人工智能的具体情况,笔者选取新华社、美联社、路透社、法新社为观察对象,这四家通讯社因其规模、发展历史、影响力、订户数量,以及日发稿量和年发稿量等因素而被公认为世界四大通讯社。它们在全球新闻传播领域扮演着重要角色,为世界各地的媒体和公众提供及时、准确的新闻报道。
(一)新华社的人工智能应用现状
新华社是国内最早开始尝试把AI技术应用于新闻生产的媒体之一。2015年,新华社推出“快笔小新”,供体育部、经济信息部和中国证券报等部门使用,可从结构化数据中自动生成体育、财经等新闻。近年来,新华社持续追踪AI技术前沿成果,创造性地研发新闻应用场景,实现新闻生成全流程智能化嵌入,比如新华社的“智能化编辑部”,用AI技术再造新闻生产。在采集环节,记者应用“现场云”移动采集系统和手机、录音笔等硬件发起“现场新闻”直播,同步采集文、图、视频等全媒体形态新闻素材。在生产环节,利用“媒体大脑”、AI合成主播等工具和平台,对新闻素材进行分类和标引,生产文字、图片、AI主播视频、短视频、地图新闻、数据新闻等全媒体产品。在分发和反馈等环节,基于用户画像技术,实现精准推送,依托区块链等技术,精准评估传播效果。新华社应用AI技术研发的工具,覆盖选题策划、调度采集、编辑加工、分发供稿、传播分析、业务管理等6个环节。
2024年全国两会前,围绕重大主题、新闻生产、海外舆情等核心场景,新华社基于大模型和智能搜索技术研发出一个行业模型“采编助手”,具有包括引证溯源类、知识检索类、综述归纳类、智能工具类等十几项功能。
“采编助手”模型目前还在持续优化迭代。新华社采编人员每天都在投喂训练这个模型,每周有反馈机制,不断优化,以期让模型更好用。目前使用量较高的功能是“内容核查助手”“要点提取助手(含AI标题)”“智能搜索助手”等。
笔者对新华社超过50位一线记者编辑做了口头访谈,发现所有人都或多或少地使用这个“采编助手”模型,应用场景几乎覆盖所有采编环节:
1.采访前阶段:查找政策文件、追踪舆情热点、策划报道方案、查找某主题的已有公开报道、生成采访问题单等;
2.采访阶段:AI记录,把语音、视频等转录为文字,将外文采访素材翻译为中文;
3.写作阶段:创建提纲、生成标题、改写导语、词语润色等。
4.核校阶段:内容核查、校对错误等;
5.多媒体产品制作阶段:语义搜索相关图片、制作海报、文图生成视频、生成多语种视频等。
受访记者编辑普遍认为,人工智能不仅分担了他们整理录音、核校文字等简单机械劳动,也打开了记者编辑的创意空间,激发了创造力。比如,很多记者都会参考AI给稿件取的标题,因为同一篇文字,AI能按照记者的要求,对消息、通讯、新媒体稿等不同体裁取出几十个备选标题,从观点、措辞、风格等方面启发记者编辑。
(二) 美联社的人工智能应用现状
2013年,美联社使用AI生产新闻内容,主要是将AI应用于体育新闻数据和财经新闻数据的分析,并生成自动化新闻。2014年,美联社在编辑部建立了自动化报道团队,启动新闻自动化生成的探索。其与人工智能领域的新兴初创企业合作,自动制作某些新闻内容。例如,与科技公司Automated Insights达成协议,借助该公司的自然语言生成平台Wordsmith,使用人工智能制作新闻内容,对财经数据进行自动分析并生成文本。这一机制大幅提高新闻生产效率,使得美联社能够将其财报覆盖从原先的300家公司扩大到现在的3000家。
此外,美联社采用名为NewsWhip的新闻机器人。它能够对社交网络上的竞争对手和用户参与度进行分析,对社交媒体上的讨论趋势进行预测和追踪。这些信息为记者和编辑提供有价值的线索,使他们能够更精准地把握和跟踪新闻动态。截至2020年,已经有近一半的美联社财经新闻内容来源于自动化系统,大幅提升新闻产出效率。美联社还使用机器学习技术优化编辑工作流程,建立了新闻分类、自动打标签和素材整合推荐系统,以便编辑快速获取相关新闻素材。
随着ChatGPT问世,美联社近年与OpenAI等多家前沿科技企业达成合作,在多模态搜索、新闻产品和服务等方面也进行了多项有益尝试。2023年,美联社推出一个AI驱动的多模态搜索平台,该平台能让用户通过语义搜索更容易地找到符合搜索条件的照片和视频。该平台与新华社2023年4月推出的“闻觅”统一数据库具有同类功能。
为规范AI在新闻产业的应用,并确保其安全和准确性,美联社还发布一系列关于人工智能工具使用的指导方针。这些方针不仅涵盖了AI生成的文本、图像和多媒体内容的审查标准,还包括在其知名的《风格手册》中增设了关于如何报道与AI相关故事的专门章节。2023年7月,美联社和OpenAl达成协议,研究生成式人工智能在新闻产品和服务中可能使用的案例时,共享对选定新闻内容和技术的访问权限。
美联社“NewsWhip”首页截图
(三)路透社的人工智能应用现状
路透社2016年开始采用人工智能技术,用于提升其新闻生产和分析能力。其旗下项目Reuters Newsmaker使用自然语言处理技术监控和分析海量信息来源,运用机器学习生成多种类型新闻的初稿,包括金融市场报道、体育赛事报道等。这种自动化草稿生成系统极大提升了路透社的新闻产出能力,新闻生产效率比传统方法提高了10倍。
在编辑生产流程中,路透社使用知识图谱和机器学习编辑社内大量文档资料,建立智能内容推荐和文章自动标注系统。这可帮助编辑在更短时间内找到所需信息,大幅提升工作效率。在股市实时报道上,路透社开发出自动文本生成系统,每秒自动产出上百字的股市数据变化新闻。多语言服务上,路透社应用机器翻译提升新闻产出效率。
路透社还与语义辨识技术公司Graphiq进行合作,给新闻媒体提供许多免费的数据可视化素材,这些素材涵盖娱乐、体育、政治、经济等内容,媒体可以通过路透社的Open Media Express平台访问这些数据,且这一数据可视化服务实时更新。
2020年2月,路透社与从事AI研发的Synthesia公司合作推出虚拟体育报道主持人,该虚拟主持人外貌和声音与读体育赛事摘要的主持人完全相同,比赛摘要则是使用路透社的文字报道和摄影图片,展示关键动作和评论,全程无需人工编写、编辑或制作。
2023年7月,路透社发布快速找到路透社视频中的关键人物和时刻的功能,实现更快发现、编辑和发布,该功能是由路透社专门的应用创新团队通过微调机器学习模型来构建的,提供在交互式场景中语音到文本转录,将多种语言翻译为英文,标记视频中关键人物,增强搜索能力。
值得关注的是,为解决人工智能难以识别假新闻这一问题,路透社推出一个名为“News Tracer”(新闻追踪器)的AI系统,能够在X(原Twitter)上识别真正的新闻。根据算法,它对Twitter每天发布的约5亿条推文进行筛选,以区分真实新闻和垃圾邮件、废话、广告和噪音。据《哥伦比亚新闻评论》报道,这个新闻追踪器与其他流行的监控工具不同之处在于,它的构建是为了像记者一样思考。据哈佛大学尼曼实验室(Nieman Lab)分析,这个系统使用诸如原始发布者的位置和状态以及新闻传播方式等信息,为所讨论的新闻项目建立一个“可信度”评级。该系统还对记者认定为可靠的来源进行交叉检查,并使用那个初始网络来识别其他可能可靠的来源,新闻追踪器还能够区分趋势标签和真正的新闻。
(四)法新社的人工智能应用现状
法新社的人工智能应用主要通过“Medialab”(媒体实验室),这是一个小型多科学团队,处于利用AI及相关技术打击虚假信息和提升新闻工作的前沿。该团队参与了法国和欧洲资助的多个研发项目,在开发打击虚假信息的尖端工具中起到了关键作用。其作为主要开发成员研发了揭露虚假信息的InVID-WeVerify浏览器扩展插件,该工具在2023年初已有224个国家和地区9万多名活跃用户。他们还深入参与了由欧盟地平线2020研究和创新计划资助的Vera.ai项目,专注于基于AI的验证服务和工具,以及之前参与的致力于通过参与式验证和AI算法解决内容验证、虚假信息传播的WeVerify项目。
此外,该实验室还开发各种AI智能工具:用于音频转录的AFP Transcriber、交互式内容生成器AFP 4W以及交互式HTML5视频工具。他们还参与EuropeanYouVerify项目,专注于年轻人的视觉素养培训,以便区分真实和被操纵的图像和视频。
法新社还参与使用AI技术对新闻进行研究的学术项目,以便改进媒体报道。比如,2020年伦敦政治经济学院的媒体智库Polis发起了一个由法新社和欧洲多家媒体机构参与的研究,使用AI自动追踪新闻内容中的性别偏见和刻板印象。
法新社高度重视AI使用中的知识产权等问题。2024年,法新社和一些新闻和出版组织联合发出一封致全球政策制定者和行业领袖的公开信,呼吁制定全球AI政策以保护编辑完整性,具体包括:披露用于创建生成性AI模型的训练集;保护用于训练AI的内容制作者的知识产权;媒体机构集体与AI模型运营商和开发者就专有知识产权的使用进行协商的能力等。
(五)通讯社应用人工智能技术的三大特点
四大通讯社都在积极拥抱人工智能技术,在人工智能创新应用方面有三个鲜明特点:
一是四大通讯社都已将人工智能技术广泛应用于新闻生产的主要流程,包括信息搜集、舆情研判、数据分析、智能推荐等技术,重塑了议题设置、报道策划、信息采集、编辑加工等流程,有相当量的环节AI可以独立处理,一些核心创意环节、深度理解环节还需要人类为主、AI辅助完成。
二是自ChatGPT问世以来,这些媒体机构陆续推出应用生成式人工智能技术计划,通过自主打造或与技术公司合作方式推出媒体领域的大语言模型,不断探索新闻报道场景大模型的研发和应用。可以预见,未来会有更多媒体行业的大模型和小模型出现,适用更多应用场景。
三是媒体机构非常注重防范生成式人工智能带来的潜在威胁,部分媒体通过制定AI使用规范、研发AI生成检测算法和工具,积极应对人工智能技术带来的风险和挑战。
二、四大通讯社应用人工智能实践的启示与思考
通过研究四大通讯社的人工智能应用,分析这些媒体机构的多媒体产品,笔者发现,现阶段人工智能至少在三方面还无法替代优秀的新闻从业者。
第一,人文关怀。一切新闻都是关于“人”的。任何宏大主题,都要落脚到人。从议题设置、信息收集、内容生产、分发传播这个全链条看,如果没有对人的深切关怀,新闻就没有意义。而技术工具无法理解这种使命,AI技术是冷冰冰的,没有价值观、同情心、敬畏心。比如,在一次重大自然灾害报道中运用AI,它是否能衡量人员伤亡和经济损失孰轻孰重,哪个应该优先报道?它是否会严重侵害受伤害个体的隐私?它是否会关注弱势群体的利益?所以,人工智能时代,新闻从业者的立身之本将不再是无差别信息收集加工,而是秉持深厚的人文关怀,识别受众日益差异化的信息需求,利用独有的创造力,提供有情感、有深度、有价值的细分产品满足受众需求。
第二,建立信任。AI目前应用于新闻业主要在文本分析、技术赋能等方面,但在生产链上游的新闻采集方面,AI不具备突破能力。比如,优秀记者区别于普通记者的一个关键指标就是,与消息源之间有深厚的信任。这可不是简单地说,记者有某重要人士的电话、微信号就行,而是记者通过积年累月的客观公正报道,形成了对某些领域的全面深入见解,得到了行业普遍认可和社会公信力。这样行业里的重要参与方,包括机构等,都会与记者保持密切的联系。也许双方很久不联系,但关键时候,重要人士会接受记者提出的采访需求或主动告诉记者,“我要通过你和你所在的新闻机构披露一个消息”。这不可能在AI大模型中输入提示词就能得到。这是任何AI无法替代记者的地方,也是记者需要持续下功夫的地方。无论技术如何发展,人类的情感、创造力、同理心都不可取代,在人与人的深度连接、共情方面,记者大有可为。
第三,追求真实。真实是新闻的生命,也是记者的职业追求。而“仿真”是AI的“天性”。对AI的界定通常引用图灵测试的标准,即“如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么称这台机器具有智能”。现在,AI生成内容日益近似人工、难辨真伪,像AI合成语音能够模仿任何人的声音,Deep-Fake(深度伪造技术)能伪造出“让任何人干任何事”的虚假视频,这给新闻生产带来极大干扰,也挑战公众甄别真假的能力。比如2024年2月,香港发生一起震惊世界的“变脸诈骗”案,骗子邀请一家跨国企业香港员工进入用深度伪造技术制作的“高管视频会议”,以总部首席财务官名义发出汇款指令,员工被骗转账2亿元。
所以,人工智能时代,媒体机构的责任感和专业性更加凸显。新闻从业者要坚持抵达现场调查研究,在新闻采集的源头捍卫真实,同时在生产传播全链条上更加警惕防范“假”,更好担当信息的看门人。
每一次技术突破,既是推动行业进步的引擎,也是反思行业发展的契机。哪怕AI技术日新月异,新闻最核心的竞争力还是优质内容。新闻工作者要保持对社会的密切关注,持之以恒地学习。在把握社会脉动、提高采访质量、触达更多受众等方面,新闻工作者有很多事情可以做。重塑专业性和权威性也将成为媒体机构在AI时代的使命和出路。
2023年底,笔者看到报道说,随着人工智能的崛起,《韦氏词典》(Merriam-Webster)将2023年度词汇选为“authentic”(真实的)。而2024年3月美国芯片领军企业英伟达创始人黄仁勋在开发者大会说出振聋发聩的“The future is generative”(未来是生成的)。
“真实的”还是“生成的”,这是一个问题,留给新闻从业者,也留给这个时代所有人。(作者熊争艳系新华社国内部深度新闻采访室副主任)
来源 《中国记者》