AI给新闻业带来致命威胁？哥大新闻学院权威报告给你答案丨雷报第31期

本文作者：李秀琴

2017-11-04 23:35

导语：AI对于正在陷入困境的新闻业来讲，是一个急迫需要的生命线，还是新闻业生存的下一个致命威胁？

雷锋网按：随着越来越多的新闻媒体开始采用AI进行新闻报道，AI和自动化技术的日益增强正在改变整个新闻业。那么对于正在陷入困境的新闻业来说，AI究竟是一个急迫需要的生命线，还是新闻业生存的下一个致命威胁？

日前，数字新闻中心（ the Tow Center for Digital Journalism）和布朗媒体创新研究所（the Brown Institute for Media Innovation）联合技术专家和记者召开了政策交流论坛，一起讨论了AI如何影响新闻媒体，以及如何将AI更好的应用于新闻领域这一议题。在本次报告中，他们着重讨论了这四个问题：

记者如何利用AI来辅助报道？
AI可以替代哪些新闻室角色？
新闻机构还未应用AI技术的领域有哪些？
AI最终将成为新闻报道不可或缺的一部分吗？

议题一：AI在新闻业的应用

如大家所了解，每个新闻编辑室都有一套独特的AI方法。经过几次案例研究，AI在新闻机构中贡献最大的活动共有以下三类：

在数据量很大或很复杂的情况下，AI可以作为一种突破性工具，排除人身认证的外部或特殊情况--这个角色完全适用于标准的新闻编辑室的流程。
识别趋势（或偏离趋势）：AI的大量计算能力可以帮助提供数据聚合的表征，或有可能按照时间、地理或人口统计分组。此外，它还能快速识别离群数据。
检查AI或计算的应用程序可以作为故事本身的主题：算法是由人类构建的，所以不可避免带有人类的偏见——如何通过这些工具找到复杂的思想？当这些工具被国家或城市具体采纳并运用时，又会发生哪些不可预知的情况？

1、几大具体案例

AI可以通过以下几种方法来增强记者的工作：分类文件；识别数据中的异常值。当然，在讨论的过程中经验丰富的人类经常会运用真实新闻来做判断，以作为新闻编辑室工作的重要组成部分。

虽然有许多有据可查的由AI编写的新闻故事，例如体育赛事的总结、公司财报的发布，甚至地震等数据模式，但很少有与会者认为记者的工作会完全被机器或算法取代。只有在人类的操纵和验证结果的情况下，AI才能更好的帮助自由作家持续不断地重写相同的故事，并处理更多的原始报告。

最近的一些案例，比如，《洛杉矶时报》记者使用分类器检测LAPD（洛杉矶市警局）降级犯罪分类的实例，取得了显著成功；亚特兰大宪法机构对医生实施的性虐待的调查；路透社的主题建模，以寻求最高法院上访问的权利中心；ProPublica（美国一家非政府、非盈利的网络新闻机构）日前联合谷歌推出一个基于机器学习的工具——仇恨犯罪新闻纪录索引。它通过对大量新闻文章的分析，建立起一个全国范围内的能预测仇恨犯罪发生地的预警图；《纽约时报》在报道总统特朗普的就职典礼新闻事件中，使用了人脸识别技术以获取观众席的情况信息。

对于一些记者来说，他们可能会在GitHub抓取示例代码，并将其应用于新闻报道中。但是，除非这名记者对这些工具或技术有很好地了解，不然可能会出现不法行为的风险。

2、记者在使用数据时应注意陷阱

记者在使用从社交媒体到政府机构的数据时，应小心陷阱。他们必须小心评估这些新型信息来源的可靠性，特别是在涉及AI的情况下。比如，使用Twitter作为社交媒体平台的记者，必须谨慎使用这些数据来分析社会行为。

3、出版商的挑战：包括大型和小型新闻机构

所有这些新工具，新闻机构都有责任和义务训练记者、编辑以及开发人员如何正确的使用它们。虽然像《纽约时报》这种大型新闻机构，资金可能不是问题。但对于资源较少的小型新闻机构来说，这将是一个不小的挑战。

新闻媒体的领导人可能面临的一个决定在于，如何与他人建立AI工具使用上的合作。因为使用复杂数据集和自定义算法进行的调查分析和团队建设可能需要几个月的时间，而这并不是所有的新闻机构都能独自完成的。

与学术机构和研究人员合作可以成为新闻机构在新闻编辑室中开始使用AI工具的好方法。不过，新闻编辑室和学术实验室的文化差异很大，二者在创造AI工具的目标上可能会存在分歧。

议题二：AI技术如何适应新闻报道规则？

AI技术如何适应新闻管道？如前所述，AI在报道、内容创建、分发和受众互动起的作用越来越大。比如，近日，开发众包、头脑风暴和事实核查工具正被用来收集数据信息，特别是用于构建相关数据。在当代的新闻编辑室中，自动化已成为竞争的关键工具，不仅是为了获取客户关注，还用于和大型平台的竞争，如Netflix、Facebook和亚马逊。

1、自动化写作和个性化推介

自动化可以在短时间内处理大量的任务，例如在几分钟甚至几秒钟内分析和汇总大量的数据，从而尽可能的减少记者的负担。另一方面，许多社交媒体平台和网络公司也都实证了个性化推送是捕捉注意力的一种有力工具。如，Netflix使用行为数据为观众提供观看建议；亚马逊的成功部分原因在于它为购物体验提供数据驱动的个性化设计。

1）案例一：Wibbitz

Wibbitz公司和《今日美国》报的体育报道部门开始合作，该公司可以把媒体记者写作的文字报道在短短几秒钟内制作出短视频。Wibbitz公司最核心的AI技术是“文本转换视频技术”（Text-to-Video Technology）。一开始，Wibbitz的AI技术会分析一个故事文本，然后在这个文字报道的基础上形成一个摘要，紧接着，AI将这个文本摘要转换成一个伴随有照片、图形及其它更多媒介形式的带有画外音的短视频。实际上，整个制作过程就是利用AI驱动软件，将一个文字报道内容压缩为一个故事脚本，然后将一系列图像或视频片段串接在一起，并添加一些画外音。

2）案例二：BuzzFeed

BuzzFeed是另一个进入AI领域的知名媒体。在2016年美国大选期间，BuzzFeed的“新闻开放实验室”（Open Labs for Journalism）开发了一个新闻机器人（Buzzbot），这个新闻机器人可以搜集共和党全国代表大会中来自不同消息来源的新闻信息。AI驱动的新闻聚合器可以追踪实时选举结果和投票报道，这样媒体记者就不用通过人力来完成这些工作。有了新闻机器人，BuzzFeed的记者可以集中精力去报道更加复杂和场景化的新闻故事，而这类新闻是机器学习解决方案技术，自身无法生产出来的。

3）案例三：路透社

路透社为了解决真假信息辨识的问题，他们使用新的新闻追踪系统叫做News Tracer，针对每天5亿则Twitter信息进行演算，从假新闻、不合理的新闻、广告、杂音中找到真的新闻事件，有了算法的辅助，记者可以从社交媒体众多信息中脱身，把更重要的时间用来挖掘故事。News Tracer 与其他监控工具不同之处在于其模仿的是记者的思考方式，程序人员在这套演算法中植入 40 个评量指标，诸如原始贴文者的地点与身份、新闻的传播方式等，建立一个新闻可信度评分，该系统还会针对记者确定可靠的新闻进行来源交叉检查，并识别其他潜在的消息来源。

4）案例四：美联社

美联社是最早采用AI技术的媒体组织之一。早在2014年，美联社与美国“自动化洞察”（Automated Insights）公司合作——该公司开发出了自动化写稿程序Wordsmith，它当时是世界上唯一的公共自然语言生成平台——来程式化地写作许多上市公司公开发布的季度收入报告相关新闻报道。在将人工智能技术用于处理季度收入报告之前，美联社新闻记者每季度只能创作几百个新闻故事，结果导致数千个公司的收入报告，没有被写作报道。在使用Wordsmith自动化写稿程序之后，美联社有关公司收入的新闻报道数量增加了12倍。

2、评论系统和观众参与

今年6月，《纽约时报》与谷歌母公司Alphabet旗下技术孵化器Jigsaw合作，运用后者的Perspective机器学习技术来过滤新闻报道的评论数量。据雷锋网了解，此前《纽约时报》每天安排14名审查员处理约12000条评论，每篇文章下方的评论有20%是打开的。运用该AI工具后，其可以把有害的评论和健康正确的评论阻隔开来，不仅可以减少修正评论人员的25%的工作量，还能将文章下方的评论取的打开率提升至80%。

《纽约时报》想利用该AI工具，建立一个平台，以便审查员和读者进行更加深入的交互。不过，这其中仍然存在一大挑战，即如何建立共同点，且尊重不同的观点，让新闻报道和读者的区域观点保持一致。通过这一机器学习工具，审查员不仅可以提高处理评论的速度，还可以通过预测模型轻松组合相似的评论。

议题三：算法与伦理：究竟该怪人类还是算法？

在新闻编辑室使用AI工具，如机器学习、自然语言处理、人脸识别和机器视觉，这个过程不可避免会带上人类伦理的思考痕迹。这里牵扯到三个方面的内容。

1、透明度和责任感

由于AI在新闻工作中可以扮演很多角色，因此在解释何时何地以及如何使用AI时，更应该谨慎解释。如涉及聊天机器人和用户的互动时，如果由AI 来驱动，这个机器人又该如何向观众解释自己的运行原理？观众需要知道故事的构建过程，以及机器在创建过程做了哪些选择？当涉及AI时，最终应该追究谁的错误？如何解释由人类创建的算法引起的错误？究竟该怪人类还是算法？

据ProPublica的研究表明，算法偏差在数学上是不可避免的。即便如此，新闻工作者应该对这些AI系统负责，并鼓励在算法系统的构建流程中建立问责制。

2、编辑性决定和偏见

算法在新闻策划中的作用越来越普遍，这些代表编辑性决策的算法需要用人类的方式来编写。以聊天机器人为例，计算机就像人类一样，如果他们不了解内容，就不能进行对话。机器人能够谈论的唯一领域就是我们可以为该会话语境构建模型。

此外，为了让去偏见概念更加复杂化，通常会让数据更具中性。一些研究表明，有许多类型的机器学习，都是用来“监督学习”。算法无法重现人类的心理模型，但能重构因果关系。

3、数据的伦理使用

数据的伦理使用是每个记者需要面对的根本问题，同样的原则也适用于处理大量数据的公司。虽然有许多社交媒体平台会向记者提供数据，但数据发布商和平台之间关于开放数据获取的关系依然复杂。

许多算法的性质更像是一个“黑盒”，其掩盖了对软件正在做的决定的批判性认识。所以，记者需要尽可能的在研究和报道中使用这种批判性态度。

七大研究结论

如前所述，经过这次研究，关于AI究竟是对新闻业是威胁还是助力，我们可得到以下7大发现。

1、AI工具可以帮助记者讲述或报道此前不切实际或技术上无法实现的新故事。虽然AI可能会转变新闻业，但它会增强而不是取代记者的工作。事实上，为了正确使用AI技术，人类必须随时保持机敏状态。

2、设计AI的技术人员和使用AI技术的记者之间存在知识差距和沟通差距，这样可能导致新闻事件的不正之风。

3、读者在如何使用AI工具进行分析、识别模式以及报告故事中的发现时，应该得到一种透明的方法。

4、虽然AI和数据的交互可以为读者参与、获利和个性化新闻推送提供新的机会，但是在创建回声室和继续致力于新闻公共服务使命之间找到平衡存在挑战。

5、数据的伦理使用和披露（如何收集，存储，使用，分析和分享用户信息）是记者需要面对的一个根本问题。

6、AI有潜力增强记者的工作，但在开放数据获取上依然存在挑战。

7、AI是不可以预知的。我们不能自信地预测哪里会出现最大的问题，所以技术专家和记者需保持警惕，以确保AI系统的准确性。

雷锋网结语

照目前的情况来看，AI对新闻业的助力远大于威胁。未来采用AI辅助报道将成为各新闻机构在竞争赛道上的一大趋势。只是，在应用AI的道路上，人类还应尽快厘清算法伦理的追责问题，以便提前清除后患。

注：报告原文来自哥伦比亚大学新闻学院，由Mark Hansen、Meritxell Roca-Sales、 Jon Keegan和George King四位共同编写，雷锋网对整篇报告进行了重点编译和解读。报告原文可关注“雷锋网”公众号获得。

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

1人收藏

李秀琴

记者

跟踪Fintech和区块链（微信：cqmm16，备注身份姓名来意，thx）

扫描关注作者微信

发私信

当月热门文章