假新闻大师,既能看出 92% 的假新闻,也能写高质量假新闻
你对假新闻司空见惯了吗?
一张真假难辨的图片,一个在现实和虚假间游离的故事,这会让你难以分辨事实的真相。久而久之,在习惯用质疑的眼光看一切的你看来,真新闻也像假新闻,假新闻也有真事实。
而在今天,假新闻也不仅由人类产生,机器也可以生产出令人信服的假新闻。随着时间的推移和技术的发展,这种情况只会变得越来越普遍,并且可能更有破坏性。
真真假假分不清,不如「以火治火」,用 AI 来检测 AI 写的假新闻。这个检测假新闻的 AI 就是 Grover。
我们对 Grover 的研究表明,检测虚假信息的最佳模型就是产生它的最佳模型。
Grover 从 Google 新闻上 5000 个不同媒体撰写的新闻中进行学习。在这过程中,它接收了 120 千兆字节的真实新闻文章,并用这些文章进行训练,最终 Grover 分辨人和 AI 写的故事的正确率是 92%。在此之前,最好的假新闻识别器的正确率是 73%。
Grover 之所以能如此有效地发现虚假内容,是因为它也非常善于自己制作内容。毕竟造假大师和鉴假大师之间只有一线之隔。
华盛顿大学教授和论文的共同作者 Yejin Choi 在一份新闻稿中就表示辨别假新闻的 Grover 在假新闻撰写编造上也远比他人得心应手。「在我们的研究中,我们发现 Grover 的假新闻内容远比我们人类同胞写的新闻更可信,这一事实说明了自然语言生成的发展程度——以及为什么我们需要努力克服这种威胁。」
▲ Grover 研究团队
这个擅长打假也擅长造假的 AI 还有能力模仿特定媒体的风格,甚至是特定作家的风格。之前,Grover 生成的一篇假新闻就模仿了《纽约时报》专栏作家 Paul Krugman 的文章风格。不过研究人员也表示,即使是最好的人工智能假新闻,所做的一切依然基于习得的风格和语调,而不是对语言和世界的真正理解。因此,只要我们有耐心,我们可以从原作者浩如烟海的文章中找到 Grover 模仿的痕迹。
大方的研究者们将 Grover 的演示放在了网上,每一个人都可以用它写些天马行空的假新闻。Fastcompany 的编辑就用它写了一个《为什么川普一天要做 100 个俯卧撑》的怪诞文章。面对这种专业编辑都有点束手无策的文章,Grover 的表现也蛮出彩:
当你想到俯卧撑时,第一个想到的形象绝对并不是美国总统。
作为一名三军统帅,特朗普的健康状况几乎不为人知,虽然他承诺一旦当选总统就会锻炼身体。在《名人学徒》节目中,他对阿诺德·施瓦辛格的技术大加嘲讽,没有什么能阻止特朗普不做「特朗普式的俯卧撑」。
不过就连特朗普自己也承认,不管你的工作多么适合你,要想驾驭自己的身体都是极其困难的。那么,是什么让三军统帅走上正轨呢?答案是 100 个俯卧撑。
▲ 图片来自:unsplash
虽然只有短短两段内容,但是我们也可以看出 Grover 对川普性格和言论的把握和本人性格非常相似。刨开令人啼笑皆非的新闻主题,可能真的会有不少人相信这条新闻。
Grover 论文的第一作者 Zellers 表示:「尽管书写看起来很流畅,但 Grover 和其他神经语言生成器所写的文章包含了机器独有的语言怪癖,这暴露了它们的机器起源。」这些语言不畅之处就类似于神经文本生成器的签名或水印。Grover 知道去寻找这些「水印」,这使得它在挑选人工智能创造的故事时更为高效。
▲ 图片来自:unsplash
Grover 依然需要进化,虽然它已经比同行做得更加出色了,但它依然还有无法识别的 8% 假新闻。
随着人工智能变得越来越复杂,用 AI 抵御 AI「制造」可能是我们能够采取的最佳手段。
题图来自 unsplash。