OpenAI开发了会写假新闻的人工智能

2019-08-29 06:09 由春笋发表于 #趣闻

今年年初，OpenAI开发了一个“AI造假写手”，由于被认为“太危险”而无法完整对外公开。最近，这款AI模型发布了更全新，更强大的版本。据媒体所言，现在，它真的可以自如地写假新闻或者垃圾邮件了。

这款AI的模型叫做GPT-2，它的内部包含了15亿个参数，是在800万个网页数据集上训练而成的。而制作它的主要目的，是用以接替自己的第一代，执行语言建模的任务。

简单来说，它的功能就是根据人类给出的一句话，编写接下来的文本，同时在此基础上，对整个文章细节进行补充。

在模型公布新版本后，一些感兴趣的AI专家对其进行了测试。他们试着把一条真新闻的内容放进了模型中，这条内容为：

AI写手接收到该信息之后，便编写了如下文字：

BBC当时报道的真新闻

从AI续写的内容中，可以看出它具备有很强的逻辑能力，能找到辅助资料对新闻进行补充，整个短讯也足够完整。一家科技网站的作者对此结果感到害怕，他认为这项技术代表着坏人可以操纵他人，在他看来，这甚至比任何枪支还要危险。

其实早在年初之时，就已经有许多人对GPT-2表示了担忧。在这个原本就信息爆炸，人们越来越难分清信息真假的年代，GPT-2可以毫无违和的融入进去。如果它真的能独立、完整地书写各类新闻，由谁使用它就变得尤为重要。

如果使用者居心不良，它可以发表极端言论，伪造内容，成为引导舆论的政治工具。OpenAI也意识到了这个问题，因此他们一直没有公开完整的预训练模型，都是放出小版本的模型供以测试。

谢菲尔德大学的计算机教授诺埃尔却表示，人类可能没必要感到恐慌。在对模型进行了多次的测验，输入了很多次文字开头后，他发现AI写手还是犯下了许多错误，好比不连贯和奇怪的字句，以及和输入标题毫无关系的内容填充。

图源：fxtradingrevolution

人工智能咨询公司的创始人戴夫，也对这个模型进行了测试，他输入的是一个经典英国笑话的开头：一个男人走进了酒吧。

结果，GPT-2续写的内容是：

在戴夫看来，这个故事看似荒谬，实际上却说明了模型的部分训练数据，就是来自于互联网新闻报道。它呈现出来的偏见，就是现当下社会新闻所暴露出来的问题。如果AI写手持续以此作为训练，模型编写的内容可能会引起更多的争议。尽管有所担忧，戴夫相信这些问题都会被解决。

而他认为，一旦大家对GPT-2的担忧被消除后，人们可能会面对一个更重要的探讨：人工和机器制造内容越来越难以区分之时，我们究竟应该如何正确看待这个世界。