人工智能打假:莎士比亚著名作品居然是代写?
《亨利八世》是莎士比亚众多著名剧作中的其中一部,但这部作品出名的地方,与其它莎士比亚著作不太一样,甚至还能说有点儿尴尬。
因为这部作品被大家谈论得最多的地方,其是它的「出身」问题。简单来说,就是不少人怀疑这部作品根本不是出自莎士比亚笔下,而是有人「代写」。
实际上,在这部作品面世之后,就已经引起了不少争议。众多批评家批评这部作品的语言和情节,认为它的语言不够优美,情节不够紧凑,并因此怀疑这到底是不是莎士比亚的剧作。
▲《亨利八世》
1850 年詹姆斯·庞斯丁在仔细地研读了《亨利八世》之后也严重怀疑这部作品并非出自莎士比亚,而是另外一位剧作家弗莱彻,并在当时发表了一篇论文《莎士比亚的亨利八世是谁写的?》
其实,梁实秋在翻译此作品时,在序言中也曾经提出相同的疑惑,并在后来记录在了《著作人问题》当中。这个问题在文学界中的讨论其实并没有停息过。而最近,针对这个问题,一位强有力的指控者出现了,但他并不是一个人,而是一个 AI。
来自捷克的研究人员 Petr Plecháč 开发出了一套可以分析文学风格的算法系统,于是他将极具争议的《亨利八世》输入到了系统当中进行分析。
首先,Plecháč 分别将莎士比亚同时期作品以及「代写」嫌疑人弗莱彻的作品都输入到了算法系统当中,让系统去学习他们各自的语言风格,行文习惯等。
当系统都学习完之后,Plecháč 最后再将《亨利八世》也输入到系统当中,逐字逐句地进行分析。
最终结果和之前众人的猜想一样,《亨利八世》确实是由两个人合作完成的,并且另外一个人,就是大家所怀疑的弗莱彻。
从系统的分析结果中显示,剧作中存在着许多风格突然转变的地方,例如第一幕的第三场,第三幕的第一场等。而从统计结果来看,这部作品真正来自于莎士比亚笔下的,只有一半左右。
▲ AI 分析结果,图片来自:《Relative contributions of Shakespeare and Fletcher in Henry VIII》
当然,为了让测试更加严谨,更具对比性,Plecháč 还将另一位「代写」嫌疑人菲利普·马辛格的著作也输入到算法系统当中,让算法也对他的文学风格进行学习。
但结果显示,虽然与菲利普·马辛格与《亨利八世》的行文风格也有相似的地方,但占比相比起弗莱彻的根本不值得一提,所以基本可以排除菲利普·马辛格的嫌疑。
Plecháč 认为,虽然该算法系统在讨论语言风格和行文习惯时,更多的还是基于遣词造句的组合模型。但是对于戏剧来说,这其实极具作者的身份辨识率。所以这次「打假」的结果,是相当可靠的。