ChatGPT 爆火之后,阿法狗团队拿出了一个王炸产品,马斯克看了也点赞
ChatGPT 热潮未歇,新的风暴已经出现。
12 月 10 日,马斯克发了条推文:「似乎每周都有新的 Al 进步。」
让他有感而发的,是 Google 旗下 DeepMind 的 Dramatron。
Dramatron 比起 ChatGPT 更专精,是一种用来编写戏剧和电影剧本的 AI 工具。
三句话不能让别人为我花 18 万,但一句话让 AI 帮我写了个剧本,并不是个段子。
一句话就能写剧本,但还不能独立行走
Dramatron 到底怎么玩?只要你给出「一句话大纲」(log line)描述戏剧冲突,Dramatron 就能生成标题、人设、情节、场景和对话。
比如,「一句话大纲」可以是「詹姆斯发现他是一个恶魔,他将被驱魔」。
但 Medium 网站的作者 Tristan Wolff 指出,这句话缺少基本的叙事元素,例如主角的目标和对手,所以生成的结果平平无奇,角色只有詹姆斯和驱魔人,标题也是干巴巴的「詹姆斯的驱魔」。
如果把大纲补充为「詹姆斯发现自己是恶魔,他将被驱魔,他不得不在善与恶之间做出选择」,并加入一个额外的角色——詹姆斯的恋人,效果就会好得多。
故事也就变成了,詹姆斯的恋人在詹姆斯死后受尽折磨,后来发现詹姆斯以恶魔的形式生活在自己体内,标题则取为「内心的恶魔」,有了多重的文学意味。
在输入大纲之后,你可以多次生成标题、人设等结果直到满意,或者直接动手编辑当前的结果,甚至回到大纲推倒重来,相当于和 AI 在交互过程里共同编写脚本。
所以,Dramatron 的定位其实是人机「共同写作」(co-writing)工具,还无法独立行走。
Dramatron 是如何开发出来的?类似其他生成式 AI,Dramatron 也有一个大型语言模型 Chinchilla 作为「靠山」。不过,OpenAI 的 GPT-3 等大模型也可以用来部署 Dramatron。
值得一提的是,内容的连贯性对于戏剧和电影来说是基础,但对大型语言模型来说是一件难事。因为它们并没有真的理解内容,生成的文本其实是概率计算的结果。Dramatron 的特点就在于,在这方面下了许多功夫。
一方面,Dramatron 通过「分层故事生成」的方法生成脚本,运用了具备结构化生成能力的提示词链(prompt chaining)。
从你输入的「一句话大纲」开始,Dramatron 先是创建标题和角色,生成的角色被当作提示词,用来生成情节和场景…… 如此递进,最后将这些元素全部组合起来生成对话。
另一方面,Dramatron 学习了两种经典的叙事结构:
一是德国剧作家 Gustav Freytag 的金字塔结构,它列出了写故事的七个关键步骤,包括阐述、触发事件、上升动作、高潮、下降动作、解决方案和结局。
二是英雄旅程(Hero’s journey),主线围绕一个踏上冒险旅程的英雄,这个人物会在一个决定性的危机中赢得胜利,然后得到升华转变或带着战利品归返到原来的世界。
Dramatron 究竟有几板斧,还是要内行说了算,DeepMind 请了 15 位剧作家和编剧体验了 2 个小时。
参与体验的编剧们反馈,Dramatron 的输出结果可能是「公式化的」,它的「分层故事生成」结构也并不适合所有作家。
与此同时,他们中的大部分认同 Dramatron 是有帮助的,愿意将它当做创意工具,用来构建世界观,或者改变角色或情节从而探索不同的故事。
加拿大即兴剧院 Rapid Fire Theatre,已经将与 Dramatron 共同创作的剧本搬上了舞台,受到了不少好评。
在本职工作仍待进步之外,初出茅庐的 Dramatron 还有不少问题。
一个是版权问题,它的输出结果可能包含训练时的原材料,需要人力搜索和检查;一个是道德问题,它可能重现语料库的偏见和刻板印象,Google 建议让 Perspective API 工具出手,帮助识别「有毒」的文字。
12 月 10 日,DeepMind 开放了试玩版,但不知道什么原因很快关闭,现在网站只剩下关于 Dramatron 的论文和简介。
AI 揽过编剧活,在智障和智能之间反复横跳
AI 写的剧本其实很早就有,但是总被当成笑话看,成了整活区的一道道风景。
去年 10 月,Netflix 与作家、喜剧演员 Keaton Patti 合作,给 AI 看了 40 万小时的恐怖片,然后让 AI 自己写一个原创剧本。40 万小时约等于 45 年,至少 AI「看」电影的速度比我们快多了。
最终影片长约 4 分钟,名为「谜题先生希望你少活一点」,不仅有《电锯惊魂》《十三号星期五》《我知道你去年夏天干了什么》等电影的影子,还写出了「祝你买棺材有优惠券」「他喝醉了却被清醒所困扰」「我有几个家庭」等不少介于荒诞和合理间的台词。
再配合「学了三年动画」水平的僵硬肢体和敷衍画风,有网友发出了这样的感慨:「AI 写恐怖剧本可能为时尚早,但写喜剧已经炉火纯青。」
类似地,看了 1000 小时蝙蝠侠电影的 AI 写了个剧本,最后被做成了有声漫画,其中一个情节是,小丑送给蝙蝠侠一个兑换新父母的优惠券,但优惠券已经过期,小丑的性格被 AI 抓住了神髓。
▲ 图片来自:B 站@HUSH_13
这些或喜剧或恐怖的 AI 剧本,比「狗屁不通文章生成器」写得好多了,细品还挺有意思,似乎有潜台词和言外之意,带着某种「思考」,但它们并不知道人类为什么发笑。
在 Dramatron 出来之前,也有人基于大型语言模型,让 AI 写正儿八经的电影剧本。
YouTube 博主@Bradius 在看完《蜘蛛侠:英雄无归》后,好奇 AI 能不能写出这样的剧情,甚至与两亿美元的大制作相提并论。
于是,他在 GPT-3 用英文输入了一句话:「以下是下一部 MCU(漫威电影宇宙)蜘蛛侠电影的完整泄露脚本。」
结果让他大吃一惊,GPT-3 给了他 21 页的脚本,情节起伏、结构紧凑,既讲了彼得·帕克和迈尔斯·摩拉勒斯(多重宇宙设定中的黑人蜘蛛侠)围殴反派克莱文,还穿插了漫威高管打算缩减下一部蜘蛛侠电影预算的桥段。
不知道 AI 是不是在讽刺好莱坞的大片制度和流水线式生产电影。当大制作电影越来越缺乏新意,让 AI 替代部分人类编剧,看来没有什么问题,说不定还会有意料之喜。
虽然没有 Dramatron 那么「垂直」,最近的 AI 顶流 ChatGPT 也可以充当「文案工具人」,写周报、诗歌甚至剧本。
知乎答主、卡耐基梅隆大学机器人系博士@田渊栋尝试向 ChatGPT 投喂中英文片段,大致结果并不差,但发现「一些深层次的想像力和联系能力仍然缺失,情节的关键部分还需要作者自己去开拓并且诱导 AI 系统来完成」。
目前,大型语言模型的一个限制是,它们只能根据给定的训练数据,根据某些单词或单词序列一起出现的概率来生成文本,依靠大模型、大数据、大算力「大力出奇迹」,但并不真正理解自己在「说」什么,回答并不总是连贯或者有意义。
但仅从结果来看,让它们从自然语言的文本里,提取出人类觉得说得通、甚至眼前一亮的叙事,已经不是小概率事件。
前段时间,「小帅小美式」的电影解说也引起了讨论,这类电影解说是短平快的「电子榨菜」,由 AI 配音讲述主角是如何意外地遭遇了意外。
为了解说得精彩,它们将人物标签化,选取最猎奇或悬疑的情节添油加醋,常常不遵从电影原意,既不是电影,也不是解说。
这部分的工作以后由 AI 完全代劳,应该是不在话下,实现电子榨菜的全自动化。
AI 是用来激发创意,还是让创意更难得
写文章、做视频、玩音乐、当画家,AI 今年的进步一日千里,让任何人类个体望尘莫及。
我们常说,AI 可以作为创意工具,但在 AI 面前,人类是在让渡自己的角色,还是享受新的角色?我们越来越需要和 AI 合作,是在激发创意还是扼杀创意,创意本身被摆在了一个怎样的位置?
眼下有一些人类和 AI 写作的例子,看起来人类还是更不可替代的那一个。
比如,除了 Dramatron,Google 还计划基于对话神经语言模型 LaMDA,开发 AI 写作工具 Wordcraft,目前还在实验阶段。
Wordcraft 是一种专门服务虚构作品的文本编辑器,你可以输入一个开头让它续写,或者用它加工句子和充实语料库。
为了测试 Wordcraft,Google 邀请了 13 位专业作家体验。作家们一致认为,Wordcraft 不会很快取代作家,它不擅长独特的叙事风格,比喻老套,措辞平庸,同时避开了卑劣的角色。
当然,他们也得出了一个共识,就像其他所有 AI 工具一样——用 Wordcraft 激发创意是可行的。
不够完美的 AI 还会再好好学习天天向上,与此同时,豆瓣有「文字失语者互助联盟」等小组,对于人类来说,组织文字的逻辑,清楚地用文字表达自己的情绪,竟然成了越发困难的事。
相似地,为了提高 AI 生成的质量,Prompt engineers(提示语工程师)这个新工种应运而生,在 PromptBase 等平台,你需要特定的某种艺术风格,可以向他们求助。
但这项工作同样可以由 AI 上阵,比如用 ChatGPT 形成一段文字,再把文字输入给 StableDiffusion,生成的画作一般比自己直接输入描述好看很多。
那么,当我们有了「一句话大纲」的脑洞,却无法联想到更多的细节把它完整铺陈,不得不求助于 AI 时,是一种无奈选择,还是物尽其用?
乐观一点地想,AI 理应增强而不是取代人的劳动,但如果将时间维度拉得更长一些,可能就不再是这样。
OpenAI 的首席执行官 Sam Altman 认为,「作为创意工具」将在很长时间内成为 AI 的重要应用,但当我们展望一百年,AI 最终可能全权代劳完整的创意工作。
如果你在 10 年前问人们,AI 将如何产生影响,大多数人都非常有信心,你会首先听到它出现在工厂等地,然后它将用于低技能的白领工作,再是程序员等高技能、高智商的工作。最后,也许永远不会,它将取代创造性的工作。但是,它正朝着另一个方向发展。
这其实是一个提醒,我们可能并不真的清楚,对于人类或者 AI 来说,什么技能是容易的,什么技能是简单的,什么工作绞尽脑汁,什么工作不费脑细胞;我们也渐渐意识到,在 AI 涉猎的领域,早点熟练运用 AI 的人,才可能留在未来。