豆瓣、猫眼和 IMDb 的电影评分是怎么得出来的?
若批评无自由,则赞美无意义。
针对不断发酵的豆瓣、猫眼被批 “恶意刷分” 事件,有知友如是说。
12 月 28 日,《人民日报》客户端转载了《中国电影报》的一篇文章,并以《豆瓣、猫眼电影评分面临信用危机 恶评伤害电影产业》为题发布。由此,拉开了事件的序幕。
随后,某媒体报道称 “豆瓣、猫眼已因评分过低被电影局约谈”,将事件推向了高潮。一时间,网络上有关此事件的讨论者众。但电影局局长张宏森晚间在朋友圈回应,该报道系过度 “猜想” 了事实,电影局实际上没有与豆瓣有过任何接触。豆瓣 CEO 阿北也被 “炸” 了出来,澄清并未被 “约见”,只是媒体弄错后的误传。
《人民日报》评论部也在晚上发表题为《中国电影,要有容得下 “一星” 的肚量》的文章作为回应。
一时间,口水与手指齐飞。当大家争论的焦点集中在 “电影到底烂不烂”、“批评到底对不对” 时,针对电影评分制度的讨论也一同展开。
观众更多地从自己的体验出发,普遍认为自己有对所观看电影进行评价的自由。代表体制的电影局则从行业的宏观发展角度着手,认为创作和批评是电影的一体两面,试图拒绝批评无益于电影的进步。电影的直接利益关系者——片方,也认同中国电影需要评价体系。他们指出,中国电影不是批评多了,而是良性批评太少、有建设性的批评太少。
(图片来自:International Business Times)
看上去,表面上矛盾重重的各利益方也并非 “没有共识”。作为面向大众发行的艺术创作,电影要接受来自多方的评价是一件 “顺其自然” 的事情。因而对电影的评价,从来就不是 “对不对” 的问题,而是这个评价标准到底 “好不好”。
一般来说,对一部电影的评价主要有两个参考体系:电影本身的质量和观众的个人喜好。除了专业的电影研究者,观众受第二种因素的影响更深。其中,个人情怀、文化差异甚至粉丝效应等因素又会使得每个人的评价变得更为主观、有倾向性。再加上近些年不断涌现的 “水军” 现象,电影评分的权威性越来越受到人们的质疑。
因此,一个平台、组织或者个人对电影的评价是否具有参考价值,取决于它能否尽可能多地摒除 “个人因素” 影响,表现出相对的客观性。
豆瓣:披着大众外衣的小众社区
在中国的电影爱好者心中,豆瓣是绝对不会错过的一个驿站。文艺青年可以在此闲话法国新浪潮和意大利新现实主义,迷妹们可以为自己 “墙头们” 参演的大片点赞……更多的人,可能根本对电影没有太多研究,但也会选择在买票或观影之前参考一下豆瓣电影的评分。
可以说,豆瓣电影的评分一度成为大家评价电影质量的标杆。那么豆瓣电影的评分标准到底是怎样的呢?
豆瓣 CEO 阿北曾在 2015 年发表长文,解密了豆瓣电影的评分机制。他指出,豆瓣电影的评分基于用户打分。简单来说就是这么一个程序:把豆瓣用户的打分(一到五星换算为零到十分)加起来,再除以用户数。这个分数完全来自程序的计算,中间没有编辑审核,每过几分钟,程序会自动重跑一遍,以便把最新的分数加进来。
可以说,这是一个 “简单粗暴” 的评分机制。观众的评价将以非常直接的方式反映在电影的分数上,心情好时打的 “五星” 和心情不好时的 “一星” 都将被加入到简单的计算公式中,最终变成其他人的参考标准。
但阿北指出,豆瓣也是有 “非正常打分” 规避机制的。基于 “所有能判断属于非正常评分的一概不算” 原则,豆瓣的程序会 “判断” 出那些 “非正常分数”,将其剔除在评分之外。并且,作为一个拥有一亿多用户的 “大众评审团”,每个用户都是 “一人一票” 制。随着参与打分人数的增加,单个人评分对整体评分走向的影响其实是在不断被稀释的。因此,尽管计算方法简单粗暴,但 “刷分” 基本上是不可能的。
传统的观念认为,豆瓣是文艺青年们的圣地,因此豆瓣电影的评价可能不太 “接地气”。对此,阿北承认,曾经的豆瓣是有这个特点,但随着用户数量的增加,豆瓣已经变得更加 “大众化” 了。数据显示,截至 2012 年 8 月 ,豆瓣的日均 PV 达到 1.6 亿,阿北也表示,豆瓣现在的用户数量已经超过 1 亿。
豆瓣用户地域分布(图片来自:豆瓣用户@西蒙奥特曼)
但这个 “大众化” 还是有限制语的,豆瓣的主要用户集中在一二线城市。用阿北的原话来说:
在所有去电影院看电影的 “大众” 和所有看电视的 “大众” 之间,当前在豆瓣打分的人更接近去电影院的那个。
总体来说,豆瓣的电影评分是参与评分人群的意见 “平均值”,尽管建立了相关的规避机制,但总体上受评分人个人喜好的影响较大。而拥有相对 “高端” 用户群体的豆瓣,其评分还是偏 “小众” 的。
猫眼们:真正的大众评审团
如果说豆瓣的电影评价体系过于 “阳春白雪”,那么猫眼电影之类的在线购票平台就 “平易近人” 多了。基于购票场景,猫眼电影、淘票票、微影时代平台等逐渐成为观众观影的 “第一入口”,掌握着大众的 “注意力”。从前人们可能会在购票前翻一下豆瓣评分,现在这些购票平台也开发了评分功能,降低了人们观看影评的门槛。
但这些平台上的电影评分,无论是打分人群还是打分机制,都与豆瓣不太一样。
以猫眼为例,它的电影评分由两部分组成:观众评分和专业评分。观众评分部分与豆瓣类似,由观众评价电影的星级再换算成相应的分数;专业评分的评审由主流电影媒体的资深媒体人、资深影评人、影视专业学者组成,这些评审针对影片进行实名制打分和评价,最终分数并列显示在观众评分旁边。
据猫眼介绍,这个专业评分体系是参考国外专家评分平台 “烂番茄”(Rotten Tomatoes)的专业筛选规则并结合国内现状推出的,目前共有评审 69 位。原则上,平台尊重每一位评审的独立性,不会干涉其打分。
由此来看,猫眼把两个评价体系都展示出来,交由用户自己去判断影片的价值,兼具了专业性和大众性。但也有人指出,这种看似 “贴心” 的方式其实存在诸多弊病。
首先在观众评分方面,基于购票场景,猫眼的受众更广,且准入门槛较低,评分者中可能混杂了影迷、意见领袖甚至水军;其次在专业评分方面,专家数量和专家的专业程度都受到不同程度的质疑,前文提到的《中国电影报》的文章中就指出,“猫眼专业影评人凭什么一句顶一万句?”
猫眼对此有过应对。他们对普通评分者进行了区分:购票观看的评分者会在用户名后添加一个 “购” 字加以区别,这在一定程度上能够减少水军刷分的影响。
但针对专家评分的质疑,想要改善就难得多了。毕竟再资深的电影专家,终究逃不开个人价值取向对评分的影响。在此次风波之后,猫眼暂时关闭了专业评分功能,并称优化方案还在探讨中。
尽管存在种种缺陷,但以猫眼为代表的在线购票平台评分体系在大众化方面还是比豆瓣要强一些。
IMDb:走自己的权威之路,让其他人说去吧
传说中的 IMDb(互联网电影数据库),则完全是另一种玩法。创立于 1990 年,IMDb 是国际知名的权威电影点评网站。除了 “看上去好厉害”,IMDb 的电影评分机制也相对更加专业和神秘。
根据 IMDb 网站的介绍,他们的评分采取 “加权平均” 的计算方法。尽管并未透露算法细节,但 IMDb 表示,在他们大名鼎鼎的 TOP 250 榜单中,采用的是贝叶斯统计算法,公式如下:
WR =(V ÷(V+M))× R +(M ÷(V+M))× C
其中,WR 指最终的加权得分,V 指投票人数,M 指进入 TOP 250 所需的最小票数,R 指普通算法的平均分,C 指目前所有电影的平均分。
值得注意的是,V 代表的投票人数,仅包含 “经常投票者”。这是 IMDb 为了保证 TOP 250 榜单的权威性,尽量把投票者限制在资深影迷范围的举措。
举个简单的例子,知友@陈博学这么解释 IMDb TOP 250 的算法逻辑:
电影 A,十个人看过,全部评分均为 10 分;电影 B,十万个人看过,评分平均值为 9.8 分。
请问你愿意相信哪部电影更加优秀?贝叶斯算法的核心思想就是避免让电影 A 的最终得分超过 B。
但百密之中必有一疏,如此严格的评分机制也曾被 “刷分” 冲破。当年《蝙蝠侠:黑暗骑士》上映时,曾被粉丝用 “刷分” 的方式抬上首位。同时 IMDb 对 “经常投票者” 的定义方式也颇受争议。但总的来说,通过这种复杂的计算方法,IMDb 能够在一定程度上挤掉 “非正常评分” 的水分。
评分是面子,质量是里子
如此看来,各大平台的评分制度都有优有劣。而无论批评还是赞美、权威还是业余,电影评分始终难以绕开主观因素的影响。喜欢小清新的观众可能会给《行尸走肉》打低分,而热爱商业大片的影迷可能也无法理解《路边野餐》中的长镜头。但你能因为这些 “差评” 就认定这些是 “烂片” 吗?
归根结底,评分就只是一个参考系,一部电影的价值并不会因较低的评分而被抹灭,单纯靠打高分也无法帮助电影实现真正的成长。
不过在电影越来越商业化的今天,空谈电影的艺术价值还是过于理想化了。就如同公司的各项 KPI 指标,电影的评分、票房收入往往直接与其价值划上等号,甚至可以决定一部电影、一个电影人的命运。
(图片来自:Trendinfo)
当行业开始鼓吹 “叫好” 与 “叫座” 不可兼得时,电影的评价体系仿佛被生硬地割裂成为商业和艺术两个维度。因此当冯小刚开始为 “潘金莲” 正面杠王思聪,当张嘉佳为了 “摆渡” 自己的电影免费请观众观看时,在被声讨的 “哗众取宠” 背后,还有畸形的电影评价体系带来的巨大压力。
而对观众来讲,当我们开始习惯于用 “几颗星” 来标记对一部电影的观感、用评分来决定是否去看一部电影时,电影评分对我们的价值不会比绩效考核表上的参考系数更多。
在电影《罗曼蒂克消亡史》中,有这样一句台词,“电影我没看懂,导演没打算让大家看懂,这是艺术片,是拍给下一个世纪的人看的。” 这是剧中的 “演员” 对自己所拍电影的评价。你说这样的评价到底是批评还是赞美?看了电影的人可能不知道,但我知道的是,没看的人肯定不知道。
题图来自:Forbes