我们都是数据奴隶。
“数据奴隶”,美国艺术家 Jennifer Lyn Morone 认为这是大部分现代人所处的状态。为了“换取”免费服务,我们将自己的信息和数据拱手送到科技公司手中,“个人数据其实比你想象中更值钱。”
她曾创作了一件作品:注册了一个公司,将自己各方面的个人信息分类,标价,发售,总定价为 7000 英镑。
▲ Jennifer Lyn Morone 的个人信息,图片来自《卫报》
虽然这看起来,就和她自己说的一样——“荒谬极了”。但如果你退一步看,会发现这个艺术行为和 Cambridge Analytica 购买 Facebook 用户信息的性质是一样的。
▲ 图片来自《经济学人》
在当今社会中,信息的确有价值,但用户并没有控制自己数据的权力。而且,就和人类劳动力一样,数据的价值也很难被“定价”。在西方历史中,部分人类劳动在很长时间里都被迫“无偿化”,直到各种各样的工会形成,工人的薪资才提高至能过日子的程度。
这也是为什么,耶鲁大学经济学家 Glen Weyl 认为,随着势态发展,类似“数据劳动工会(data-labour unions)”的组织将应运而生。这些组织将成为特定群体数据的守门人,并为其争取权利。
▲ 图片来自 Business Insider
这听起挺遥远的,但《经济学人》认为这并非不可能,因为对于人工智能的发展而言,人类的数据投入是必要的。
Weyl 将“人工智能”称为“集体智慧(collective intelligence)”,因为现时大部分人工智能算法都是走深度学习模式,这也意味着,研究人员必须通过输入大量由人类产生的“正确答案”,人工智能才有可能“学会”识别图像、语音等内容。随着功能发展越高级,数据需求量就越大。
此前,《纽约时报》曾撰文对极度依赖输入数据量的深度学习模式提出质疑。算法对数据的此般依赖,不仅限制了算法可应用的领域,同时,在本质上也注定了训练出来的算法必然刻板,很容易受到劣质数据源影响。这也是为什么,不少研究人员已经开始尝试不同类型的人工智能训练分支,探索更灵活的方式。
但在另一种算法“引领新时尚”前,大部分公司估计仍将采用基于大量数据的算法模式,它们对数据的渴望也将继续下去。事实上,现在已经有科技公司为数据聘请人类员工的模式雏形。
正如爱范儿在《那些假装成 AI 的人类》一文中报道,部分公司的算法因为不够成熟,需要聘请人类员工来进行内容纠正(对外还是称“这是人工智能的成果”),而亚马逊 AWS 的众包平台 Amazon Mechanical Turk 上就发布了不少这类工作机会。
▲ 图片来自 Medium
《经济学人》指出,即便如此,在迈向“付费数据劳动”的路上,我们需要准备的还有很多,相对应法规就是其中一部分。从某个层面来看,早前欧盟提出的 GDPR 是第一步,要求科技公司赋予消费者查看、下载甚至删除个人信息的权利。
其次,我们还需优化数据计量的工具,制定衡量数据对人工智能发展价值的体系,甚至为日后可能产生的数据价值不均等可能带来的社会问题做准备……
但在那之前,大家还是得有相关意识。不能一边说觉得自己的数据很重要,另一边就把自己的信息随便抛给网络上的服务。