在机器学习的应用上,欧盟给科技公司出了一道大难题
今年 4 月,欧盟通过了一项关于个人数据收集、储存和使用的法案。这项法案的名字是《General Data Protection Regulation》(简称 GDPR,通用数据保护法案),将于 2018 年生效。该法案的目的是保护欧盟公民的数据,即使这些数据由欧盟以外的公司收集。它还给予欧盟公民 “被遗忘权”,就是说,公民可以发出请求,让自己姓名相关的特定链接不出现在搜索结果中。当公司触犯此项法案后,将会面临巨额罚款(2000 万欧元,或者全球收入的 4%)。
(图片来自 thecourier)
除了数据保护的内容之外,GDPR 还对 “自动化个人决策” 做出了限制。对于大型科技公司来说,这可能成为一个潜在问题,因为 “自动化个人决策” 正是神经网络的强项。“这涉及到了机器学习。” 伦敦大学的社会科学研究员 Bryce Goodman 对 Wired 网站说。
法案禁止任何对欧盟公民有重大影响的自动化决策,包括评价个人 “工作表现、经济状况、健康、个人爱好、兴趣、行为、位置或运动” 的技术。同时,欧盟公民还有 “解释权”,就是说,他们有权了解一项特定服务是如何做出特定决策的。
这些限制可能影响到大型科技公司的服务。例如,Facebook 已经把机器学习用于精准的广告投放。更为关键的问题在于,机器学习很难适用 “解释权”,因为神经网络的内部是极其复杂的。神经网络依赖于庞大的数据,而且,它的算法复杂,难以理解。
(图片来自 crowdanalytix)
Bryce Goodman 认为,法案中的这些内容明显针对大型的跨国公司,但是,它同样会影响到互联网的各方面。由于机器学习已经成为科技公司的发展方向,逐步渗透到互联网的各方面,因此,欧盟的新法案给出了一道难题。
对此,参与法案起草的一位专家 Viktor Mayer-Schonberger 说,“自动化决策” 并非一个明确的概念。欧盟可能最终界定,神经网络不属于 “自动化决策”,而是 “统计分析”。但即使如此,科技公司仍然需要与 “解释权” 对抗,这是因为,神经网络就像是 “黑盒子”,使用该技术的公司很难给出合理的解释,满足欧盟法案的要求。
在科技与法律的冲突方面,数据保护只是一个方面,其它方面例子还有:反垄断法案如何对待机器学习?目前,Google 面临的一项指控是,它通过操纵搜索结果来打压竞争对手。如果今后的搜索引擎完全由人工智能驱动,情况是否会有所变化?毕竟,到那个时候,即使 Google 也无法解释某些决策的原因是什么了。
题图来自 knowledgent