在机器学习的应用上，欧盟给科技公司出了一道大难题

今年 4 月，欧盟通过了一项关于个人数据收集、储存和使用的法案。这项法案的名字是《General Data Protection Regulation》（简称 GDPR，通用数据保护法案），将于 2018 年生效。该法案的目的是保护欧盟公民的数据，即使这些数据由欧盟以外的公司收集。它还给予欧盟公民“被遗忘权”，就是说，公民可以发出请求，让自己姓名相关的特定链接不出现在搜索结果中。当公司触犯此项法案后，将会面临巨额罚款（2000 万欧元，或者全球收入的 4%）。

(图片来自 thecourier)

除了数据保护的内容之外，GDPR 还对“自动化个人决策”做出了限制。对于大型科技公司来说，这可能成为一个潜在问题，因为“自动化个人决策”正是神经网络的强项。“这涉及到了机器学习。” 伦敦大学的社会科学研究员 Bryce Goodman 对 Wired 网站说。

法案禁止任何对欧盟公民有重大影响的自动化决策，包括评价个人“工作表现、经济状况、健康、个人爱好、兴趣、行为、位置或运动”的技术。同时，欧盟公民还有“解释权”，就是说，他们有权了解一项特定服务是如何做出特定决策的。

这些限制可能影响到大型科技公司的服务。例如，Facebook 已经把机器学习用于精准的广告投放。更为关键的问题在于，机器学习很难适用“解释权”，因为神经网络的内部是极其复杂的。神经网络依赖于庞大的数据，而且，它的算法复杂，难以理解。

machine learning

(图片来自 crowdanalytix)

Bryce Goodman 认为，法案中的这些内容明显针对大型的跨国公司，但是，它同样会影响到互联网的各方面。由于机器学习已经成为科技公司的发展方向，逐步渗透到互联网的各方面，因此，欧盟的新法案给出了一道难题。

对此，参与法案起草的一位专家 Viktor Mayer-Schonberger 说，“自动化决策”并非一个明确的概念。欧盟可能最终界定，神经网络不属于“自动化决策”，而是“统计分析”。但即使如此，科技公司仍然需要与“解释权”对抗，这是因为，神经网络就像是“黑盒子”，使用该技术的公司很难给出合理的解释，满足欧盟法案的要求。

在科技与法律的冲突方面，数据保护只是一个方面，其它方面例子还有：反垄断法案如何对待机器学习？目前，Google 面临的一项指控是，它通过操纵搜索结果来打压竞争对手。如果今后的搜索引擎完全由人工智能驱动，情况是否会有所变化？毕竟，到那个时候，即使 Google 也无法解释某些决策的原因是什么了。

题图来自 knowledgent