史上最大的芯片来了，它能用来做什么？

iPhone 的芯片比一半硬币小，云服务器中的芯片比一角纸币小，但现在，一个比 iPad 还大的芯片制造出来了。

这个芯片名为 Cerebras Wafer Scale Engine ，由加利福尼亚一家名为 Cerebras 的初创公司制造，尺寸约为 8 英寸 ×8 英寸。

我们先来看看它「惊人」的性能参数：

如果你对这些参数的程度不熟悉的话，要知道，上个月 AMD 发布的世界上功能最强大的 Epyc 芯片，也只拥有 320 亿个晶体管和 64 个内核。

比起世界上领先的图形处理单元，Cerebras Wafer Scale Engine 的高速片上存储器大了 3,000 倍，内存带宽大了 10,000 倍，它比最大的 Nvidia GPU 芯片面积也大了 56.7 倍。

按理说，在半导体行业中，其实更大的不代表就是更好。

但其创始人兼首席执行官安德鲁・费尔德曼（Andrew Feldman）表示，更大的芯片，就是为了满足更与时俱进的人工智能。

这背后的逻辑很简单：AI 对我们的生活影响越来越大，数据库也越来越大，但现在人工智能行业进步的主要瓶颈，就是培训模型需要极长时间。

高性能 AI 的深度学习，需要通过大量的计算和频繁的数据访问进行训练，才能不断改进和升级，一个更强大的处理器，才能尽可能快地处理海量增长的新数据。

▲ Andrew Feldman 和原始的 SeaMicro 盒子

该芯片使用台积电的 16 纳米工艺制造的 300 毫米晶圆切割而成，这是单个晶圆级的解决方案，比起以往大多数芯片都是数十上百个集合起来，它能通过 84 个互连芯片组成的晶圆直接联动工作。

这不仅克服了数 10 年前芯片尺寸的技术限制，而且这个芯片还具有 400000 个 AI 优化的内核，具有灵活性、可编程性。

▲典型的硅片包含大约 100 个计算机芯片. 图片来自：GETTY IMAGES

再加上比 GPU 大 3000 倍的片上内存，解决了以往需要跨多个设备和内存层并行计算的问题，现在只用一个设备就能存储和处理整个神经网络。

等于就是在一个芯片上，构建了带有内存的一整个计算机集群。

最后，与具有数百个传统加速器的机架式服务器相比，Cerebras 具有带宽高、延迟低的独特通信结构，比现有的解决方案性能速度快数千倍，可以用以往无法想象的高效率来工作。

更多的内核、更大的本地内存、低延迟高带宽结构，共同构成了加速 AI 工作的绝佳环境。

Cerebras 表示，该芯片可以驱动复杂的人工智能（AI）系统，带来 AI 技术的巨大飞跃，应用在未来的无人驾驶汽车、监控软件市场等各个领域。

但是，芯片制造商通常不会制造这么大的芯片，因为这种大胆的设计，必须克服重大的技术障碍，包括互连、制造、封装、冷却等等。

即便是用了再精细的制造技术，这么一大块芯片也不可能没有任何缺陷。虽然该公司打算使用「冗余处理核心」技术，抛弃制造过程中一定数量的「坏」芯片，但量产良品率过低，也定会是个难越的坎。

▲ Cerebras 正在设计自己的测试和包装系统

另外，冷却芯片也是个问题。小型计算机芯片使用的功率低，很容易冷却，而 Cerebras 庞大的芯片不仅仅是散热器和风扇就能冷却，而是需更专业的基础设施来协助。

此外，芯片由于太大而无法放入任何传统封装中，Cerebras 必须发明定制包装技术和工具来应对挑战。

这也是为什么它适合人工智能领域，因为那也是现在大笔资金流向的地方。

总而言之，Cerebras芯片的规模和雄心是疯狂的。但因为缺乏性能和功耗的细节，现在很难评估 Cerebras 芯片在未来的影响力。

Cerebras 表示，它目前正在几家大型潜在客户中开展测试系统，并将于 10 月份开始商用。但它不会单独销售或作为扩展卡销售，Cerebras 希望在 2020 年中期推出围绕此类芯片构建的完整服务器。

预计未来几个月，Cerebras 芯片还会公布更多技术的细节，这项技术，也必会随着 AI 日新月异的进程而持续升温。

文中部分图片来自：Cerebras