Habana Labs 人工智能训练处理器

有八个高迪处理器的 Habana »HLS-1«。

与具有相同数量 GPU 的系统相比,新款 Habana 高迪人工智能训练处理器的吞吐量是它们的四倍。

基于高迪处理器的训练系统,其性能几乎可以线性伸缩:从只有一个到有数百个高迪处理器的系统。

此外,»聚合以太网 (RDMA over Converged Ethernet)« 功能 (RoCE v2) 内置在 AI 处理器中。这使得在标准以太网上扩展人工智能系统变得很容易。

此外,用户可以使用具有不同速度和不同端口数且来自不同生产商的以太网交换机,因为它们会在数据中心中使用。相比之下,现有的基于 GPU 的系统依赖于专有的系统接口,因此可伸缩性有限,系统设计人员的选择性也有限。 

»随着新产品的推出,Habana 已经从干扰应用迅速发展到训练中,涵盖了神经网络的所有功能领域«,Linley 集团的首席分析师 Linley Gwennap 说道。»作为第一个人工智能处理器,它集成了 100G 以太网链接和 RoCE 支持,允许它在标准组件的基础上构建大型加速集群。«

高迪处理器拥有 32 GB HBM-2 内存。HL-200 型号是一个 PCI 卡,支持八个 100Gb 以太网端口。HL-205 夹层卡符合 OCP OAM 规范,支持十个 100Gb 以太网端口或二十个 50Gb 以太网端口。

此外,在 »HLS-1« 的名称下,Habana 拥有一个由八个高迪处理器和八个夹层卡组成的系统,用于连接外部主机和 24 个 100 Gbps 以太网端口的 PCI 连接器。这使得多个 HLS-1 系统可以安装在一个标准的 198 英寸机架上。

高迪处理器是完全可编程的,可根据客户需求进行定制,并且内含第二代张量处理核心集群 (TPC)。此外,还提供了开发工具、库和编译器。SynapseAI 软件栈包含一个内核库,允许客户捕获专有内核。Habana 将从下半年开始向选定的客户提供样品。

高迪是继去年 Habana Labs 推出 Goya 干扰处理器之后的第二款 AI 处理器。自 2018 年第四季度以来,Habana 一直在供应 Goya。