英特尔详细介绍 Ponte Vecchio GPU 和 Sapphire Rapids HBM 性能

2024-10-12 03:01:04 动态 > 快讯 >
导读 在 Hot Chips 34 期间,英特尔再次详细介绍了其在 Sapphire Rapids HBM 服务器平台上运行的Ponte Vecchio GPU 。Intel 展示 P

在 Hot Chips 34 期间,英特尔再次详细介绍了其在 Sapphire Rapids HBM 服务器平台上运行的Ponte Vecchio GPU 。

Intel 展示 Ponte Vecchio 2-Stack GPU 和 Sapphire Rapids HBM CPU 性能与 NVIDIA A100 的对比

在英特尔院士兼首席 GPU 计算架构师 Hong Jiang 的演讲中,我们从蓝队获得了有关即将到来的服务器强国的更多详细信息。Ponte Vecchio GPU 具有三种配置,从单一 OAM 到配备 Xe Links 的 x4 子系统,可以单独运行,也可以使用双插槽 Sapphire Rapids 平台。

OAM 支持 4 GPU 和 8 GPU 平台的 all-to-all 拓扑。补充整个平台的是英特尔的 oneAPI 软件堆栈,它是一个零级 API,提供低级硬件接口以支持跨架构编程。oneAPI 的一些主要功能包括:

oneAPI 和其他工具与加速器设备的接口

精细的增益控制和低延迟加速器功能

多线程设计

对于 GPU,作为驱动程序的一部分提供

因此,在性能指标方面,2-Stack Ponte Vecchio GPU 配置(如单一 OAM 上的配置)能够提供高达 52 TFLOP 的 FP64/FP32 计算、419 TFLOP 的 TF32(XMX Float 32)、839 TFLOP BF16/FP16 和 1678 TFLOPs 的 INT8 马力。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

热门文章

热点推荐

精选文章