导读 在 Hot Chips 34 期间,英特尔再次详细介绍了其在 Sapphire Rapids HBM 服务器平台上运行的Ponte Vecchio GPU 。Intel 展示 P
在 Hot Chips 34 期间,英特尔再次详细介绍了其在 Sapphire Rapids HBM 服务器平台上运行的Ponte Vecchio GPU 。
Intel 展示 Ponte Vecchio 2-Stack GPU 和 Sapphire Rapids HBM CPU 性能与 NVIDIA A100 的对比
在英特尔院士兼首席 GPU 计算架构师 Hong Jiang 的演讲中,我们从蓝队获得了有关即将到来的服务器强国的更多详细信息。Ponte Vecchio GPU 具有三种配置,从单一 OAM 到配备 Xe Links 的 x4 子系统,可以单独运行,也可以使用双插槽 Sapphire Rapids 平台。
OAM 支持 4 GPU 和 8 GPU 平台的 all-to-all 拓扑。补充整个平台的是英特尔的 oneAPI 软件堆栈,它是一个零级 API,提供低级硬件接口以支持跨架构编程。oneAPI 的一些主要功能包括:
oneAPI 和其他工具与加速器设备的接口
精细的增益控制和低延迟加速器功能
多线程设计
对于 GPU,作为驱动程序的一部分提供
因此,在性能指标方面,2-Stack Ponte Vecchio GPU 配置(如单一 OAM 上的配置)能够提供高达 52 TFLOP 的 FP64/FP32 计算、419 TFLOP 的 TF32(XMX Float 32)、839 TFLOP BF16/FP16 和 1678 TFLOPs 的 INT8 马力。