首页 > 动态 > 快讯 >

英特尔详细介绍 Ponte Vecchio GPU 和 Sapphire Rapids HBM 性能

发布时间:2024-10-12 03:01:04来源:

在 Hot Chips 34 期间,英特尔再次详细介绍了其在 Sapphire Rapids HBM 服务器平台上运行的Ponte Vecchio GPU 。

Intel 展示 Ponte Vecchio 2-Stack GPU 和 Sapphire Rapids HBM CPU 性能与 NVIDIA A100 的对比

在英特尔院士兼首席 GPU 计算架构师 Hong Jiang 的演讲中,我们从蓝队获得了有关即将到来的服务器强国的更多详细信息。Ponte Vecchio GPU 具有三种配置,从单一 OAM 到配备 Xe Links 的 x4 子系统,可以单独运行,也可以使用双插槽 Sapphire Rapids 平台。

OAM 支持 4 GPU 和 8 GPU 平台的 all-to-all 拓扑。补充整个平台的是英特尔的 oneAPI 软件堆栈,它是一个零级 API,提供低级硬件接口以支持跨架构编程。oneAPI 的一些主要功能包括:

oneAPI 和其他工具与加速器设备的接口

精细的增益控制和低延迟加速器功能

多线程设计

对于 GPU,作为驱动程序的一部分提供

因此,在性能指标方面,2-Stack Ponte Vecchio GPU 配置(如单一 OAM 上的配置)能够提供高达 52 TFLOP 的 FP64/FP32 计算、419 TFLOP 的 TF32(XMX Float 32)、839 TFLOP BF16/FP16 和 1678 TFLOPs 的 INT8 马力。

免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。