AMDInstinctMI300数据中心APU特写13个小芯片1460亿个晶体管

导读 AMD在2023年国际消费电子展上推出了其下一代InstinctMI300加速器,我们有幸获得了一些动手时间,并拍摄了几张这款庞大芯片的特写照片。毫无

AMD在2023年国际消费电子展上推出了其下一代InstinctMI300加速器,我们有幸获得了一些动手时间,并拍摄了几张这款庞大芯片的特写照片。

毫无疑问,InstinctMI300是一个改变游戏规则的设计——数据中心APU混合了总共13个小芯片,其中许多是3D堆叠的,以创建一个具有24个Zen4CPU内核并融合了CDNA3图形的芯片引擎和8堆HBM3。总体而言,该芯片拥有1460亿个晶体管,是AMD投入生产的最大芯片。

MI300拥有1460亿个晶体管,轻松超过英特尔的1000亿个晶体管PonteVecchio,再加上128GB的​​HBM3内存。考虑到其闪亮的外观,去边芯片很难拍摄,但您可以清楚地看到中心芯片侧面的八个HBM3堆栈。在这些HBM堆栈之间放置小的结构硅片,以确保在封装顶部拧紧冷却溶液时的稳定性。

该芯片的计算部分由九个5nm小芯片组成,它们是CPU或GPU内核,但AMD没有详细说明每个小芯片的使用数量。Zen4内核通常部署为八核裸片,因此我们可以查看三个CPU裸片和六个GPU裸片。GPU芯片使用AMD的CDNA3架构,这是AMD数据中心专用图形架构的第三次修订。AMD没有指定CU数量。

这九个裸片被3D堆叠在四个6nm基础裸片之上,这些裸片不仅仅是无源中介层——我们被告知这些裸片是有源的,可以处理I/O和各种其他功能。AMD代表向我们展示了另一个MI300样品,该样品的顶部裸片用砂带打磨机打磨掉,以揭示四个有源中介层裸片的架构。在那里,我们可以清楚地看到不仅可以在I/O块之间实现通信的结构,还可以看到与HBM3堆栈接口的内存控制器之间的通信。我们不允许拍摄第二个样本。

3D设计允许在CPU、GPU和内存芯片之间实现令人难以置信的数据吞吐量,同时还允许CPU和GPU同时处理内存中的相同数据(零拷贝),从而节省电力、提高性能并简化编程。看看这个设备是否可以在没有标准DRAM的情况下使用将会很有趣,正如我们在英特尔的XeonMaxCPU中看到的那样,它也采用了封装HBM。

AMD的代表不愿透露细节,因此不清楚AMD是使用标准的TSV方法将上下裸片熔合在一起,还是使用更先进的混合键合方法。我们被告知AMD将很快分享有关包装的更多细节。

AMD声称MI300提供的AI性能是InstinctMI250的八倍,每瓦性能是InstinctMI250的五倍(使用具有稀疏性的FP8测量)。AMD还表示,它可以将ChatGPT和DALL-E等超大型AI模型的训练时间从几个月缩短到几周,从而节省数百万美元的电费。

当前一代的InstinctMI250为Frontier超级计算机提供动力,这是世界上第一台百亿亿级计算机,而InstinctMI300将为即将推出的两台exaflopElCapitan超级计算机提供动力。AMD告诉我们,这些haloMI300芯片价格昂贵且相对稀有——它们不是大批量产品,因此它们不会像EPYCGenoa数据中心CPU那样得到广泛部署。但是,该技术将过滤到不同外形的多种变体。

该芯片还将与Nvidia的GraceHopperSuperchip竞争,后者在同一块板上结合了HopperGPU和GraceCPU。这些芯片预计将于今年上市。基于Neoverse的GraceCPU支持Armv9指令集,并且系统配备了两个与Nvidia新品牌NVLink-C2C互连技术融合在一起的芯片。AMD的方法旨在提供卓越的吞吐量和能效,因为将这些设备组合到一个封装中通常比连接到两个单独的设备时能够在单元之间实现更高的吞吐量。

MI300还将与Intel的FalconShores竞争,该芯片将具有数量不等的计算块,具有x86内核、GPU内核和内存,具有令人眼花缭乱的可能配置,但这些配置要到2024年才会到货。

在这里,我们可以看到MI300封装的底部以及用于LGA安装系统的接触垫。AMD没有分享有关插槽机制的详细信息,但我们一定会尽快了解更多信息——该芯片目前在AMD的实验室中,该公司预计将在2023年下半年交付InstinctMI300。ElCapitan超级计算机将在2023年部署时成为世界上最快的超级计算机。目前正在按计划进行。