AMD重磅发布CDNA4架构及MI350系列AI GPU:性能4倍跃升
发布时间:2025-6-13 15:42
发布者:eechina
在今日召开的Advancing AI 2025峰会上,全球半导体巨头AMD正式发布基于CDNA 4架构的Instinct MI350系列AI加速器,以“史上最大性能飞跃”向英伟达发起正面挑战。新系列包含风冷版MI350X和液冷版MI355X两款产品,搭载288GB HBM3E内存,FP4精度下算力达20.1 PFLOPS,推理性能较前代提升35倍,标志着AMD在AI算力竞赛中迈出关键一步。![]() 核心突破:CDNA4架构重构AI计算范式 MI350系列基于台积电第二代3nm(N3P)制程工艺,集成1850亿个晶体管,采用Chiplet 3D混合封装技术(XCD计算核心+IOD I/O核心),通过第四代Infinity Fabric总线实现5.5TB/s芯片间互联。其核心创新包括: · 全精度计算引擎:首次支持FP4/FP6低精度格式,结合增强型矩阵计算引擎,在混合精度计算中性能提升2倍,DeepSeek-R1等大模型推理效率达英伟达H100的90%-120%。 · 内存带宽巅峰:288GB HBM3E内存带宽达8TB/s,较前代MI325X提升33%,可承载万亿参数大模型,700亿参数模型推理延迟降至毫秒级。 · 能效比优化:通过架构改进与制程升级,MI350X在维持1000W TDP(热设计功耗)下实现38倍能效提升,液冷版MI355X峰值功耗1400W,较前代翻倍但性能提升4倍。 市场对标:直击英伟达软肋,生态布局补位 AMD CEO苏姿丰在发布会上直面与英伟达的竞争:“MI355X在FP4精度下生成Token的速度比英伟达B200快20%-30%,每美元投资可多生成40%的Token。”这一表态直指英伟达Hopper架构在能效比上的短板。 市场数据显示,MI350系列已获得头部云服务商青睐: Meta、微软、甲骨文已在生产环境部署MI300X,MI350将延续这一合作关系; OpenAI CEO山姆·阿尔特曼现身捧场,表示期待MI400(2026年发布)的更强性能; 戴尔、惠普、超微正研发支持8卡至128卡液冷互联的机架级方案,剑指超大规模AI训练集群。 战略布局:从芯片到全栈的AI野心 AMD此次发布会不仅推出硬件,更构建了端到端AI基础设施蓝图: 软件生态:即将发布的ROCm 7软件栈推理性能提升3.5倍,支持LLaMA、DeepSeek等主流模型开箱即用,180万个Hugging Face模型已适配; 系统级创新: MI350X风冷机柜:8卡设计高度仅6U,HBM显存容量18TB,FP8算力590 PFLOPS; MI355X液冷机柜:16卡设计显存36TB,FP8算力1.28 EFLOPS,较前代密度提升117%; 网络突破:联合推出智能网卡Pensando Pollara 400,基于Ultra Ethernet标准,卸载GPU/CPU通讯负载,吞吐量较RoCEv2网卡提升10%-20%。 未来路线图:MI400与Helios架构蓄势待发 苏姿丰在会后透露,下一代Instinct MI400将于2026年发布,搭载432GB HBM4内存,带宽跃升至19.6TB/s,FP4算力预计达40 PFLOPS。配套的“Helios”AI机架式服务器将整合EPYC CPU、MI400 GPU和Pensando智能网卡,支持72颗GPU紧密耦合,纵向扩展带宽达260TB/s。 |
网友评论