AMD重磅发布CDNA4架构及MI350系列AI GPU：性能4倍跃升

发布时间：2025-6-13 15:42 发布者：eechina

关键词： AMD , CDNA4 , MI350 , AI , GPU

在今日召开的Advancing AI 2025峰会上，全球半导体巨头AMD正式发布基于CDNA 4架构的Instinct MI350系列AI加速器，以“史上最大性能飞跃”向英伟达发起正面挑战。新系列包含风冷版MI350X和液冷版MI355X两款产品，搭载288GB HBM3E内存，FP4精度下算力达20.1 PFLOPS，推理性能较前代提升35倍，标志着AMD在AI算力竞赛中迈出关键一步。

核心突破：CDNA4架构重构AI计算范式

MI350系列基于台积电第二代3nm（N3P）制程工艺，集成1850亿个晶体管，采用Chiplet 3D混合封装技术（XCD计算核心+IOD I/O核心），通过第四代Infinity Fabric总线实现5.5TB/s芯片间互联。其核心创新包括：

· 全精度计算引擎：首次支持FP4/FP6低精度格式，结合增强型矩阵计算引擎，在混合精度计算中性能提升2倍，DeepSeek-R1等大模型推理效率达英伟达H100的90%-120%。
· 内存带宽巅峰：288GB HBM3E内存带宽达8TB/s，较前代MI325X提升33%，可承载万亿参数大模型，700亿参数模型推理延迟降至毫秒级。
· 能效比优化：通过架构改进与制程升级，MI350X在维持1000W TDP（热设计功耗）下实现38倍能效提升，液冷版MI355X峰值功耗1400W，较前代翻倍但性能提升4倍。

市场对标：直击英伟达软肋，生态布局补位

AMD CEO苏姿丰在发布会上直面与英伟达的竞争：“MI355X在FP4精度下生成Token的速度比英伟达B200快20%-30%，每美元投资可多生成40%的Token。”这一表态直指英伟达Hopper架构在能效比上的短板。

市场数据显示，MI350系列已获得头部云服务商青睐：

Meta、微软、甲骨文已在生产环境部署MI300X，MI350将延续这一合作关系；
OpenAI CEO山姆·阿尔特曼现身捧场，表示期待MI400（2026年发布）的更强性能；
戴尔、惠普、超微正研发支持8卡至128卡液冷互联的机架级方案，剑指超大规模AI训练集群。

战略布局：从芯片到全栈的AI野心

AMD此次发布会不仅推出硬件，更构建了端到端AI基础设施蓝图：

软件生态：即将发布的ROCm 7软件栈推理性能提升3.5倍，支持LLaMA、DeepSeek等主流模型开箱即用，180万个Hugging Face模型已适配；
系统级创新：
MI350X风冷机柜：8卡设计高度仅6U，HBM显存容量18TB，FP8算力590 PFLOPS；
MI355X液冷机柜：16卡设计显存36TB，FP8算力1.28 EFLOPS，较前代密度提升117%；
网络突破：联合推出智能网卡Pensando Pollara 400，基于Ultra Ethernet标准，卸载GPU/CPU通讯负载，吞吐量较RoCEv2网卡提升10%-20%。

未来路线图：MI400与Helios架构蓄势待发

苏姿丰在会后透露，下一代Instinct MI400将于2026年发布，搭载432GB HBM4内存，带宽跃升至19.6TB/s，FP4算力预计达40 PFLOPS。配套的“Helios”AI机架式服务器将整合EPYC CPU、MI400 GPU和Pensando智能网卡，支持72颗GPU紧密耦合，纵向扩展带宽达260TB/s。

AMD重磅发布CDNA4架构及MI350系列AI GPU：性能4倍跃升

相关文章

网友评论

厂商推荐

相关视频