
AI驱动的数据中心竞赛:AMD与英特尔在服务器CPU版图上分庭抗礼
来自第三方机构的最新统计显示,2025年一季度,AMD在服务器CPU市场的出货份额首次与英特尔并驾齐驱。回顾EPYC产品线的推进节奏,自2018年起,AMD在服务器领域的占比一路提升,至2024年上半年已突破三成,随后在2025年初实现关键拐点。随着“50%对50%”格局的形成,下一阶段的竞争将更趋白热化。
从Naples到Turin:EPYC五代演进的底层逻辑
2017年,首代EPYC(Naples)基于Zen架构进入数据中心,打破了长期的单一格局。
2019年,第二代(Rome)将7nm制程引入服务器平台,开启密度与能效的双轮驱动。
2021年,第三代(Milan)采用Zen 3架构,并在延时与缓存层面做深化优化。
随后第四代(Genoa、Bergamo)面向更高并发与云原生场景迭代。
2024年推出的第五代(Turin)把核心数量提升到最高192核,进一步拉升吞吐与每瓦效能。
在AI时代的数据中心,CPU的角色正在重估:既要为GPU“让路”以释放加速卡潜能,也要承担模型前后处理、特征工程、数据搬运与服务编排等大量CPU侧工作。EPYC面向的,正是这条“适配GPU、同时可独立承担推理”的平衡之道。
CPU如何“点燃”GPU:高频率、高带宽与大I/O的系统级配合
要让GPU跑得更快,主机CPU并非可有可无。高频核可快速完成预处理与后处理;大容量L3与更高的内存带宽,有助于缩短数据路径;更丰富的PCIe通道与CXL支持则保障了CPU—GPU之间的高效互连;而能效更优的核心设计,让整机功耗预算向GPU侧倾斜,同时降低TCO;最后是生态层面的兼容与优化,决定了系统调度与软件栈落地的效率。
面向AI与云工作负载的EPYC 9005系列
架构与工艺:基于Zen 5/Zen 5c,采用台积电先进工艺;在IPC上较前代有明显提升。
规格与性能:最高192核/384线程,频率上探至5GHz;面向吞吐的Zen 5c核心提升每插槽吞吐与每瓦效能。
存储与互连:单插槽最高支持6TB DDR5,扩展I/O丰富,支持CXL 2.0与大量PCIe Gen5通道。
安全与特性:在平台安全与隔离方面持续加码,匹配多租户与云原生场景。
在同等整数性能目标下,新平台可显著压缩机架规模与能耗,释放机房空间并减少软件许可成本,为新增AI工作负载预留资源。在纯CPU方案上,基于EPYC 9005的双路服务器,面对参数量在百亿级及以下的语言模型、图像/反欺诈分析与推荐系统等任务,较上一代可获得显著推理吞吐提升。以双路EPYC 9965为例,推理吞吐最高可达上一代的两倍。在典型传统ML任务(如XGBoost的Higgs数据集,FP32)上,192核配置的双路平台可取得约3倍的平均每小时运行次数提升。
针对“GPU主机CPU”这一角色,EPYC 9005中的部分高频型号在实际推理服务中可带动整机吞吐增长。例如,在搭载8张GPU、运行Llama 3.1-70B的同等配置下,选用高频的EPYC 9575F可将系统性能最高提升约20%,提高单机ROI。
五类典型CPU推理场景
传统机器学习:决策树、随机森林、线性模型等更偏CPU友好,能充分利用高核心与大缓存优势,适合情感分析、分类、欺诈检测、时间序列等高并发推理。
计算机视觉:模式识别与深度学习视觉模型在CPU侧也能做到可观吞吐,适合对响应时延不极致苛刻的大规模企业级/边缘推理。
图分析:社交网络、IT系统、供应链等复杂网络的内存密集型图计算,CPU凭借直接访问大容量系统内存的优势,能在内存中处理大图数据集,减少IO往返。
推荐系统(小到中型):高频与多核的组合、加之大缓存与高速内存,可满足实时推荐场景的并行化与低延迟要求。
轻量化与微调:通过PEFT/LoRA等方法对大模型做参数高效微调,得到更小、更贴域的模型后,可在CPU上高效运行专家助手、检索问答与业务决策应用。
能效与空间:换机的复利效应
以整机替换为例,单台新一代EPYC服务器可承担多台老一代平台的等效工作量,从而显著降低数据中心能耗与占地。若以特定规模的集群对比,在相同整数性能目标下,用更少的机架实现同等算力,可带来用电、散热与软件许可的多重节约,五年期TCO改善明显。
CPU+加速器的协同:从平台到集群的整体收益
AMD在AI硬件栈上同时推进通用CPU与加速器产品,例如Instinct系列。当EPYC与MI300X这类加速器协作时,在Llama等主流大模型的推理上可见到延迟下降与吞吐上升,GPU利用率更高。在同规模的加速集群中,采用高频EPYC作为主机CPU,常能取得更好的端到端tokens处理速率,缩短服务响应时间并提升单位功耗的有效产出。类似优势也可在NVIDIA H100平台的主机CPU对比中观察到:更强的CPU侧预处理/后处理与更畅通的数据通道,能让GPU更少“空转”。
财务与展望
2025年一季度,AMD实现营收约74.38亿美元,同比增长约36%;净利润约15.66亿美元,同比增长约55%。数据中心业务为核心增长引擎,单季营收约37亿美元,同比增长约57%。公司给出的二季度营收指引位于71–77亿美元区间,中值约74亿美元,略高于市场一致预期。受益于AI产业景气与产品竞争力的持续增强,AMD在数据中心处理器与相关平台上的份额仍有望进一步提升。
结语
服务器CPU正从“单点性能比拼”走向“系统级协同优化”。在AI驱动的算力范式中,谁能在CPU、内存、互连、软件栈和加速器之间实现更高效的耦合,谁就能在真实工作负载中获得更好的单位成本表现。以EPYC为代表的新一代平台,正在把这种协同转化为可量化的吞吐、时延与能耗优势。