首页>商情资讯>行业新闻

AMD服务器CPU市占率达50%

2025-8-12 9:18:00
  • AMD在服务器CPU的攻守之势

AMD服务器CPU市占率达50%

AMD在服务器CPU的攻守之势

市场格局变化:PassMark最新统计显示,至2025年一季度,AMD在服务器CPU市场的份额首次触及50%,与英特尔并驾齐驱。按照AMD对外披露的数据,自EPYC面世以来,其服务器份额从2018年的约2%一路攀升至2024年上半年的34%,并在最新季度实现与对手持平。持平只是开始,接下来的拉锯战会更激烈。

技术演进与代际路线:自2017年首款基于Zen架构的EPYC Naples推出,AMD在数据中心赛道持续加码。2019年Rome把7nm工艺带进数据中心;2021年Milan升级至Zen 3;随后第四代Genoa、Bergamo加速堆栈扩展;到去年,第五代EPYC Turin把核心规格拉到192核的高度。几代产品的共同主线很清晰:更高的性能密度、更好的能效、更优的性价比。

AI时代下的CPU角色:让GPU“吃满”与CPU“更聪明”

为什么还需要强劲CPU:GPU是训练与大规模低延迟推理的主力,但数据准备/后处理、内存与I/O搬运、调度与安全隔离等大量“非核算”活儿,需要高频率、宽内存带宽、大缓存与强I/O的CPU配合。合适的CPU能把GPU利用率抬上去,整体AI吞吐随之上升。

EPYC 9005系列的要点:该系列基于Zen 5/Zen 5c架构,台积电4nm/3nm工艺,IPC最高提升约17%,最高规格192核/384线程,频率可达5GHz。单路支持最高6TB DDR5内存,CXL 2.0与多达约160条PCIe 5.0通道,强调每瓦效能与插槽级吞吐的同步提升,并补强了安全特性。面向GPU主机角色的“F”系高频型号(如9575F),在相同GPU配置下可进一步压低延迟、抬升系统吞吐。

以GPU为中心的整机收益:在相同8 GPU配置下,搭配高频EPYC(如9575F)的整机,在运行Llama 3.1-70B等工作负载时,系统性能可报告高达约两成的提升;这类收益来自CPU侧的更快队列填充、数据管线提速与更稳的I/O供给。

CPU可承接的五类推理负载

传统机器学习:决策树、随机森林、线性模型等对多核CPU友好,未必能显著吃到GPU的并行红利。若你的场景以情感分析、分类、欺诈检测、时序预测为主,高核数与更高频率的CPU往往更划算。

视觉与模式识别:人脸/物体/图像分类、热图与缺陷检测等深度学习视觉任务,虽然GPU加速更快,但在企业规模的实时性要求不高场景,CPU也能高效承载,便于大规模铺开。

图计算与图分析:社交网络、IT系统、供应链等复杂网络的图分析,常常受益于CPU对系统内存的直接低延迟访问。选用更高内存带宽与更大容量的CPU平台,能在内存中处理大型图数据集,减少反复IO带来的开销。

实时推荐(小到中型):高频+多核CPU配合大缓存与高速内存,可满足实时推荐的并行与延迟需求,尤其适合以CPU为主的“轻推理”在线服务。

模型微调与压缩:PEFT、LoRA等参数高效微调技术,能把通用大模型“瘦身”为面向特定知识库的小模型,利于在CPU上做高效推理与部署,适合专家助手、企业内检索问答与决策支持等应用。

以EPYC 9005为底座的能效与TCO

机架与能耗的实测口径:官方数据指出,以第五代EPYC(如9965)构建的双路服务器,较上一代在推理吞吐方面可实现成倍提升;在一些整数性能对比中,单台新平台可替代多台旧平台,从而显著缩减上架数量、功耗与软件许可支出。

以旧换新示例:将约1000台基于Xeon Platinum 8280的服务器替换为约127台基于EPYC 9965的服务器,针对约39.1万单位的整数性能目标,可把电力消耗降至原来的约三成出头,五年电费累计节约或可达数百万美元量级(以公开测算为例)。

CPU+加速器的整机表现:AMD将Instinct MI300系列与EPYC配套优化。在1,000节点规模、每节点8×MI300X的集群中,搭配EPYC 9575F运行Llama 3.1-70B(FP8、指定I/O token配置)时,每秒可处理的token数相较同规模且采用英特尔对标CPU的集群显著提高。对比测试也显示,在基于MI300或NVIDIA H100的系统上,搭配EPYC的整机推理延迟更低、GPU利用率更高,平均推理时间缩短幅度在个位数到两位数的区间内浮动,视模型与负载而定。

样本工作负载与结果片段

CPU侧纯推理:在FP32精度下运行XGBoost(Higgs数据集)时,双路、192核的EPYC 9965平台,推理吞吐(单位时间完成次数)相较既有方案可达到数倍差距。

LLM中型规模:对诸如Llama 3.1-70B的场景,8×GPU整机在相同条件下更换为EPYC高频主机CPU(如9575F),系统性能有统计的两位数百分比增益,归因于数据供给链路与调度效率的提升。

经营与财务概览

2025年一季度,AMD营收约74.38亿美元,同比增长约36%;净利润约15.66亿美元,同比增长约55%。数据中心业务表现突出,季度营收约37亿美元,同比增幅约57%,高于市场此前一致预期。公司对二季度营收指引在71亿–77亿美元区间,中值约74亿美元,略高于分析师普遍预期。

展望:在AI驱动下的算力结构升级与EPYC产品力的持续迭代加持,AMD有望在数据中心处理器市场进一步扩大份额。对用户侧而言,评估标准应围绕TCO(能耗、机架、许可)、AI吞吐/延迟、内存与I/O可扩展性,以及对GPU集群的主机优化能力。

选型建议(给到采购与架构团队)

以GPU为核心的训练/大模型低延迟推理:优先考虑高频“F”系EPYC(如9575F)或等效高频型号,关注PCIe 5.0通道数与CXL 2.0拓展,以保证队列填充效率与NUMA亲和性。

以CPU为主的中小模型推理与传统ML:倾向高核数、较大L3缓存与高带宽DDR5,结合功耗预算选择Zen 5c密度核型SKU,追求每瓦吞吐与机架密度。

图计算/内存数据库:优先看内存容量上限(单路至数TB级)与内存通道/频率,结合CXL内存扩展路线,确保在峰值窗口不发生溢出到磁盘。

推荐系统与在线服务:选择高频+多核折中方案,评估缓存命中与延迟指标;在多租户场景下考虑硬件隔离与安全扩展特性。

说明与出处提示

上述统计、对比与性能数字来自公开市场研究机构口径与AMD对外发布的测试或资料。不同测试条件、软件栈、编译器、固件版本、场景与数据规模会导致显著差异;在落地前建议以自有数据集与目标SLA进行复现场内评估,确保结论与贵方环境一致。