AMD服务器CPU市占率达50%

2025-8-12 9:18:00

AMD在服务器CPU的攻守之势

AMD在服务器CPU的攻守之势

市场格局变化：PassMark最新统计显示，至2025年一季度，AMD在服务器CPU市场的份额首次触及50%，与英特尔并驾齐驱。按照AMD对外披露的数据，自EPYC面世以来，其服务器份额从2018年的约2%一路攀升至2024年上半年的34%，并在最新季度实现与对手持平。持平只是开始，接下来的拉锯战会更激烈。

技术演进与代际路线：自2017年首款基于Zen架构的EPYC Naples推出，AMD在数据中心赛道持续加码。2019年Rome把7nm工艺带进数据中心；2021年Milan升级至Zen 3；随后第四代Genoa、Bergamo加速堆栈扩展；到去年，第五代EPYC Turin把核心规格拉到192核的高度。几代产品的共同主线很清晰：更高的性能密度、更好的能效、更优的性价比。

AI时代下的CPU角色：让GPU“吃满”与CPU“更聪明”

为什么还需要强劲CPU：GPU是训练与大规模低延迟推理的主力，但数据准备/后处理、内存与I/O搬运、调度与安全隔离等大量“非核算”活儿，需要高频率、宽内存带宽、大缓存与强I/O的CPU配合。合适的CPU能把GPU利用率抬上去，整体AI吞吐随之上升。

EPYC 9005系列的要点：该系列基于Zen 5/Zen 5c架构，台积电4nm/3nm工艺，IPC最高提升约17%，最高规格192核/384线程，频率可达5GHz。单路支持最高6TB DDR5内存，CXL 2.0与多达约160条PCIe 5.0通道，强调每瓦效能与插槽级吞吐的同步提升，并补强了安全特性。面向GPU主机角色的“F”系高频型号（如9575F），在相同GPU配置下可进一步压低延迟、抬升系统吞吐。

以GPU为中心的整机收益：在相同8 GPU配置下，搭配高频EPYC（如9575F）的整机，在运行Llama 3.1-70B等工作负载时，系统性能可报告高达约两成的提升；这类收益来自CPU侧的更快队列填充、数据管线提速与更稳的I/O供给。

CPU可承接的五类推理负载

传统机器学习：决策树、随机森林、线性模型等对多核CPU友好，未必能显著吃到GPU的并行红利。若你的场景以情感分析、分类、欺诈检测、时序预测为主，高核数与更高频率的CPU往往更划算。

视觉与模式识别：人脸/物体/图像分类、热图与缺陷检测等深度学习视觉任务，虽然GPU加速更快，但在企业规模的实时性要求不高场景，CPU也能高效承载，便于大规模铺开。

图计算与图分析：社交网络、IT系统、供应链等复杂网络的图分析，常常受益于CPU对系统内存的直接低延迟访问。选用更高内存带宽与更大容量的CPU平台，能在内存中处理大型图数据集，减少反复IO带来的开销。

实时推荐（小到中型）：高频+多核CPU配合大缓存与高速内存，可满足实时推荐的并行与延迟需求，尤其适合以CPU为主的“轻推理”在线服务。

模型微调与压缩：PEFT、LoRA等参数高效微调技术，能把通用大模型“瘦身”为面向特定知识库的小模型，利于在CPU上做高效推理与部署，适合专家助手、企业内检索问答与决策支持等应用。

以EPYC 9005为底座的能效与TCO

机架与能耗的实测口径：官方数据指出，以第五代EPYC（如9965）构建的双路服务器，较上一代在推理吞吐方面可实现成倍提升；在一些整数性能对比中，单台新平台可替代多台旧平台，从而显著缩减上架数量、功耗与软件许可支出。

以旧换新示例：将约1000台基于Xeon Platinum 8280的服务器替换为约127台基于EPYC 9965的服务器，针对约39.1万单位的整数性能目标，可把电力消耗降至原来的约三成出头，五年电费累计节约或可达数百万美元量级（以公开测算为例）。

CPU+加速器的整机表现：AMD将Instinct MI300系列与EPYC配套优化。在1,000节点规模、每节点8×MI300X的集群中，搭配EPYC 9575F运行Llama 3.1-70B（FP8、指定I/O token配置）时，每秒可处理的token数相较同规模且采用英特尔对标CPU的集群显著提高。对比测试也显示，在基于MI300或NVIDIA H100的系统上，搭配EPYC的整机推理延迟更低、GPU利用率更高，平均推理时间缩短幅度在个位数到两位数的区间内浮动，视模型与负载而定。

样本工作负载与结果片段

CPU侧纯推理：在FP32精度下运行XGBoost（Higgs数据集）时，双路、192核的EPYC 9965平台，推理吞吐（单位时间完成次数）相较既有方案可达到数倍差距。

LLM中型规模：对诸如Llama 3.1-70B的场景，8×GPU整机在相同条件下更换为EPYC高频主机CPU（如9575F），系统性能有统计的两位数百分比增益，归因于数据供给链路与调度效率的提升。

经营与财务概览

2025年一季度，AMD营收约74.38亿美元，同比增长约36%；净利润约15.66亿美元，同比增长约55%。数据中心业务表现突出，季度营收约37亿美元，同比增幅约57%，高于市场此前一致预期。公司对二季度营收指引在71亿–77亿美元区间，中值约74亿美元，略高于分析师普遍预期。

展望：在AI驱动下的算力结构升级与EPYC产品力的持续迭代加持，AMD有望在数据中心处理器市场进一步扩大份额。对用户侧而言，评估标准应围绕TCO（能耗、机架、许可）、AI吞吐/延迟、内存与I/O可扩展性，以及对GPU集群的主机优化能力。

选型建议（给到采购与架构团队）

以GPU为核心的训练/大模型低延迟推理：优先考虑高频“F”系EPYC（如9575F）或等效高频型号，关注PCIe 5.0通道数与CXL 2.0拓展，以保证队列填充效率与NUMA亲和性。

以CPU为主的中小模型推理与传统ML：倾向高核数、较大L3缓存与高带宽DDR5，结合功耗预算选择Zen 5c密度核型SKU，追求每瓦吞吐与机架密度。

图计算/内存数据库：优先看内存容量上限（单路至数TB级）与内存通道/频率，结合CXL内存扩展路线，确保在峰值窗口不发生溢出到磁盘。

推荐系统与在线服务：选择高频+多核折中方案，评估缓存命中与延迟指标；在多租户场景下考虑硬件隔离与安全扩展特性。

说明与出处提示

上述统计、对比与性能数字来自公开市场研究机构口径与AMD对外发布的测试或资料。不同测试条件、软件栈、编译器、固件版本、场景与数据规模会导致显著差异；在落地前建议以自有数据集与目标SLA进行复现场内评估，确保结论与贵方环境一致。

AMD服务器CPU市占率达50%

企业新闻

行业新闻