
英伟达CUDA“护城河”再推进——正式拥抱RISC-V架构
过去十余年,英伟达在数据中心生态布局上持续拓展。其CUDA平台,作为GPU高性能计算的核心工具,最初只支持x86和Power架构,2019年又扩展支持了Arm CPU。这一步极大加快了CUDA在数据中心、AI等行业的普及。
值得关注的是,在最近举办的第五届RISC-V中国峰会上,英伟达副总裁Frans Sijstermanns透露,英伟达将在RISC-V架构上移植CUDA。这一举措,被业界视作RISC-V发展史上的重大进展,将为开源硬件生态注入全新动力。
英伟达“量产级”布局:每年逾10亿颗RISC-V MCU出货量
其实,英伟达对RISC-V架构早有战略布局。公司是RISC-V国际基金会及其软件生态联盟(RISE)的董事成员,并持续为RISC-V指令集规范做贡献。
据2023年公开资料,早在2015年,英伟达就确定了RISC-V作为GPU控制器的核心架构。迄今为止,英伟达形成了包括NV-RISCV32(顺序执行,RV32IMU),NV-RISCV64(乱序,RV64IMSU),NV-RVV(支持向量扩展)在内的多型MCU核心。
目前,英伟达基于RISC-V的微控制器已集成超30种自研IP,每年出货量超过10亿颗,充分显示出对RISC-V生态的高度认可。
CUDA移植RISC-V的技术挑战
按照英伟达规划,CUDA的完整迁移涵盖两个关键板块:
CUDA工具链(Toolkits):如NVCC编译器、GDB等开发工具链,这部分确保开发者可以为GPU编程和调试。
CUDA驱动与底层库(Drivers & Libraries):包括CUDAKMD、CUDAUMD等驱动栈,以及业界关键的并行计算库,为各行业领域(如物理模拟、基因测序、气象分析等)提供深度优化的软件加速。
但在实际推进过程中,英伟达也碰到了现实瓶颈。首先,从硬件角度来说,兼容、性能可用的RISC-V主板选择有限,主要依赖SiFive P550和阿里巴巴玄铁C920,难以满足大规模服务器场景高并发需求。即使新一代高性能配置(如2024年10月刚通过的RVA23标准)获得批准,高频高核数的RISC-V服务器板卡尚未量产,单核性能仍有待提升。
其次,RISC-V CPU与现代GPU协同时,对数据交换速度与虚拟内存体系有新要求,只有当统一的虚拟内存机制成熟后,RISC-V平台下的CUDA体验才能真正媲美x86及Arm体系。此外,移植工作涉及复杂的开发栈和底层库的适配,整个生态的“健壮性”也需进一步打磨。
目前,英伟达正携手RISC-V产业链合作伙伴,在相关平台上持续开展移植和适配测试,一旦标准化生态和高性能RISC-V服务器普及,支持Linux系统、面向数据中心的RISC-V+CUDA方案将成为现实选项——为业界提供更多选择。
RISC-V的突破与行业影响
英伟达与CUDA的加入,可视为RISC-V服务器生态的一针强心剂。回顾Arm在服务器市场的崛起,2019年CUDA宣布支持Arm后,短短五年,Arm服务器CPU市场占有率跃升十数倍。如今RISC-V站在同一起点,开放指令集与低授权费用为其吸引了大量关注:据中国RISC-V联盟数据,开发大规模高算力CPU若选择自研+RISC-V,研发成本将节省约33%。
业界也有担心:RISC-V的开放性是否会带来碎片化、兼容性难题?英伟达则认为,像CUDA这样的大型通用软件平台“下沉”为生态统一奠定了基础,未来有望推动RISC-V在部分细分高性能领域获得突破。
结语
如英伟达副总裁所言,硬件平台应服务于开发者和用户自由选择。只要核心软件生态能兼容,底层CPU架构是x86、Arm还是RISC-V并不重要。长远看,CUDA全面支持RISC-V将大大拓展产业空间,加速中国、全球高性能服务器芯片的创新步伐。