首页>商情资讯>行业新闻

Arm 推出 Armv9 边缘 AI 计算平台

2025-3-7 9:18:00
  • Arm 推出新一代边缘 AI 计算平台:Cortex-A320 CPU 与 Ethos-U85 AI 加速器亮相

Arm 推出 Armv9 边缘 AI 计算平台

Arm 推出新一代边缘 AI 计算平台:Cortex-A320 CPU 与 Ethos-U85 AI 加速器亮相

随着 AI 技术的快速发展,边缘设备正逐渐承担起越来越复杂的任务,为各类场景提供高效、智能的解决方案。为了满足边缘侧日益增长的 AI 需求,Arm 近日发布了全新的边缘 AI 计算平台,其核心包括基于 Armv9 架构的高能效 CPU——Cortex-A320,以及对 Transformer 网络提供原生支持的 Ethos-U85 AI 加速器。该平台不仅能效表现出色,还具备运行超 10 亿参数 AI 模型的能力,为边缘计算带来了全新的性能突破。

Cortex-A320 CPU:引领边缘 AI 的新变革

作为此次发布的亮点之一,Cortex-A320 是 Arm 首款基于 Armv9 架构的超高能效 CPU,专为物联网和边缘 AI 应用优化设计。相比前代的 Cortex-A35,Cortex-A320 在机器学习(ML)性能方面提升了高达 10 倍,而能效表现则比 Cortex-A520 提升了 50%,显著降低了功耗。此外,其标量计算性能相比 Cortex-A35 提高了 30%,为边缘设备提供了更强的通用计算能力。

随着边缘设备对更大规模、多模态 AI 模型的需求增加,系统内存性能的重要性愈发凸显。Cortex-A320 支持更大的内存空间,并优化了多层次内存访问延迟,能够更好地满足复杂应用场景的需求。此外,该处理器具备支持多种操作系统的能力,包括实时操作系统(如 FreeRTOS 和 Zephyr)以及功能丰富的操作系统(如 Linux 和 Android),为开发者提供了极大的灵活性。

Cortex-A320 还为现有的物联网处理器提供了理想的升级路径。无论是从 Cortex-A35 迁移,还是从市场上广泛应用的 Cortex-A53 升级,Cortex-A320 都能够提供更高的计算性能、更先进的安全性以及对 Armv9 软件生态的全面支持。

安全性与 AI 能力的双重提升

在边缘应用场景日益复杂的背景下,设备的安全性变得尤为关键。Cortex-A320 引入了 Armv9 架构的多项安全增强功能,例如 Secure EL2 提供更高的隔离性,支持更安全的软件容器运行;指针验证与分支目标识别(PACBTI)有效缓解了指针安全隐患;内存标记扩展(MTE)则通过内存标记机制,进一步提升了系统的防护能力。

在 AI 计算能力方面,Cortex-A320 通过增强的 Neon 和 SVE2 技术,显著提升了 ML 计算效率,并支持 BFloat16 等新数据类型,优化了神经网络推理和训练任务。此外,新增的矩阵乘法指令进一步加速了 AI 工作负载的执行,为边缘 AI 计算提供了强大的支持。

Cortex-A320 与 Ethos-U85 的深度协作

此次发布的边缘 AI 计算平台,不仅仅是 Cortex-A320 和 Ethos-U85 的简单组合,而是通过深度集成实现了协同优化。Cortex-A320 提供了更高的内存容量和带宽,支持 Ethos-U85 执行更大规模的 AI 模型。同时,当某些 AI 操作不适合在 AI 加速器上运行时,可以回退到 Cortex-A320,利用其 Neon/SVE2 引擎高效完成任务。例如,在连续图像检测任务中,AI 加速器表现更优;而对于单张图像的处理,CPU 则可能更为高效。

这样的设计使得边缘设备能够根据实际需求,灵活分配计算任务,从而在性能与能效之间找到最佳平衡。

加速边缘 AI 的软件生态:Kleidi 的扩展

在边缘 AI 的普及过程中,软件开发和部署的复杂性一直是主要障碍之一。为此,Arm 推出了 Kleidi 软件库,并将其扩展至物联网领域。Kleidi 包括 KleidiAI 和 KleidiCV 两大模块,分别优化 AI 负载和机器视觉任务的执行。KleidiAI 已集成至多种主流 AI 框架,如 Llama.cpp 和 LiteRT,能够加速 Meta Llama 3 等大模型的推理和训练,进一步释放 Arm CPU 的计算潜力。

通过 Kleidi 的支持,开发者可以更轻松地在 Arm 平台上实现高效的 AI 部署,显著降低开发门槛。

应对边缘 AI 的未来需求

随着边缘 AI 模型规模的不断扩大,内存容量和带宽成为影响性能的关键因素。Cortex-A320 提供了多种内存配置选项,能够适配不同大小的 AI 模型参数。此外,Arm 的 Cortex 处理器家族覆盖了从高性能到高能效的多种应用场景,例如 Cortex-X925 适用于高端机器人领域,而 Cortex-A320 则专注于能效要求极高的边缘设备。

在未来,Arm 还计划推出更多 AI 加速产品,进一步丰富其边缘计算生态。

总结

此次发布的 Arm 边缘 AI 计算平台,通过 Cortex-A320 CPU 和 Ethos-U85 AI 加速器的深度协作,为边缘设备提供了强大的计算能力和灵活性。无论是在复杂的 AI 推理任务中,还是在安全性和能效方面,该平台都展现出了领先的优势。随着边缘设备在物联网、消费电子等领域的应用不断拓展,Arm 的前瞻性布局将为行业发展注入新的动力。