首页>商情资讯>行业新闻

工信部力推:国产训练芯片与异构算力引领AI新征程

2026-1-22 9:20:00
  • 在国务院新闻办的新闻发布会上,工信部副部长张云明的表态,为人工智能产业的发展划出了清晰主线 —— 近期工信部联合 7 部门出台的《“人工智能 + 制造” 专项行动实施意见》,搭配配套的行业转型指引和企业应用指南,正构建起 AI 产业高质量发展的 “四梁八柱”。

工信部力推:国产训练芯片与异构算力引领AI新征程

在国务院新闻办的新闻发布会上,工信部副部长张云明的表态,为人工智能产业的发展划出了清晰主线 —— 近期工信部联合 7 部门出台的《“人工智能 + 制造” 专项行动实施意见》,搭配配套的行业转型指引和企业应用指南,正构建起 AI 产业高质量发展的 “四梁八柱”。而这一蓝图的核心突破点,明确指向了训练芯片与异构算力两大关键技术领域,这既是破解当前算力瓶颈的迫切需求,也是筑牢产业自主可控根基的必由之路。

作为 AI 模型研发的 “算力基石”,训练芯片的重要性不言而喻。这种能处理海量数据、完成复杂深度计算的高性能集成电路,直接决定着 AI 技术的发展速度与高度。但长期以来,高端训练芯片市场被国外厂商高度垄断,国内大规模模型训练始终面临算力供给不足、结构性失衡的困境,想要摆脱对国外芯片的依赖,国产高端训练芯片的全链条技术攻坚迫在眉睫。

令人振奋的是,2026 年初的行业动态显示,国产训练芯片正迎来多点突破,技术成果已从实验室走向实际应用。智谱 AI 与华为的合作堪称标杆 —— 借助华为昇腾 Atlas 800T A2 设备,双方全程基于国产芯片完成了新一代多模态图像生成模型 GLM-Image 的训练,从数据预处理到强化学习后训练的全流程,彻底摆脱了对国外芯片的依赖。这款模型发布后迅速登顶 Hugging Face 趋势榜第一,用实打实的市场表现证明,国产算力底座已具备支撑前沿 AI 模型研发的实力。

在集群训练效率上,科大讯飞与华为的深度合作同样交出亮眼答卷。双方攻克万卡级集群组网和通信协同优化的核心难题,将通用大模型训练效率从行业普遍的 30%-50% 大幅提升至 85%-95%,即便在长思维链强化学习这样的复杂场景中,训练效率也超过 84%。这意味着国产芯片训练大模型的成本将显著下降,稳定性也已接近国际主流水平,为产业规模化应用扫清了关键障碍。

芯片厂商的产品迭代同样迅猛,多款新品在关键参数上对标国际主流,且坚持国产工艺路线。燧原科技推出的 L600 定位极高性能 AI 算力,不仅采用国产工艺,还首创原生 FP8 低精度算力,专门用于训练集群,性能可对标英伟达 H20 GPU,未来计划支持万卡级超大算力集群建设;中诚华隆的 HL100 则走出差异化路线,采用自研 GPGPU+NPU 融合架构,主打高能效比和高性价比,同等算力下的总拥有成本仅为国外某知名 AI 芯片的 1/4,为不同场景的算力需求提供了更经济的选择。

更值得关注的是科研团队在颠覆性技术路径上的探索。清华大学发布的 “太极 - II” 首创全前向智能光计算训练架构,让大规模神经网络训练速度较传统 GPU 提升 10 倍,凭借超高能效比为突破算力瓶颈提供了全新思路;中科院自动化所的 “瞬悉 1.0” 在国产 GPU 集群上完成训练,其出色的推理效率和能耗表现,也印证了非 Transformer 架构在国产算力平台上的巨大潜力,为行业技术路线多元化发展打开了空间。

如果说训练芯片是 “单点突破”,那么异构算力则是 “系统破局” 的关键。这种早已跳出 “硬件堆叠” 思维的技术路径,通过在计算系统中混合使用 CPU、GPU、NPU、FPGA 等不同架构的计算单元协同处理任务,实现了算力资源的最优配置。打个形象的比方,传统同构算力模式就像满街都是小轿车,拉货载人都难兼顾;而异构模式则根据任务特性精准调度 “交通工具”—— 拉货用 “卡车”(NPU / 加速卡),载人用 “轿车”(CPU),长途用 “高铁”(专用芯片),最终实现效率最大化、成本最低化。

当前,国内异构算力的突破主要集中在三个核心层面。首先是打破 “算力孤岛”,解决跨地域、跨芯片协同的难题。上海 AI 实验室的 DeepLink 技术实现了全球首次长距离、跨地域异构算力互联,就像一个 “万能插座”,成功将上海和济南两地不同架构的算力资源整合为 “超级节点”,训练效率达到单一芯片集群的 95% 以上,有效盘活了分散的算力资源,缓解了算力分布不均的问题。

其次是攻克软硬协同的 “调度艺术”。异构算力的核心难点不在于硬件组合,而在于软件层面的高效调度。阿里云率先构建起业内首个万卡混合异构算力云平台,通过算网融合架构让不同厂商的 GPU 顺畅协同,通信性能提升 20%;京东云的 JoyScale 平台则实现了更广泛的兼容,支持超 10 家国产算力卡,成为行业最多元的异构调度方案;中国电信的创新实践更具借鉴意义,其验证的 “英伟达 + 国产” 芯片交叉组合推理试验,将推理任务的 “Prefill” 和 “Decode” 阶段拆分,分配给不同特性的芯片处理,最终实现成本最高下降 42%,为行业提供了降本增效的新范式。

最后是颠覆性的 “光计算” 探索,这被视作下一代异构算力的重要方向。前文提到的清华 “太极 - II” 就是典型代表,这款智能光计算芯片利用光子进行计算,在特定任务上的速度比传统 GPU 快 10 倍,且能效比大幅提升,有望打破 “电算力” 的物理极限,为算力行业开辟全新赛道。而国家超级计算成都中心的最新动态更显示,量子与经典算力的协同调度已成为现实 —— 西南首台 550 量子比特相干光量子计算机的落地,让异构算力的边界从传统芯片拓展到了量子领域,为未来算力升级埋下了重要伏笔。

从工信部的政策导向不难看出,异构算力已从 “技术概念” 转变为 “刚需基础设施”。未来的 AI 算力竞争,不再是单一芯片 “大力出奇迹” 的比拼,而是 “精打细算” 的系统能力较量。通过异构算力的深度发展,不仅能充分盘活国内丰富的算力资源,更能降低对单一进口芯片的依赖,为《“人工智能 + 制造” 专项行动实施意见》中提出的 “到 2027 年实现关键核心技术安全可靠供给” 目标,提供坚实的算力支撑。

随着清微智能等企业的可重构芯片实现量产落地,国家超算中心的多元算力平台持续扩容,国产 AI 算力正从单点突破走向体系化升级。在政策引导与市场驱动的双重作用下,训练芯片的自主化与异构算力的规模化应用,必将加速推动 AI 与制造业的深度融合,为新质生产力的培育注入强劲动能。

如果想进一步聚焦某类芯片的技术细节、特定企业的实践案例,或者补充 “AI + 制造” 的具体应用场景,我可以继续深化内容,让分析更具针对性和实用性。