
中国团队刷新纪录:超算“神威·Oceanlite”上实现AI驱动的最大规模量子化学模拟
2016到2017年,中国超级计算机“神威·太湖之光”曾四度登顶全球超级计算机TOP 500榜单,将中国超算推上世界之巅。此后,国产超算变得相对低调,继任者“神威·Oceanlite”相关信息鲜少公开,也未再现身TOP 500排名。然而,国内科研团队并未止步,反而在幕后默默发力。
近日,中国科学技术大学团队在“神威·Oceanlite”上,利用大规模神经网络技术取得了突破性成果:首次在真实分子尺度下完成了复杂的量子化学建模。这一成果发表于高性能计算领域顶级期刊《IEEE TPDS》,为超算在量子化学领域的新应用树立了标杆。
量子化学:用计算洞见分子世界
量子化学研究的是分子、原子以及电子等微观粒子的量子行为。比如化学反应中关键但难以捕捉的“过渡态”,是理解反应本质的关键环节。受限于实验手段,很难直接观测这些瞬时过程,因为在微观世界里,电子运动极快,一旦试图测量就会干扰系统本身。
理论上,分子的量子行为遵循薛定谔方程。但这个方程的复杂性随系统中电子数增长而呈指数暴涨。例如,仅10个电子的分子,就可能存在超过10万亿种量子态。药物分子、催化剂等实际分子则往往拥有几十电子、上百自旋轨道,计算量更是天文数字。
传统上,科研人员通过密度泛函理论(DFT)等近似方法来求解这些复杂问题,虽然能处理较大体系,但对于强电子关联现象(如化学键断裂、形成)容易产生较大误差。理论上量子计算机能够解决这一难题,但以目前技术,量子计算机还远未到实用阶段。
AI+超算:破解“计算太复杂”的难题
这一次,中科大团队的突破点,在于结合大规模神经网络与超级计算机硬件,让经典计算机也能逼近量子计算机才能胜任的分子模拟难题。团队开发的数据并行型NNQS-Transformer框架,是一套专为超算“神威·Oceanlite”打造的神经网络量子态解决方案,有三大核心创新:
混合架构创新
框架结合了Transformer注意力机制,用于动态捕捉电子间复杂的长程相互作用。这样,能够显著提升强关联系统中的计算精度,克服传统神经网络量子态(NNQS)方法面临的精度瓶颈。
高效并行设计
针对“神威·Oceanlite”采用的国产SW26010-Pro CPU(单芯384核,整机4100万核),团队构建了MPE(管理核心)与CPE(计算核心)的分工体系。MPE负责跨节点数据通信,CPE配备512位向量引擎,专注本地高效量子计算。如此分工配合,使得在3700万个CPE核心上进行大规模模拟时,任务分配可以实时调整,计算资源利用率达到92%的强扩展性、98%的弱扩展性,极大提升了超算效率。
软硬件适配与底层优化
“神威·Oceanlite”CPU架构采用本地内存设计,原本更适合AI训练,但量子化学模拟面对随机采样、不规则计算等特殊难题。团队针对性地用Julia语言开发代码,结合底层硬件深度优化,实现了任务与硬件之间的高效对接。
最终,研究团队成功实现了包含120个自旋轨道的分子模拟,这是目前经典超算下规模最大的AI驱动量子化学计算。
推动新材料、药物发现模式变革
用超级计算机模拟量子化学的意义,首先在于理解化学反应的本质过程。通过虚拟模拟,可以重现如光合作用等关键“过渡态”,为人工制氢等原创技术提供理论依据。
更进一步,在新材料、药物研发领域,量子级模拟能预测药物分子与蛋白、病毒的结合能力,帮助提前筛选新药。材料领域则可以借此模拟分子结构,预测材料的物理化学性质,反向设计催化剂、电池材料等,实现从原理到产业的创新飞跃。
结语
这项研究表明,超级计算机不仅仅是硬件算力的较量,更是软硬件协同与创新生态建设的重要舞台。当中国超算榜单排名不再是关注重点,平台化科研和自主生态正成为新的发展重心。同样令人振奋的是,在量子计算机尚处于“婴儿期”时,经典超算与AI结合,依旧拥有强大的科研创新潜力——计算边界仍在持续拓展。

