中国超算九年磨一剑，杀回世界之巅！,中国超算最新进展

出处 | 有理儿有面

6月23日，德国汉堡，第41届国际超级计算大会的现场气氛有点微妙。

当第67期全球超算TOP500榜单揭晓的那一刻，原本嘈杂的会场出现了一瞬间的凝滞。所有人的目光都聚焦在榜首位置——那里不再是已连续3期霸榜的美国“酋长岩”，而是一个来自中国深圳的名字：“灵晟”。

更让某些西方人士破防的是，紧随其后的HPCG（高性能共轭梯度）榜单也同步公布，“灵晟”再次拿下第一。

双榜第一，意味着什么？意味着在纯粹的理论算力上，我们是第一；在更考验实际应用效率、更贴近真实科研场景的“干活能力”上，我们依然是第一。

先来看看这组让对手惊掉下巴的数据。

在TOP500测试中，“灵晟”的持续双精度浮点性能达到了惊人的2.198 ExaFlop/s（每秒219.8亿亿次）。

这是个什么概念？排名第二的美国“酋长岩”是1.809 ExaFlop/s。算一下就知道，“灵晟”比它快了整整21.5%。

而在HPCG这个更考验“内功”的榜单上，“灵晟”以22.00 PetaFlop/s的成绩位列第一，对比酋长岩17.41 Petaflop/s的成绩，同样优势明显。这说明它不是只会在跑分软件里刷榜的“纸面算力怪兽”，而是真正能扛实活的算力重器。

从大气海洋的模拟，让我们能更早预知台风和洪涝；到工程仿真，支撑国产大飞机和火箭发动机的全流程设计；再到材料科学、药物发现、脑科学以及大模型推理——以前我们搞这些，算力不够任务就得慢慢排队，或者得看别人脸色，现在有了“灵晟”，我们有了最坚实的算力底座。

但“灵晟”最震撼世界的，不是它有多快，而是它"怎么做到这么快"。

全球顶尖超算55%以上依赖GPU加速卡，走的是"CPU+GPU"异构路线。美国"酋长岩"塞满了AMD高端GPU，英伟达CUDA生态更是垄断了AI算力江湖。

“灵晟”呢？零GPU。纯CPU架构，近1400万个国产LX2处理器核心，自研"灵启"高速互联网络，国产HBM高带宽内存，麒麟操作系统，100%全液冷散热——从芯片设计到整机集成，从底层系统到上层软件，全栈国产，没有一个海外核心零部件。

这相当于在高端GPU被全面断供的绝境下，中国超算团队硬是靠自研CPU蹚出了一条新路。别人用GPU堆算力，我们用自己造的CPU来干同样的事，而且干成了世界第一。

这个“世界第一”，不仅是技术上的胜利，更是中国超算在被美国持续打压十余年后，完成的一次史诗级突围。

回望这条荡气回肠的突围之路，可以清晰地划分为三个阶段，每个阶段都上演着“封锁”与“反封锁”的激烈博弈。

第一阶段（2010-2014年），是美国的“警惕试探期”。

2010年“天河一号A”和2013年“天河二号”接连登顶，打破了美国的长期垄断。美国国防部立刻以“国家安全”为由，依托《瓦森纳协定》暗中收紧高性能芯片的出口审查，试图通过拖延供货来遏制中国。

对此，中国未雨绸缪，同步启动了“申威”和“飞腾”两条国产CPU的自研路线，为摆脱依赖埋下伏笔。

第二阶段（2015-2017年），是美国的“定点打击期”。

2015年4月，美国商务部直接将国防科大等四大超算中心列入“实体清单”，切断了“天河二号”升级所需的英特尔芯片供应，企图锁死中国超算的迭代。

然而，这一招很快失效。2016年，搭载纯国产“申威”处理器的“神威·太湖之光”横空出世，连续四次登顶，用实力戳破了美国的封锁幻想。

美国这才意识到，只打击终端用户远远不够，必须转向打击整个产业链。

第三阶段（2018年至今），是美国的“全面围剿期”。

随着中美贸易摩擦爆发，美国的遏制逻辑彻底转变，目标从限制排名升级为打断中国E级超算的整个自主研发进程，发起了一场无死角的立体战争。

2018年，美国修订规则，将超算与AI芯片统一管制，并凭借CPU+GPU的异构架构在榜单上重新夺回优势。

2019年，实体清单扩容至中科曙光、海光等核心企业，切断其EDA工具和x86架构授权，卡住供应链咽喉。

2020年，出台“外国直接产品规则”（FDPR），建立长臂管辖，让全球代工厂都无法为中国超算企业供货。

2021年，飞腾、申威等所有国产CPU研发单位和国家级超算中心全部上榜，实现全产业链封锁。

2022年，发布史上最严新规，全面封禁英伟达A100/H100等高端GPU和14nm以下制造设备，并限制美籍人才参与研发。

2023-2026年，联合日荷组建“设备同盟”，限制光刻机等设备出货，甚至施压停止存量设备的维修，并通过多边法案强制盟友同步执行禁令。

九年时间，美国从"不让你拿第一"升级到"不让你造出来"，从单点断供升级到全球产业链围剿。但中国超算没有死，反而被逼出了全栈自主的闭环。

2021年之后，中国主动停止向TOP500提交新一代超算数据。榜单上只剩老旧的太湖之光、天河二号A，排名逐年下滑。

外界以为中国超算凉了，实际上我们在低调攻关——攻克国产HBM高带宽内存，攻克自研高速互联芯片，攻克麒麟操作系统和国产编译器，攻克千万核心级并行调度。

九年沉默，不是放弃，是磨剑。直到灵晟横空出世，全栈国产，纯CPU路线，双榜第一，一举打破美国、日本E级超算已持续多年的榜单垄断。

这是怎样的九年？美国层层加码，中国步步为营；美国筑墙，中国修路；美国卡脖子，中国练内功。

从太湖之光的"计算核心"国产，到“灵晟”的"芯片、互联、存储、系统、软件、整机"国产，中国超算完成了一次从“局部自主”到“全产业链自主”的跃迁。

不仅如此，此次TOP500榜单中，中国上榜超算总数占全球近四成，形成了恐怖的规模化自主算力集群——我们不仅有最高的山峰，还有最厚实的高原。

对全球南方国家而言，中国走出的这条路提供了一个关键范本：不受外部管制、可自主迭代的算力方案，打破了高端算力被少数西方国家垄断的局面。

当然，也无需回避短板。由于采用纯CPU路线且制造工艺吃亏，“灵晟”的满载功耗（42.2MW）高于“酋长岩”（29.7MW），且在更贴近AI训练的HPL-MxP混合精度测试中仅排第四，在AI专用加速方面与GPU仍有差距。

但毋庸置疑的是，美国当年靠GPU卡我们脖子，逼我们另辟蹊径走纯CPU路线，如今我们这条路不仅走通了，还走成了世界第一，这本身就是对美国封锁政策最响亮的耳光。

回看这十六年，像极了一场漫长的高强度马拉松。美国一路使绊子、扔石子、设路障，手段用尽。但中国超算没有停下，反而在封锁中越跑越快。

图灵奖得主杰克·唐加拉亲赴深圳核验后评价："中国的灵晟系统，让世界看到了超算通向AI4Science新型系统架构的希望之光。"。

“灵晟”登顶，不是终点，而是起点。它用铁一般的事实告诉世界：“小院高墙”困不住中国创新，“脱钩断链”只会让中国更强大。

曾经那些看似密不透风的封锁，如今都成了“灵晟”登顶大典上最扎眼的背景板。

图片源自网络

点击「有理儿有面」阅读原文