出处 | 有理儿有面
6月23日,德国汉堡,第41届国际超级计算大会的现场气氛有点微妙。
当第67期全球超算TOP500榜单揭晓的那一刻,原本嘈杂的会场出现了一瞬间的凝滞。所有人的目光都聚焦在榜首位置——那里不再是已连续3期霸榜的美国“酋长岩”,而是一个来自中国深圳的名字:“灵晟”。
更让某些西方人士破防的是,紧随其后的HPCG(高性能共轭梯度)榜单也同步公布,“灵晟”再次拿下第一。
双榜第一,意味着什么?意味着在纯粹的理论算力上,我们是第一;在更考验实际应用效率、更贴近真实科研场景的“干活能力”上,我们依然是第一。
先来看看这组让对手惊掉下巴的数据。
在TOP500测试中,“灵晟”的持续双精度浮点性能达到了惊人的2.198 ExaFlop/s(每秒219.8亿亿次)。
这是个什么概念?排名第二的美国“酋长岩”是1.809 ExaFlop/s。算一下就知道,“灵晟”比它快了整整21.5%。
而在HPCG这个更考验“内功”的榜单上,“灵晟”以22.00 PetaFlop/s的成绩位列第一,对比酋长岩17.41 Petaflop/s的成绩,同样优势明显。这说明它不是只会在跑分软件里刷榜的“纸面算力怪兽”,而是真正能扛实活的算力重器。
从大气海洋的模拟,让我们能更早预知台风和洪涝;到工程仿真,支撑国产大飞机和火箭发动机的全流程设计;再到材料科学、药物发现、脑科学以及大模型推理——以前我们搞这些,算力不够任务就得慢慢排队,或者得看别人脸色,现在有了“灵晟”,我们有了最坚实的算力底座。
但“灵晟”最震撼世界的,不是它有多快,而是它"怎么做到这么快"。
全球顶尖超算55%以上依赖GPU加速卡,走的是"CPU+GPU"异构路线。美国"酋长岩"塞满了AMD高端GPU,英伟达CUDA生态更是垄断了AI算力江湖。
“灵晟”呢?零GPU。纯CPU架构,近1400万个国产LX2处理器核心,自研"灵启"高速互联网络,国产HBM高带宽内存,麒麟操作系统,100%全液冷散热——从芯片设计到整机集成,从底层系统到上层软件,全栈国产,没有一个海外核心零部件。
这相当于在高端GPU被全面断供的绝境下,中国超算团队硬是靠自研CPU蹚出了一条新路。别人用GPU堆算力,我们用自己造的CPU来干同样的事,而且干成了世界第一。
这个“世界第一”,不仅是技术上的胜利,更是中国超算在被美国持续打压十余年后,完成的一次史诗级突围。
回望这条荡气回肠的突围之路,可以清晰地划分为三个阶段,每个阶段都上演着“封锁”与“反封锁”的激烈博弈。
第一阶段(2010-2014年),是美国的“警惕试探期”。
2010年“天河一号A”和2013年“天河二号”接连登顶,打破了美国的长期垄断。美国国防部立刻以“国家安全”为由,依托《瓦森纳协定》暗中收紧高性能芯片的出口审查,试图通过拖延供货来遏制中国。
对此,中国未雨绸缪,同步启动了“申威”和“飞腾”两条国产CPU的自研路线,为摆脱依赖埋下伏笔。
第二阶段(2015-2017年),是美国的“定点打击期”。
2015年4月,美国商务部直接将国防科大等四大超算中心列入“实体清单”,切断了“天河二号”升级所需的英特尔芯片供应,企图锁死中国超算的迭代。
然而,这一招很快失效。2016年,搭载纯国产“申威”处理器的“神威·太湖之光”横空出世,连续四次登顶,用实力戳破了美国的封锁幻想。
美国这才意识到,只打击终端用户远远不够,必须转向打击整个产业链。
第三阶段(2018年至今),是美国的“全面围剿期”。
随着中美贸易摩擦爆发,美国的遏制逻辑彻底转变,目标从限制排名升级为打断中国E级超算的整个自主研发进程,发起了一场无死角的立体战争。
2018年,美国修订规则,将超算与AI芯片统一管制,并凭借CPU+GPU的异构架构在榜单上重新夺回优势。
2019年,实体清单扩容至中科曙光、海光等核心企业,切断其EDA工具和x86架构授权,卡住供应链咽喉。
2020年,出台“外国直接产品规则”(FDPR),建立长臂管辖,让全球代工厂都无法为中国超算企业供货。
2021年,飞腾、申威等所有国产CPU研发单位和国家级超算中心全部上榜,实现全产业链封锁。
2022年,发布史上最严新规,全面封禁英伟达A100/H100等高端GPU和14nm以下制造设备,并限制美籍人才参与研发。
2023-2026年,联合日荷组建“设备同盟”,限制光刻机等设备出货,甚至施压停止存量设备的维修,并通过多边法案强制盟友同步执行禁令。
九年时间,美国从"不让你拿第一"升级到"不让你造出来",从单点断供升级到全球产业链围剿。但中国超算没有死,反而被逼出了全栈自主的闭环。
2021年之后,中国主动停止向TOP500提交新一代超算数据。榜单上只剩老旧的太湖之光、天河二号A,排名逐年下滑。
外界以为中国超算凉了,实际上我们在低调攻关——攻克国产HBM高带宽内存,攻克自研高速互联芯片,攻克麒麟操作系统和国产编译器,攻克千万核心级并行调度。
九年沉默,不是放弃,是磨剑。直到灵晟横空出世,全栈国产,纯CPU路线,双榜第一,一举打破美国、日本E级超算已持续多年的榜单垄断。
这是怎样的九年?美国层层加码,中国步步为营;美国筑墙,中国修路;美国卡脖子,中国练内功。
从太湖之光的"计算核心"国产,到“灵晟”的"芯片、互联、存储、系统、软件、整机"国产,中国超算完成了一次从“局部自主”到“全产业链自主”的跃迁。
不仅如此,此次TOP500榜单中,中国上榜超算总数占全球近四成,形成了恐怖的规模化自主算力集群——我们不仅有最高的山峰,还有最厚实的高原。
对全球南方国家而言,中国走出的这条路提供了一个关键范本:不受外部管制、可自主迭代的算力方案,打破了高端算力被少数西方国家垄断的局面。
当然,也无需回避短板。由于采用纯CPU路线且制造工艺吃亏,“灵晟”的满载功耗(42.2MW)高于“酋长岩”(29.7MW),且在更贴近AI训练的HPL-MxP混合精度测试中仅排第四,在AI专用加速方面与GPU仍有差距。
但毋庸置疑的是,美国当年靠GPU卡我们脖子,逼我们另辟蹊径走纯CPU路线,如今我们这条路不仅走通了,还走成了世界第一,这本身就是对美国封锁政策最响亮的耳光。
回看这十六年,像极了一场漫长的高强度马拉松。美国一路使绊子、扔石子、设路障,手段用尽。但中国超算没有停下,反而在封锁中越跑越快。
图灵奖得主杰克·唐加拉亲赴深圳核验后评价:"中国的灵晟系统,让世界看到了超算通向AI4Science新型系统架构的希望之光。"。
“灵晟”登顶,不是终点,而是起点。它用铁一般的事实告诉世界:“小院高墙”困不住中国创新,“脱钩断链”只会让中国更强大。
曾经那些看似密不透风的封锁,如今都成了“灵晟”登顶大典上最扎眼的背景板。
图片源自网络
点击「有理儿有面」阅读原文