[返回网际谈兵首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
nextplatform.com为什么中国保持其百亿亿级超级计算机安静?Nicole Hemsoth
送交者: 沧桑一声笑[☆★男儿当自强★☆] 于 2022-06-01 5:54 已读 1292 次 1 赞  

沧桑一声笑的个人频道


来源      谷歌转译
https://www.nextplatform.com/2021/11/15/why-did-china-keep-its-exascale-supercomputers-quiet/
6park.com

为什么中国保持其百亿亿级超级计算机安静?

2021 年 11 月 15 日 妮可·赫姆索斯

6park.com

6park.com

在超级计算领域,没有什么比那些在两年一度的世界上最强大的系统——Top500 榜单上名列前十的那些更值得吹嘘的了。在这十年中,没有哪个国家比美国和中国更愿意(以及数十亿人)投入到这场竞争中。

今天,公布了最新的结果(更多关于这里的结果),但除了预期的美国第一台百亿亿次机器,橡树岭国家实验室的“前沿”之外,还有中国的结果,如果公布,将显示两个独立的百亿级机器。

如果中国决定在多个方面公布其结果,这将是一个主要的主流新闻报道。

最明显的是在 LINPACK 基准测试(衡量超级计算性能的指标)上率先达到峰值并使用双精度浮点保持百亿亿次。此外,这将在具有两个独立的国产处理器和加速器架构的两个独立系统上得到证明。第三,这将意味着在两个站点上对超级计算技术进行数十亿美元的投资(因此中国政府将长期做出认真的承诺)。

所有这一切都表明,尽管美国在过去十年中进行了数十亿美元的技术投资,但仍无法以百亿亿级的功能性能率先到达。

然而,中国对此保持沉默。嗯,大部分。 6park.com

HPC 没有受到媒体友好的主流关注,而是每年两次在展示实际应用程序性能的论文中悄悄讨论这些系统。此外,中国确保这个消息在 Top500 之外以其他方式传播开来。

10 月下旬,The Next Platform 证实并报告称,根据 LINPACK 的说法,两台独立的 exascale 超级计算机——世界上第一台具有这种能力的超级计算机——达到了峰值和持续的 exascale 性能。从那时起,许多人想知道为什么中国会选择不公布这些结果,因为在过去十年中为了确保顶级系统地位而展开了激烈的公开竞争。

当我们在 4 月第一次得知基准结果达到百亿亿次时(基准结果是在 3 月发布的,顺便说一下,就在贸易限制对这些百亿亿级设施和供应商实施打击之前),最初的迹象来自中国一家工厂的联系人– Top500 的追随者所熟知的。当时的谈话没有记录在案,并表示对如此多的工程工作无法在全球范围内得到认可感到不满,这意味着即使不是提前,也很早就做出了对结果保持沉默的决定。我们又花了几个月的时间才获得足够全面的信息来发布确认信息。

最终,虽然中国可能能够将长期统治的日本第一“富岳”强国淘汰出局,但这种影响也可能不会产生中国希望通过这些双百亿亿次系统获得的持久印象。

有充分的理由要求吹牛的权利……

所有这一切都让我们想起了中国不得不在显而易见的情况下公布结果的众多原因——不仅在一台,而是两台百亿亿次机器上获得了冠军头衔。这将使中国成为世界上第一个达到高性能计算性能里程碑的国家,在过去几年中,这一里程碑一直是美国数十亿美元投资的主题。

在 6 月版或本周发布的 Top500 名单中,也会引起人们对中国在本土半导体、网络和软件技术方面的重大物质投资的关注。通过深入了解SunwayPhytium架构和制造背景,可以找到更多细节。尽管这两个百亿亿级系统都没有“新”架构,但它们确实代表了显着的可扩展性飞跃,除了在要求严苛的 HPC 领域的显着性能,还显示了系统执行混合精度的能力(有利于 AI/ML)和紧耦合的 FP64 驱动的传统超级计算。

在阿里巴巴、百度、腾讯和其他中国公司中,为其现有的大型计算基础设施提供 HPC 补充将是另一个吹嘘的权利来源。这些公司都在努力构建自己的原生处理器、加速器和软件生态系统。拥有本地技术的超级计算/研究方面将是实力的进一步迹象。

在这一点上,中国也将能够展示既能处理通用高性能计算又能处理新兴人工智能的系统。当 Sunway 系统的量子模拟工作结果公布时,我们认为中国不仅展示了真实世界的紧密耦合 HPC 性能,而且还可以处理复杂的混合精度工作负载,这在 AI 中很常见(FP16,Int -8 等)。简而言之,它将吹捧人工智能和模拟能力——对于所有新兴的大型系统来说都是一个有价值的方面——而且所有这些都没有传统的 Nvidia 或 AMD GPU,因为美国和欧洲系统为人工智能、低精度能力部署了这些 GPU。

对于超级计算以外的人来说,这可能看起来微不足道——但想想看:除了展示多种本土架构的技术实力和可扩展性外,还失去了展示中国团队辛勤工作的能力,通常超过整个尖端系统(制造商、设计师、架构师、程序员、系统管理员等)。这些 HPC 专业人士没有机会在国际舞台上庆祝这样一个里程碑是一种耻辱。无论国家之间是否存在激烈的争执,我们不要忘记这些人——他们中的许多人都在为实现这一令人垂涎的目标而奋斗。这确实很重要,即使更大的国际图景掩盖了它。

竞争战略、认知,当然还有政治

虽然我们尚未确认直接的单一原因,但在过去几周内,我们从美国、日本和欧洲的国家实验室 HPC 负责人那里收集了许多意见,他们都认为缺乏宣传是出乎意料和令人费解的但一般来说,纯粹是政治性的。然而,鉴于政治和技术上的细微差别,我们确实有一些想法。

如上所述,出于竞争目的,中国可能只是在战略上保持沉默。中国政府为这些系统提供了数十亿美元的资金支持(不仅是设计和建造,还有正在进行的设施和电力),可能在这些机器的战略公告(或缺乏)中拥有最终决定权。

最有趣的是,这些团队没有进入 Top500,而是通过Gordon Bell 奖论文提交确认了该系统的存在。作为参考,这是通过 Top500 超越顶级系统地位的超级计算中最令人垂涎​​的奖项。特别是针对 Sunway 系统的提交,这些提交确定了这些机器的存在和生产,以及展示了性能和可扩展性——尽管有一组精心挑选的应用程序。

这表明中国渴望展示这些系统的“真实世界”生产和使用,而不是声称在 500 强中广为人知的榜首位置和第一个达到百亿亿次级的桂冠。简而言之,他们在没有为 LINPACK 或 HPCG、Graph500 或 Green500 等 HPC 中更关注现实世界的基准测试提供系统规范的情况下获得了技术优势的认可。

由于中国过去构建系统只是为了与 Top500 竞争——包括一个直接复制的类似 AMD 外观的系统,后来被从列表中删除——人们可能会说这些百亿亿级机器是一款游戏。但并非如此,根据我们采访的那些接近基准结果的原始故事的消息来源。在这种情况下,这是合法的,机器功能强大,这意味着贸易战——可能是这个故事的很大一部分——也是缺乏公布重要结果的核心。

美国最近限制与两个百亿亿级系统背后的实验室和供应商建立关系的时间是在 4 月,即在每个系统上运行基准一个月后。目前尚不清楚决定不报道这一成就是由于等待 6 月的 Top500 名单还是出于其他原因,但我们采访过的人怀疑,真正的延迟是为了避免被我们。

预计美国的“前沿”机器将出现在今天的Top500排行榜上,远高于中国的任何一个系统。如果中国在 6 月或今天的榜单中上市,假设“Frontier”在 Argonne 占据位置,紧随其后的是“Aurora”(预计达到 2+ exaflops峰值),它只会在相对较短的时间内保持领先地位。考虑到这些大型机器的使用寿命(平均 5 年)以及新机器进一步取代中国的潜力,从而将其系统进一步推低,这一点很重要。

预计半导体短缺不会像它那样影响大型系统,因此中国可能没有看到“前沿”从 11 月份的名单中消失。

我们收集到的关于中国为何选择沉默的观点之一在表面上显得有点“外在”,但值得重复:如果美国和欧洲一心想要在未来三年推出几个百亿亿次级系统多年来,中国在成为第一名和两个系统启动方面都超出了预算,因此带球回家可能符合其最大利益。换言之,如果中国“不再打Top500”这个长期以来一直是衡量全国超级计算竞赛的标杆,那这个榜单还有价值吗?

换句话说,通过选择使用机器作为“软公告”或运行 LINPACK 并让这些结果“意外”溜走而不发表,是的,中国失去了顶级系统的重要新闻日,但是只有这最后一次。作为一个指标的列表不再像多年来那样国际化。多年来,顶级系统的针锋相对在美国和中国之间反弹。

当你唯一真正的竞争者不会上场时,你很难声称自己占据主导地位。 6park.com

[iframe][/iframe] 6park.com

虽然 Top500 在过去的几十年里一直在推动架构发展,但从 2008 年左右开始,它尤其推动了美国和中国之间的竞争——而且激烈的竞争最终导致了失败,这一次是出于选择。

显而易见的是,中国已经走上了自己的民族主义技术道路。这样做存在问题,其中最重要的是缺乏晶圆厂和半导体制造能力。所有这一切都超出了它的边界——现在(她不祥地说)。有多种架构可供选择,在中国拥有强大的超大规模基础来交易硬件和软件工具,以及长期坚持这一路线的所有政治理由,中国在此次 Top500 榜单中没有发布的消息要大得多比它可能有的任何公告。

当然,这对于 Top500 榜单的未来都不是好兆头。虽然它的创建者对其缺点持开放态度,并建立了 HPCG 和 HPC-AI 等配套基准,但双精度浮点指标对于带宽有限的实际应用程序来说并不那么重要。即便如此,每一份名单的公布都意味着全世界都在关注全球超级计算,这是一件大事——尤其是对于依赖资助下一台大型机器的国家实验室和组织而言。国际竞争,尤其是美国和中国之间的竞争,也凸显了双方日益增长的雄心,将 HPC 作为试金石话题。

我们预计目前名单上的太湖之光和其他中国系统会出现,直到它们退役。也许在一段时间内,也许是几年内,我们不会看到任何其他来自中国的前十级机器。不是因为它没有,而是因为它会选择其他的宣传方式。

喜欢沧桑一声笑朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ 沧桑一声笑的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回网际谈兵首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名:密码:[--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助

打开微信,扫一扫[Scan QR Code]
进入内容页点击屏幕右上分享按钮

楼主本栏目热帖推荐:

>>>>查看更多楼主社区动态...






[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]