[返回网际谈兵首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
nextplatform中国的 EXASCALE 量子模拟并非如此-Nicole Hemsoth
送交者: 沧桑一声笑[☆★男儿当自强★☆] 于 2022-06-01 5:45 已读 911 次  

沧桑一声笑的个人频道

来源连接 (谷歌中文转译)
https://www.nextplatform.com/2021/11/15/why-did-china-keep-its-exascale-supercomputers-quiet/ 6park.com

中国的 EXASCALE 量子模拟并非如此
2021 年 11 月 18 日 妮可·赫姆索斯

6park.com

6park.com

实际上,可以说它也远比看起来要多。

三年前,橡树岭国家实验室 (ORNL)、谷歌和 NASA Ames 的一个团队发表了一篇论文,展示了量子霸权的第一缕曙光。对于那些不关注量子计算的人来说,简而言之,这意味着证明量子系统可以超越传统的超级计算机。

结果基于模拟 53 量子比特的“Sycamore”电路(谷歌的量子架构)并在 ORNL 的“Summit”超级计算机上运行相同的模拟。结果相当惊人,显示在“Summit”上模拟完整的 53 量子比特“Sycamore”电路需要一万年的时间,但在“Sycamore”上需要大约 200 秒。这不仅速度更快,而且效率更高——能效提高约 1000 万倍。

作者对结果的戏剧性性质感到惊讶,提交了令人垂涎的年度超级计算奖的参赛作品:戈登贝尔奖,该奖专注于大规模的高价值应用程序。

这篇论文甚至没有通过第一阶段的淘汰。

然而,三年后的现在,中国的一台超级计算机是地球上最早的两个百亿亿次系统之一(尽管中国没有公开列出经过验证的 HPL 结果),它自己运行了类似的“Sycamore”电路模拟建筑学。那篇论文刚刚获得了戈登·贝尔奖——这是唯一一个基于超级计算机而颁发的奖项,该超级计算机甚至没有在 Top500 上公开列出。 6park.com

更重要的是,这篇题为“缩小‘量子霸权’差距:使用新的双威超级计算机实现随机电路的实时仿真”的论文似乎显着改善了 ORNL 的“Summit”结果,其中的计算核心要多得多。循环(令人难以置信的 4200 万)和混合精度。根据 ORNL 的 Dmitry Liakh 的说法,问题在于,与原始实验相比,模拟的复杂性有所降低——相当显着。

“在他们获得戈登贝尔奖的作品中,中国研究人员介绍了一个系统的设计流程,涵盖了模拟所需的算法、并行化和架构。使用新的双威超级计算机,中国团队有效地模拟了10x10x(1+40+1)的随机量子电路(RQC经典模拟的新里程碑)。他们的模拟使用超过 4190 万个 Sunway 内核(处理器)实现了 1.2 Eflops(每秒 1 quintillion 浮点运算)单精度或 4.4 Eflops 混合精度的性能。”

Liak 是“Sycamore”实验模拟团队的一员。他的具体贡献是开发了一个 GPU 驱动的数值张量代数库,用于“Summit”的大规模模拟以及其他优化和调整。他说,这个声称将模拟时间缩短到 304 秒的新 Gordon Bell 奖得主是通过省略模拟的关键元素来做到这一点的,这使得它不如 ORNL 自己的模拟。

Sunway exascale 系统的团队没有对 Sycamore 电路或任何其他随机电路产生的全部空间进行采样。Liak 认为,与试图模拟 Sycamore 的原始实验相比,它们只是从 21 个量子比特的空间中采样。“由于他们在未经验证的情况下使用了简化,这就是他们将模拟时间缩短到 304 秒的方式。”

“如果你像我们一样严格地执行此操作,并对 53 个量子位的全部空间进行采样,那么目前最好的估计大约是几天。使用 exascale 机器可能会缩短一两天。但是,如果您没有对整个空间进行采样,而只是像他们那样使用 21 个量子位的子采样,他们可以大大缩短求解时间。但这不是应该的工作方式。”

Gordon Bell 奖旨在表彰“高性能计算领域的杰出成就”。组织者补充说,它旨在跟踪并行计算的进展,“特别强调奖励将 HPC 应用于科学、工程和大规模数据分析应用的创新”。有人可能会争辩说,这位 2021 年的获奖者展示了卓越的并行计算能力(除了将这项工作移植到一种新颖的架构中)。但该应用程序本身实际上只是一个基准——在流行病、全球气候变化和可以从大规模模拟中受益的重大灾难的时代,它不一定具有巨大的现实价值。

该奖项还可以表彰“在重要科学和工程问题的可扩展性和解决时间方面的最佳表现或特殊成就”。双威系统虽然有前者,但后者值得质疑。如果这不是第一个运行未公开的获胜提交的系统,它可能会产生不同的感觉。悄悄曝光的双威系统和天河 3 亿亿级超级计算机绝对没有按照我们在 HPC 中所期望的规则运行,大型公共机器展示了现实世界的可扩展性,以解决当下重要的问题。

除了超级计算这一重要奖项的现实价值问题之外,还有另一个方面让 HPC 中的许多人感到不适:这篇论文是关于中国在实际消息传出之前“出柜”的消息。虽然论文中的结果并不是真正意义上的百亿亿次计算(它们基于低精度与双精度/FP64 结果),但该论文被许多人视为“谦虚的吹嘘”,展示了一个樱桃挑选的应用程序如何它证明了该系统可以处理传统的 HPC 模拟 (FP64),并且还可以使用混合精度和张量/矩阵数学加速组件来执行 AI 主力任务,这是超级计算机上现代 GPU 的替代品。

所以请记住,在顶部,我们说纸不是它所出现的全部,而且还有很多? 6park.com

[iframe][/iframe] 6park.com

事实证明,模拟不是故事。对于中国来说,这是一个引人注目的标题,它展示了一个混合精度的野兽,并向世界证实了这个系统是真实的,尽管它没有公开的 Top500 名单。

需要明确的是,对于那些外部人士来说,Top500 列表都是双精度集中在其 exascale 指定。中国双威系统确实是基准中百亿亿级机器的真正定义。然而,基准测试通常与真实世界的应用程序性能相差甚远,因此能够拥有真正的百亿亿次计算能力的系统,但顶级应用程序性能明显低于该基准测试峰值。中国希望这两个故事同时发生。他们做到了。

事情是这样的:一篇旨在以系统能力细节震惊世界的论文(中国不必经历公开分享其完整的 HPL、HPCG、Green500 结果的实际严格性)实际上因其应用而赢得了梦寐以求的奖项工作充其量是令人惊讶的——对颁奖委员会来说是愚蠢的。

标题引起了媒体的注意,可扩展性(尽管精度低/不是 HPC)引起了评奖委员会的注意。这意味着每个人都按照中国的当权者(决定对 Top500 结果保持沉默的人)所希望的去做。 6park.com

6park.com

注册我们的时事通讯


将本周的亮点、分析和故事直接从我们发送到您的收件箱,中间没有任何内容。
现在订阅 6park.com

相关文章

6park.com

中国将另一个 AI 框架扩展到 EXASCALE

6park.com

全球 EXASCALE 野心的状态检查

6park.com

中国的 EXASCALE 原型超级计算机测试 AI 工作负载

6park.com


2 条评论


Pentti Salonen 说: 6park.com

2021 年 11 月 20 日上午 8:17

您对 500 强榜单给予了太多的重视。没有什么官方的。它只是一个基于某些基准的计算机列表,操作员运行然后将结果发布给它。无论如何,并非所有真正的前 500 名表现者中的计算机都在该列表中。计算机科学家不会基于他们对计算机系统的评估,更不用说他们自己的工作基于该列表中的计算机位置。
您似乎想抨击中国没有在该列表中发布计算机,同时抨击他们在实际的科学论坛上发布他们的工作。并且缺乏现实世界的价值。喜欢 500 强榜单?真实世界的价值来自多年的工作。 6park.com

喜欢沧桑一声笑朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ 沧桑一声笑的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回网际谈兵首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


    用户名:密码:[--注册ID--]

    标 题:

    粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


         图片上传  Youtube代码器  预览辅助

    打开微信,扫一扫[Scan QR Code]
    进入内容页点击屏幕右上分享按钮

    楼主本栏目热帖推荐:

    >>>>查看更多楼主社区动态...






    [ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]