[返回游戏天地首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
PlayStation 5揭幕:Mark Cerny技术深入探究
送交者: tekkenman[☆★★铁拳男★★☆] 于 2020-04-03 4:59 已读 1410 次  

tekkenman的个人频道

PlayStation 5的增强时钟及其工作方式

我特别感兴趣谈论的领域之一是PlayStation 5的升压时钟-这项创新实质上是根据冷却组件的散热为片上系统提供固定的功率预算。 有趣的是,马克·塞尔尼(Mark Cerny)在他的演讲中承认冷却PlayStation 4的困难,并认为拥有最大的功率预算实际上会使工作变得容易。 塞尔尼在讲话中说:“由于没有更多的未知数,因此无需猜测最坏情况的游戏可能具有的功耗。” “至于冷却解决方案的细节,我们将把这些细节留到后续的拆解分析中,我认为您会对工程团队的工作感到满意。”



无论如何,事实是SoC有设定的功率水平。 无论我们是在谈论手机,平板电脑,甚至是PC CPU和GPU,提升时钟往往会导致不同的情况下有不同的运行效果-这在游戏主机上是不允许发生的。 您的PS5不能比邻居慢或快。 至少可以说,仅开发游戏中的挑战就很繁重。



“我们不使用芯片的实际温度,因为这会导致PS5之间出现两种类型的差异,” Mark Cerny解释说。 “一个是由于环境温度的差异而引起的差异;主机可能位于房间中温度较高或较低的位置。另一个是由主机中的各个定制芯片引起的差异,某些芯片的温度较高,而某些芯片的温度较低。因此我们不使用芯片的温度,而是使用一种算法,该算法的频率取决于CPU和GPU活动信息。这样可以使PS5之间的行为保持一致。”



处理器内部是一个电源控制单元,它不断测量CPU,GPU和内存接口的活动,评估它们正在执行的任务的性质。 与其根据特定PS5处理器的性质判断功耗,不如使用更通用的“模型SoC”。 可以将其视为处理器可能表现如何的模拟,并且在每个PlayStation 5的电源监视器的核心使用相同的模拟,以确保每个单元的一致性。



Cerny说:“所有PS5的行为都是相同的。” “如果您玩相同的游戏并到达游戏中的相同位置,那么拥有哪种定制芯片及其晶体管是什么都没关系。将其放在立体声柜或冰箱中也没关系。 ,您的PS5在CPU和GPU上的频率将与其他任何PS5相同。”





来自开发人员的反馈看到了开发人员遇到的两个领域-并非所有PS5都将以相同的方式运行的概念,这是Model SoC概念所解决的。 第二个方面是Boost的本质 。 在节流之前,频率会在设定的时间内达到峰值吗?



Cerny补充说:“时间常数,即CPU和GPU达到与其活动相匹配的频率所花费的时间,对于开发人员来说至关重要。” “这很短,如果游戏对一些帧进行功率密集型处理,就会受到限制。在几秒钟或几分钟内没有额外的性能可用,然后系统受到限制的时间并不存在延迟;这不是开发人员不希望生活在这个世界上-我们确保PS5对功耗非常敏感。此外,开发人员还可以准确地反馈CPU和GPU使用了多少功率。”



马克·塞尼(Mark Cerny)认为,开发人员将开始以不同的方式优化其游戏引擎-在给定的功率水平下实现最佳性能。 “功率在优化时起着重要作用。如果您优化并保持功率不变,那么您会看到优化的所有好处。如果您优化并提高功率,那么您会得到一些性能回馈。这里最有趣的是是功耗的优化,如果您可以修改代码以使其具有相同的绝对性能,但功耗降低,那么这就是胜利。”



简而言之,想法是开发人员可以通过从GPU获得相同的结果来学习通过不同的方式进行优化,但是通过为功耗进行优化而增加的时钟可以更快地完成优化。 Cerny补充说:“ CPU和GPU都有各自的功耗预算,当然,GPU功耗预算是两者中的较大者。” “如果CPU不使用其功率预算-例如,如果其上限为3.5 GHz,则预算的未使用部分将分配给GPU。这就是AMD所说的SmartShift。CPU和GPU都可以提供足够的功率可能会在3.5GHz和2.23GHz的极限下运行,开发人员不必选择运行其中一个速度较慢的情况。”



“这里还有另一种现象,叫做'竞跑到空闲'。让我们假设我们以30Hz的频率运行,并且在33毫秒的预算中我们使用了28毫秒,因此GPU空闲了5毫秒。电源控制逻辑将检测到正在消耗低功率-毕竟GPU在这五毫秒内没有做太多事情-并得出结论认为应该提高频率。但这是毫无意义的,” Mark Cerny解释说。



此时,时钟可能会更快,但是GPU没有工作要做。 任何频率颠簸都是毫无意义的。 “最终结果是,GPU不再做任何工作,而是更快地处理其分配的工作,然后空闲更长的时间,只是等待垂直同步等。我们使用“竞赛到空闲”来描述GPU频率的这种无意义的增加。” Cerny解释说。 “如果您构建一个可变频率系统,基于这种现象(CPU端有一个等效物)您将看到的是,频率通常只是固定在最大值上!但是,这没有意义;为了要对GPU的频率做出有意义的说明,我们需要在游戏中找到一个位置,在33.3毫秒的帧中,GPU可以充分利用33.3毫秒。



“因此,当我发表声明,GPU将把大部分时间都花在或接近其最高频率时,这就是排除了“闲置竞速”的因素-我们在整体情况下研究PlayStation 5游戏对CPU而言,情况也是如此。根据对整个帧利用率高的情况的研究,CPU得出的结论是,CPU将大部分时间用于峰值频率。”



简而言之,在不争分夺秒的竞争中,并且CPU和GPU都已充分使用时,升压时钟系统在大多数情况下仍应会看到两个组件都接近或以峰值频率运行。 Cerny还强调功耗和时钟速度没有线性关系。 将频率降低10%,可将功耗降低约27%。 Cerny强调说:“一般而言,功耗降低10%只是频率降低了几个百分点。



这是一种创新的方法,尽管涉及的工程工作可能很重要,但Mark Cerny简洁地总结了一下:“我们的突破之一是找到热点的一组频率-这意味着CPU和GPU的热密度-是一样的。这就是我们所做的。它们相当容易冷却或难以冷却-随便你怎么称呼它。”



关于加速将如何影响游戏设计,可能还有更多发现。 几位与Digital Foundry交谈的开发人员表示,他们目前在PS5上的工作使他们节流CPU,以确保图形核心上的持续2.23 GHz时钟。 这非常有道理,因为当前大多数游戏引擎在设计时都考虑了低性能的Jaguar-即使吞吐量翻倍(即60fps与30fps)也几乎不会增加PS5的Zen 2内核的负担。 但是,这听起来不像是一个增强的解决方案,而是类似于我们在Nintendo Switch上看到的性能配置文件。 “关于锁定的配置文件,我们支持我们开发套件中的配置文件,在优化时不要设置可变的时钟会有所帮助。已发布的PS5游戏始终会提高频率,以便它们可以利用额外的功能,” Cerny解释说。



但是,如果开发人员不打算专门针对PlayStation 5的功率上限进行优化呢? 我想知道开发人员是否可以解决“最坏情况”的频率-等同于PC组件的基本时钟。 “开发人员无需进行任何优化;如果有必要,频率将根据CPU和GPU所执行的任何操作进行调整,” Mark Cerny表示。 “我想你是在问如果故意编写一段代码,以便每个周期中CPU和GPU中的每个晶体管(或可能的最大晶体管数量)翻转,那会发生什么。这是一个非常抽象的问题,游戏不是”实际上,如果在现有控制台上运行这样的代码,则功耗将大大超出预期的工作范围,甚至控制台可能会进入热关机状态。 PS5会更优雅地处理这样一个不切实际的代码。”



目前,仍然很难掌握升压以及时钟变化的程度。 关于向后兼容性,也存在一些困惑,Cerny关于在PS5上运行前100款PlayStation 4游戏且性能得到增强的评论被误解为意味着发行时只能运行相对少量的游戏。 几天后澄清了这一点(预计将运行数千款游戏),但在PlayStation 5上向后兼容的性质令人着迷。



PlayStation 4 Pro旨在提供比其基本对手更高的性能,从而为获得4K显示支持打开了大门,但是兼容性是关键。 部署了“蝴蝶” GPU配置,该配置在图形核心上实质上增加了一倍,但是除了时钟速度之外,CPU必须保持不变-Zen核心不是一个选择。 对于PS5,RDNA 2 GPU中添加了额外的逻辑以确保与PS4和PS4 Pro的兼容性,但是等式的CPU方面呢?



Mark Cerny告诉我们:“为Jaguar CPU创建的所有游戏逻辑都可以在Zen 2 CPU上正常工作,但是指令的执行时间可能会大不相同。” “我们与AMD合作定制了特定的Zen 2内核;它们具有可以更接近Jaguar时序的模式。可以这么说,在进行向后兼容工作时,我们一直将其保留在后囊中。”





专有SSD-工作原理和交付内容

从《连线》杂志上的第一个PlayStation 5展示开始,索尼就花了很多时间宣传其固态硬盘-固态存储解决方案不仅会在加载时间方面,而且在游戏将如何交付更大容量方面都具有变革性,更详细的世界和更多动态地使用内存。 PlayStation 5的SSD具有令人印象深刻的5.5GB / s原始带宽以及硬件加速解码(将有效带宽提高到8-9GB / s左右),对于Mark Cerny和他的团队来说显然是一个骄傲。



有低级和高级访问权限,游戏制作者可以选择他们想要的任何一种口味-但这是新的I / O API,使开发人员可以利用新硬件的极快速度。 文件名和路径的概念已不再支持基于ID的系统,该系统会告诉系统确切的位置,以便尽快找到所需的数据。 开发人员只需要指定ID,开始位置和结束位置,几毫秒后,数据便会交付。 两个命令列表被发送到硬件-一个带有ID列表,另一个以内存分配和释放为中心-即确保为新数据释放了内存。



只需几毫秒的等待时间,就可以在单个帧的处理时间内请求或传送数据,或者在下一帧的处理时间最差。 这与硬盘驱动器形成鲜明对比,在硬盘驱动器中,相同的过程通常最多需要250毫秒。 这意味着主机可以以非常不同的方式(更有效的方式)处理数据。 “我仍在开发游戏。我是漫威的蜘蛛侠,死亡搁浅和最后的监护人的制片人,”马克·塞尼说。 “我的工作涉及创造性和技术性问题的混合-因此,我对系统如何在实践中发挥了很多见识。”



最大的问题之一是从硬盘驱动器检索数据需要多长时间,这对开发人员意味着什么。 “假设敌人死后会大喊大叫,可以发出紧急通知,要求其他所有人切入,但是由于以下原因,很可能需要250毫秒才能取回数据所有其他的游戏和运营要求都在准备中。” Cerny解释说。 “这250毫秒是一个问题,因为如果敌人死后要大喊大叫,它需要立即发生;这种问题是迫使大量数据进入PlayStation 4及其生成的RAM的原因。”



简而言之,要立即访问紧急数据,需要将更多数据存储在当前主机的RAM中-为下一代大幅节省效率打开了大门。 SSD减轻了很多负担,仅仅是因为可以根据需要请求数据,而不是缓存主机可能需要的大量数据……也可能不需要。 由于不再需要重复,因此进一步节省了效率。 硬盘驱动器的大部分延迟是机械磁头在驱动器盘片表面周围移动这一事实的一个因素。 查找数据可能需要与读取数据一样长或更长的时间。 因此,相同的数据经常被重复数百次,只是为了确保驱动器被读取的数据占用,而不是浪费时间寻找(或“寻找”)数据。



Cerny说:“ Marvel的Spider-Man是城市街区策略的一个很好的例子。大约一千个街区具有较高的LOD和较低的LOD表示形式。如果大量使用某些东西,则它们在这些数据包中很多。”



在没有重复的情况下,驱动器性能会下降到最低水平—在Cerny观察的一个游戏示例中,目标50MB / s至100MB / s的数据吞吐率降至了仅8MB / s。 复制可以极大地提高吞吐量,但是当然,这也意味着驱动器上浪费了大量空间。 对于Marvel的Spider-Man,Insomniac提出了一个优雅的解决方案,但再次,它严重依赖于使用RAM。



“遥测对于发现此类系统的问题至关重要,例如,遥测表明城市数据库的容量在一夜之间跃升了千兆字节。事实证明,原因是1.6MB的垃圾袋-这不是特别大的资产-但是垃圾袋恰好包含在600个城市街区中。”马克·塞尼(Mark Cerny)解释说。 “失眠法则是,使用超过四百次的任何资产都驻留在RAM中,因此将垃圾袋移到了那里,尽管显然可以在RAM中驻留多少资产是有限制的。”



这是固态硬盘如何证明可以转化为下一代游戏的另一个例子。 游戏的安装大小将是最佳的,因为不需要复制。 这些垃圾袋只需要在SSD上存在一次-无需数百次或数千次-并且永远不需要驻留在RAM中。 它们将以更快的几个数量级的延迟和传输速度加载,这意味着采用“及时”的方式以更少的缓存进行数据交付。



在后台,SSD的专用Kraken压缩块,DMA控制器,一致性引擎和I / O协处理器可确保开发人员可以轻松利用SSD的速度,而无需定制代码以充分利用固态解决方案。 在闪存控制器上的大量硅片投资可确保最佳性能:开发人员仅需使用新的API。 这是一项技术的一个很好的例子,该技术应该立即产生收益,并且不需要开发人员的大力支持就可以使用它。



6park.com

3D音频-Tempest引擎的力量


索尼的3D音频计划是广阔而雄心勃勃的,甚至是前所未有的。 简而言之,PlayStation 5看到平台持有者将环绕声推向了远远超出我们在游戏领域之前所见的范围,通过理论上在3D空间中处理数百种离散声源,而不仅仅是在32位输入中,全面超越了杜比全景声(Dolby Atmos)。大气规格。 这也与无需定制音频设备即可传递声音有关。 实际上,索尼正寻求打破音频的界限并使之**化。



从PlayStation 3到PS4,再到PlayStation VR,环绕声精度的提高是一个不断发展的过程,它能够支持约50个3D声源。 回顾索尼对Garry Taylor和Simon Gumbleton的采访 ,令人着迷的是,PlayStation 5音频所基于的许多基础都开始与PSVR脱颖而出,包括早期使用与头部相关的传输功能- HRTF。



通常,处理游戏音频的任务规模已经非常大-不仅因为音频以48000Hz的速度处理256个采样,这意味着每秒有187.5个音频“滴答声”,这意味着需要每5.3ms传送一次新音频。 。 在考虑数据的重量时,请记住,索尼的处理器在每滴答滴答中都能正常工作。



这就是HRTF进入PS5音频讨论的地方。 在演讲中,Mark Cerny展示了他自己的HRTF,该表本质上是一张表,该表映射了音频的感知方式,并通过诸如头部的大小和形状以及耳朵的轮廓之类的变量进行了过滤。 也许不清楚的是我们的耳朵不一样,这意味着实际上需要通过两个HRTF来解析定位轨迹-每个耳朵一个。





“如果HRTF的讨论有点费劲,那么关于声音定位的一些概念就更容易描述了,即ILD和ITD,” Mark Cerny解释说。 “ ILD是耳间的水平差异,也就是说到达每个耳朵的声音强度的差异。它随频率和位置的不同而变化;如果声源在我的右边,那么我的左耳将听到的低频声音较少高频的声音要少得多,因为低频声音会在头部周围绕射,而高频声音却不会-不会弯曲,会反弹。因此,ILD会根据声音的来源和频率而变化声音的大小,头的大小和头的形状ITD(耳间时间延迟)是指声音从右耳到左耳所需的时间。



“很明显,如果声源在您的前面,则耳间时间延迟为零。但是,如果声源在您的右侧,则存在的延迟大约是声速除以两耳之间的距离。HRTF我们在3D音频算法中使用的代码封装了ILD和ITD,以及更多内容。”



HRTF本质上提供了一个3D网格,其值可用于根据IAD和ITD放置对象的位置,但是它没有粒度来容纳每个位置。 使该过程更加棘手的是人脑具有令人难以置信的精确度,因此此处的算法必须非常有效。



“我们知道算法是否运行不佳的方法是通过使用粉红噪声,它在概念上与白噪声类似(我认为我们都很熟悉)。我们使用的是粉红噪声声源,然后将其移动,如果我们听到声源随着移动而改变的声音,则意味着我们的算法存在误差。” Cerny说。



本质上,粉红色声音是经过过滤以接近人耳频率响应的白色声音。 如果算法不准确,您会听到分阶段的伪影-类似于将外壳放在耳朵上的那种效果。 这是PlayStation VR 3D音频处理的局限性之一,但是由于PlayStation 5的Tempest引擎的强大功能,这些算法提供了更高的精度,从而实现了更清晰,更真实,更真实的声音。



实际上,这几乎不涵盖此处进行的数学的规模和范围。 “演示中使用过多的HRTF处理图的原因是,我想向您展示准确处理运动声音所需要的复杂性,并通过该理由来解释为什么我们构造了一个专用音频单元处理”。 “本质上,我们希望能够在遇到的任何问题上投入无限的力量。或者换句话说,我们不希望特定算法的成本成为选择该算法的原因,我们希望能够只专注于所产生效果的质量。”





正如Cerny在他的演讲中解释的那样,Tempest引擎本身是经过改造的AMD计算单元CU,它以GPU的频率运行,每个周期提供64个触发器。 因此,在PlayStation 4中使用的整个八核Jaguar CPU集群的基础上,引擎的峰值性能大约为100 gigflops。尽管基于GPU架构,利用率却有很大不同。



“ GPU处理数百甚至数千个波阵面; Tempest引擎支持两个波阵面,” Mark Cerny解释说。 “一个波前用于3D音频和其他系统功能,一个波前用于游戏。在带宽方面,Tempest引擎可以使用超过20GB / s的速度,但是我们必须谨慎一点,因为我们不希望音频如果音频处理使用过多的带宽,则可能会产生有害的影响,如果图形处理恰巧要同时饱和系统带宽。”



本质上,GPU基于并行性原理-同时运行许多任务(或波形)的想法。 Tempest引擎本质上更像是串行的,这意味着不需要附加的内存缓存。 Cerny补充说:“使用Tempest引擎时,我们会对数据进行DMA处理,处理,然后再次进行DMA处理;这恰恰是PlayStation 3上SPU上发生的事情。” “这是与GPU完全不同的模型; GPU具有缓存,这在某些方面很棒,但是在等待缓存行填满时也会导致停顿。GPU也由于其他原因而停滞, GPU管道中有很多阶段,每个阶段都需要提供下一个阶段。因此,如果GPU的VALU使用率达到40%,那该死的就很好了。其异步DMA模型的目标是在关键代码段中实现VALU的100%利用率。”



Tempest引擎还与Ambisonics兼容,后者是有效地映射到物理扬声器的虚拟扬声器系统。 因为任何给定的声音都可以在每个扬声器的36个音量级别之一上呈现,并且有可能在所有扬声器上都以某个级别呈现,所以产生了增强的临场感。 离散音频往往会“锁定”到物理扬声器,并且在某些扬声器上可能根本无法表现出来。 Ambisonics现在可在PlayStation 4和PSVR上使用,但虚拟扬声器较少,因此通过Tempest引擎已经在精度上进行了大幅度的升级-并且可以与Sony的更精确的本地化匹配。



Cerny说:“我们开始看到游戏音频的策略,其中处理的类型取决于特定的声源。” “例如,“英雄声音”(我的意思是重要的声音,而不是玩家英雄发出的声音)将获得理想位置的3D对象处理,而场景中的大多数声音则通过Ambisonics用于通过这种混合方法,理论上您可以同时兼顾两个方面的优势,并且由于两者都在音频管道末端通过相同的HRTF处理运行,因此两者都可以同样出色的存在感。”



在PlayStation 5演示文稿中,注意到推出3D音频可能需要一些时间。 尽管开发人员已经掌握了核心技术,但将结果分发给使用各种扬声器系统的用户仍在进行中。 在发布时,使用标准耳机的用户应获得预期的完整体验。 对于那些使用电视扬声器,条形音箱或5.1 / 7.1环绕声系统的人来说,事情并不是那么简单。



“使用电视扬声器和立体声扬声器,用户可以选择启用或禁用'电视虚拟环绕声',因此音频管道需要能够产生不具有我所谈论的3D方面的音频,” Mark Cerny解释说。 。 “虚拟环绕声可以在最佳位置工作,并且用户可能不会坐在那个最佳位置,或者用户可能正在玩沙发合作社(很难让两个玩家都在最佳位置),等等。启用后,将使用基于HRTF的算法。禁用该功能时,将执行简单的缩混-例如3D声音对象的位置确定其声音来自左扬声器的程度,以及声音来自右扬声器的程度。 ”



正如他在演讲中所提到的,电视和立体声扬声器已经安装并运行了一个基本实现,PlayStation 5硬件团队继续对其进行优化。



“一旦我们对这两个通道系统(即耳机和电视这种)的解决方案感到满意,我们将转向5.1和7.1系统,” Cerny补充说。 “目前,尽管5.1和7.1声道系统得到的解决方案与PS4上的解决方案相近,也就是说,声音对象的位置决定了它们从每个扬声器发出的声音的程度。

支持主要从耳机开始,其次是虚拟环绕声,然后进一步支持5.1 / 7.1扬声器系统。



PlayStation 5的下一步是什么?

关于PlayStation 5,我们还有很多未知的地方。在他的演讲中,马克·塞尔尼(Mark Cerny)提到拆机将在将来的某个时候发生,这是我们首先了解散热组件的关键所在。在PlayStation 5中,它在定义机器的实际尺寸方面发挥着作用,希望我们能早日看到!



在螺母和螺栓级别,仍然存在一些挥之不去的问号。索尼和AMD都已经确认PlayStation 5使用了基于RDNA 2的自定义图形核心,但是最近的DirectX 12 Ultimate揭示了AMD确认了索尼尚未拥有的功能,包括可变速率阴影。然后是规格和执行之间的鸿沟-索尼在规格方面分享的内容确实令人印象深刻,但布丁的证明始终在品尝中。除了一些Marvel的Spider-Man在现在已经过时的开发工具包上运行的不稳定镜头外,我们还没有看到一个渲染的像素。



这就是我接下来真正想从Sony看到的-PlayStation 5体验的一部分。这次,在PS4发行前的准备阶段,我们已经看到Killzone Shadowfall运行了,它看起来很棒(事实是,它仍然如此),是的,尽管会欢迎一些游戏代码,但我实际上感觉到周围的环境经验同样重要。系统启动速度有多快?游戏加载真的是即时的吗?是否有等同于X系列令人印象深刻的快速履历?具有解锁帧速率(例如,臭名昭著的次子,杀戮地带的暗影)的PS4标题在PS5上是否每秒锁定为60帧?您考虑得越多,就会出现更多的问题-提醒您,就像我们进入PS5系统体系结构一样,这确实只是开始。
喜欢tekkenman朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ tekkenman的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回游戏天地首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


    用户名:密码:[--注册ID--]

    标 题:

    粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


         图片上传  Youtube代码器  预览辅助

    打开微信,扫一扫[Scan QR Code]
    进入内容页点击屏幕右上分享按钮

    楼主本栏目热帖推荐:

    >>>>查看更多楼主社区动态...






    [ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]