您的位置 首页 > 德语词汇

flop是什么意思?用来形容主机性能的teraflops究竟是个什么东西

今天给各位分享flop是什么意思的知识,其中也会对用来形容主机性能的teraflops究竟是个什么东西进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

“万亿次浮点运算每秒”(teraflops,以下简称TF)是业界目前用来描述计算机图形性能的常用单位,那么其含义究竟是什么,对主机游戏表现又有怎样的影响?本文将带您走近真实的TFBOYSteraflops。

flop是什么意思?用来形容主机性能的teraflops究竟是个什么东西

自从PS4和XboxOne两者的规格首次泄露之后,它们在图形性能上的差距就一直是坊间热议的焦点。在这里我们来看一个直观的比较:XboxOne的显卡性能在规格调整之前是1.23TF,而索尼的PS4则是1.84TF,相比之下高出了不少。

从纸面上看这个差距是很大的,这意味着PS4在图形性能上有着大约50%的优势。而图形性能正是众多对次世代游戏画面表现翘首以盼的玩家们最为看重的。看起来主机还没开卖,微软就遇到了麻烦。

现在,两家公司的后续机型已经揭开了面纱,而硬件规格霸主的宝座似乎要易主了。PS4Neo(以下简称Neo)的性能目前据传为4.2TF,而微软“天蝎计划”(以下简称天蝎)的性能约为6TF,有43%的优势。当然两台主机看起来都很棒,但这不是重点。

我们今天想谈论的是TF究竟是什么?这看似巨大的规格差别对实际的性能指标和游戏体验会有怎样的影响?

首先,我们从基本的名词解释说起。teraflops中的tera代表一万亿,flop则是指一次浮点运算(floatingpointoperation),这是描述计算性能的基本单位,而s自然是每秒的意思。

就微软和索尼主机使用的AMD图形技术而言,TF的计算方法非常简单:将图形处理器(GPU)中流处理器(shader,常见译名还有着色器、渲染器等)的数量与其时钟频率相乘即可。AMDGPU的每个计算单元有64个流处理器,XboxOne有12个计算单元,PS4则有18个,因此二者分别拥有768和1152个流处理器。而两台主机的流处理器时钟频率分别为853MHz和800MHz。

此外,将流处理器数量与频率相乘得到的结果还要再乘二,这是因为在一个时钟周期内可以同步执行乘法和累加两种指令,如此这般我们就能得到一个巨大无比的天文数字。为了便于读写,我们把计算电脑硬盘容量那一套搬过来,用这个数字除以一百万,便能得到megaflops,即百万次浮点运算每秒,若除以一万亿,就可得到teraflops。

以下是XboxOne、PS4和Neo图形性能的计算过程:

微软声称天蝎的图形核心计算性能约为6TF,但GPU的其他规格并没有公布。也就是说,我们知道了计算结果,却对流处理器数量和频率一无所知。在近期对天蝎规格的分析中,我们综合考量主机设计惯例,以及代号Vega的AMD下一代GPU的泄漏情报等信息,得出了对其硬件规格最合理的两种推测:

此推测基于两个假定的前提:一是天蝎的时钟频率较低,因为其处理器面积很可能远远超过Neo,而处理器越大发热量也越大,通常工作频率就会较低;二是微软使用了AMD的下一代Vega核心,据泄漏信息确认其拥有64个计算单元4096个流处理器。因为如果要使用与Neo同样的Polaris核心实现6TF的性能,就要求GPU运行在极高的频率下。

如此一来,其频率将比NeoGPU的未删减版——RadeonRX480电脑显卡核心还要高,而这显然是不可能的。简而言之,除非微软采用的是未出现在AMD蓝图上的下一代GPU,我们几乎可以肯定天蝎采用的就是Vega的删减版。

TF是用来衡量计算性能的基本参数,独立于与GPU设计的其他方面。举例来说,相对于英伟达,AMD的GCN图形处理架构在纯粹的计算性能上是很强的,因此在前些年数字货币挖矿风潮盛行的时候RadeonGPU很吃香。然而需要强调的是,计算性能并不能与游戏性能划等号。

关于这一点有一个绝佳的对比实例:9TF的英伟达GTX1080和8.6TF的AMDRadeonR9FuryX。如果单看计算性能,你可能会认为二者的游戏性能也相差无几。但请看下面的4K分辨率测试结果,GTX1080可不是快了一点,而是几乎在所有游戏中都遥遥领先,就连只有6.5TF的GTX1070在多个游戏中的表现都优于FuryX。

事实上,若单看TF数据,GTX1070甚至比不上英伟达自家上代产品TitanX(7TF),但实际表现却并不占劣势。

因此,显卡的实际游戏性能是由多方面决定的。显示驱动程序非常重要,图形架构本身的效率更是举足轻重,更不用说还有显存带宽和内置缓存容量等一系列因素。

然而单就游戏主机而言,计算性能的比较还是很有意义的。

首先,GPU的其他指标通常会随着计算性能的增长而同步提高;其次,PS4和XboxOne的GPU源自同一家族,其核心设计非常相近。

但若要对XboxOne/天蝎和PS4/Neo进行跨代对比,意义就显得不那么大了。虽然AMD的新图形核心与上一代完全兼容,但在架构上仍然作了改进,简而言之就是更高效。对此我们可以对AMD即将发售的RX460显卡进行测试。

RX460拥有与RadeonHD7850相同的16个计算单元,但采用了新的Polaris核心。届时对二者在相同的频率和显存带宽下进行测试,理论上就可得出AMD第四代GCN架构在效率上的提升,而这就是关键所在。

就数据上说,天蝎的计算能力是XboxOne的4.6倍,而Neo是PS4的2.3倍。而这仅仅是TF的对比,AMD的新架构对最终性能的提升也许会比预想的还大。但再次强调,计算能力提高40%并不意味着实际性能表现也会提高40%。

通常来说,在GPU内加入更多的计算单元会带来更高的性能,但2倍的TF并不会带来2倍的游戏帧率。这里面的原因有很多,但总的来说显存带宽的限制是最主要的因素。

拿RadeonR9380X显卡来说,其采用了拥有完整32个计算单元的Tonga核心。在与核心相同但计算单元删减为28个的R9380进行对比测试时,游戏帧率只领先10%到15%。要知道不仅是流处理器数量,其在核心频率和显存速度上都更占优势。随着GPU规格差别的增大,TF数值和实际性能的差异只会进一步增加。微软为了让天蝎发挥出最大的实力,为其6TF的GPU提供了320GB/s的显存带宽支持,相对的Neo仅为218GB/s。

TF与实际游戏性能的差异在PS4和XboxOne身上也有一定程度的体现。由于主机游戏几乎都会锁定帧率,再加上开发商为了在不同主机实现相近的性能表现,会采用不同的渲染组件对画面质量进行微调或者直接改变原生分辨率,因此几乎找不到合适的针对不同主机GPU的性能测试程序。

但凡事都有例外,那就是IoInteractive制作的《杀手》。这个游戏的PS4版和XboxOne版具有相同的1080p分辨率,画质也完全相同,并且没有锁定帧率,很适合作为理想的测试标准。

最终的测试结果显示,在主要考验GPU性能的场景中,PS4有30%的优势。事实上PS4的1.84TF计算性能比XboxOne的1.31TF高40%,并且显存带宽也更高(这取决于它们如何利用XboxOne内置的ESRAM)。除此以外还有一个现象:XboxOne版的《杀手》在某些场景中的帧率反而更高。这就引出了我们的下一个话题。

CPU和GPU各自对游戏性能的影响在《杀手》中有很好的体现。游戏的巴黎关卡中有着数量众多的NPC,需要在模拟人物各自行为的同时处理人体动画效果,而这项工作更适合由CPU来完成。

PS4和XboxOne都采用了性能相对较弱的AMDJaguar核心CPU,其架构本来是为移动设备设计的。为了弥补性能上的不足,两家都将核心数量翻倍——老实说这只是无奈之举。不同之处在于XboxOne的CPU频率为1.75GHz,相对PS4的1.6GHz快了9.4%,这在《杀手》的某些场景中可以切实感受到。

索尼试图在Neo上解决这个问题。鉴于AMD的下代Zen核心CPU无法与GPU整合为单块芯片,只好退而求其次:维持相同的八核心不变,将工作频率从PS4的1.6GHz提高到2.1GHz,实现31.3%的性能提升。至于天蝎的CPU架构目前尚不明确,但相关分析表明微软很有可能采用同样的策略,对现有Jaguar核心进行提速,或略作改进。

这就是Neo和天蝎最令我们担心的一点。更强的GPU带来了海量的浮点计算能力和革命性的图形处理性能,但CPU性能却没有对等的增长。这也许可以解释为何厂商宣传的重点是4K分辨率,而不是帧率的显著提升。我们当然希望帧率能从30fps提高到60fps,但这需要更强力的CPU。至少就Neo的规格而言,帧率的倍增是无法实现的。

实际游戏性能同由TF代表的计算能力之间没有直接的线性关系。虽然我们可以通过TF大致推断不同GPU的性能优劣,但只有相同架构产品间的对比才是有意义的。而即便是架构相同,TF领先40%的GPU在实际游戏中的性能也并不会成线性比例增长。GPU的性能并不仅仅取决于计算能力,其他因素譬如显存带宽也非常重要。

不过可以肯定的是,XboxOne的12计算核心、1.31TFGPU相对PS4的18计算核心、1.84TFGPU处于劣势,而且这种劣势还常因为XboxOne更低的显存带宽而进一步加剧。然而纵使规格上的差距如此之大,跨平台游戏开发商们还是尽力做到了在不同平台实现相近的游戏体验,主要区别仅在于分辨率,比如1080pvs900p。当然总体来说,PS4的帧率也更稳定。

从目前的迹象来看,Neo和天蝎也会有类似的规格差别——不过这次好牌在微软手上,但这种差别对游戏体验造成的影响仍然有待观望。微软的目标似乎是原生4K分辨率,索尼也在考虑,但更可能是通过插值来实现。

当然面对强劲的对手,索尼和游戏厂商们也可能会转变思路,在现有的1080p上酝酿新文章。毕竟除了更高的分辨率,新主机们还有其他的路可以走。

关于本次flop是什么意思和用来形容主机性能的teraflops究竟是个什么东西的问题分享到这里就结束了,如果解决了您的问题,我们非常高兴。

本站涵盖的内容、图片、视频等数据,部分未能与原作者取得联系。若涉及版权问题,请及时通知我们并提供相关证明材料,我们将及时予以删除!谢谢大家的理解与支持!

Copyright © 2023