光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧
记得上一代GeForce 10的Pascal架构首发,也就是GTX 1080显卡发布,还是2016年的五月份,NVIDIA的游戏显卡换代从来没有哪次像这样让人等得望眼欲穿。一代显卡的正式服役周期通常是一年半,早在一年前坊间就不断爆出新显卡发布的时间,结果都是"狼来了"。于是各种猜测甚嚣尘上:"老黄在憋大招","A卡不给力",现在这些都不重要了,在全世界的玩家苦等了一年之后,狼真的来了。 8月21日的科龙游戏展上,NVIDIA正式曝光了新一代游戏显卡的旗舰与准旗舰型号,真相让所有人都瞠目结舌,因为之前关于新显卡的一切猜测几乎都是错的,连型号名称也是如此。 现在我们已经知道了,新旗舰叫做GeForce RTX 2080Ti,次旗舰为GeForce RTX 2080,而不是之前确信的GTX 1180,架构也不是之前认为板上钉钉的Volta,而是Turing。NVIDIA不但将系列名称直接升到GeForce 20,连自上古时代一直传承下来的游戏专属前缀GTX也舍弃了,取而代之的叫RTX。不过,笔者相信当你仔细了解完这款全新的架构之后,就丝毫不再感到惊奇了,因为与架构本身相比,这点儿名称上的变化实在是微不足道。
首先来说一下RTX的由来,R和T分别是光线追踪Ray Tracing的两个首字母,而X没猜错的话应该是代表Express。组合起来就是"高速光线追踪"意思,喻意从这一代开始NVIDIA显卡最重要的架构、功能革新。 由于Turing架构所涉及的新技术较多,这方面的描述对于图形计算基础知识薄弱的玩家阅读起来会十分晦涩,所以笔者将尽可能地深入浅出,挑选对玩家日后游戏体验影响重大的变革加以详细描述。 觉得这部分枯燥的玩家可直接跳转到第N页游戏测试部分。 图灵的来龙去脉 Turing架构其实并不是完全陌生的,去年NVIDIA发布了TITAN V时就预示了它的存在,只是这次NVIDIA换了一种方式来构建游戏产品线。 按照以往习惯,几乎每一代旗舰游戏显卡都脱胎于该架构的首款TITAN,所以当去年Volta架构的TITAN V如约而至时,我们每个人都认为已经看到了未来的下一代80Ti游戏旗舰的长相。
实际上TITAN V与初代基于Kepler的GeForce GTX Titan已经相去甚远,初代Titan的定位是一款万能显卡,既可作为游戏发烧友的旗舰游戏显卡,也为专业消费者提供全双精度浮点(FP64)计算能力。在TITAN V诞生之前,TITAN产品线几乎都是基于这种设计方法,一颗巨大的GPU核心是NVIDIA"高大全"设计思路的最好代表。 而在Titan V上,NVIDIA再次扩展了大核心的上限。Volta最引人注目的则是其全新的专用处理模块——Tensor Core(张量计算核心),它与Volta的其他微架构改进,以及支持深度学习和HPC(高性能计算)的软件/框架集成在一起,形成有史以来最大的815mm核心,使得该系列产品比任何时候都更接近工作站级。
简单算一算就知道,TITAN V的GV100核心拥有5120个流处理器,与TITAN XP的GP102核心(3840个)相比增加了三分之一,但核心面积却增加了73%,再上工艺提升到了TSMC的16nmFFET提升到了12nmFFN,增加的晶体管比例更大。可见在GV100上增加了许多流处理器之外的新功能单元,还有一部分计算功能被分配给了专用单元以提高效率。 但是追求高大全也是有代价的,较低的良率和高昂的成本,使在GV100上发展游戏消费级显卡会得不偿失,AMD的Fury就是一个典型的反例,所以今天RTX 2080Ti采用的Turing架构是由GV100为蓝本发展而来的消费级专属型号。
新显卡的核心规格 首先来看这次新发布的两款显卡规格,我们已经知道了作为旗舰的RTX 2080Ti采用TU-102核心,保持上一代的显卡与芯片的规则不变,准旗舰RTX 2080则使用规模小一圈的TU-104核心,它们都由TSMC的12nmFFN工艺制造。
TU102也由6个GPC构成,相比GV100每个GPC少了一组TPC,一共有36组TPC,72组SM,流处理器总数为4608个,ROPs总数为96个,纹理单元288个。以上都是传统的参数项目,不过Turing架构还加入了可以半精度计算与深度学习的张量计算核心Tensor Core以及专用于光线追踪的RT Core,此后显卡的主要核心功能单元项目又多了两个。其中Tensor Core为每个SM含8个,共576个,而RT core则每个SM含一个,与SM数量一致。 此外TU-102每个SM还有2个双精度单元,共144个(有观点称双精度计算也是由CUDA完成,只是寄存器的使用逻辑不同)。双精度算力为单精度的1/32,但这无关紧要,除了科学计算以外,无论是游戏用的GeForce RTX 2080Ti还是专业绘图用的Quadro RTX 6000/8000,都对此项性能没有要求。
说道Quadro,这里就必须强调一点,目前只有Quadro RTX 6000/8000才搭载了完整的TU-102核心,GeForce RTX2080Ti就像它的上代一样,进行了一定的削减,共减少了4个SM,流处理器总数为4352个,SM中包含或对应的其它单元也相应减少,显存位宽由384bit削减至352bit。略有遗憾,却符合惯例,毕竟消费级显卡是要控制成本和保证产量的,同时也预示着不久的将来NVIDIA有可能推出比RTX 2080Ti更高阶的旗舰?
与TU-102一起发布的是TU-104核心,对应显卡为RTX 2080。前者拥有TU-102中所有新特性,包括RT Core、Tensor Core,以及对SM所做的架构改变。
完整的TU-104同样有6个GPC,每个GPC包含4个TPC,全核一共有48个SM,3072个流处理器。Tensor Core与RT Core的配比都没变,所以很容易推算出分别为384个和48个。 全新的流处理器簇单元(SM) (编辑:二游网_173173游戏网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |