加入收藏 | 设为首页 | 会员中心 | 我要投稿 二游网_173173游戏网 (http://www.173173youxi.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 新闻中心 > 人物专访 > 正文

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧

发布时间:2018-09-23 13:23:06 所属栏目:人物专访 来源:游民星空
导读:记得上一代GeForce 10的Pascal架构首发,也就是GTX 1080显卡发布,还是2016年的五月份,NVIDIA的游戏显卡换代从来没有哪次像这样让人等得望眼欲穿。一代显卡的正式服役周期通常是一年半,早在一年前坊间就不断爆出新显卡发布的时间,结果都是"狼来了"。于

  光线跟踪技术长期以来被用于非实时绘制,它通过模拟光的物理行为来提供逼真的光照。光线跟踪通过跟踪光从观看者的眼睛穿过虚拟3D场景时将采取的路径来计算像素的颜色。当它穿越场景时,光可以从一个物体反射到另一个物体(引起反射),被物体阻挡(引起阴影),或者穿过透明或半透明物体(引起折射)。所有这些相互作用被组合以产生然后在屏幕上显示的像素的最终颜色。

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧
光线追踪示意图

  这一种计算工作十分繁重的渲染技术,它真实地模拟场景及其对象的光照。能够实时地渲染物理上正确的反射、折射、阴影和间接照明。相比传统的光栅化渲染,光线追踪技术创造的景象更符合人眼和大脑接受的视觉逻辑,视神经本身就是依靠自然界的可见光反射来识别图像的。因而这项技术早就被应用在了图像渲染中,但非实时渲染,而是制作CG、电影。

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧
NVIDIA光线追踪演示DEMO

  所以光线追踪与实时光线追踪是两个概念,制作CG时我们有一整天的时间去渲染一帧画面,但是在游戏中一帧画面只能耗时几十分之一秒,否则就会影响流畅度。在过去,GPU的算力远不足以使用单个核心对游戏进行实时光线跟踪,使这项并不陌生的技术一直无法应用在游戏中。于是需要30~90fps才能畅爽体验的游戏多年来一直依赖于快速的光栅化渲染,只能放弃电影般的逼真画面。

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧
星球大战光线追踪渲染演示,完全分不出哪个是电影哪个是DEMO

  直到NVIDIA Turing架构问世,使通向游戏渲染技术殿堂的那条路头一次变得清晰起来。下

  面让大家再欣赏几幅加入实时光线追踪的游戏视觉体验。

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧
《战地5》光线追踪关闭

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧
《战地5》光线追踪开启

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧
《古墓丽影:暗影》光线追踪关闭

图灵如何实现光线追踪

  NVIDIA在Turing架构的每个SM中新增RT Core是迈向实时光线追踪的关键,硬件加速是实现这一目标的唯一途径。

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧
层层筛选,判断光线命中了哪个三角形

  为了更好地理解RT核的功能,以及它们究竟加速了什么,笔者首先解释如何在没有专用硬件光线追踪引擎的情况下用GPU或CPU执行光线追踪。基本上,BVH遍历的过程需要通过着色器操作来执行,并且每光线投射数以千计的指令槽来针对BVH中的边界框交点进行测试,直到最终命中三角形,并且交点处的颜色将被用于最终像素填充。或者如果没有三角形被击中,背景颜色可以用来填充这个像素,这样就做到了模拟现实世界中人眼的视觉原理——你只能看到反射光的物体。

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧

  没有硬件加速的光线跟踪要求每条射线有数千个软件指令槽来测试BVH结构中的连续较小的边框,直到可能碰到一个三角形。这是一个海量计算的过程,使得在没有基于硬件的光线跟踪加速度的情况下,无法在GPU上进行实时处理,速度奇慢无比。

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧

  Turing的RT内核可以处理所有的BVH遍历和射线-三角形相交测试,节省了SM在每条射线上花费数千个指令槽,这对于整个场景来说可能是大量的指令。RT核心包括两个专用你单元。第一个单元进行边框回归测试,第二个单元进行射线三角形相交测试。SM只需要启动一个广南县探测器,RT核进行BVH遍历和射线三角形测试,并向SM返回命中或不命中。于是SM可充分被释放来做其它图形计算工作。

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧

  因此RT核的Turing光线跟踪性能比上一代Pascal依靠软程序实现的快得多。Turing可以在不同的工作负载下提供比Pascal更多的千兆射线/秒,比如Pascal大约花费1.1千兆射线/秒,或者10TFLOPS/千兆射线在软件中进行光线跟踪,而Turing可以使用RT Cores进行10+千兆射线/秒,并且运行速度要快10倍。

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧

深度学习抗锯齿(DLSS)

  在现代游戏中,渲染帧不直接显示,而是经过后处理图像增强步骤,结合来自多个渲染帧的输入,试图去除视觉伪像,例如混叠,同时保持细节。例如,时间抗锯齿(TAA)是一种基于着色器的算法,该算法使用运动矢量结合两帧来确定在何处采样先前帧,这是当今使用的最常见的图像增强算法之一。然而,这种图像增强处理从根本上来说是非常困难的。

  诸如此类的图像分析和优化问题没有没有干脆利落的算法解决方案,唯有应用人工智能。正如图像处理案例,是深度学习的最大成功应用之一。现在,深度学习已经实现了超人的能力,能够通过观察图像中的原始像素来识别狗、猫、鸟等。在这种情况下,目标是结合渲染的图像,基于查看原始像素,以产生高质量的结果,不同的对象,但由近似的步骤完成。

  为解决这一挑战而开发的深度神经网络(DNN)被称为深度学习超级采样(DLSS)。DLSS从给定的一组输入样本中产生比TAA高得多的质量输出,并可以利用此能力来提高总体性能。尽管TAA在最终目标分辨率下进行渲染,减去细节,组合成每一帧,DLSS允许在较少的输入样本计数下进行更快的渲染,然后推断出在目标分辨率下与TAA相似的结果,仅需一半的着色工作。

光线追踪核弹RTX 2080Ti/2080显卡首测:4K平均60帧
4K DLSS的TRAIN是4K TAA Pascal的两倍性能。

(编辑:二游网_173173游戏网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读