光明追踪颠覆显卡,NVIDIA的追光大计

作者: 产品评测  发布:2019-05-22

图片 1最后,这批预计在今年第四季发售的产品会分为 Quadro RTX 5000、6000 和 8000 三款,售价分别是 2,300、6,300 和 10,000 美元。其中最高端的 8000 将会使用 48GB 记忆体。另外,NVIDIA 还会为 RTX 服务器准备一个专门的型号,不过对应的价格暂时还没有公布。

从NVIDIA在CES发布会公布的数据来看,Max-Q设计的游戏本在2019年会大爆发,目前至少有40多个型号100多种配置,从1月29日开始陆续会有华硕、Acer、外星人、戴尔、技嘉、联想、惠普、微星、雷蛇、三星等品牌推出RTX 2080/2070/2060显卡光追游戏本。

GDDR6是现有GDDR5内存的继任者,在保持工艺、规格大部分兼容的情况下进一步提高了显存速率,通过16bit数据预取、单通道升级双通道等方式将数据频率从GDDR5时代的不超过8Gbps提升到了JEDEC标准的12-16Gbps,而三星、美光还在研发速度高达18Gbps及20Gbps的GDDR6显存。

今年早些时候,NVIDIA 发布了包括对全新即时光影技术支持在内的一系列 RTX 新功能。不过有一个问题是,在很长一段时间内并没有专门的硬件来搭配这些新的特性。直到今天的 SIGGRAPH 大会上,NVIDIA CEO 黄仁勋终于掏出了主打即时光影和 AI 表现的图灵架构新显卡。得益于专用的处理器,其渲染即时光影的速度可达到之前 Pascal 架构的 25 倍。除此之外,新品还配备了三星的 GDDR6 内存,传输速度和功耗都有了很大的进步。不意外的是,新显卡的主要目标用户是电影制作、产品建模等领域的专业人士,从下面这张保时捷原型车的渲染图上,就能看出它起到的效果。另外在发布会现场,NVIDIA 也展示了基于 Unreal 引擎的《Reflections》demo。只不过此番他们没有像 GDC 时那样使用一台配有四颗 Volta GPU 的工作站,这次仅仅用了一颗新的图灵显卡就完成了即时渲染。

·高级着色功能:NVIDIA在图灵架构上带来了全新的Mesh Shading、Variable Rate Shading (VRS,比率可变着色)、Texture-Space Sharing(TSS,纹理空间着色)、Multi-View Rendering (MVR,多视图渲染) 等全新图形技术,提高了游戏渲染性能及效率。

图片 2

在CES展会上,大家的目光都被RTX 2060显卡及新游戏吸引了,不少人并没有注意过RTX笔记本电脑,今天的超能课堂里,我们就来聊聊移动版RTX 2080/2070/2060笔记本电脑,毕竟今年要想购买高端游戏本,玩家是绕不过使用这三款GPU的笔记本的。

相比现在的PCIe 3.0总线,NVLink的优势就是延迟更低、带宽更高,NVLink 1.0的带宽就可达160GB/s,NVLink 2.0的带宽更是高达300GB/s以上,远远超过现在的PCIe 3.0 x16总线的16-32GB/s带宽。

笔记本上光追显卡有没有意义?在很多人眼里,游戏本对光追是没多大需求的,但从产业角度来看并不是这样的,因为游戏本现在已经成为影响PC产业发展的一个重要因素,因为笔记本早已经是一个比台式机还要大的市场,游戏本更是在高速发展。

1、图灵CUDA核心大改:性能提升50%

图片 3

【PConline 杂谈】过去两年的显卡市场是游戏玩家不堪回首的记忆,2016年NVIDIA发布Pascla显卡之后带来了性能更强、能效更好的GTX 10系列显卡,但是之后显卡市场遭遇矿卡从疯狂到崩盘、显存大涨价等多方因素影响,导致显卡市场两年来都没新一代更替,直到8月20日的科隆游戏展上,NVIDIA推出了代号图灵Turing的新一代GPU架构,并启用了GeForce RTX品牌,新一代显卡终于来了。

·2018年游戏技术大升级,RTX光线追踪来了

游戏玩家这一次的等待时间很长,不过某种方面来说这次的等待也很值得,因为NVIDIA的图灵显卡号称有史以来升级最大的GPU架构,创始人、CEO黄仁勋直接称之为2006年以来GPU最大的飞跃。

2018年是游戏技术发展史上载入史册的一年,3月份的GDC大会上微软正式宣布DirectX Raytracing光线追踪标准,使得Windows PC平台支持光线追踪技术成为可能。不过微软的DXR统一了光线追踪API,但还有赖于硬件实现。

AI加速在游戏显卡上的应用还是初级阶段,不过它已经显示出了极具竞争力的前景,后续还需要NVIDIA与游戏开发商合作推动更多游戏支持AI加速功能。

本文约3566字,需6分钟阅读

NVIDIA在去年的Volta架构上就首发了HBM 2显存,所以技术上使用HBM 2不存在问题,NVIDIA没用HBM 2显然还是出于成本控制原因,再加上今年GDDR6显存也开始商业化了,这次的图灵GPU就首发了GDDR6显存。

图片 4

图片 5

光线追踪(Ray Tracing)技术问世以及数十年了,此前在一些专业领域——CG动画、动画渲染等应用已经大量应用了,但是专业应用中靠的是大量的工作站,而且会花费大量时间去制作简短的视频,可以说不惜成本,而且不需要做到实时输出,但这也让光线追踪技术很难用于PC游戏中,直到2018年PC平台才有了可用的实时光线追踪技术,那就是NVIDIA的RTX技术。

图片 6

根据盖特纳的统计,2018年全球个人计算设备出货量约为4.07亿台,其中桌面PC及桌面工作站出货量9370万台,而笔记本及移动工作站平台高达1.641亿台,将近是桌面电脑的两倍出货量。

相比一般的CUDA核心,Tensor Core主要用于执行神经网络、推理训练等深度学习相关的运算,特点就是对性能要求很高,但对运算精度没这么高,因此图灵架构大砍了FP64双精度运算,仅为FP32单精度的1/32,反正对游戏来说FP64单元没什么意义,只会增加功耗。

NVIDIA为了解决实时光线追踪的问题,开发了图灵GPU架构,这是2006年CUDA统一架构以来的一次飞跃,除了使用更先进的12nm FFN制造工艺之外,图灵GPU在全新内核架构、高级着色、RT Core及Tensor Core四个方面做了创新。

光线追踪也是游戏玩家常听到但又非常陌生的技术,在电影工业光线追踪技术已经应用很多年了,但在游戏卡一直是雷声大雨点小,在图灵GPU之前显卡跑RT运算的性能非常弱,并不足以支撑良好的RT光线追踪体验。

与PC平台一样,由于生态建设初期的成本问题,光追游戏本的价格也不便宜,毕竟是独一份的选择,搭载RTX 2060显卡的笔记本也要差不多万元了,最便宜的神舟也要8000多,这个问题只能靠时间慢慢来解决了。

图片 7

在CES展会上,大家的目光都被RTX 2060显卡及新游戏吸引了,不少人并没有注意过RTX笔记本电脑,今天的超能课堂里,我们就来聊聊移动版RTX 2080/2070/2060笔记本电脑,毕竟今年要想购买高端游戏本,玩家是绕不过使用这三款GPU的笔记本的。

图灵显卡视频及接口改进:支持双8K,VittualLink对VR更友好

桌面平台的光追显卡布局基本完成了,CES上NVIDIA又发布了RTX笔记本电脑,这不仅仅是老黄要在游戏本市场上赚钱的问题,实际上也是在扩大光线追踪生态系统阵容,毕竟舍得在游戏本上砸钱的玩家还是很多的。

全新的内存压缩算法

光追游戏数量不足也成为尚不支持光线追踪技术的AMD批评光追意义不大的基础,但是解决这个问题也不是一蹴而就的,游戏厂商需要有更广泛的硬件基础才有动力去开发更多的光追游戏,所以球又回到了NVIDIA、AMD这边,他们推出更多的显卡扩展PC游戏平台才是关键,但AMD现在有没有光追显卡,暂时只能看NVIDIA的了,桌面台式机之外就是游戏本市场了。

在视频接口方面,图灵显卡除了支持HDMI 2.0之外,还支持了DP 1.4a标准,支持双8K 60Hz输出能力,虽然目前的8K显示器还是凤毛麟角,不过图灵显卡在技术上已经做好了准备。

·NVIDIA图灵架构揭秘:全新CUDA架构,AI、RT核心加持

图灵架构的重点之二:新增RT Core,一切为了光线追踪

光线追踪之所以数十年来都没在PC平台普及,根源就在于光线追踪对GPU的性能要求很高,而游戏是需要做到实时运算的,所以也不能挪用CG工业界的那些离线渲染方法,有关光线追踪技术的基础介绍,我们之前在超能课堂:RTX显卡支持的实时光线追踪是什么?做过详细的介绍,一句话说就是:

图灵架构的重点之一:保留Tensor单元,显卡也能玩AI

·RT Core:RT Core可以说事图灵GPU最为核心的功能了,没有之一,因为RT Core才是实现实时光线追踪的关键,一个SM单元中只需要配备一个RT Core即可,因为SM单元只是个引子,用于启动,剩下的工作全都交由RT Core处理,会自动计算执行BVH遍历以及光线和三角求交,并且向SM单元返回结果,从而节省SM单元执行的数以千计的指令。

图灵显卡的SLI进化:迎接NVLink时代的到来吧

·全新CUDA内核架构:Turing图灵架构采用全新的SM设计——Turing SM单元,与Pascal架构相比,每个CUDA Core性能提升50%,效果显著。

VitualLink接口将是未来VR设备的统一接口,因此图灵显卡对VR设备更加友好,以后用它来玩VR设备更合适,而USBC物理接口还能提供15-27W的供电能力,支持DP视频及USB 3.1 Gen 2数据传输,是个万能接口。

图片 8

如果说NVIDIA的图灵显卡中最让人意外的技术升级,那肯定非NVLink莫属了,因为NVLink原本是NVIDIA联合IBM开发的高性能总线技术,主要用于服务器市场上,目前已经发展了两代标准。

2018年被视为光线追踪游戏元年,因为这一年微软确定了DXR光线追踪标准,NVIDIA推出了图灵GPU显卡,EA也推出了《战地5》光追游戏,光追游戏的产业链已经建起来了,虽然目前的规模还比较小。为了扩大光追生态链,今年的CES展会上NVIDIA又推出了适用于笔记本的图灵GPU,包括RTX 2080/2070/2060三款,与桌面版的RTX 2080 Ti/2080/2070/2060显卡联手给PC产业提供了光追游戏的硬件基础。

GTX1080显卡的GP104核心SM单元架构

2018年已经远去了,这一年PC平台迎来了实时光线追踪技术,这是游戏以及GPU硬件史上都值得记住的一年,RTX 20系列显卡的问世使得单卡实时完成光线追踪渲染成为现实,靠的就是图灵GPU的RT Core专用单元加速,这个技术也是图灵GPU的核心升级,怪不得老黄一直夸耀这是2006年以来GPU架构升级最大的一次。

图片 9

图片 10

从后续公布的RT渲染测试来看,图灵显卡的光线追踪性能确实很强大,GTX 1080 Ti显卡渲染单光源的延迟可以做到11毫秒,但2-16光源的情况下延迟大幅提升,不具备可行性了,图灵显卡在单光源、双光源乃至8光源下都能将延迟控制在10毫秒内,性能提升了四五倍,这是有史以来首次有游戏卡能够达到这样的光线追踪渲染性能。

在保留了桌面版RTX 2080/2070/2060显卡的性能及规格的同时,RTX 2080/2070/2060笔记本也使用了NVIDIA的Max-Q设计,这个技术标准是NVIDIA 2017年推出的,一揽子方案可以降低游戏笔记本的厚度、噪音及发热,厚度从51mm降至18mm以内,保证散热效果的情况下噪音低于40分贝,所以在性能强大的同时也让笔记本更加美观、时尚,游戏本也不是傻大黑粗的代名词了。

总结:

根据ZDC互联网调研中心2017年全年的数据显示,5000-6000元之间的产品占比30.1%位居第一位,6000-8000元之间的产品占比28.6%,8000元以上产品占比22.4%,售价在5000元以下的产品占比18.9%,这也可以看出游戏本6000 以上价位的产品能占到一半,这个市场的潜力比台式机大多了。

GDDR6内存带来内存带宽大幅提升,不过NVIDIA还从源头进一步降低了对带宽的消耗,图灵显卡支持更先进的内存压缩算法,全新的GPU压缩引擎可以自动匹配最合适的算法以便在不同的材质上寻找最有效的压缩方法,与GP102核心的GTX 1080 Ti显卡相比,RTX 2080 Ti的内存压缩能够提升50%的效率,与带宽更高的GDDR6一起为图灵架构的SM单元性能提升50%保驾护航。

在NVIDIA发布的几款RTX 20系显卡中,目前有TU102、TU104、TU106三个图灵GPU核心,分别用于RTX 2080 Ti、RTX 2080及RTX 2070显卡,分别集成了68组、46组、36组RT Core,其中RTX 2080 Ti每秒钟可以追踪10G条光线,78T的RTX-OPS;RTX 2080每秒追踪光线降低至8G条,RTX-OPS也降低至60T;RTX 2070每秒能追踪的光线只有6G条,45T RTX-OPS;而Pascal的游戏王者GTX 1080 Ti只能追踪1.1G条光线,RTX-OPS只有11.3T,所以RT Core性能是非常强劲的。

图片 11

在8月份的SIGGRAPH 2018大会以及科隆游戏展上,NVIDIA首先吃了光线追踪这个大闸蟹,发布了Turing图灵架构GPU,分别针对专业市场、PC游戏市场推出了RTX 8000/6000/5000以及RTX 2080 Ti/2080/2070显卡,NVIDIA CEO、创始人黄仁勋宣称图灵GPU是2006年统一渲染架构问世以来GPU架构升级幅度最大的一次,原因就在于光线追踪对于PC游戏画质提升是革命性的。

TU102核心的SM单元架构

图片 12

另一方面,全新的GeForce RTX 20系列显卡的售价也水涨船高,这次发布了GeForce RTX 2080 Ti、RTX 2080及RTX 2070三款显卡,其中前两款显卡率先上市,FE创始人公版RTX 2080 Ti价格达到了9999元,RTX 2080显卡的FE公版也要6499元,第三方厂商的价格分别是8199、5699元,整体价格比现在的GTX 1080系列高出一截。

笔记本上光追GPU是有必要的,但是真要用于移动平台并不容易,因为笔记本空间有限,还要考虑续航问题,所以移动GPU需要在功耗、发热、空间占用等方面做出大量改进,不亚于螺蛳壳里做道场,所以这次亮相的RTX 2080/2070/2060笔记本电也用上了NVIDIA的Max-Q设计。

NVIDIA宣称他们的Turing图灵架构是一次技术飞跃,尽管其中不乏宣传的味道,但是从图灵架构的改变来看,这代显卡的技术亮点还真不少,等待了两年多的N饭并没有白等,CUDA核心性能大增50%、新增RT Core及Tensor Core将原来行业级的技术带入到了消费级显卡中,同时首发了GDDR6显存,增加了USB-C输出接口,升级幅度要比之前的历代NVIDIA GPU更为明显。返回搜狐,查看更多

游戏本售价相对较高,但销量并不低

由于NVLink的超高带宽,图灵显卡SLI之后可以玩出更多花样,比如支持5K 75Hzueu,支持4K 144Hz环绕屏模式,还可以支持8K视频,RTX 2080 Ti更可以做到8K环绕屏模式。

·移动GPU光追三杰,RTX遇到了Max-Q

如果说图灵架构增加Tensor Core是把专业技术带到消费显卡上来,那么图灵架构真正给游戏市场带来变化的改进则是RT Core,也就是专门的光线追踪渲染核心。在8月底的科隆游戏展发布会上,NVIDIA创始人、CEO黄仁勋提及最多的就是光线追踪了,他表示图灵显卡的RT性能是Pascal显卡的6倍多,是提升最明显的。

图片 13

图灵显卡显存:不只首发GDDR6,还有高效压缩

与对应的桌面版RTX 2080/2070/2060显卡相比,RTX笔记本电脑中RTX 2080/2070/2060显卡的规格都是一样的,分别拥有2944、2304及1920个CUDA核心,68、46及36组RT核心,显存位宽、频率及容量也没变,主要差别在于GPU核心频率,由于要控制功耗的缘故,笔记本电脑RTX 2080/2070/2060显卡的基础频率及加速频率降低了,换来的是TDP功耗大降,RTX 2080只有80到150W 之间,RTX 2070降至80-115W之间,RTX 2060更是低至80-90W之间,与桌面版相比平均减少了一半左右的功耗。

图片 14

图片 15

图灵GPU架构的SM单元不一样,NVIDIA减少了SM单元中的CUDA核心数到64个,但增大了SM单元数量,TU102总计72组SM单元,而GP104是20组SM单元,同时又增加了每组SM单元的缓存,新增了L0缓存、L1/共享缓存增加到了96KB,看似减少了,但是分配方式更灵活,需要的时候L1缓存分配到64KB,比Pascal显卡的48KB提升50%。

图片 16

责任编辑:

图片 17

以DLSS抗锯齿技术为例,在RTX 2080显卡上,DLSS技术不仅能带来更精细的画质,基于Tensor Core强大的AI加速能力,RTX 2080实现DLSS的速度比GTX 1080显卡可以高出一倍之多。

图片 18

N卡玩家常听到的一个词就是CUDA核心,它就是GPU架构中的基本单位——流处理器单元,CUDA核心数越多,显卡性能越强,同时每个CUDA核心的性能越强,这就类似于CPU中的核心数及单核性能一样,只有CUDA核心又多又强的情况下显卡性能提升才会更明显。

图片 19

目前NVIDIA的GeForce RTX 2080系列显卡还没有解禁,因此性能提升幅度还没有定论,不好比较更高价的RTX 2080系列显卡是否对得起它的售价。不过今晚NVIDIA解禁了图灵显卡的技术细节,我们可以从技术角度来看看图灵GPU架构到底带来哪些改变?

除了总数量占优,面向游戏玩家的游戏笔记本近年来也保持高速增长,前瞻产业研究院发布的数据显示笔记本电脑则将更多地承担重度应用的角色,例如玩竞技游戏、做复杂的office文档、代码编制及运算、绘图渲染等对配置硬件要求高的工作,所以笔记本正向专业化、商务化方向转型,已经出现了高配置的专业游戏本、主打便携办公功能的超极本、专业渲染本。

图片 20

图片 21

图片 22

随着显卡计算性能日益提升,NVIDIA认为显卡加入硬件级光线追踪支持的时机已经成熟,光线追踪也会成为未来3A级游戏竞相使用的技术,以达到玩家们梦寐以求的画面效果。因此NVIDIA在经历Volta游戏显卡跳票后,带来了拥有专门处理光线追踪的RT Core的Turing游戏显卡,不仅仅可以让游戏开发者进行实时光线追踪计算,所见即所得,而玩家也能从游戏中感受到前所未有、电影级的画质。

在显存选择上,现在的显卡大部分选择了GDDR5,这是成熟标准,不过速率很难超过8Gbps,搭配256bit位宽的话,带宽可达256GB/s,如果最求性能会上HBM 2显存,4096bit位宽下带宽可达1024GB/s,但是HBM 2的成本比GDDR5显存贵太多了,一颗4GB HBM2显存成本就要80美元,8GB HBM2显存成本就要160美元了,光这一项就占了高端显卡的1/3到1/2价格,实在是用不起。

·Tensor Core:张量核心,这是之前的Volta架构就有的设计,Turing架构对其进行了增强。还增加了新的INT8和INT4精度模式,FP16半精度也能够被完整支持。简单来说,Tensor Core就是给GPU带来了AI人工智能加速能力,NVIDIA的DLSS抗锯齿技术就需要Tensor Core来加速运算。

正是因为NVLink技术的超高性能,所以原本没期待消费级的RTX 2080系列显卡能用上NVLink,不过NVIDIA竟然真的在图灵显卡上开放了NVLink技术,不过消费级的NVLink技术带宽也没有那么夸张,TU102核心的RTX 2080 Ti以及专业级的Quadro RTX 8000/6000显卡的NVLink带宽100GB/s,RTX 2080显卡NVLink带宽50GB/s,RTX 2070显卡遗憾不能支持NVlink。

·桌面显卡完成市场布局,笔记本也要追光了

图片 23

总结:

图片 24

随着Windows系统、NVIDIA硬件做好了DXR光线追踪的支持,光线追踪生态链的最后一环就是游戏支持了,微软的DXR已经得到了EA寒霜、SEED、EPIC的UE、Unity及3DMark等软件及游戏引擎的支持,NVIDIA也跟多家游戏厂商合作,推出了二十多款RTX游戏,其中神力科莎(Assetto Corsa Competizione)》、《战地(Battlefield)V》、《控制》、《逆水寒》、《地铁(Metro Exodus)》、《古墓丽影:暗影》等11款游戏支持RTX光线追踪技术,《战地5》已经率先在11月中旬推出了RTX升级补丁,成为第一个支持RTX光线追踪技术的游戏,今年还会有更多游戏加入光线追踪支持中。

总的来说,在CUDA及SM单元上,图灵架构重新分配了缓存系统,优化了执行单元效率,使得CUDA核心性能最多提升50%,在其他不同类型的负载中提升幅度也有50-70%,使得图灵显卡在CUDA核心数没有大幅增长的情况下游戏性能依然有明显提升。

但是任务远没有结束,玩转光追现在最大的问题还不是显卡性能如何,而是生态系统才刚刚开始,特别是支持光线追踪技术的游戏数量,已上市的才有一款,今年上半年还有技术光追游戏问世,但这远远不够。

在现在的Pascal显卡上,GP102大核心的CUDA核心数最多3840个,GTX 1080 Ti是3584个,而图灵GPU的TU102核心完整版是4608个CUDA核心,不过RTX 2080 Ti现在只使用了4352个,从3584到4352意味着CUDA核心数增加了21%,这个增幅并不算高,因为图灵这一代的CUDA架构着重于提升性能,NVIDIA宣称每个CUDA核心的性能提升了50%。

到今天为止,NVIDIA在游戏显卡市场上已经推出了RTX 2080 Ti/2080/2070/2060四款显卡了,最低价格也也下探到了2899元,后面还有一波新卡,但是光追显卡由于对RT Core的高要求性,所以RTX 2060就是目前玩转光追游戏的底线了,桌面显卡的光追市场布局已经完成了。

图片 25

对于这样的机会,NVIDIA当然不会错过,所以本月初的CES展会上,NVIDIA除了推出RTX 2060显卡之外,还推出了面向笔记本的RTX 20系列移动版,也就是RTX 2080、RTX 2070、RTX 2060移动GPU,它们不仅带来了桌面级电脑相近的性能,同时也让游戏本支持光线追踪成为可能。

原标题:写在RTX2080评测之前:老黄想用AI/光线追踪颠覆显卡?

图片 26

图片 27

图片 28

图片 29

随着GPU计算性能的增加,对带宽的要求也越来越高,在图灵架构上NVIDIA也升级了显存子系统,首发支持了GDDR6显存,这是7年来GPU架构首次从GDDR5升级到GDDR6,不过图灵GPU在显存改进上做的不只是带宽大幅增加,还改进了内存压缩技术。

为此NVIDAI在图灵显卡中改变了RT渲染的工作流程,将其从Shader渲染器中独立出来,变成了单独的RT Core,专门用于RT运算,每个SM单元有一个专用的RT Core,RTX 2080 Ti显卡上总计68组RT Core,带来了10 Giga Rays/s的光线追踪渲染能力,而现在的Pacal显卡的渲染能力只有1.2 Giga Rays/s,性能提升了10倍,而老黄现场宣布的6倍光线追踪渲染性能还是很谦虚的了。

对游戏玩家来说,RT光线追踪技术的进入使得游戏画质更上一层楼,这个技术多年来一直被视为3D图形技术的一次革命,将极大地改变游戏以及电影工业的渲染方式,通过追踪光线的轨迹来计算物品对光线的反射和折射,更真实地还原物品在现实中的颜色,带来了更真实的光影效果,从而达到梦寐以求的“以假乱真”效果,让玩家真正融入到游戏中。

图灵显卡增加了Tensor除了可以用于AI加速运算,NVIDIA也在加速推动游戏支持AI加速的过程,这次还推出了NGX软件工具,通过它可以在图灵显卡上实现DLSS(深度学习超级采样)抗锯齿,INPAINTING图形修补、AI Slow-Mo慢动作、AI Super Rez超级分辨率等功能。

图片 30

图片 31

图片 32

图片 33

在I/O接口上,图灵显卡也带来了全面的升级,最大的变化就是首发支持了VitualLink接口,它的物理接口为USB Type-C,也就是现在电脑及手机上开始普及的USBC接口,而VitualLink则是NVIDIA、AMD以及微软、Oculus、Valve等公司联合制定的VR设备专用接口,有望能简化这些线缆的需求,提供更简单、统一的体验,而不仅仅是性能,据说新的接口还能为更低的延迟时间作出优化。

▍ NVIDIA图灵架构改进:

图灵显卡虽然大幅提升了CUDA单元的性能,那为什么不增加更多的CUDA单元呢?毕竟核心面积以及晶体管规模相比Pascal显卡大幅增加了,原本该有足够的空间增加CUDA核心才对。这个问题就要说到NVIDIA在图灵架构上的野心了,这也是NVIDIA一直强调图灵显卡为什么是有史以来架构变化最大的GPU了,因为它增加了AI运算单元及RT光线追踪渲染单元。

图片 34

增加专用的Tensor Core核心之后,图灵显卡的AI性能大幅提升,以RTX 2080 Ti为例,其FP32浮点性能为13.4TFLOPS,FP16浮点性能翻倍到了26.89TFLOPS,FP16 Accumulate性能高达107.6TFLOPS,INT8、IN4性能更是可以达到215.2TFLOPS、430.4TFLOPS,这是现有Pascal显卡不支持的运算。

图灵显卡首发的GDDR6显存频率为14Gbps,考虑到GDDR6显存还是首发,这个频率还是可以的,相比目前8Gbps的GDDR5显存速率已经提升了75%,同样在256bit或者384bit位宽下能带来448GB/s、672GB/s的带宽,性能非常接近HBM 2显存了,要知道AMD的RX Vega64显卡使用的HBM 2带宽也不过484GB/s,Vega 56甚至只有404GB/s。

图片 35

图片 36

GP102与TU102核心参数对比 显卡RTX2080TiGTX1080Ti Quadro RTX 6000Quadro 6000架构TuringPascal TuringPascal晶体管数186亿120亿186亿120亿 制作工艺12nm16nm 12nm16nm 流处理器**43523584 46083840 RTX-Ops**7811.3 84- 显存容量**11GB11GB24GB24GB 显存类型**GDDR6GDDR5X GDDR6GDDR5X 显存位宽352Bit352Bit384bit384bit 显存频率14000MHz11000MHz14000MHz9000MHz 显存带宽**616GB/s484GB/s672GB/s432GB/sFP3214.2TFlops11.3TFlops16.3TFlops12.6TFlopsFP1628.5TFlops-32.6TFlops-INT8227.7TFlops-261.0TFlops-TDP**260W250W 260W250

图片 37

最后,图灵显卡在还升级了用于视频编码解码的NVENC单元,新增支持H.265 8K 30fps编码,同时提供H.265格式25%的码率节省,H.264格式也能节省15%码率,而解码性能也更快,支持的格式更多。

先说AI单元,实际上叫做Tensor Core(张量核心),这是Volta架构上首次增加的新单元,图灵架构继承了Tensor Core设计,每个SM单元中有8个Tensor Core核心,总计576个Tensor单元,不过RTX 2080 Ti实际启用的是544个。

图片 38

此外,图灵GPU的SM单元还基于常见工作负载做了执行单元的优化,增加了第二条并行单元,在执行整数类型的计算时浮点单元也不会空置了,使得执行单元的效率提升了36%,大幅提升了执行单元的效率及性能。

图片 39

不过NVLink还需要搭配额外的NVLink桥,这个东西也是单独出售的,有3插槽及4插槽两种版本,售价79美元,折合人民币也要500多块。

图片 40

图片 41

图片 42

在图灵显卡发布之后,RT光线追踪技术也成为新一代3A游戏大作的选择,包括战地5、古墓丽影以及国内的逆水寒、剑侠3等11款游戏都宣布支持光线追踪技术,这个名单目前来说还不多,但是等到RTX 2080显卡上市、普及之后,支持RT渲染的游戏会越来越多。

CUDA核心性能大幅增长则受益于SM单元的改变,在Pascal GPU架构中,NVIDIA在GP102、GP104、GP106核心中的SM单元中塞入了128个CUDA核心,配备了48KB L1缓存、96KB共享缓存、256KB寄存器容量,架构如下所示:

本文由必德电竞官网发布于产品评测,转载请注明出处:光明追踪颠覆显卡,NVIDIA的追光大计

关键词: 必德电竞官网