相信大伙儿都已经关注到了,就在昨天,NVIDIA 解禁了秒天秒地的 RTX 5090,还不清楚的同学可以看下咱们昨天的文章:
那这次 50 系的升级就没有什么令人称道的地方吗?
也有,那就是这次大肆宣扬的 DLSS4.0 了。与其说是 50 系显卡发布,不如说是 DLSS4.0 发布。
因为除了 90 档,其他的新显卡继任者传统性能提升实在是有限。但 DLSS4.0 的确改写了接下来的显卡发展方向。
与之前的小修小补不同,DLSS4.0 算是彻底推倒重来了,因为 DLRR 光线重建、DLSR 超分辨率、DLAA 抗锯齿以及帧生成之前都依赖于传统 CNN(卷积神经网络)模型,这个模型需要依赖 GPU 当中的光流单元。
CNN 模型是通过分析局部的上下文、追踪连续帧画面当中容易变化的区域,来预测、生成新的画面帧。
而 MFG「多帧生成」再依赖这种模型就显得力不从心了,原因是毕竟依赖特有硬件,所以在算法和模型上很难再有质的突破。
NVIDIA 在这次引入了全新的 Transformer 模型,依赖 Tensor core 算力,用 AI 模型的思路去做到以上的这些。
并且这个模型是所有的 RTX GPU 共享,也就是 20 系也能吃上。
相较于原来的 CNN 模型,在识别上面 Transformer 会更加精准,用例子来形容的话,CNN 模型就类似原来的传统语音助手,只能识别特定的区域画面,在超出模型范围上面就容易翻车了。
而 Transformer 模型参数量是 CNN 的 2 倍,就类似今天的 AI 助手,可以通过自注意力操作(Self-Attention),来评估整个画面、多个帧画面中每个像素的相对重要程度。所以在质量纹理效果以及边缘过渡平滑上面强了不少。
最后是 Transformer 模型以及提升的第 5 代 Tensor core 带来的MFG(多帧生成),在 50 系显卡上面独占。
帧生成画面速度提升 40%,硬件显存占用也少了 30%,并且一次就可以为原始渲染帧多生成 3 帧。
不仅如此,DLSS4.0 可以仅凭画面的 1/16 从而补全画面。依靠原来的超分率技术的结合,可以把帧率最高提升 8 倍。
但玩游戏的同学都知道,插帧到底不是原始帧,所以在游戏交互的时候就会出现不可避免的操作延迟感,所以 NVIDIA 也带来了全新的 Reflex 2。
直接说区别,在传统的 Reflex 和 DLSS3.0 中,依赖 CPU Pacing 技术控制帧画面显示,而由于 CPU和 GPU 的信号交互延迟,会随着帧数增加导致两帧之间节奏不一致,给人的直观感受就是卡顿。
在 DLSS4.0 中,这个活儿就交给显卡来干了,引入 Flip Metering 的 DSC 新硬件来专门干这件事,CPU 只需要下发一帧渲染帧给显卡,然后就不会再和 GPU 同步,显卡插帧完成以后可以直接输出到显示器,这样带来的感受就是没那么卡顿了。
而至于操作延迟部分,在传统 Reflex 压缩渲染队列基础之上,Reflex 2 在最终帧形成的时间差上,用键盘鼠标输入端传进的信号来用AI模型进行改写还没渲染完的最终帧,用这种方式来进一步降低延迟。
看到这儿可能有同学举手了,说的这么好,那我们老显卡用不上有啥用啊?
倒也不一定。
在最近对 NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro 的采访中;
他表示因为新的 DLSS4.0 采用了新的 Transformer 模型,衍生出了多帧生成,未来可以看看能不能够在旧的 GPU 中挤一挤相关的技术。但这需要强大的数据以及庞大的工作量来支撑。
中译中的意思是,更换了模型原因,新技术理论上是可以下放的,但需要大量适配工作,并且效果因为 Tensor core 算力差别和最近的硬件区别,所以效果还可能不尽如人意。
所以这事儿有没有后续,就看老黄良心有多少了。
数据来源:NVIDIA、videocardz、极客湾,图源网络。
本文编辑:@ 阿红
©本文著作权归电手所有,未经电手许可,不得转载使用。