50系显卡又集体翻车,过热设计或降低寿命

50系显卡PCB缩小导致散热翻车。
NVIDIA 50 系显卡算是彻底和 intel 13、14 代处理器坐一桌了。

在 Igor's Lab 的研究测试下,发现了影响整个 RTX 50 系显卡的问题,大部分 AIC 厂家(与 NVIDIA 达成官方合作的显卡制造销售厂家)的 50 系显卡容易出现供电区域高温,长期高负载使用后会对显卡造成损害,甚至缩短其使用寿命。
有同学看到这可能不理解了,NVIDIA 不是只提供芯片吗?过热难道不是 AIC 厂家的问题?
这只说对了一半。
众所周知,NVIDIA 是负责提供显卡芯片,而 AIC 厂商是负责供电、PCB、外观、散热等设计,然后组装打包销售。
但是哈,AIC 厂商的设计并不是随心所欲的。
为了保住自己的口碑(emmm…虽然 NVIDIA 剩的不多了),NVIDIA 会提供给所有 AIC 厂商一份散热供电设计指南。
这里面会包括各组件的热功耗、PCB 布局、每个元器件的热规格要求、组件硬性要求、以及各个组件的排布要求。
甚至为了更具体一点,NVIDIA 会出一个 FoundersEdition 版本打样,也就是咱们俗称的公版显卡来保证显卡设计的下限。
而这次的高温罪魁祸首就是显卡供电的结构设计上,通常供电系统由多个原件组成、包括 FET、电感线圈、驱动器以及导线。
不过大伙儿看到了,NVIDIA 以身作则,在这代 50 系显卡上把 PCB 面积大幅缩小。
所以除了 NVIDIA 公版的紧凑型 PCB 设计以外,你还能看到这样的 RTX 5060Ti:
因为供电元件被放置得过于密集,导致 PCB 上局部温度过高,尤其是在电压转换器的周围。长期高负载使用产生的高温可能容易使元器件迅速老化或者虚焊,从而减少显卡寿命。
那这个问题有没有办法解决呢?
当然有,厂商可以使用更好更多的导热材料来改善这个问题。
例如 Igor's Lab 对 PNY RTX 5070 和 Palit RTX 5080 Gaming Pro OC 进行了热成像测试。
RTX 5080 在供电区域热点温度达到了 80.5℃,而核心才 70.3℃。
PCB 更加紧凑的 RTX 5070 就更加糟糕了,供电区域来到了 107.3℃,核心附近也才不到 70℃。
而 RTX 5080 采用可塑硅脂填充背板后,带背板热点温度一下就从 79.1℃ 下降到 70.3℃。
背板热成像也更加均匀。
但是这样做成本太高了,在消费端几乎不太可能实现。 
NVIDIA 的 RTX 50 系显卡核心和一起打包的显存成本就要占据显卡成本的 80% 左右;
再让厂商额外增加成本显然不太可能,那结果只能由消费者来承担了。
除了硬件上不断翻车,50 系显卡在驱动上的 Bug 也停不下来。
4 月 17 日,NVIDIA 放出了重量级更新 GeForce 576.02 版驱动,据它自己介绍是一口气修复了 41 个 Bug,包括之前一直在修复,但从未间断的黑屏问题,以及游戏崩溃、闪退等情况。
但这里修完立马又有新的问题,升级 576.02 版驱动后会导致核心温度异常,从而使 GPU 核心频率电压无法调节,尤其是睡眠或者休眠后会 100% 出现。
所以 NVIDIA 立马又在 22 日发布了 576.15 版热修复驱动,还顺带解决了其他 6 个 Bug。
不过是否会出现新的问题就难保证了。
总的来说,50系 显卡从上市以来就状况不断,驱动问题更是跟 intel13、14代CPU崩溃事件有一拼了,而这些本质上面是半导体行业「摩尔定律」放缓的缩影,在逼近物理极限制造的时候,只能在性能提升和稳定性上面寻找平衡点。
老黄能否在接下来的产品所有突破,可能要看台积电给到怎样的惊喜了。
数据来源:Igor's Lab、NVIDIA技术论坛、bilibili@51972,图源网络。


本文编辑:@ 阿红

©本文著作权归电手所有,未经电手许可,不得转载使用。