01GeForce RTX 50显卡白皮书公开
产品:RTX 4090 炫光 耕升 显卡英伟达最新发布的 Blackwell GPU 架构白皮书,揭示了 GeForce RTX 50 系列显卡的先进技术细节。其中最值得注意的是,Blackwell 架构中的所有单精度 CUDA 核心同时支持 FP32 / INT32 数据类型,这一设计回到了九年前的 Pascal 架构时代。
在 Pascal 架构中,英伟达采用了单精度 CUDA 单元兼顾 FP32 / INT32 的设计。然而,在 Volta 和 Turing 两代架构中,英伟达改变了策略,分别使用了两组 1:1 比例的 CUDA 核心来承担 INT32 和 FP32 的任务。
来到 Ampere 架构时代,每个 SM 流式处理器的四个处理块之一提供了 1 组 16 个 FP32 / INT32 单元和 1 组 16 个纯 FP32 单元。而在 Ada GPU 上,这种设计得到延续。
Blackwell 架构实现了对 CUDA 的统一处理。这意味着每台 SM 设备都具备更高的 INT32 整数运算能力,相较于 Ada 架构提升了一倍。然而,在任何给定的时钟周期内,Blackwell 架构只能以 FP32 或 INT32 模式中的一种运行。
英伟达提到,Ada 架构的 SM 设备是为标准着色器设计和优化而构建的,而 Blackwell SM 则是为了适应神经网络着色器设计和优化需求而构建的。
总而言之,GeForce RTX 50 系列显卡采用了先进的 Blackwell 架构,并在性能方面取得了显著突破。这一系列显卡将为用户带来更强大的计算能力和更好的神经网络处理效果。