常见问题

常见问题分类
产品使用
产品使用

NVIDIA 4090 核心技术参数/核心算力数据

NVIDIA GeForce RTX 4090 是 Ada Lovelace 架构的消费级旗舰 GPU,核心为 AD102,台积电 4N 工艺,兼顾游戏、创作与 AI 推理,以下是核心参数与算力详情:

核心技术参数

参数

详情

核心型号

AD102(启用 144 个 SM,16384 个 CUDA 核心)

架构

Ada Lovelace

制造工艺

台积电 4N

显存

24GB GDDR6X,位宽 384bit,带宽 1008GB/s,L2 缓存 96MB

核心频率

基础 2235MHz,Boost 2520MHz(非公版更高)

光追 / Tensor 核心

144 个第三代 RT Core,576 个第四代 Tensor Core(支持 FP8)

接口

PCIe 4.0 x16,16 针 12VHPWR 供电

晶体管

760 亿

TGP

450W(可配置,非公版最高超 600W)

视频输出

3×DP 2.1,1×HDMI 2.1

核心算力数据

精度类型

算力

FP32(单精度)

83 TFLOPS

FP64(双精度)

1.3 TFLOPS(约为 FP32 的 1/64)

BFLOAT16/FP16(Tensor Core)

665 TFLOPS

FP8/INT8(Tensor Core)

1329 TOPS

光线追踪(RT Core)

191 TFLOPS


关键特点

  1. 消费级顶级性能,4K/8K 游戏、3D 渲染、视频剪辑与 AI 推理(如 Stable Diffusion、LLaMA - 2 7B)均表现出色,DLSS 3 可大幅提升游戏帧率。

  2. 第四代 Tensor Core 原生支持 FP8,适合本地部署生成式 AI 模型,显存带宽与 L2 缓存升级,降低数据传输瓶颈。

  3. 无 NVLink,分布式训练带宽受限(PCIe 4.0 x16 双向约 64GB/s),更适合单卡或小规模推理场景。