常见问题
NVIDIA 4090 核心技术参数/核心算力数据
NVIDIA GeForce RTX 4090 是 Ada Lovelace 架构的消费级旗舰 GPU,核心为 AD102,台积电 4N 工艺,兼顾游戏、创作与 AI 推理,以下是核心参数与算力详情:
核心技术参数
参数 | 详情 |
|---|---|
核心型号 | AD102(启用 144 个 SM,16384 个 CUDA 核心) |
架构 | Ada Lovelace |
制造工艺 | 台积电 4N |
显存 | 24GB GDDR6X,位宽 384bit,带宽 1008GB/s,L2 缓存 96MB |
核心频率 | 基础 2235MHz,Boost 2520MHz(非公版更高) |
光追 / Tensor 核心 | 144 个第三代 RT Core,576 个第四代 Tensor Core(支持 FP8) |
接口 | PCIe 4.0 x16,16 针 12VHPWR 供电 |
晶体管 | 760 亿 |
TGP | 450W(可配置,非公版最高超 600W) |
视频输出 | 3×DP 2.1,1×HDMI 2.1 |
核心算力数据
精度类型 | 算力 |
|---|---|
FP32(单精度) | 83 TFLOPS |
FP64(双精度) | 1.3 TFLOPS(约为 FP32 的 1/64) |
BFLOAT16/FP16(Tensor Core) | 665 TFLOPS |
FP8/INT8(Tensor Core) | 1329 TOPS |
光线追踪(RT Core) | 191 TFLOPS |
关键特点
消费级顶级性能,4K/8K 游戏、3D 渲染、视频剪辑与 AI 推理(如 Stable Diffusion、LLaMA - 2 7B)均表现出色,DLSS 3 可大幅提升游戏帧率。
第四代 Tensor Core 原生支持 FP8,适合本地部署生成式 AI 模型,显存带宽与 L2 缓存升级,降低数据传输瓶颈。
无 NVLink,分布式训练带宽受限(PCIe 4.0 x16 双向约 64GB/s),更适合单卡或小规模推理场景。