24小时客服热线

4008-022-818

常见问题

常见问题分类

产品使用

NVIDIA 4090 核心技术参数/核心算力数据

NVIDIA GeForce RTX 4090 是 Ada Lovelace 架构的消费级旗舰 GPU，核心为 AD102，台积电 4N 工艺，兼顾游戏、创作与 AI 推理，以下是核心参数与算力详情：

核心技术参数

参数	详情
核心型号	AD102（启用 144 个 SM，16384 个 CUDA 核心）
架构	Ada Lovelace
制造工艺	台积电 4N
显存	24GB GDDR6X，位宽 384bit，带宽 1008GB/s，L2 缓存 96MB
核心频率	基础 2235MHz，Boost 2520MHz（非公版更高）
光追 / Tensor 核心	144 个第三代 RT Core，576 个第四代 Tensor Core（支持 FP8）
接口	PCIe 4.0 x16，16 针 12VHPWR 供电
晶体管	760 亿
TGP	450W（可配置，非公版最高超 600W）
视频输出	3×DP 2.1，1×HDMI 2.1

核心算力数据

精度类型	算力
FP32（单精度）	83 TFLOPS
FP64（双精度）	1.3 TFLOPS（约为 FP32 的 1/64）
BFLOAT16/FP16（Tensor Core）	665 TFLOPS
FP8/INT8（Tensor Core）	1329 TOPS
光线追踪（RT Core）	191 TFLOPS

关键特点

消费级顶级性能，4K/8K 游戏、3D 渲染、视频剪辑与 AI 推理（如 Stable Diffusion、LLaMA - 2 7B）均表现出色，DLSS 3 可大幅提升游戏帧率。
第四代 Tensor Core 原生支持 FP8，适合本地部署生成式 AI 模型，显存带宽与 L2 缓存升级，降低数据传输瓶颈。
无 NVLink，分布式训练带宽受限（PCIe 4.0 x16 双向约 64GB/s），更适合单卡或小规模推理场景。