NVIDIA A40 加速了最苛刻的视觉计算工作负载,将最新的 NVIDIA Ampere 架构 RT Core、Tensor Core 和 CUDA® 核心与 48GB 图形内存结合在一起。从任何地方访问的强大虚拟工作站到专用渲染节点,NVIDIA A40 将下一代 NVIDIA RTX™ 技术引入数据中心,满足最先进的专业可视化工作负载需求。
NVIDIA® RTX™ 技术彻底改变了专业视觉计算。NVIDIA Ampere 架构基于 RTX 的强大功能,显著提升了渲染、图形、AI 和计算工作负载的性能。工程完美,具有尖端创新,NVIDIA Ampere 架构将 RTX 提升到新的高度,满足专业工作负载的需求。
新的 Tensor Float 32 (TF32) 精度提供了比上一代高达 5 倍的训练吞吐量,加速了 AI 和数据科学模型的训练,而无需任何代码更改。对结构化稀疏性的硬件支持使推理的吞吐量加倍。Tensor Cores 还将 AI 引入图形中,具备 DLSS、AI 降噪和特定应用的增强编辑功能。
相较于上一代,第二代 RT 核心的吞吐量提高了 2 倍,并且能够同时运行光线追踪和着色或降噪功能。第二代 RT 核心为电影内容的真实感渲染和产品设计的虚拟原型制作等工作负载提供了极大的速度提升。这项技术还加快了光线追踪运动模糊的渲染,提供更快的结果和更高的视觉准确性。
NVIDIA Ampere 架构的 CUDA® 核心为单精度浮点(FP32)操作提供双倍速度处理,并且功效比 Turing GPU 提高了 2 倍。这为 3D 模型开发等图形工作流和计算机辅助工程(CAE)的桌面仿真等计算工作流提供了显著的性能提升。
超快速的 GDDR6 内存,使用 NVLink³ 可扩展至 96GB,为数据科学家、工程师和创意专业人士提供处理庞大数据集和工作负载(如数据科学和仿真)所需的大量内存。
NVIDIA A40 采用双插槽、高效能设计,与上一代相比,能效提高了 2 倍,并且与全球 OEM 的广泛服务器兼容。NVIDIA A40 包括硬件根信任的安全启动,确保固件未被篡改或损坏。
PCI Express Gen 4 的带宽是 PCIe Gen 3 的两倍,提高了从 CPU 内存到 GPU 的数据传输速度,适用于数据密集型任务如 AI、数据科学和 3D 设计。更快的 PCIe 性能还加速了 GPU 直接内存访问(DMA)传输,为 GPU 和支持 GPUDirect® 的视频设备之间的视频数据输入/输出通信提供了更快的速度,提供了一个强大的解决方案用于直播。A40 向后兼容 PCI Express Gen 3,以便灵活部署。
要了解更多关于 NVIDIA A40 GPU 的信息,请访问 NVIDIA A40
© 2022 NVIDIA Corporation. 保留所有权利。NVIDIA、NVIDIA 徽标、CUDA、GPUDirect、NVLink、OpenACC、Quadro 和 RTX 是 NVIDIA Corporation 在美国和其他国家或地区的商标和/或注册商标。其他公司名称和产品名称可能是其各自公司的商标。其他所有商标均为其各自所有者的资产。MAR22
¹ 渲染和图形测试在 2x Xeon Gold 6126 2.6GHz(3.7GHz Turbo),256GB 系统内存,NVIDIA 驱动程序 461.09 上运行。渲染测试:Iray 2020.1,NVIDIA Endeavor 场景的渲染时间。图形测试:SPECviewperf 2020 子测试,4K 医疗-03 复合。
² AI 和 HPC 测试在 AMD EPYC 7742@2.25GHz(3.4GHz Turbo),512GB 系统内存,NVIDIA 驱动程序 460.14 上运行。AI 训练:BERT 预训练吞吐量。PyTorch(2/3)第 1 阶段和(1/3)第 2 阶段。Precision FP32 用于 RTX 6000 和 TF32 用于 A40 和 A100。第 1 阶段的序列长度 = 128。第 2 阶段 = 512。单精度 HPC:NAMD 版本 3.0a7,stmv_nve_cuda;Precision=FP32;ns/day,CUDA 版本:11.1.74。
³ 连接两块 NVIDIA A40 卡以通过 NVLink 扩展性能和内存容量至 96GB,仅在应用程序支持 NVLink 技术的情况下可能。请联系您的应用程序提供商以确认其对 NVLink 的支持。
⁴ Quadro Sync II 卡单独出售。Mosaic 支持 Windows 10 和 Linux。
⁵ GPU 支持 DX 12.0 API,硬件功能级别 12 + 1。
⁶ 产品基于已发布的 Khronos 规范,预计将在可用时通过 Khronos 一致性测试流程。当前一致性状态可在 Khronos 一致性测试 找到。