NVIDIA A40 GPU 可使數據中心的性能和多工作負載能力獲得進化式飛躍。它集優秀的專業圖形性能與強大的計算和 AI 加速能力于一體,可應對當今的設計、創意和科學挑戰。NVIDIA A40 能驅動新一代虛擬工作站和基于服務器的工作負載,并隨時隨地為專業人士提供光線追蹤渲染、模擬、虛擬制作等領域的先進功能。
NVIDIA? A40 提供基于數據中心的解決方案,可滿足設計師、工程師、藝術家和科學家所需,助其攻克當今面臨的挑戰。A40 依托于 NVIDIA Ampere 架構而構建,將新一代 RT Core、Tensor Core、CUDA? Core 與 48GB 顯存融于一身,可提供遠超以往的圖形處理、渲染、計算和 AI 性能。從隨時隨地可供訪問的強大虛擬工作站,到專用渲染節點,A40 旨在處理數據中心中要求非常嚴苛的視覺計算工作負載。
速度提升一倍的單精度浮點 (FP32) 運算處理和改善的能效可顯著提高圖形和模擬工作流程的性能,例如復雜的 3D 計算機輔助設計 (CAD) 和計算機輔助工程 (CAE)。
單個 NVIDIA A40 主板能夠憑借對陰影、反射和折射物理屬性的準確把握,渲染復雜的專業模型,從而為用戶提供即時見解?;?NVIDIA A40 的服務器可與 NVIDIA OptiX、Microsoft DXR 和 Vulkan 光線追蹤等利用 API 的應用配合使用,助力真正的交互式設計工作流程,繼而提供即時反饋,以實現前所未有的超高生產效率。NVIDIA A40 的可將光線追蹤的運行速度提升至前一代的兩倍。
與前一代相比,第三代 Tensor Core 可借助全新的 Tensor Float 32 (TF32) 精度,提供高達五倍的訓練吞吐量,還可運用結構化稀疏技術,提供高達十倍的推理吞吐量,且無需更改任何代碼。這縮短了 AI 模型訓練或數據科學數據準備和建模工作流程所需的時間。支持結構化稀疏技術的硬件會通過壓縮網絡模型的大小并加快模型執行,進一步提升速度。新一代 Tensor Core 還支持腦浮點格式 (BFloat16)。
A40 具有一個視頻編碼引擎和兩個解碼引擎,能夠提供對 AV1 解碼的支持,同時具有多流視頻應用所需的性能,可用于提供安全與視頻服務。
A40 支持 PCI Express 4.0 (PCIe 4.0),可將 PCIe 3.0 x16 連接的帶寬從 15.75 Gb/s 提高到 31.5 Gb/s,從而提高了數據密集型任務(如 AI 和數據科學)中 CPU 內存的數據傳輸速度,同時可從大型數據集中創建 3D 模型。更快的 PCIe 性能還加速了 GPU 直接顯存訪問 (DMA) 傳輸,從而能讓支持視頻的設備通過 GPUDirect? 更快速地傳輸視頻數據,并利用 GPUDirect Storage 加快輸入/輸出 (I/O) 速度。
NVIDIA A40 的能效是前一代的兩倍,且可兼容全球 OEM 供應商生產的各式服務器。
A40 擁有 48GB 的 GDDR6 顯存。用戶可借助第三代 NVLink 技術連接兩塊 A40 顯卡,獲得高達 96GB 的組合顯存,以滿足渲染、數據科學、工程仿真和其他 GPU 內存密集型工作負載所需的內存需求。
A40 與 NVIDIA 虛擬 GPU (vGPU) 軟件相結合,助力遠程用戶打造規模更大、功能更強的虛擬化工作站實例,可用于高端設計、AI 和計算工作負載的較大工作流程。NVIDIA vGPU 支持訪問虛擬工作站,并可助力用戶實現可隨處施行的靈活解決方案。
支持最新的高分辨率頭戴式顯示 (HMD)設備、高性能圖形和 48GB 的較大 GPU 顯存,能夠創建出令人驚嘆的沉浸式增強現實 (AR) 和虛擬現實 (VR) 體驗,可在訓練、產品驗證、搭建場景和引人入勝的娛樂活動中加以應用。
硬件加速的動態模糊渲染(一種難以渲染的常見電影效果),意味著藝術家不再需要依靠動態矢量這種傳統方法來實現動態模糊。盡管藝術家可以借助動態矢量靈活地調整后期的動態模糊,但卻需要對反射和半透明進行視覺修復。
由 AI支持的實時圖像超分辨率可提高設計和可視化應用的交互能力和幀速率。用戶可借助 DLSS 以較低的分辨率進行實時引擎渲染,并能在始終保持畫質清晰的情況下,采用 AI 技術,輸出分辨率較高的內容。
通過 NVLink 連接兩塊 NVIDIA A40 顯卡,即可以高達 112.5 GB/s(總帶寬)的速度在 GPU 之間傳輸數據,從而將有效顯存占用提升一倍并實現應用性能的擴展。
能夠憑借無損計算精度與可靠性,滿足對任務關鍵型應用的嚴苛數據完整性要求。
NVDEC 非常適用于實時解碼的轉碼和視頻播放應用。支持用戶使用以下視頻編解碼器進行硬件加速解碼:MPEG-2、VC-1、H.264 (AVCHD)、H.265 (HEVC)、VP8、VP9 和 AV1。將此項技術與 Ampere Tensor Core 結合使用后,A40 可快速地將 AI 和推理應用到實時視頻之中。
NVENC 可處理要求十分嚴苛的 4K 或 8K 視頻編碼任務,從而釋放圖形引擎和 CPU 來執行其他操作。NVENC 還支持虛擬工作站以流式方式傳輸 8K 內容,以處理高保真設計和渲染工作負載。此外,與基于軟件的 x264 編碼器相比,NVIDIA A40 的編碼質量更勝一籌。
NVIDIA A40 采用雙插槽、高能效設計,與上一代相比能效提升 2 倍,這點已經過全球 OEM 出品的各種 NVIDIA 認證系統的驗證。NVIDIA A40 還通過硬件可信根功能進行安全的測量式引導,確保固件未被篡改或損壞。
指令級先占可實現對計算和圖形任務的更精細控制,以防長時間運行的應用獨占系統資源或超時。
NVIDIA ? NVLink ? 112.5 GB/s (雙向) PCIe 4.0 31.5 GB/s(雙向)
使用 FP16 累加的 FP16 Tensor TFLOPS 峰值
74.8| 149.6*
使用 FP32 累加的 BF16 Tensor TFLOPS 峰值
INT8 Tensor TOPS 峰值
INT4 Tensor TOPS 峰值
299.3| 598.6*
598.7 | 1197.4*
3 個 DisplayPort 1.4**;支持 NVIDIA Mosaic 和 Quadro ? Sync 4
300 W
NVIDIA vPC/vApp、NVIDIA RTX 虛擬工作站、NVIDIA 虛擬計算服務器
您的電子郵件地址不會被公開,必填項已用 * 標注。
提交評論
Δ
? ? ? ? ? ? ? ?Copyright 2020-2025 IT存儲營 粵ICP備2021121885號網站地圖