NVIDIA DGX A100

第3世代 世界最先端AIシステム NVIDIA DGX A100

Web

世界初の5ペタFLOPSを実現

DGX A100®はGPUに最新のAmpereアーキテクチャである A100 GPU8基を双方向600GB/Sの新世代NVSwitch で結合しています。CPUはAMDのRome EPYC7742 64コア を採用。ストレージはOS用として1.92TB NVMeSSDをRAID-1で搭載し冗長性を確保、さらにキャッシュ用として高速なU.2 NVNeをRAID-0構成で15TB(3.84TBx4基)の容量をオールフラッシュで提供。
外部インターコネクトはMellanox ConnectX®-6 HDR 200Gb/s のQSFP56ポー トを9基装備しスケールアップを強力にサポートする仕様です。
新GPU A100®の演算性能は、倍精度で19.5TFLOPSと従来のV100の約2.5倍、単精度は「TF32」と呼ばれるFP32とFP16のハイブリッド方式を採用しソフトウェアの改編の必要なく 312TFLOPSのスループットを実現、ディープラーニング推論性能は1,248TOPSといずれもV100の約20倍の演算性能を誇り、8基のA100®を搭載したDGX A100®のAI性能は1ノードで実に5PFLOPSに達します。
さらに、新たに追加された 
MIG(Multi instance gpu) 機能は A100 GPUを7つのインスタンスに分割して、メモリ、キャッシュ、コンピューティングコアなどのリソースを割り当てて利用できます。1台の DGX A100 で最大56のインスタンスを立ててフレキシブルにリソースを配分し、推論、学習、HPC といった複数のワークロードを互いのレイテンシとスループットに影響を与えることなく同時に実行することが可能になります。

 
 

NVIDIA A100 TENSOR コア GPU

NVIDIA A100 Tensor コア GPU による前例のない高速化をもって、世界で最も困難な計算に AI、データ分析、HPC (ハイ パフォーマンス コンピューティング) で挑むことができます。
第3世代の NVIDIA Tensor コアにより性能を大幅に向上できるようになり、A100 GPU を効率的に数千までスケール アップできます。また、マルチインスタンス GPU を使用すれば、あらゆるサイズのワークフローを加速するために 7 つの小さな専用インスタンスとして割り当てることができます。




マルチインスタンスGPU(MIG)

MIG を利用することで、DGX A100 の 8 つの A100 Gpu を最大 56 個の GPU インスタンスとして構成し、それぞれが独自の高帯域幅メモリ、キャッシュ、コンピューティング コアで完全分離できます。
これにより管理者は、複数のワークフローに対してサービス品質 (QoS) が保証された GPU のサイズを適切に設定することができます。






次世代NVLINKとNVSWITCH

DGX A100 の第 3 世代の NVIDIA® NVLink® は、GPU から GPU への直接帯域幅を 600 ギガバイト/秒 (GB/s) まで倍増します。
Gen4 のほぼ 10 倍に相当します。DGX A100 には、前世代と比較して 2 倍の速度を可能にする次世代の NVIDIA NVSwitch™ も搭載されています。








MELLANOX CONNECTX-6 VPI HDR INFINIBAND

DGX A100 には最新型の Mellanox ConnectX-6 VPI HDR InfiniBand /イーサネット アダプターが搭載されており、それぞれが 200 ギガバイト/秒 (GB/s) で動作し、大規模 AI ワークフロー用の高速ファブリックを形成します。







最適化されたソフトウェア スタック

DGX A100 には、AI チューニングされた基本オペレーティング システム、必要となるすべてのシステム ソフトウェア、GPU 対応アプリケーション、トレーニング済みモデル、NGC™ の各種機能など、テスト済みで最適化された DGX ソフトウェア スタックが統合されています。









組み込まれたセキュリティ

DGX A100 は、あらゆる主要なハードウェアとソフトウェア コンポーネントを保護するための自動暗号化ドライブ、署名付きソフトウェア コンテナー、安全な管理と監視といったマルチレイヤー アプローチを採用することで、AI 導入において最も信頼性の高いセキュリティ体制を実現します。









NVIDIA DGX A100 スペック

GPU
NVIDIA A100 Tensor Core GPUs × 8
GPUメモリ Total 320 GB
性能
5 petaFLOPS AI
10 petaOPS INT8
NVIDIA NVSwithes 6
最大消費電力 6.5 kW
CPU
Dual AMD Rome 7742
128 cores total,
2.25 GHz(base), 3.4 GHz(max boost)
システムメモリ 1 TB
Network
8x Single-Port Mellanox ConnectX-6 VPI
200Gb/s HDR InfiniBand
1x Dual-Port Mellanox ConnectX-6 VPI
10/25/50/100/200Gb/s Ethernet
ストレージ
OS: 1.92TB M.2 NVME drives × 2
Internal Storage: 15TB
(4x 3.84TB) U.2 NVME drives
ソフトウェア  Ubuntu Linux OS
重量 123kg
大きさ 897.1 D x 482.3 W x 264.0 H  [mm]
運用温度範囲 5 ℃ – 30 ℃
  contact
trending_flat