NVIDIA DGXシリーズ NVIDIA® DGX A100

NVIDIA DGX A100
new

DGX A100®はGPUに最新のAmpereアーキテクチャである A100 GPU8基を双方向600GB/Sの新世代NVSwitch で結合しています。CPUはAMDのRome EPYC7742 64コア を採用。ストレージはOS用として1.92TB NVMeSSDをRAID-1で搭載し冗長性を確保、さらにキャッシュ用として高速なU.2 NVNeをRAID-0構成で15TB(3.84TBx4基)の容量をオールフラッシュで提供。
外部インターコネクトはMellanox ConnectX®-6 HDR 200Gb/s のQSFP56ポー トを9基装備しスケールアップを強力にサポートする仕様です。
新GPU A100®の演算性能は、倍精度で19.5TFLOPSと従来のV100の約2.5倍、単精度は「TF32」と呼ばれるFP32とFP16のハイブリッド方式を採用しソフトウェアの改編の必要なく 312TFLOPSのスループットを実現、ディープラーニング推論性能は1,248TOPSといずれもV100の約20倍の演算性能を誇り、8基のA100®を搭載したDGX A100®のAI性能は1ノードで実に5PFLOPSに達します。
さらに、新たに追加された MIG(Multi instance gpu) 機能は A100 GPUを7つのインスタンスに分割して、メモリ、キャッシュ、コンピューティングコアなどのリソースを割り当てて利用できます。1台の DGX A100 で最大56のインスタンスを立ててフレキシブルにリソースを配分し、推論、学習、HPC といった複数のワークロードを互いのレイテンシとスループットに影響を与えることなく同時に実行することが可能になります。

 
 

 

NVIDIA A100 Tensor コア GPU による前例のない高速化をもって、世界で最も困難な計算に AI、データ分析、HPC (ハイ パフォーマンス コンピューティング) で挑むことができます。
 
​第 3 世代の NVIDIA Tensor コアにより性能を大幅に向上できるようになり、A100 GPU を効率的に数千までスケール アップできます。また、マルチインスタンス GPU を使用すれば、あらゆるサイズのワークフローを加速するために 7 つの小さな専用インスタンスとして割り当てることができます。






MIG を利用することで、DGX A100 の 8 つの A100 Gpu を最大 56 個の GPU インスタンスとして構成し、それぞれが独自の高帯域幅メモリ、キャッシュ、コンピューティング コアで完全分離できます。

 
​これにより管理者は、複数のワークフローに対してサービス品質 (QoS) が保証された GPU のサイズを適切に設定することができます。








DGX A100 の第 3 世代の NVIDIA® NVLink® は、GPU から GPU への直接帯域幅を 600 ギガバイト/秒 (GB/s) まで倍増します。

 
​これは PCIe Gen4 のほぼ 10 倍に相当します。DGX A100 には、前世代と比較して 2 倍の速度を可能にする次世代の NVIDIA NVSwitch™ も搭載されています。










DGX A100 には最新型の Mellanox ConnectX-6 VPI HDR InfiniBand /イーサネット アダプターが搭載されており、それぞれが 200 ギガバイト/秒 (GB/s) で動作し、大規模 AI ワークフロー用の高速ファブリックを形成します。

 




DGX A100 には、AI チューニングされた基本オペレーティング システム、必要となるすべてのシステム ソフトウェア、GPU 対応アプリケーション、トレーニング済みモデル、NGC™ の各種機能など、テスト済みで最適化された DGX ソフトウェア スタックが統合されています。




DGX A100 は、あらゆる主要なハードウェアとソフトウェア コンポーネントを保護するための自動暗号化ドライブ、署名付きソフトウェア コンテナー、安全な管理と監視といったマルチレイヤー アプローチを採用することで、AI 導入において最も信頼性の高いセキュリティ体制を実現します。



 

GPU
NVIDIA A100 Tensor Core GPUs × 8
GPUメモリ Total 320 GB
性能
5 petaFLOPS AI
10 petaOPS INT8
NVIDIA NVSwithes 6
最大消費電力 6.5 kW
CPU
Dual AMD Rome 7742
128 cores total,
2.25 GHz(base), 3.4 GHz(max boost)
システムメモリ 1 TB
Network
8x Single-Port Mellanox ConnectX-6 VPI
200Gb/s HDR InfiniBand
1x Dual-Port Mellanox ConnectX-6 VPI
10/25/50/100/200Gb/s Ethernet
ストレージ
OS: 1.92TB M.2 NVME drives × 2
Internal Storage: 15TB
(4x 3.84TB) U.2 NVME drives
ソフトウェア  OUbuntu Linux OS
重量 123kg
大きさ 897.1 D x 482.3 W x 264.0 H  [mm]
運用温度範囲 5 ℃ - 30 ℃
 
 
TOPへ

Linuxn対応について

[ 動作確認モデル ]

動作確認を行ったモデルには[ Linux対応 ]のマークを表示しています。

[ ディストリビューション ]

動作確認は標準のインストーラーを使用したインストールとX-windowの起動、及びLANチップの動作確認(DHCPでのインターネット接続)までを確認しました。
ディストリビューションはRed Hat Enterprise Linux とCentOSですが、ご要望によっては、FedraやUbuntuなど、その他ディストリビューションやバージョンについてもお気軽にご相談下さい。

[ 動作確認デバイス ]

ビデオ内蔵モデルについては内蔵ビデオチップを無効化し別途ビデオカード(nVIDIA社製)を搭載して動作確認を行っているモデルもあります。
また同様にオンボードLANチップではなく別途LANカード(Realtek社製、intel社製)を搭載し動作確認を行っているモデルもございます。

※音源(サウンド)の動作については弊社では確認を行っておりません。インストーラー標準のドライバーで動作する場合もございますが、Linuxのドライバー自体が無く動作認識しないチップもございます。ご理解下さい。

[ 設定、インストール ]

インテルやPGI等の有償コンパイラやMKL等のライブラリやツール類のインストール、各種サーバー構築、設定も承っています。お気軽にご相談下さい。