Geforce RTX3090/3080/3070 について

2020.09.30 ホット

Geforce RTX 3090/3080/3070 について

ー 9月30日最新情報 -
9月30日  cuDNN 8.0.4 がリリース されました。株式会社ジーデップ・アドバンスでは Geforce RTX3000 シリーズ上での各種フレームワークの動作を検証中です。結果が分かり次第このページでご案内させて頂きます。


ー 9月25日最新情報 -

9月24日 CUDA11.1がリリース されました。これによりGeforce RTX3000シリーズでCUDAが動作可能になります。但し、対応するcuDNNの動作確認が取れておりませんので Deeplearningでのご利用においては Tensorflow, Pytorch などメジャーなフレームワークの安定動作の確認がまだとれておりません。
そのため ジーデップ・アドバンスの Geforce RTX 3000シリーズ搭載モデル は、とりあえずDocker環境とSingularity、Slurmをインストールした状態で販売を開始致しますので、対応するフレームワークがNGCにアップされた時点でお客様ご自身でコンテナイメージの入手をお願い致します。
Geforce3000シリーズ 搭載モデル(9月25日時点)
DeepLearning BOX/Alpha
DeepLearning BOX II
GWS-TR3/2G
※安定した開発環境をご希望のお客様は G-Works がインストールされた従来のGPU (2080Ti / TITAN RTX / Quadro RTX) の構成をお勧めします。

2020年9月2日午前1時 Ampereアーキテクチャを搭載した新しいGeforceシリーズのGPU「Geforce RTX3090/3080/3070」が発表になりました。

Geforce3070-3090

Samsung 8nm製造プロセスとPAM4

製造プロセスは先に発売されているNVIDIA A100のTSMC 7nm とは異なりSumsung製の8nm、トランジスタ数は280億となります。トップビンのRTX 3090とその下のレンジのRTX3080は世界で初めてMicron社製のGDDR6Xを搭載。1サイクルで4値パルス振幅変調可能なPAM4を採用しより高速化なメモリアクセスを実現しています。また今回からPCI Express Gen4対応となっています。

Samsung8nm

増強されたCUDAコアとTensorコア

今回発売されたGeforce RTX各GPUの仕様を以下にまとめてみました。12nmから8nmとなり集積率が上がった分当然CUDAコア、Tensorコアの性能は増強されています。Tensorコアの数は減っていますが性能は実質Volta比2倍に向上しており、VoltaやTuring では16×16(1クロックで64並列演算のコア性能)でしたが、Ampereでは16x32(1クロックで混合精度の積和算を256並列演算が可能)となっています。2080_TITAN_3070_3080_3090

 

Deeplearningでの利用について

新しいGeforce RTX3090/3080/3070 はご覧の通りFP32性能やTensor Perf FP16性能が向上しており、GDDR6XメモリやGen4など強化されたハードウェア性能から、かなりの学習速度の向上が見込めます。各カードの発売予定は RTX3090は9月24日、3080は9月17日、RTX3070は10月(いずれも北米時間)となっています。ジーデップ・アドバンスでも事前検証を行い、対応モデルとベンチーマークを掲載するべく準備を進めています。バッチサイズの関係でお勧めはやはり Geforce RTX3090 となります。またメモリサイズは小さいものの Geforce RTX3070 も 2080Ti と比較すると抜群のコストパフォーマンスを実現しています。まずはこの2機種をメインにラインアップをご用意し、対応のCUDAバージョンやNGCイメージ、既存の当社モデルへのGPUカード差し替え、開発環境の再構築など順次ご案内して参りますので、ご検討のお客様は弊社までお気軽にお問い合わせ下さい。

注意すべきは消費電力で TITAN RTXと同じメモリサイズのGeforce RTX3090の場合は消費電力350Wと25%もアップします。これは消費電力だけでなく発熱に関しても同様の懸念があり、GPUは常にサーマルスロットリングによるクロックダウンで性能と安定動作をトレードオフにするという点と、同じく熱による故障率のアップという点に関しては残念ながら念頭に置いておかなければなりません。このクラスのGPUはBOMレベルでは各ベンダーの設計思想によるところが大きいので、ある程度の個体性能差があるのはやむを得ないとしても、コストパフォーマンスは抜群ですのでテスト利用や入門機としてご利用頂き、本格運用には NVIDIA A100搭載のエンタープライズ製品をご利用いただくことをお勧めします。

TOPへ