Geforce RTX3090/3080/3070 について

2020.10.02 ホット

Geforce RTX 3090/3080/3070 について

ー 11月9日最新情報 -
Geforce RTX3080/3090のベンチマークを取得しました。

We got a benchmark about Geforce RTX3080/RTX3090.

ー 10月2日最新情報 -
GeForce RTX 3000シリーズ での Deep Learningフレームワーク検証に関する報告です。
Pytorch-1.6.0にcuda-11.1 + cudnn-8.0.4の正常動作を確認しました。
ソースコードに3行ほど簡単な修正を入れる必要がありましたが、ユニットテストでVolta世代や, A100と同程度にパスします。Tensorflow-2.3.0はどうもビルドシステムのbazel/3.1.0のがcuda-11.1をうまくハンドリングできないように見えるエラーでビルドすることができません。
恐らくTensorflow-2.4.0 + bazelのもう少し上のバージョンで修正されるのではないかと思われます。
引き続き性能検証行っていますが、続報をお待ちください。

GeForce RTX 3080 has been tested with Deep Learning Frameworks.We have successfully built Pytorch-1.6.0 with cuda-11.1 and cudnn-8.0.4 support enabled.
Modifying three lines of source codes was necessary, however otherwise it was quite straight forward.
We have verified the major functionalities by running unit tests, and it resulted in almost the same
success ratio as to when executed on Volta generation and A100 GPUs.Tensorflow on the other hand was not built successfully so far.
It looks like the build system 'bazel-3.1.0' cannot handle cuda-11.1, yet, and work arounding the
problem was not that simple, we gave up building the binary at the moment.
It is likely that we need to wait for a new Tensorflow and/or Bazel release.
We will wait and see.Performance evaluation results will follow shortly.


ー 9月30日最新情報 -
9月30日  cuDNN 8.0.4 がリリース されました。株式会社ジーデップ・アドバンスでは Geforce RTX3000 シリーズ上での各種フレームワークの動作を検証中です。結果が分かり次第このページでご案内させて頂きます。


ー 9月25日最新情報 -

9月24日 CUDA11.1がリリース されました。これによりGeforce RTX3000シリーズでCUDAが動作可能になります。但し、対応するcuDNNの動作確認が取れておりませんので Deeplearningでのご利用においては Tensorflow, Pytorch などメジャーなフレームワークの安定動作の確認がまだとれておりません。
そのため ジーデップ・アドバンスの Geforce RTX 3000シリーズ搭載モデル は、とりあえずDocker環境とSingularity、Slurmをインストールした状態で販売を開始致しますので、対応するフレームワークがNGCにアップされた時点でお客様ご自身でコンテナイメージの入手をお願い致します。
Geforce3000シリーズ 搭載モデル(9月25日時点)
DeepLearning BOX/Alpha
DeepLearning BOX II
GWS-TR3/2G
※安定した開発環境をご希望のお客様は G-Works がインストールされた従来のGPU (2080Ti / TITAN RTX / Quadro RTX) の構成をお勧めします。

2020年9月2日午前1時 Ampereアーキテクチャを搭載した新しいGeforceシリーズのGPU「Geforce RTX3090/3080/3070」が発表になりました。

Geforce3070-3090

Samsung 8nm製造プロセスとPAM4

製造プロセスは先に発売されているNVIDIA A100のTSMC 7nm とは異なりSumsung製の8nm、トランジスタ数は280億となります。トップビンのRTX 3090とその下のレンジのRTX3080は世界で初めてMicron社製のGDDR6Xを搭載。1サイクルで4値パルス振幅変調可能なPAM4を採用しより高速化なメモリアクセスを実現しています。また今回からPCI Express Gen4対応となっています。

Samsung8nm

増強されたCUDAコアとTensorコア

今回発売されたGeforce RTX各GPUの仕様を以下にまとめてみました。12nmから8nmとなり集積率が上がった分当然CUDAコア、Tensorコアの性能は増強されています。Tensorコアの数は減っていますが性能は実質Volta比2倍に向上しており、VoltaやTuring では16×16(1クロックで64並列演算のコア性能)でしたが、Ampereでは16x32(1クロックで混合精度の積和算を256並列演算が可能)となっています。2080_TITAN_3070_3080_3090

 

Deeplearningでの利用について

新しいGeforce RTX3090/3080/3070 はご覧の通りFP32性能やTensor Perf FP16性能が向上しており、GDDR6XメモリやGen4など強化されたハードウェア性能から、かなりの学習速度の向上が見込めます。各カードの発売予定は RTX3090は9月24日、3080は9月17日、RTX3070は10月(いずれも北米時間)となっています。ジーデップ・アドバンスでも事前検証を行い、対応モデルとベンチーマークを掲載するべく準備を進めています。バッチサイズの関係でお勧めはやはり Geforce RTX3090 となります。またメモリサイズは小さいものの Geforce RTX3070 も 2080Ti と比較すると抜群のコストパフォーマンスを実現しています。まずはこの2機種をメインにラインアップをご用意し、対応のCUDAバージョンやNGCイメージ、既存の当社モデルへのGPUカード差し替え、開発環境の再構築など順次ご案内して参りますので、ご検討のお客様は弊社までお気軽にお問い合わせ下さい。

注意すべきは消費電力で TITAN RTXと同じメモリサイズのGeforce RTX3090の場合は消費電力350Wと25%もアップします。これは消費電力だけでなく発熱に関しても同様の懸念があり、GPUは常にサーマルスロットリングによるクロックダウンで性能と安定動作をトレードオフにするという点と、同じく熱による故障率のアップという点に関しては残念ながら念頭に置いておかなければなりません。このクラスのGPUはBOMレベルでは各ベンダーの設計思想によるところが大きいので、ある程度の個体性能差があるのはやむを得ないとしても、コストパフォーマンスは抜群ですのでテスト利用や入門機としてご利用頂き、本格運用には NVIDIA A100搭載のエンタープライズ製品をご利用いただくことをお勧めします。

TOPへ