GeForce GTX1080 と TITAN XのDeepLearning学習時間ベンチマーク
株式会社GDEPアドバンス(本社 東京都文京区/代表取締役:飯野匡道 )は、自社が販売するディープラーニング用ワークステーション「Deep Learning BOX®」において、世界最先端の GPU アーキテクチャ Pascal を採用した GeForce GTX 1080の搭載モデルの販売およびサポートを本日より開始いたしましました。
DeepLearning BOX®は日本で初めてディープラーニングGPUトレーニング・システムの「NVIDIA® DIGITS™ソフトウェア」をサポートしたオールインワンDeepLearning開発キットです。
深層学習研究において、高効率で高いパフォーマンスを発揮できるよう Caffe , Chainer、Theano, TensorFlow、CNTK、CUDA , CuDNN , cuda-convnet な どのDeepLearning関連フレームワークを整合性と動作確認がとれた状態でプレインストールされたディープラーニング専用モデルです。
■GEFORCE GTX 1080 Pascalアーキテクチャの性能について
GeForce GTX 1080は、NVIDIA社の新たなフラグシップとされたPascal™アーキテクチャを採用したデスクトップPC向けGPUです。Pascalは1ワットあたりのパフォーマンスが最高となるように設計されており、その結果、Maxwell世代のGPUに比べて電力効率が向上されGTX180は180Wと省電力設計されており、製造プロセスは16nmを採用し、GPUのクロックはベース1,607MHz、ブースト1,733MHzでCUDAコア数は2,560、メモリは世界で初めて採用するというGDDR5X 8GBを搭載これまでのGDDR5に比べ、有効メモリ帯域幅を1.7倍に高めることができ、速度は10Gbps、インターフェイスは256bit、バンド幅は320GB/sです。
■ベンチマーク Geforce GTX TITAN X vs Geforce GTX1080
テスト環境
H/W:DeepLearning BOX
Ubuntu 14.04 / cuda Ver:8.0rc / drver Ver:367.27 / cuDNN Ver:5
単精度性能比較 最大16%向上 by CUDA8.0rc Tool kit
前アーキテクチャー搭載TITANXと比較時、GTX1080の方が最新のアーキテクチャーによりTITANXと比較して性能向上が見受けられます。
デバイス・バンド幅 最大11%向上 by CUDA8.0rc Tool kitマルチGPU化の際に影響するデバイス間のバンド幅は改善されております。
■GTX TITAN X と GEFORCE GTX 1080 ディープラーニング学習時間の比較
上記の通りPascalアーキテクチャにより高い性能を実現したGTX1080ですが、しかしながら、ImageNet 2012 を利用したNVIDIA® DIGITS™学習時間においては、GTX1080は TITAN Xと比較して44%遅い結果となっております。これはメモリ容量が12GBから8GBへと、約2/3に減少したことによる処理速度の低下と考えられます。もちろん今度ドライバの改良による性能向上も期待できますが、GPUを用いたDeeplearningという側面だけを見ますと、現時点ではメモリ容量がその学習時間に大きく効いてくるという結論に至っています。
NVIDIA® DIGITS™3.0 学習時間比較時 by ImageNet 2012 by CUDA8.0rc Tool kit
そこで、GDEPアドバンスでは、従来通りGeforce TITAN X搭載モデルも選択肢の一つとして継続販売することと致しました。
但し、既に生産が完了しているGPUチップでもあり、あくまで弊社在庫分での受注製造とさせて頂きます。品切れの際はご容赦下さい。