Advance with you
株式会社ジーデップ・アドバンス

NVIDIA エリートパートナー

革新的AI処理力&ビジュアル性能

NVIDIA RTX PRO サーバー

次世代データセンターに最適化された
NVIDIA RTX PRO™ 6000 Blackwell Server Editionで
マルチワークロードをスマートに高速化

NVIDIA RTX PRO™ 6000
Blackwell Server Edition とは?

NVIDIA RTX PRO

複雑なタスクを、シンプルに解決

RTX PRO 6000 Blackwell Server Editionは、マルチGPUサーバー向けに設計された高性能GPUです。
パッシブ冷却を採用し、エネルギー効率とパフォーマンスのバランスを最適化。推論、ファインチューニング、分散レンダリング、HPC、仮想ワークステーションなど、エンタープライズデータセンターの多様なワークロードを強化します。パッシブ冷却による信頼性の高い設計が特徴で、データセンターの効率と持続可能性をサポート。強力なパフォーマンスと多様なコンピューティング機能でビジネスの生産性を高めます。

最新のRTX PRO 6000 Blackwell Server Editionで

エンタープライズ
AI ファクトリーを構築

AI ファクトリーは、生成 AI やシミュレーション、ロボティクス、デジタルツインなどの多様な研究開発・産業用途に対応し、
あらゆる AI ワークロードを高性能かつスケーラブルに処理できるよう設計された統合基盤です。

AIエージェント

AIエージェント

動画や画像の作成

動画や画像の作成

デジタルツイン

デジタルツイン

ゲノムと創薬開発

ゲノムと創薬開発

レコメンド

レコメンド

コンテンツ作成

コンテンツ作成

ロボティクス

ロボティクス

データサイエンスと解析

データサイエンス
と解析

ライブメディア

ライブメディア

バーチャルワークステーション

バーチャル
ワークス
テーション

ワークロードパフォーマンス

LLM推論
レコメンド
テキストから画像・動画へ
ゲノム
omniverse
レンダリングとグラフィックス

LLama3 70B 推論;8K/256、20 トークン/秒/ユーザー、2秒 FTL、8 GPU;RTX PRO 6000 (FP4) 対 L40S (FP8)

DLRM(20ms レイテンシ);サンプル数/秒;RTX PRO 6000 対 L40S (INT8)

Cosmos-1.0-Diffusion-7B-Text2World;2.5秒 720p ビデオ、画像数/秒、64 GPU;RTX PRO 6000 (FP4) 対 L40S (FP8)

Smith & Waterman(TCUPs);8ビット;RTX PRO 6000 対 L40S

LSS4搭載オムニバース;RTX PRO 6000 対 L40S

DLSS4搭載4Kゲーミング(RTX + AI);RTX PRO 6000 対 L40S

CTAイメージ

NVIDIA RTX PRO™
Blackwell Server Edition

マルチワークロードを
スマートに高速化

製品についてより詳しく知りたい方

RTX 6000Ada比の速度倍率

ベンチマークレポート

最適化により画像生成のように
複数の重い処理を連続して
行うタスク
で特に効果を発揮

GDEP
ベンチマークデータ

NVIDIA社提供の
ベンチマークデータ

モジュール別およびパイプライン全体における
推論速度の比較結果

GitHub 上で公開されているTensorRT 10.11 デモ環境(Diffusion Pipeline)をベースに、
NVIDIA RTX™ 6000AdaとNVIDIA RTX PRO™ 6000 Blackwell Workstation Editionを用いて画像生成における推論速度を
当社の環境で比較ベンチマークを取得しました。

その結果、画像1枚あたりの生成時間(Pipeline全体)がNVIDIA RTX™ 6000Adaと比較して、
7倍高速化されました。

※同シリーズの別型番のGPU(同一の消費電力、メモリ容量・ブロワータイプ)で取得した結果となります。

REPORT

RTX 6000Ada比のモジュール別速度倍率は約7倍高速化。

レポート
レポート

各種数値・表記の補足

※1 CLIP(ms)

入力されたテキストを画像生成用のベクトルに変換する前処理時間

※2 T5(ms)

プロンプトの補完・修正に使われる言語モデル処理時間

※3 Transformerx50(ms)

画像の潜在表現を生成する処理時間

※4 VAE-Dec(ms)

潜在ベクトルを画像に復元するデコード処理時間

※5 Throughput(image/s)

1秒間に何枚画像を出力できるかの指標

Pipeline(ms)

※1~5 すべてを合計した画像生成全体の処理時間

FP4において実力を発揮

Blackwell世代では、第5世代Tensor CoreによるFP4およびFP6演算が新たに正式サポートされました。
これにより、従来よりもはるかに低い精度での高速かつ効率的な推論が可能となりました。
さらに、TensorRT 10.0以降では、Blackwell世代以降のGPUにおいてFP4(軽量な演算精度)が
行列演算で正式にサポートされたため、推論処理全体の高速化が実現しています。
また、96GBのGDDR7メモリと1.8TB/sのメモリ帯域幅により、大規模な生成AIモデルでも安定して高速な処理が可能です。

画像1枚あたりの生成速度(Pipeline全体)は約7倍短縮
1秒間に生成できる画像枚数(Throughput)も約6.8倍増加
2.5倍前後の高速化

※この結果は2024年7月時点で入手可能なドライバーやCUDA、学習モデルの最新バージョンを用いたものであり、
今後ソフトウェアのバージョンアップ等により性能値が変化する場合がありますことをご了承下さい。

LLM推論とファインチューニング

前モデルL40Sと比較したRTX PRO 6000 Blackwell Server Editionの
小規模から中規模のモデルのパフォーマンス

特に高いパフォーマンスを発揮する領域

前モデルL40Sと比較したRTX PRO 6000 Blackwell Server Editionの
小規模から中規模のモデルのパフォーマンス(NVIDIA社提供)

特に高いパフォーマンスを発揮する領域

CTAイメージ

NVIDIA RTX PRO™
Blackwell Server Edition

マルチワークロードを
スマートに高速化

製品についてより詳しく知りたい方

RTX PRO 6000 Blackwell Server Editionの

パフォーマンスを
最大限発揮できるシステム

NVIDIA RTX PRO サーバー

NVIDIA RTX PRO 6000 Blackwell Server Edition を搭載した「NVIDIA RTX PROサーバー」は、最新のNVIDIA Blackwellアーキテクチャを使って、高いパフォーマンスとエネルギー効率を実現しあらゆるエンタープライズ ワークロードを加速。
AI技術を活用した工場(AIファクトリー)や、研究開発領域においての
さまざまなタスクを高いパフォーマンスで処理できる設計に最適化。

RTX PRO 6000 Server Editionと
他製品の構成・仕様比較

それぞれの仕様と強み、特徴の傾向など、検討時に押さえておきたい要素をまとめました。
製品選びの参考としてぜひご活用ください。

RTX PRO 6000 Server Edition HGX Server
搭載GPU RTX PRO 6000 Blackwell Server Edition HGX-B200
コスト
circle
triangle
GPUのカスタマイズ性
doublecircle

1枚ずつ予算や利用用途に合わせて増設が可能

PCI

x

8基固定

SXM

拡張性 NVIDIA BlueField®-3に対応

高速・広帯域ネットワークカード専用スロットを装備しており、マルチノードでのクラスター構築も可能。

NVSwitchテクノロジーを広範に採用し、優れたスケーラビリティを備えたGPUインターコネクトを提供。

データセンターレベルの大規模なマルチノードAIまたはHPCクラスターの構築に最適。

強み AI アクセラレーションワークロードでの多様な要件に対応可能。
PCI Express対応GPUのため、予算や目的に応じて
GPU搭載数を1基から8基まで選択可能。
クラウドやデータセンター環境での大規模AI処理や
マルチユーザー対応に圧倒的なパフォーマンスを発揮し、
スケーラビリティやネットワーク統合性にも優れている。

RTX PRO Server

GSV-IGRAS-4U8G

エンタープライズ向け
PCIe構成ユニバーサル
データセンタープラットフォーム

GSV-IGRAS-4U8G

NVIDIA MGX

2CPU

4U Rackmount

8GPU

NVMe

PCIe 5.0

DDR5

80 PLUS Titanium

製品の特長

  • インテル® Xeon® 6デュアルプロセッサーを2CPU(最大172コア)搭載
  • メモリ:最大4TB DDR5 6400MT/s ECC RDIMM (1DPC) / 5200 (2DPC)
  • 高密度4Uコンピューティングサーバーに2スロットGPUを8基搭載
  • 広帯域のPCIe 5.0とスケーラブルなNVMeストレージを最適化
    ※GPUあたり各600wまで対応
  • GPUに最適化した熱設計専用エアフロー
  • 簡単かつ柔軟に拡張可能MGXアーキテクチャ
    複数の構成を可能にするモジュール設計
  • 電源:冗長(3+1)合計4基の3200W 80 PLUS Titanium
GSV-IGRAS-4U8Gをオンラインで簡単見積り

RTX PRO Server

GSV-ATRSM-5U8G

5Uラック・高性能ファン10基設計により安定した
エアフローを維持
大規模HPCに最適なパフォーマンス

GSV-ATRSM-5U8G

LGA 4710

2CPU

5U Rackmount

8GPU

NVMe

PCIe 5.0

DDR5

80 PLUS Titanium

製品の特長

  • プロセッサー:AMD EPYC™ 9005シリーズデュアルプロセッサー(最大192コア)
  • メモリ:最大6TB DDR5 6400MT/s ECC RDIMM (1DPC)
  • 2スロットGPUを最大8基搭載
  • 最大24基のDIMM、6400 MT/s 6TB DDR5 を 1DPC でサポート
  • 9つのPCIe 5.0 x16 FHFLスロット
  • 2つのフロントホットスワップ対応2.5インチSATA
    + 4つのフロントホットスワップ対応2.5インチNVMeドライブベイ
  • 電源:冗長(3+3)合計6基の2700W Titanium Level (96%)
    ※電源ユニットの完全冗長化は構成とアプリケーション負荷に依存
GSV-IGRAS-5U8Gをオンラインで簡単見積り
trending_flat