NVIDIA Tesla

  • HPC/高性能計算
  • AI/ディープラーニング
  • ハードウェア

グラフィック計算の高速化のために、グラフィックライブラリとともに提供されたGPUは、その用途を広げ、現在では汎用プログラムでも特に大規模で並列化が効果を発揮する計算領域での性能を高めた製品を提供しています。
AI・ディープラーニングの領域での適用に最適化され、開発用のフレームワークも含め、トータルソリューションを提供しています。
アルゴグラフィックスは、最高ランクのNVIDIA Compute DGX Elite パートナーに認定されています。

AIやHPCなどを高速化するGPUアクセラレータ
NVIDIA Tesla

NVIDIA Teslaを使用することで、HPCやハイパースケール データセンターのワークロードを高速化できます。データ サイエンティストや研究者は、AI・ディープラーニングのトレーニングを従来のCPUよりもはるかに高速にデータ解析できるようになります。さらに、従来よりも大型のシミュレーションを高速で実行するために必要なパワーを実現します。また、NVIDIA Teslaは仮想デスクトップ、アプリケーション、ワークステーションに最高のパフォーマンスを提供します。

NVIDIA A100

NVIDIA A100 Tensor コア GPUは、コア・アーキテクチャーに多くの改良を加えており、V100と比べてAI、HPC、データ分析のワークロードを大幅に高速化しています。新しいスパース性機能を使えば、算術演算スピードをさらに2倍にまで高めることができます。また、高帯域幅のHBM2メモリと、より大容量かつ高速のキャッシュを採用したことにより、さらに多くのCUDAコアとTensorコアにデータを送り込めるようになっています。

新しい第3世代NVLinkとPCIe Gen4は、マルチGPUシステム構成を高速化します。その他の多くの機能強化により、ハイパースケール・データセンターにおける強力なスケーリングや、クラウド・サービス・プロバイダー(CSP)のシステムとその顧客向けの堅牢なマルチインスタンスGPU(MIG)仮想化が可能になりました。また、NVIDIA Ampereアーキテクチャーは、レイテンシを短縮し、AIやHPCソフトウェアの複雑さを軽減しながら、プログラミングを容易にします。NVIDIA AmpereアーキテクチャーGPUはこれらの新機能をすべて提供しつつも、ワットあたりのパフォーマンスは前世代のNVIDIA Volta GPUより優れています。

NVIDIA A100 GPU は、大規模で複雑なワークロードだけでなく、多数の小規模なワークロードも効率的に高速化できるように設計されています。A100は、予測不可能なワークロードの需要に対応できるデータセンターの構築を可能にすると同時に、きめ細かなワークロードのプロビジョニング、GPU 利用率の向上、TCOの削減を実現します。

仕様 Tesla A100
GPUメモリ 40GB
GPUメモリ帯領域 1,555GB/s
相互接続 NVIDIA NVLink 600GB/s※
PCIe Gen4 64GB/s
マルチインスタンスGPU 最大7MIG@5GBのさまざまなインスタンス・サイズ
フォームファクタ― PCIe
最大TDP電力 250W
主要アプリケーション実効性能 90%

※HGX A100サーバー・ボード経由のSXM GPU、最大2GPUのNVLinkブリッジ経由のPCIe GPU

NVIDIA T4

NVIDIA T4は、HPC、ディープラーニングのトレーニングと推論、機械学習、データ分析、グラフィックスなどを加速します。新しいNVIDIA Turingアーキテクチャを基盤としたTesla T4は、スケールアウト・コンピューティング環境向けに最適化されており、多精度のTuring Tensorコアと新しいRTコアを備えています。NGCのコンテナー化された高速ソフトウェア スタックと組み合わせることで、Tesla T4は規模に応じたパフォーマンスを提供します。

仕様 Tesla T4
CUDAコア 2650
Tensorコア 320
単精度演算性能 8.1 TFLOPS
メモリ容量 16GB GDDR(メモリ帯域幅 320GB/秒)
ECC 対応

NVIDIA V100

NVIDIA V100は、AI、HPC、およびグラフィックスを高速化するために構築された世界最先端のデータセンター GPUです。最新のGPUアーキテクチャー「NVIDIA Volta」を搭載し、単一のGPUでCPU 100個分のパフォーマンスを実現します。

仕様 Tesla V100 PCle Tesla V100 SXM2
CUDAコア 5120
Tensorコア 640
倍精度演算性能 7 TFLOPS 7.8 TFLOPS
単精度演算性能 14 TFLOPS 15.7 TFLOPS
行列演算性能 112 TFLOPS 125 TFLOPS
メモリ容量 32/16GB HBM2(メモリ帯域幅 900GB/秒)
ECC 対応

製品やソリューションについて、
お気軽にお問い合わせください。