4gpu

RTX4090を4枚でgpu burnした時の消費電力とSmart Power

Ken Hanabusa - February 17, 2024 550

消費電力が最大級のgpu、RTX4090を4枚でgpu burnすると消費電力はどのくらいになるのかIPMIから確認してみました。

使用したマシンはSupermicroのSYS-741GE-TNRT、CPU: 2 * Intel Xeon Silver 4110T TDP 150W、Memory : 16 * 32GB DDR5-4800 ECC RDIMM、SSD: 960GB M.2 PCIe Gen4 x4 NVMe M.2 SSDです。

gpu_burnを実行してしばらくすると最初のscreenshotの状態で安定します。

Evaluation 新着情報

RTX 6000 Ada 1, 2, 4 GPU vs RTX 4090 1, 2, 4 GPU vs A6000 1, 2, 4 GPU

- June 25, 2023 300

RTX 6000 Adaを1, 2, 4, GPU 使い、batch size を64, 128, 256, 512, 1024 と変化させてtf_cnn_benchmarks での学習速度を計測しました。 modelは、resnet50, inception3, vgg16, nasnet, resnet152, inception4です。 fp16とfp32の学習速度を計測しました。以前測定したRTX A6000と比較してどれほど高速になったかを掲載します。Geforce RTX 4090との比較も掲載します。 GPUサーバー選択の参考になれば幸いです。

HowTo config 新着情報

RTX4090をDeepLearningで並列動作可能にさせるcuda-driversのversion

- June 18, 2023 170

GeForce RTX 4090をDeepLearningなどで並列動作させようとした場合、driverのバージョンを限定（525.105.17）しないとうまく動作しません。

Evaluation

4GPU: GeForce RTX 3090 Deep Learning Benchmarks

- October 23, 2020 20

GeForce RTX 3090 の Deep Learning 学習での性能評価のため、HPCDIY-ERM1GPU4TS に４枚実装して、tensorflow で tf_cnn_benchmarks.py（ダウンロートはこちら）を実行してみました。 TensorFlow を新しくして再計測したらもっと高速になりました。その記事はこちら。 CPU: AMD EPYC Rome 7252 DP/UP 8C/16T 3.1G 64M 120W, Memory: 128GB, SSD: NVMe M.2 512GB NVIDIA Driver: 455.32.00 TensorFlow: nvcr.io/nvidia/tensorflow:20.09-tf1-py3

Evaluation