Evaluation
-
February 17, 2024 134
消費電力が最大級のgpu、RTX4090を4枚でgpu burnすると消費電力はどのくらいになるのかIPMIから確認してみました。
使用したマシンはSupermicroのSYS-741GE-TNRT、CPU: 2 * Intel Xeon Silver 4110T TDP 150W、Memory : 16 * 32GB DDR5-4800 ECC RDIMM、SSD: 960GB M.2 PCIe Gen4 x4 NVMe M.2 SSDです。
gpu_burnを実行してしばらくすると最初のscreenshotの状態で安定します。
-
June 25, 2023 23RTX 6000 Adaを1, 2, 4, GPU 使い、batch size を64, 128, 256, 512, 1024 と変化させてtf_cnn_benchmarks での学習速度を計測しました。 modelは、resnet50, inception3, vgg16, nasnet, resnet152, inception4です。 fp16とfp32の学習速度を計測しました。 以前測定したRTX A6000と比較してどれほど高速になったかを掲載します。Geforce RTX 4090との比較も掲載します。 GPUサーバー選択の参考になれば幸いです。
-
June 17, 2023 7GeForce RTX 4090を1, 2, 4 GPU 使い、batch size を64, 128, 256, 512と変化させてtf_cnn_benchmarks での学習速度を計測しました。RTX3090との比較も掲載してあります。 modelは、resnet50, inception3, vgg16, nasnet, resnet152, inception4です。 fp16とfp32の学習速度を計測しました。
-
June 10, 2023 21AMDの最新CPU、Genoaを搭載する2台のサーバーに200GbpsのInfinibandカードを搭載し、Infinibandクラスターを構築した。Infiniband Driverをインストールし、Subnet Managerを立ち上げ、最新のOpenMPIのソースコードをダウンロードしてbuild後、osu-micro-benchmarksで速度を計測してみた。ついでに、姫野ベンチで192コアでのベンチマークを撮ってみた。
-
January 26, 2023 10HPCDIY-ERMGPU8R4S(こちら)に GeForce RTX 4090 を 2 枚実装して、nvidia-smi と deviceQuery を実行してみました。
-
January 26, 2023 45GeForce RTX 4090 2台がテスト用に入荷してきたので、HPCDIY-ERMGPU8R4S に GeForce RTX 4090 を 2 枚実装して、gpu_burnを実行して、最大温度がどの程度のものか調べてみました。
-
July 25, 2021 21HPCDIY-ERMGPU8R4S(こちら)に A6000 を 8 枚実装して、nvidia-smi と deviceQuery を実行してみました。
-
July 24, 2021 7A6000を1, 2, 4, 8 GPU 使い、batch size を64, 128, 256, 512, 1024 と変化させてtf_cnn_benchmarks での学習速度を計測しました。 modelは、resnet50, inception3, vgg16, nasnet, resnet152, inception4です。 fp16とfp32の学習速度を計測しました。
-
July 24, 2021 8GeForce RTX 3090を1, 2, 4, 8 GPU 使い、batch size を64, 128, 256, 512と変化させてtf_cnn_benchmarks での学習速度を計測しました。 modelは、resnet50, inception3, vgg16, nasnet, resnet152, inception4です。 fp16とfp32の学習速度を計測しました。
-
July 12, 2021 13GeForceでは最強のRTX 3090と、NVIDIA RTX A6000とは価格差はかなりありますが(2021年7月12日現在、¥329,220 vs ¥589,850, お値引前の消費税抜き当サイト価格)、性能差はどの程度なのか、8GPU並列までの性能を、tf_cnn_benchmarksを使って比較してみました。