GeForce RTX 2080 Ti 10GPU Deep Learning ベンチマーク
2020年2月3日月曜日 2時29分53秒 Asia/Tokyo
NVIDIA GeForce RTX 2080 Tiには、前世代のGTX 1080 TiなどにはあったGPU間DMA転送機能がなくなったため、複数GPUでの並列学習で性能が出ないと言われています。実際はどうなのか、標準的なTensorFlowのtf_cnn_benchmarks.pyを1, 2, 4, 8, 10GPUで実行してみました(ダウンロードはここから)。テストしたネットワークはResNet50, ResNet152, Inception v3, Inception v4, VGG-16, Nasnetです。テストにはHPCDIY-XCLGPU10R4Sを使いました。スペックは、GPU:10*GeForce RTX 2080 Ti 11GB, CPU:2*Intel Xeon Gold 6230 (20C/40T 2.1G/3.9G 27.5MB 3UPI 1TB/2933M 125W) , Memory:12*32GB DDR4-2933 ECC REG DIMM, U.2 NVMeSSD:1*Samsung DC PM983, 1.92TB , NVMe PCIe3.0x4, V4 TLC VNAND, 2.5" (1.3 DWPD) です。
Read More最新GPU複数枚で学習速度を比較 (2019/2/4)
2019年2月4日月曜日 6時26分40秒 Asia/Tokyo
TESLA V100 NVLink 2枚、TITAN RTX 4枚、RTX 2080 ti 4枚、GTX 1080 ti 4枚がたまたま揃ったので、Caffeでの学習時間を測定してみました。
Read MoreGTX1080tiとTESLA P100をCaffeで比較してみた
2017年5月18日木曜日 5時47分00秒 Asia/Tokyo
GTX1080tiの結果も加えました(2017/5/18)
PascalアーキテクチャのTesla P100とNVIDIA TITAN Xを、Caffeでの学習時間で比較したいとずっと思っていたのですが、なかなかその機会がありませんでした。今回同時に試すことができましたので、その結果を報告します。
Read MoreGTX1080tiを10枚でのnvidia-smiとdeviceQuery
2017年5月17日水曜日 19時41分17秒 Asia/Tokyo
10GPUマシンにGeforce GTX 1080tiを10枚実装し、nvidia-smiとdeviceQueryを実行した結果を掲載します。
Read MoreNVIDIA TITAN XとTESLA P100をCaffeで比較してみた
2016年10月24日月曜日 9時47分55秒 Asia/Tokyo
PascalアーキテクチャのTesla P100とNVIDIA TITAN Xを、Caffeでの学習時間で比較したいとずっと思っていたのですが、なかなかその機会がありませんでした。今回同時に試すことができましたので、その結果を報告します。
Read MoreTesla P100 PCIe 16GB のCaffeでの学習時間(AlexNet)
2016年8月31日水曜日 16時23分15秒 Asia/Tokyo
Tesla P100 PCIe 16GB のCaffeでの学習時間(AlexNet)
Read MoreNVIDIA TESLA P100 PCIe 16GB での nvidia-smi (2GPU)
2016年8月31日水曜日 9時31分52秒 Asia/Tokyo
NVIDIA TESLA P100 PCIe 16GB での nvidia-smi (2GPU)
Read MoreNVIDIA TESLA P100 PCIe 16GB での DEVICEQUERY (2GPU)
2016年8月31日水曜日 8時55分02秒 Asia/Tokyo
NVIDIA TESLA P100 PCIe 16GB での DEVICEQUERY (2GPU)
Read MoreCaffeの学習時間をGTX 1080とNVIDIA TITAN Xで比較する
2016年8月22日月曜日 9時36分26秒 Asia/Tokyo
ディープラーニングの画像分類の学習時間を、Caffeを使ってPascalアーキテクチャのGTX 1080とNVIDIA TITAN Xとで比較してみました。NVIDIA TITAN XはこれまでのGeForce GTX TITAN Xが1世代前のMaxwellアーキテクチャだったのに対し、Pascalアーキテクチャの最新世代に生まれ変わっています。名称のTITAN Xの前がGeForce GTXでなくNVIDIAに変わりました。ディープラーニングの学習時間は長時間かかるので、高性能なGPUでどれだけ学習時間が短縮されるかは是非知りたい事項です。
Read MoreNVIDIA GeForce GTX 1080 でdeviceQuery
2016年8月21日日曜日 16時12分08秒 Asia/Tokyo
NVIDIA GeForce GTX 1080 でのdeviceQueryの結果
Read More