21件~30件 (全40件)

件表示
ページ:
  1. 1
  2. 2
  3. 3
  4. 4

GeForce RTX 2080 Ti 10GPU Deep Learning ベンチマーク

2020年2月3日月曜日 2時29分53秒 Asia/Tokyo

NVIDIA GeForce RTX 2080 Tiには、前世代のGTX 1080 TiなどにはあったGPU間DMA転送機能がなくなったため、複数GPUでの並列学習で性能が出ないと言われています。実際はどうなのか、標準的なTensorFlowのtf_cnn_benchmarks.pyを1, 2, 4, 8, 10GPUで実行してみました(ダウンロードはここから)。テストしたネットワークはResNet50, ResNet152, Inception v3, Inception v4, VGG-16, Nasnetです。テストにはHPCDIY-XCLGPU10R4Sを使いました。スペックは、GPU:10*GeForce RTX 2080 Ti 11GB, CPU:2*Intel Xeon Gold 6230 (20C/40T 2.1G/3.9G 27.5MB 3UPI 1TB/2933M 125W) , Memory:12*32GB DDR4-2933 ECC REG DIMM, U.2 NVMeSSD:1*Samsung DC PM983, 1.92TB , NVMe PCIe3.0x4, V4 TLC VNAND, 2.5" (1.3 DWPD) です。

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

最新GPU複数枚で学習速度を比較 (2019/2/4)

2019年2月4日月曜日 6時26分40秒 Asia/Tokyo

TESLA V100 NVLink 2枚、TITAN RTX 4枚、RTX 2080 ti 4枚、GTX 1080 ti 4枚がたまたま揃ったので、Caffeでの学習時間を測定してみました。

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

GTX1080tiとTESLA P100をCaffeで比較してみた

2017年5月18日木曜日 5時47分00秒 Asia/Tokyo

GTX1080tiの結果も加えました(2017/5/18)

PascalアーキテクチャのTesla P100とNVIDIA TITAN Xを、Caffeでの学習時間で比較したいとずっと思っていたのですが、なかなかその機会がありませんでした。今回同時に試すことができましたので、その結果を報告します。

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

GTX1080tiを10枚でのnvidia-smiとdeviceQuery

2017年5月17日水曜日 19時41分17秒 Asia/Tokyo

10GPUマシンにGeforce GTX 1080tiを10枚実装し、nvidia-smiとdeviceQueryを実行した結果を掲載します。

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

NVIDIA TITAN XとTESLA P100をCaffeで比較してみた

2016年10月24日月曜日 9時47分55秒 Asia/Tokyo

PascalアーキテクチャのTesla P100とNVIDIA TITAN Xを、Caffeでの学習時間で比較したいとずっと思っていたのですが、なかなかその機会がありませんでした。今回同時に試すことができましたので、その結果を報告します。

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

Tesla P100 PCIe 16GB のCaffeでの学習時間(AlexNet)

2016年8月31日水曜日 16時23分15秒 Asia/Tokyo

Tesla P100 PCIe 16GB のCaffeでの学習時間(AlexNet)

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

NVIDIA TESLA P100 PCIe 16GB での nvidia-smi (2GPU)

2016年8月31日水曜日 9時31分52秒 Asia/Tokyo

NVIDIA TESLA P100 PCIe 16GB での nvidia-smi (2GPU)

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

NVIDIA TESLA P100 PCIe 16GB での DEVICEQUERY (2GPU)

2016年8月31日水曜日 8時55分02秒 Asia/Tokyo

NVIDIA TESLA P100 PCIe 16GB での DEVICEQUERY (2GPU)

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

Caffeの学習時間をGTX 1080とNVIDIA TITAN Xで比較する

2016年8月22日月曜日 9時36分26秒 Asia/Tokyo

ディープラーニングの画像分類の学習時間を、Caffeを使ってPascalアーキテクチャのGTX 1080とNVIDIA TITAN Xとで比較してみました。NVIDIA TITAN XはこれまでのGeForce GTX TITAN Xが1世代前のMaxwellアーキテクチャだったのに対し、Pascalアーキテクチャの最新世代に生まれ変わっています。名称のTITAN Xの前がGeForce GTXでなくNVIDIAに変わりました。ディープラーニングの学習時間は長時間かかるので、高性能なGPUでどれだけ学習時間が短縮されるかは是非知りたい事項です。

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

NVIDIA GeForce GTX 1080 でdeviceQuery

2016年8月21日日曜日 16時12分08秒 Asia/Tokyo

NVIDIA GeForce GTX 1080 でのdeviceQueryの結果

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

21件~30件 (全40件)

件表示
ページ:
  1. 1
  2. 2
  3. 3
  4. 4