ディープラーニングの画像分類の学習時間を、Caffeを使ってPascalアーキテクチャのGTX 1080とNVIDIA TITAN Xとで比較してみました。NVIDIA TITAN XはこれまでのGeForce GTX TITAN Xが1世代前のMaxwellアーキテクチャだったのに対し、Pascalアーキテクチャの最新世代に生まれ変わっています。名称のTITAN Xの前がGeForce GTXでなくNVIDIAに変わりました。ディープラーニングの学習時間は長時間かかるので、高性能なGPUでどれだけ学習時間が短縮されるかは是非知りたい事項です。

ubuntu14.04, NVIDIA Driver 367.35, cuda 8.0.27, cuDNN 5.1を使っています。CaffeのフロントエンドとしてDigitsを使っています。

画像分類のコンテスト等て使われているカラーで265x256サイズの学習用画像を手軽に用意したかったので、CIFAR10(カラー, 32x32)を、Digitsで256x256に解像度を上げて使いました。1epoch37,500枚の画像を30epoch(1,125,000枚)学習する時間を測定しました。

GTX 1080でAlexNetを使った場合、49分35秒(2,975秒)かかりました。378枚/秒の学習速度でした。
NVIDIA TITAN Xで同上の場合、37分56秒(2,276秒)かかり、494枚/秒の学習速度でした。
GTX 1080に比べてNVIDIA TITAN Xが1.31倍高速という結果になりました。

GTX 1080でGoogLeNetを使った場合、1時間8分(4,080秒)かかりました。276枚/秒の学習速度でした。
NVIDIA TITAN Xで同上の場合、47分47秒(2,867秒)かかり、392枚/秒の学習速度でした。
GTX 1080に比べてNVIDIA TITAN Xが1.42倍高速という結果になりました。

 GTX 1080のdeviceQueryの結果はこちらです。
NVIDIA TITAN XのdeviceQueryの結果はこちらです。

GTX 1080のコア数は2,560に対しNVIDIA TITAN Xは3,584と1.4倍に増えています。
クロックは1.734GHzから1.531GHzと0.88倍に少し遅くなっています。
コア数かけるクロックが演算性能の目安と考えると、4,440から5,487と1.23倍です。
メモリは容量が8GBから12GBへ、ビット数が256から384へとどちらも1.5倍になっています。メモリクロックは同じです。
GTX 1080で8GBを読み書きする時間で、NVIDIA TITAN Xなら12GBを読み書きできるということになります。
ディープラーニングの学習の速度比がコア数とクロックの演算性能比以上になっているのは、NVIDIA TITAN Xのメモリ性能によるところが大きいのでしょう。

2016年8月23日時点では、ディープラーニングの最高速度のGPUはNVIDIA TITAN Xと言えるかもしれません。

NVIDIA TITAN Xでディープラーニングならこちら

GTX 1080でも十分という方はこちら

AlexNet GTX1080    AlexNet NVIDIA TITAN X                GoogleNet GTX 1080                GoogleNet NVIDIA TITAN X

AlexNet(CIFAR10)GTX1080
AlexNet(CIFAR10)TITANX
GoogLeNet(CIFAR10)GTX1080
GoogLeNet(CIFAR10)TITANX