NVIDIA TITAN Xでnvidia-smiの結果
2016年8月21日日曜日 15時59分30秒 Asia/Tokyo
NVIDIA TITAN Xでnvidia-smiの結果
Read MoreNVIDIA GeForce GTX 1080でnvidia-smiの結果
2016年8月21日日曜日 15時59分30秒 Asia/Tokyo
NVIDIA GeForce GTX 1080でnvidia-smiの結果
Read MoreNVIDIA TITAN X DeviceQuery
2016年8月21日日曜日 15時54分03秒 Asia/Tokyo
NVIDIA TITAN XでのdeviceQueryの結果
Read MoreOpenMPIで別ノードの環境変数をセットするには
2016年2月17日水曜日 16時05分57秒 Asia/Tokyo
2ノード以上を使ってOpenMPIのプログラムを実行する場合、mpirunを実行するノードで実行用にセットされた環境変数を、別のノードでもセットする必要があります。例えばhybrid実行をする場合のOMP_NUM_THREADSがそれに当たります。mpirunにはそのためのオプションが用意されています。
Read MoreOpenMPIとOpenMPのhybrid実行でのmustオプション
2016年2月17日水曜日 10時03分06秒 Asia/Tokyo
OpenMPIとOpenMPのhybrid実行では必ず指定しなければいけないオプションがあります。指定しないと、計算時間が何倍にも増えてしまいます(OpenMPI v1.10.1辺の場合)。例えばIntel Xeon E5-2697v3が2CPUのコンピュータで2CPU間はMPIで並列、CPU内はOpenMPで並列する、2プロセス、各プロセス14スレッドの実行は
mpirun -np 2 -x OMP_NUM_THREADS=14 program
とすればよさそうですがそれではうまくいきません。
sshでrootのloginを禁止するには
2016年2月17日水曜日 7時52分38秒 Asia/Tokyo
社外や学外からsshでlogin可能なネットワークに接続されるコンピュータでは、sshを使ったrootでのloginは禁止に設定しないと非常に危険です。なぜ危険かはless /var/log/secureなどとしてloginの試みの記録をご覧になってみるとすぐにわかります(/var/log/secureはrootでないと見ることができません)。
Read Moreインテル® Xeon® プロセッサー E5-2600 v3 ファミリー比較
2016年2月13日土曜日 10時35分17秒 Asia/Tokyo
インテル® Xeon® プロセッサー E5-2600 v3 ファミリー(2014年9月8日リリース)
プロセッサー・ ナンバー | コア数 | 動作周波数 | AVX時 動作周波数 | Last Level Cache | QPIリンク速度 | DDR4周波数 | TDP | 1CPUのピーク性能 (倍精度) |
---|---|---|---|---|---|---|---|---|
E5-2699 v3 | 18 | 2.3GHz | 1.9GHz | 45MB | 9.6GT/s | 2133 / 1866 / 1600 | 145W | 547.2Gflops |
E5-2698 v3 | 16 | 2.3GHz | 1.9GHz | 40MB | 9.6GT/s | 2133 / 1866 / 1600 | 135W | 486.4Gflops |
E5-2697 v3 | 14 | 2.6GHz | 2.2GHz | 35MB | 9.6GT/s | 2133 / 1866 / 1600 | 145W | 492.8Gflops |
E5-2695 v3 | 2.3GHz | 1.9GHz | 35MB | 9.6GT/s | 2133 / 1866 / 1600 | 120W | 425.6Gflops | |
E5-2683 v3 | 2.0GHz | 1.7GHz | 35MB | 9.6GT/s | 2133 / 1866 / 1600 | 120W | 380.8Gflops | |
E5-2690 v3 | 12 | 2.6GHz | 2.3GHz | 30MB | 9.6GT/s | 2133 / 1866 / 1600 | 135W | 441.6Gflops |
E5-2680 v3 | 2.5GHz | 2.1GHz | 30MB | 9.6GT/s | 2133 / 1866 / 1600 | 120W | 403.2Gflops | |
E5-2670 v3 | 2.3GHz | 2.0GHz | 30MB | 9.6GT/s | 2133 / 1866 / 1600 | 120W | 384.0Gflops | |
E5-2687W v3 | 10 | 3.1GHz | 2.7GHz | 25MB | 9.6GT/s | 2133 / 1866 / 1600 | 160W | 432.0Gflops |
E5-2660 v3 | 2.6GHz | 2.2GHz | 25MB | 9.6GT/s | 2133 / 1866 / 1600 | 105W | 352.0Gflops | |
E5-2650 v3 | 2.3GHz | 2.0GHz | 25MB | 9.6GT/s | 2133 / 1866 / 1600 | 105W | 320.0Gflops | |
E5-2667 v3 | 8 | 3.2GHz | 2.7GHz | 20MB | 9.6GT/s | 2133 / 1866 / 1600 | 135W | 345.6Gflops |
E5-2640 v3 | 2.6GHz | 2.2GHz | 20MB | 8.0GT/s | 1866 / 1600 | 90W | 281.6Gflops | |
E5-2630 v3 | 2.4GHz | 2.1GHz | 20MB | 8.0GT/s | 1866 / 1600 | 85W | 268.8Gflops | |
E5-2643 v3 | 6 | 3.4GHz | 2.9GHz | 20MB | 9.6GT/s | 2133 / 1866 / 1600 | 135W | 278.4Gflops |
E5-2620 v3 | 2.4GHz | 2.1GHz | 15MB | 8.0GT/s | 1866 / 1600 | 85W | 201.6Gflops | |
E5-2609 v3 | 1.9GHz | 1.9GHz | 15MB | 6.4GT/s | 1600 | 85W | 182.4Gflops | |
E5-2603 v3 | 1.6GHz | 1.3GHz | 15MB | 6.4GT/s | 1600 | 85W | 124.8Gflops | |
E5-2637 v3 | 4 | 3.5GHz | 3.2GHz | 15MB | 9.6GT/s | 2133 / 1866 / 1600 | 135W | 204.8Gflops |
E5-2623 v3 | 3.0GHz | 2.7GHz | 10MB | 8.0GT/s | 1866 / 1600 | 85W | 172.8Gflops |
InfinibandのSubnet Manager
2016年2月11日木曜日 13時07分43秒 Asia/Tokyo
Infinibandのスイッチには同じポート数で、Subnet Manager付きと無しの2種類が存在します。Subnet Manager付きの方がかなり高価格です。Subnet ManagerはInfinibandのネットワークの接続を調べてInfiniband機器の各ポートにLID(Local Identifier)と呼ばれる値を割り振ります。そしてLIDに基づいてルーティングテーブルを構築します。Subnet Managerは継続してネットワークの監視を行い、接続などが変化した場合、LIDとルーティングテーブルを再構築します。Subnet Managerがないスイッチを使っても、コンピューターにドライバーと一緒にインストールされる、ソフトウェアのSubnet Managerを使うことにより、同じことができます。ソフトウェアのSubnet Managerを使っても性能が低下することはありませんが、CPUのリソースを少し消費し続けます。ソフトウェアのSubnet Managerによるリソースの消費を抑えたい場合は、
/etc/init.d/opensmd start
の代わりに、
opensmd -o
とすることでLIDの割り振りとルーティングテーブルの構築を1回だけにすることができます
参考文献はこちら
4 Node FDR Infiniband Cluster 性能評価
2015年12月4日金曜日 17時53分31秒 Asia/Tokyo
4 Node FDR Infiniband Clusterの性能評価を行った。FDR Infinibandのデーター転送速度はQDR Infinibandの約1.7倍であることが確認された。メモリーアクセスが多いプログラムの場合、メモリー帯域不足が原因で1ノード当たり16コア程度で性能は頭打ちになる。4ノードの並列実行では1ノードの3.91倍の性能になった。
Read MoreBlogを作り直しました
2015年12月4日金曜日 14時55分44秒 Asia/Tokyo
過去のBlogにSPAMコメントが4万以上書き込まれていて、それを削除する過程で手順を誤り、過去のBlogも削除するハメに陥りました。最初からやり直します。過去のBlogへのリンクを辿ってきた方には申し訳ありません。同様の記事は徐々に追加していきます。よろしくお願いいたします。
SPAMメールを防ぐために、コメントはloginしないと書き込めないように設定しました。あらかじめご了承ください。