HPCDIYC Storeへようこそ

昇順

11-20 中 20

ページ:
  1. 1
  2. 2

NVIDIA TITAN Xでnvidia-smiの結果

2016年8月21日日曜日 15時59分30秒 Asia/Tokyo

NVIDIA TITAN Xでnvidia-smiの結果

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

NVIDIA GeForce GTX 1080でnvidia-smiの結果

2016年8月21日日曜日 15時59分30秒 Asia/Tokyo

NVIDIA GeForce GTX 1080でnvidia-smiの結果

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

NVIDIA TITAN X DeviceQuery

2016年8月21日日曜日 15時54分03秒 Asia/Tokyo

NVIDIA TITAN XでのdeviceQueryの結果

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

OpenMPIで別ノードの環境変数をセットするには

2016年2月17日水曜日 16時05分57秒 Asia/Tokyo

2ノード以上を使ってOpenMPIのプログラムを実行する場合、mpirunを実行するノードで実行用にセットされた環境変数を、別のノードでもセットする必要があります。例えばhybrid実行をする場合のOMP_NUM_THREADSがそれに当たります。mpirunにはそのためのオプションが用意されています。

Read More
コメント | Posted in OpenMPI By Kenetsu Hanabusa

OpenMPIとOpenMPのhybrid実行でのmustオプション

2016年2月17日水曜日 10時03分06秒 Asia/Tokyo

OpenMPIとOpenMPのhybrid実行では必ず指定しなければいけないオプションがあります。指定しないと、計算時間が何倍にも増えてしまいます(OpenMPI v1.10.1辺の場合)。例えばIntel Xeon E5-2697v3が2CPUのコンピュータで2CPU間はMPIで並列、CPU内はOpenMPで並列する、2プロセス、各プロセス14スレッドの実行は
mpirun -np 2 -x OMP_NUM_THREADS=14 program
とすればよさそうですがそれではうまくいきません。

Read More
コメント | Posted in OpenMPI By Kenetsu Hanabusa

sshでrootのloginを禁止するには

2016年2月17日水曜日 7時52分38秒 Asia/Tokyo

社外や学外からsshでlogin可能なネットワークに接続されるコンピュータでは、sshを使ったrootでのloginは禁止に設定しないと非常に危険です。なぜ危険かはless /var/log/secureなどとしてloginの試みの記録をご覧になってみるとすぐにわかります(/var/log/secureはrootでないと見ることができません)。

Read More

タグ:

コメント | Posted in Config By Kenetsu Hanabusa

インテル® Xeon® プロセッサー E5-2600 v3 ファミリー比較

2016年2月13日土曜日 10時35分17秒 Asia/Tokyo

インテル® Xeon® プロセッサー E5-2600 v3 ファミリー(2014年9月8日リリース)

プロセッサー・
ナンバー
コア数動作周波数AVX時
動作周波数
Last Level
Cache
QPIリンク速度DDR4周波数TDP1CPUのピーク性能
(倍精度)
E5-2699 v3 18 2.3GHz 1.9GHz 45MB 9.6GT/s 2133 / 1866 / 1600 145W 547.2Gflops
E5-2698 v3 16 2.3GHz 1.9GHz 40MB 9.6GT/s 2133 / 1866 / 1600 135W 486.4Gflops
E5-2697 v3 14 2.6GHz 2.2GHz 35MB 9.6GT/s 2133 / 1866 / 1600 145W 492.8Gflops
E5-2695 v3 2.3GHz 1.9GHz 35MB 9.6GT/s 2133 / 1866 / 1600 120W 425.6Gflops
E5-2683 v3 2.0GHz 1.7GHz 35MB 9.6GT/s 2133 / 1866 / 1600 120W 380.8Gflops
E5-2690 v3 12 2.6GHz 2.3GHz 30MB 9.6GT/s 2133 / 1866 / 1600 135W 441.6Gflops
E5-2680 v3 2.5GHz 2.1GHz 30MB 9.6GT/s 2133 / 1866 / 1600 120W 403.2Gflops
E5-2670 v3 2.3GHz 2.0GHz 30MB 9.6GT/s 2133 / 1866 / 1600 120W 384.0Gflops
E5-2687W v3 10 3.1GHz 2.7GHz 25MB 9.6GT/s 2133 / 1866 / 1600 160W 432.0Gflops
E5-2660 v3 2.6GHz 2.2GHz 25MB 9.6GT/s 2133 / 1866 / 1600 105W 352.0Gflops
E5-2650 v3 2.3GHz 2.0GHz 25MB 9.6GT/s 2133 / 1866 / 1600 105W 320.0Gflops
E5-2667 v3 8 3.2GHz 2.7GHz 20MB 9.6GT/s 2133 / 1866 / 1600 135W 345.6Gflops
E5-2640 v3 2.6GHz 2.2GHz 20MB 8.0GT/s 1866 / 1600 90W 281.6Gflops
E5-2630 v3 2.4GHz 2.1GHz 20MB 8.0GT/s 1866 / 1600 85W 268.8Gflops
E5-2643 v3 6 3.4GHz 2.9GHz 20MB 9.6GT/s 2133 / 1866 / 1600 135W 278.4Gflops
E5-2620 v3 2.4GHz 2.1GHz 15MB 8.0GT/s 1866 / 1600 85W 201.6Gflops
E5-2609 v3 1.9GHz 1.9GHz 15MB 6.4GT/s 1600 85W 182.4Gflops
E5-2603 v3 1.6GHz 1.3GHz 15MB 6.4GT/s 1600 85W 124.8Gflops
E5-2637 v3 4 3.5GHz 3.2GHz 15MB 9.6GT/s 2133 / 1866 / 1600 135W 204.8Gflops
E5-2623 v3 3.0GHz 2.7GHz 10MB 8.0GT/s 1866 / 1600 85W 172.8Gflops

コメント | Posted in Tutorial By Kenetsu Hanabusa

InfinibandのSubnet Manager

2016年2月11日木曜日 13時07分43秒 Asia/Tokyo

Infinibandのスイッチには同じポート数で、Subnet Manager付きと無しの2種類が存在します。Subnet Manager付きの方がかなり高価格です。Subnet ManagerはInfinibandのネットワークの接続を調べてInfiniband機器の各ポートにLID(Local Identifier)と呼ばれる値を割り振ります。そしてLIDに基づいてルーティングテーブルを構築します。Subnet Managerは継続してネットワークの監視を行い、接続などが変化した場合、LIDとルーティングテーブルを再構築します。Subnet Managerがないスイッチを使っても、コンピューターにドライバーと一緒にインストールされる、ソフトウェアのSubnet Managerを使うことにより、同じことができます。ソフトウェアのSubnet Managerを使っても性能が低下することはありませんが、CPUのリソースを少し消費し続けます。ソフトウェアのSubnet Managerによるリソースの消費を抑えたい場合は、

/etc/init.d/opensmd start

の代わりに、

opensmd -o

とすることでLIDの割り振りとルーティングテーブルの構築を1回だけにすることができます

参考文献はこちら

コメント | Posted in Tutorial By Kenetsu Hanabusa

4 Node FDR Infiniband Cluster 性能評価

2015年12月4日金曜日 17時53分31秒 Asia/Tokyo

4 Node FDR Infiniband Clusterの性能評価を行った。FDR Infinibandのデーター転送速度はQDR Infinibandの約1.7倍であることが確認された。メモリーアクセスが多いプログラムの場合、メモリー帯域不足が原因で1ノード当たり16コア程度で性能は頭打ちになる。4ノードの並列実行では1ノードの3.91倍の性能になった。

Read More
コメント | Posted in Evaluation By Kenetsu Hanabusa

Blogを作り直しました

2015年12月4日金曜日 14時55分44秒 Asia/Tokyo

過去のBlogにSPAMコメントが4万以上書き込まれていて、それを削除する過程で手順を誤り、過去のBlogも削除するハメに陥りました。最初からやり直します。過去のBlogへのリンクを辿ってきた方には申し訳ありません。同様の記事は徐々に追加していきます。よろしくお願いいたします。

SPAMメールを防ぐために、コメントはloginしないと書き込めないように設定しました。あらかじめご了承ください。

タグ:

コメント | Posted By Kenetsu Hanabusa
昇順

11-20 中 20

ページ:
  1. 1
  2. 2