config
-
July 24, 2024 87
この記事は未完成です。完成まで少しお待ちください。
今年4月にリリースされたUbuntu 24.04 LTSを使いHPC Clusterを構築します。この記事を書くに至った理由は次のとおりです。
私のお客様でHPC Clusterをお使いの方は何人かいらっしゃいますが、その中にCentOS 6.3の時代にHPC Clusterを構築させていただいて、毎年ノードを追加しながら25ノードのクラスタまで成長した事例があります。今年度1ノードを追加する際にOSも最新のものにアップグレードすることになりました。現地でスクラッチからHPC Clusterを構築するのは、時間もかかりますし、予期しないトラブルへの対処も難しいことから、私の作業場で小規模なHPC Clusterを構築して動作検証を行い、そのOSクローンを行ったUSBを使い、現地でノード数を拡大するという手順を採用しました。この記事では私の作業場での小規模HPC Cluster構築の手順を実際の体験に基づいて記述していきます。この方法で構築した26台のHPC Clusterがお客様の大学で順調に稼働しており、日夜計算が流されています。HPC Clusterを構築したい読者の役に立つよう、最短手数でのクラスタ構築の解説を行います。
この記事では4台のPCを使ってHPC Clusterを構築します(HPC Cluster構成図参照)。
-
June 18, 2023 89GeForce RTX 4090をDeepLearningなどで並列動作させようとした場合、driverのバージョンを限定(525.105.17)しないとうまく動作しません。
-
September 28, 2020 10「14TBx12のディスクアレイとRAIDカードを接続しRAIDを構築し速度を計測する」動画(こちら)をアップしました。
-
September 14, 2020 1210GPU4Uサーバー(こちら)のGPUをラックマウントしたまま交換する動画(こちら)をアップしました。
-
September 14, 2020 13200V PDU(こちら)をラックマウントして10GPUサーバー(こちら)に電源ケーブルを配線する動画(こちら)をアップしました。
-
September 14, 2020 1210GPUサーバー(こちら)をラックにマウントする方法を動画にしました。 よろしければこちらをご覧ください。