1万イベントでのCPU/GPU比較
- CPU 1 thread: 約392秒
- CPU 16 threads: 約31.5秒
- CPU 64 threads: 約17.4秒
- A100 1GPU OpenACC版: 約8.90秒
- CUDA検証版: 約2.87秒
HPC Code GPU Acceleration Assessment
公開論文、公開リポジトリ、ビルドログ、実行ログ、プロファイル結果、代表的な関数、最小再現コードなどをもとに、GPU化・高速化に向いた処理を調査します。必要な資料が揃う場合は、A100×4実機GPUサーバーでビルド・実行を確認し、通常5営業日で一次診断レポートをお送りします。
まずは公開情報・ログ・代表部分だけでも相談可能です。公開論文、公開リポジトリ、ビルドログ、実行ログ、プロファイル結果、代表的な関数、最小再現コードなど、提供可能な範囲から診断可否を確認できます。
未公開コードや研究データを扱う場合は、NDA締結や提供範囲の合意後に確認します。お預かりした情報は、診断可否確認、一次診断、PoC方針整理、見積・相談対応の目的で利用します。
AI-assisted code review
大規模なHPCアプリケーションでは、どこを直せば速くなるのかを人間が短時間で見つけるのは容易ではありません。関数、ループ、データ構造、ビルド設定、MPI/OpenMPの使い方、GPU化の有無、I/Oや通信のボトルネックなど、多くの要素が関係します。
ServerGearの無料診断では、提供可能な範囲のソースコード、公開リポジトリ、ビルド手順、実行ログ、プロファイル結果をAI支援も使いながら横断的に解析し、人間だけでは見落としやすい高速化候補やGPU化に向いた処理を調査します。そのうえで、A100×4実機GPUサーバー上でのビルド・実行確認と組み合わせて、次に試すべきPoC方針を整理します。
Before buying GPU servers
GPUサーバーのスペック表だけでは、お客様のHPCアプリがどれくらい速くなるかは分かりません。さらに、大規模なHPCコードでは、ボトルネックが単純な1か所にあるとは限りません。ソースコード全体、ビルド設定、実行条件、MPI/OpenMPの使い方、プロファイル結果を横断的に見る必要があります。そこでServerGearでは、AIによるコード・ログ解析とA100×4実機検証を組み合わせ、お客様のHPCコードがGPUで高速化できる可能性を一次診断します。
Free assessment
Diagnostic case
国内研究機関の研究者様からご相談いただいた、Fortranで実装された多数イベントを扱う確率的な軌道シミュレーションコードについて、A100 GPUサーバー上でGPU高速化無料診断を行いました。CPUでも実行できる一方、イベント数が増えると計算時間が大きく伸び、どこをGPU化すれば効果が出るかを見極めにくいことが課題でした。
AIを使ってソースコード、実行ログ、プロファイル結果、出力差分を読み解き、GPU計算部だけでなくCPU側の後処理や集計処理にもボトルネックがあることを仮説化しました。大規模イベントでは、メモリ配置、分割実行、集計方法まで含めて見る必要がありました。
高速化方針は、既存CPU版・OpenACC版・CUDA検証版を比較し、出力整合性を確認しながらGPU計算部とCPU側後処理の両方を見直すことでした。さらに、すべてのイベントを一度にGPUメモリへ載せるのではなく、一定サイズに分けて順番に処理し、最後に集計する方式を検証しました。
通常であれば、ソース理解、ビルド環境整備、比較実行、プロファイル、ボトルネック仮説、修正、再検証を順番に進めるため、数週間から数ヶ月かかることもあります。本事例では、AIを使ってログ・ソース・出力差分を並行して読み解き、仮説化と検証を短いサイクルで回すことで、5営業日程度でPoC結果として整理しました。
本内容は、この検証環境・条件下でのGPU高速化無料診断のPoC結果です。同じ実行時間を保証するものではなく、正式利用には追加検証が必要です。AIだけで高速化を完了したという意味ではなく、AIによる解析支援と人間の確認を組み合わせた検証です。
ソースコード、未公開研究内容、詳細ログ、詳細な出力データは公開しません。本番出力相当の確認および分布生成の本番相当確認は、今後の検証項目です。
Target applications
以下のような研究・技術計算コードを対象にします。
Timeline
必要な資料・ビルド手順・小規模テストデータをご提供いただいた後、通常5営業日以内に一次診断レポートをお送りします。コード規模、依存ライブラリ、ビルド環境、入力データの内容によっては、詳細検証に追加日数がかかる場合があります。
Scope
無料診断では、GPU化・高速化の可能性を判断するための一次調査を行います。
Important note
GPU化によって常に高速化できるとは限りません。本診断では、A100×4実機環境とAI解析を用いて、GPU化に向いている処理、想定されるボトルネック、必要な移植作業、推奨GPU構成を整理します。AIによる解析結果は、実機でのビルド・実行確認、ログ確認、必要に応じた人間のレビューと組み合わせて判断します。診断結果によっては、GPU化よりもCPU並列化、ライブラリ変更、ビルド設定、実行条件の見直しの方が有効と判断する場合もあります。
What to share
一次診断の前段階では、公開論文、公開リポジトリ、ビルドログ、実行ログ、プロファイル結果、代表的な関数、最小再現コードなど、提供可能な範囲で診断可否を確認できます。未公開コードや研究データの確認が必要な場合は、NDA締結や提供範囲の合意後に進めます。
一次診断を開始するには、対象ソースコードまたは代表部分、ビルド手順、小規模テストデータ、実行コマンド、現在の実行時間やログのご提供が必要です。これらが揃っている場合、通常5営業日以内に一次診断レポートをお送りします。資料が不足している場合は、まず診断可否の確認から行います。
Free assessment request
無料診断は対応件数に上限があります。対象コード・実行条件を確認のうえ、診断可能な案件から順に対応します。
未公開コード全体の提供は初回相談では必須ではありません。まずは公開情報・ログ・代表部分だけでもご相談ください。
Company and contact
サーバーギア合同会社の会社情報はトップページに掲載しています。
販売・見積・納品はサンウェイテクノロジー株式会社と連携して対応します。
HPCコードのGPU高速化診断は専用フォームからお申し込みください。