GPU計算で再現するLLZO 96原子 3×3×3 スーパーセル中のLi拡散経路 — Quantum ESPRESSO＋DeepMD＋LAMMPSによる3D可視化実測 —

Ken Hanabusa - October 25, 2025 55

H200 NVL × QE → DeepMD → LAMMPS による LLZO/Li イオン経路の 3D 可視化。AI-MDワークフロー＋ハイエンドGPU構成で材料シミュレーションを加速する実践事例を公開。

新着情報 GPU Quantum Espresso + DeepMD + LAMMPS

第2回「シリコンにフェムト秒レーザーで穴を開ける——GPUシミュレーション“予習編”」

Ken Hanabusa - August 25, 2025 13

第2回: シリコンにフェムト秒レーザーで穴を開ける——GPUシミュレーション“予習編”

要約：本番の「Si 薄膜 × フェムト秒レーザー」分子動力学を成功させるため、まず Quantum ESPRESSO で基礎データを収集しました。A100 80GB ×4 機での実測時間を整理し、どのケースが穴あけシミュレーションの何を支えるのかをストーリー仕立てで説明します。さらに、H200 NVL に置き換えた場合の時間短縮効果も展望します。

TL;DR：液体化と空孔形成が最重量級。A100×4 で 1 ステップ 70–95 秒、総時間は 2.8–3.7 時間級。Bulk/Strain は 1 ステップ 2–3 秒台で網羅向き。H200 NVL×4 なら概ね 1.7–2.3×（推定）短縮、8GPU でさらに半減レンジ。

なぜ“予習”が必要か：ケースの役割を物語で理解

① Bulk（バルク）＝「健康診断」

シリコン結晶の標準状態を決めます。これがないと、レーザー照射後の「異常」を正しく比較できません。

② Strain（ひずみ）＝「耐久テスト」

引張・圧縮で材料の応力–歪み特性を把握。レーザーによる瞬間的な膨張・収縮を理解する基盤となります。

③ Liquid（液体化）＝「氷が解ける瞬間の再現」

レーザー直下では Si が溶融します。液体状態を正しく記述できなければ、溶け拡がりや再凝固の描像は成立しません。計算負荷は最重量級。

④ Void（空孔）＝「割れ目のタネ」

欠陥や空孔は、穴あけの起点になります。局所的な応力集中や熱流入を理解するために必須です。

A100×4 実測まとめ（WALL 時間）

総時間ランキング

カテゴリ	ケース	総時間 (秒)	備考
最重量級	strain_extra/strain_extra_T600K	13260	ひずみ拡張大規模
重量級	voids/void_strain_+00pct_T300K	10500	空孔シミュレーション
重量級	voids/void_strain_+05pct_T300K	10080	空孔シミュレーション
液体	liquid/liquid_T3000K	1115.99	溶融 Si 高温
液体	liquid/liquid_T2000K	570.22	溶融 Si 中温

1ステップあたり時間ランキング

カテゴリ

新着情報 GPU Quantum Espresso + DeepMD + LAMMPS

第0回・予告編「GPUで拓く未来のシミュレーション —— シリコン薄膜 × フェムト秒レーザー」

Ken Hanabusa - August 24, 2025 25

【予告編】GPU で拓く未来のシミュレーション —— シリコン薄膜 × フェムト秒レーザー

要約：これまで困難だった「シリコン薄膜にフェムト秒レーザーを照射し、原子レベルで穴が形成される過程」を、DeepMD + LAMMPS + GPUサーバーという最新スタックで再現する試みが始まりました。この記事は本編シリーズの予告編です。

TL;DR：「現実には絶対に観測できない瞬間」を GPU によるシミュレーションで可視化。その迫力と実用価値をお届けします。

1. 誰も見たことのない現象を映像化する

シリコン薄膜にフェムト秒レーザーを照射すると、わずか数百フェムト秒の間に原子が弾き飛ばされ、穴が形成されます。
これまでの理論や実験では「起きる」ことは分かっても、その ダイナミクス を再現するのはほぼ不可能でした。

しかし今、GPU を活用した新しいアプローチで、その瞬間を映像化できるようになったのです。

2. これまでの壁 —— なぜ不可能だったのか？

第一原理分子動力学（DFT-MD）はサイズ・時間スケールの制約が大きすぎた
古典ポテンシャル（Tersoff 等）はレーザー誘起の非平衡現象を正しく記述できなかった

結果として「穴が空くシーン」を原子スケールで追いかけることは夢物語でした。

3. DeepMD が開いた突破口

Deep Potential Molecular Dynamics (DeepMD) は、第一原理計算（Quantum ESPRESSO）で生成したデータをディープラーニングで学習し、現実的な時間・サイズでの分子動力学を可能にします。

これにより、従来の 1,000 ステップ級の制約を超え、数百万ステップにわたるシミュレーションを GPU で実行できるようになりました。

4. 実用的価値とインパクト

半導体加工：EUV を超える次世代微細加工の理解
光応答材料：耐レーザー性や新規設計への応用
教育・可視化：研究室や展示で「原子の世界」を直感的に伝えられる

つまり「派手で人目を引く」だけでなく、「研究・産業的に意味がある」テーマなのです。

5. GPU サーバーの役割

今回の挑戦は A100 80GB ×4GPU サーバーを用いて進めています。
本編記事では、ここで得られた計算時間を基準に、H200 NVL 4GPU / 8GPU

新着情報 GPU Quantum Espresso + DeepMD + LAMMPS

第1回・入門編「Quantum ESPRESSO で何を計算すれば「シリコン薄膜 × フェムト秒レーザー」を再現できるのか？」

Ken Hanabusa - August 24, 2025 57

第1回・入門編：Quantum ESPRESSO で何を計算すれば「シリコン薄膜 × フェムト秒レーザー」を再現できるのか？

要約：この記事では、シリコン薄膜にフェムト秒レーザーを照射して穴を開けるシミュレーションを行うために、Quantum ESPRESSO（QE）で必要となる計算の種類と役割を整理します。「なぜこの計算が必要か」を理解することで、後続の DeepMD 学習や LAMMPS 実行の意味がつながります。

TL;DR：基礎構造 → 表面 → 欠陥 → 高温挙動。この順で QE のデータを揃えれば、レーザー照射のダイナミクスを DeepMD で学習し、LAMMPS によって原子レベルでの「穴あき」を再現できます。

1. バルク計算 —— シリコンの「教科書的」基準

最初に必要なのは シリコン結晶（ダイヤモンド構造）のバルク計算です。
ここで得られる格子定数・エネルギー・力は 全ての基準点になります。
たとえば、レーザーで加熱する前の「健全なシリコン」の姿を定義する役割です。

2. 薄膜（スラブ）計算 —— 表面を作る

次に 薄膜（スラブ）構造を計算します。
レーザー照射は基本的に「表面現象」なので、周期境界の中にシリコン薄膜＋真空層をつくり、表面の安定性や原子の動きやすさを評価します。

ここがなければ「穴が開く場所そのもの」がモデル化できません。

3. 欠陥・空孔計算 —— 穴のタネを仕込む

レーザーが当たった瞬間にすぐ原子が飛び出すわけではなく、欠陥や空孔が拡大していくことで穴が成長します。
そこで、シリコン結晶や薄膜に原子を抜いた状態を作り、「欠けたときの力学応答」を QE で計算しておきます。

4. 液体相（高温シリコン）計算 —— 溶ける過程

レーザーで数千 K に加熱されたシリコンは 一瞬で液体化します。
そのため、液体状態のシリコンを QE で分子動力学（MD）しておくことが重要です。
これにより「固体から液体へ移行する原子の動き」を学習データに反映できます。

5. 歪み（strain）計算 —— 引き延ばし・圧縮の効果

最後に strain（引張・圧縮）を加えた構造

新着情報技術解説

フェムト秒レーザーとは何か――シリコン薄膜に穴を開ける最先端技術

Ken Hanabusa - August 24, 2025 54

フェムト秒レーザーとは何か――シリコン薄膜に穴を開ける最先端技術

要約：フェムト秒レーザーは「1フェムト秒＝10^-15秒」という極短パルスの光を発する特殊なレーザーです。この超高速パルスにより、物質の熱拡散を抑えながら原子・分子レベルで精密加工が可能になります。従来のレーザーでは困難だった「シリコン薄膜に微細な穴を開ける」シナリオが現実の技術応用として見えてきました。

TL;DR：フェムト秒レーザーは「熱で溶かす」前に加工が終わる。だからシリコン薄膜にナノスケールの穴を正確に開けられる。

1. フェムト秒レーザーとは？

フェムト秒レーザーは極めて短い時間幅の光パルスを照射するレーザーで、代表的には「チタンサファイアレーザー」などが使われます。その特徴は：

パルス幅が極端に短い：10^-15秒単位
高ピーク強度：瞬間的に巨大なエネルギーを物質表面に集中
熱拡散を抑制：熱が広がる前に加工が完了するため、周辺に損傷を与えにくい

2. なぜシリコン薄膜に穴を開けるのにフェムト秒レーザーを使うのか

従来のナノ加工手法（ナノインプリントや電子線加工）には以下の課題がありました：

加工速度が遅い
熱による変形・欠陥が避けられない
大面積加工への展開が難しい

フェムト秒レーザーはこれを克服します。

熱影響が極小 → 周囲の結晶を壊さず穴を開けられる
高い再現性 → 同じ条件なら同じサイズの穴が形成可能
高スループット → レーザーパルスをアレイ化すれば大面積加工も視野に

3. 実用的価値：どんな応用があるのか

半導体微細加工：次世代トランジスタや光学デバイスの作製
フォトニクス：シリコンフォトニクス用のナノホールアレイ形成
バイオ応用：センサー基板やDNAチップへの加工

つまり「現実には目で見られない微細な加工」を可能にすることが、フェムト秒レーザーの実用的価値です。

4. シミュレーションでの挑戦とGPUの役割

ただし、このプロセスを「原子レベル」でシミュレーションするのは極めて難しい課題でした。従来の分子動力学や第一原理計算では計算コストが膨大で、ナノ秒スケールすら現実的に扱えませんでした。

ここで登場するのが DeepMD（機械学習ポテンシャル） と GPU サーバーです。Quantum ESPRESSO で生成したデータを DeepMD で学習し、LAMMPS

Evaluation 新着情報

「待ち時間」をハードで消す：Gaussian 使いにも効く QE 実測と、H200 NVL 141GB の現実的な伸びしろ

Ken Hanabusa - August 13, 2025 62

CPU で材料計算を回しているなら——いまが GPU への乗り換え時。A100 実測を踏まえた H200 NVL 141GB（PCIe）導入ガイド

要約：量子化学・固体計算を CPU で回している研究室では 1 本の SCF にも何十分もかかるのが日常です。この記事では Quantum ESPRESSO（QE）GPU 版を A100 80GB ×4 機で実測し、最短 47.35 秒を確認しました。比較用に CPU 64 MPI では 10分58.33秒（658.33 秒）で、約 13.9× 高速化です。さらに H200 NVL 141GB（PCIe）×4 なら、HBM 帯域と容量の伸びから おおむね 1.7〜2.3×（推定）短縮が期待できます。つまり「分」単位の計算が「十数秒」へ。

TL;DR：CPU 64MPI ≈ 10分58秒 → A100×4 ≈ 47秒（13.9×）。H200×4（推定）で 20〜30 秒台のレンジ。

なぜ今 GPU なのか（Gaussian ユーザーにも刺さる話）
テスト環境（読者マシン比較用スペック表）
ベンチマーク条件（QE / Au 表面「DEISA pw」）
結果：CPU vs GPU の実測比較と 1 / 2 / 4 GPU スケール
H200 NVL 141GB ×4 はどこまで短縮できるか（推定）
Gaussian ユーザーへの現実的な移行ライン
再現方法とスクリプト
どの構成を選ぶか：1 / 2 / 4 GPU の目安

1. なぜ今 GPU なのか（Gaussian ユーザーにも刺さる話）

Gaussian を長年お使いの方ほど CPU を積み増すことで凌いできましたが、表面・周期境界系では FFT/BLAS とメモリ帯域がボトルネックになりがちです。QE（平面波・擬ポテンシャル）はここを GPU に逃がせます。FFT、ハミルトニアン作用、密度生成など重い箇所を GPU に載せ、PCIe/NVLink の転送を抑える実装が成熟。結果として、A100×4 実測で「分」が「秒」になりました。

2. テスト環境（読者マシン比較用スペック表）

収集ディレクトリ：

Evaluation 新着情報 LLM

大規模言語モデルMistral-NeMoにGPT4o作成の問題を回答させ、GPT4oで採点してみた

Ken Hanabusa - September 05, 2024 99

前回の記事では、Mistral AI社が開発したLLMを小規模なマシンでChatbotにすることを紹介しました。

今回はこのChatbotにGPT4o作成の問題を入力し、出力された回答をGPT4oで採点してみました。

この記事を書く前に同じChatbotで推論の問題をいろいろ試していました（それに関しては別の記事で紹介します）。

推論以外にLLMに必要な機能をGPT4oに聞いてみました。

私の質問：LLMに必要な能力は推論の他に何がありますか

LLM（大規模言語モデル）に必要な能力は推論以外にもさまざまあります。以下に代表的な能力を挙げます。

### 1. **理解力（Comprehension）**
- モデルが自然言語を理解し、文脈や意図を正確に把握する能力です。例えば、曖昧な言葉や異なる意味を持つ言葉を正しく解釈することが求められます。この能力は、モデルが文脈に基づいて適切な返答を生成するために必要です。

### 2. **知識の保持（Knowledge Retention）**
- 広範なドメイン知識を持ち、それを元に正確な回答を提供できる能力です。LLMは事前に大量のテキストを学習するため、一般常識や専門知識を保持しておくことが求められます。事実に基づいた回答や、特定の分野に特化した知識を提供する際に重要です。

### 3. **言語生成力（Text Generation）**
- 与えられた指示に基づいて、自然で流暢なテキストを生成する能力です。文法や文脈を正しく理解し、適切な語彙や文体を使うことが必要です。例えば、ニュース記事の生成や、プログラムコードの自動生成など多様なタスクに活かされます。

### 4. **対話管理（Conversation Management）**
- 複数ターンの会話を正確に管理し、過去の会話履歴を適切に参照しながら、整合性のある返答を行う能力です。これにより、対話型システムとして一貫したやり取りが可能になります。

### 5. **創造力（Creativity）**
- 物語の生成や新しいアイデアの提案など、創造的なタスクにおいて重要な能力です。特に文章や詩、デザインのアイデア生成など、想像力を活かしたタスクに強いモデルが求められる場合があります。

### 6. **常識推論（Commonsense

Evaluation 新着情報 LLM

大規模言語モデルMistral-NeMoの推論能力を試す

Ken Hanabusa - September 05, 2024 94

GeForce RTX 4080 Super *2のマシンにMistran AI社のMistral-NeMoをインストールしてChatbotを動作させ、その能力を試しています。

今回は推論能力を試してみましょう。前回と同様、GPT4oで問題を作成し、採点もGPT4oで行いました。

難易度の高い推論問題をいくつか作成しました。これらの問題は、論理的思考や複雑な条件を必要とし、より高度な推論力を試すことができます。

### 1. **条件付き自己矛盾問題**
- **問題**: AさんとBさんは、正直者か嘘つきのどちらかです。Aさんは「Bさんは嘘をついている」と言い、Bさんは「Aさんは嘘をついている」と言いました。この場合、AさんとBさんのどちらが正直者で、どちらが嘘つきでしょうか？また、その理由を説明してください。

### 2. **多数派と少数派の推論問題**
- **問題**: 10人の友達がパーティーにいます。そのうち7人はいつも真実を話し、3人は常に嘘をつきます。Aさん、Bさん、Cさんの3人が次のように言いました。Aさんは「Bさんと私はどちらも真実を話している」と言い、Bさんは「Aさんは嘘をついている」と言い、Cさんは「Bさんは嘘をついている」と言いました。Aさん、Bさん、Cさんのうち、誰が真実を話していて、誰が嘘をついているかを推論してください。

### 3. **条件付き時系列推論問題**
- **問題**: ジョンは毎週月曜日と水曜日にジムに行きます。メアリーはジョンがジムに行かない日に買い物をします。サムはメアリーが買い物をしない日に映画館に行きます。次の火曜日、ジョン、メアリー、サムのうち、誰がどこに行くかを推論してください。

### 4. **相対的な時間の推論問題**
- **問題**: アリス、ボブ、キャロルの3人がいます。アリスはボブよりも30分早く家に帰り、キャロルはアリスよりも15分遅く家に帰ります。ボブは18時30分に家に帰りました。アリスとキャロルはそれぞれ何時に家に帰ったでしょうか？

### 5. **論理パズル問題**
- **問題**: 5人の友達が公園で遊んでいます。AさんはBさんよりも早く公園を出ましたが、Cさんよりは遅く出ました。DさんはCさんの後に出ましたが、Bさんの前に出ました。Eさんは全員の中で最も遅く公園を出ました。この5人が公園を出た順番を推論してください。

製品紹介 Evaluation 新着情報 LLM

GeForce RTX 4080 Super * 2のワークステーションにMIstral-NeMoをインストールしてChatを楽しむ

Ken Hanabusa - September 04, 2024 163

MIstral-NeMoはMIstral AI社が開発した12Bの大規模言語モデル（パラメーターの数が120億個）です。多言語で訓練されていますので、日本語でのやりとりも問題ありません。比較的入手が容易でそこまで高価でないGeForce RTX 4080 Superが２枚あれば、ダウンロードしてオフラインでChatを楽しむことができます。やりかたはここを見れば簡単です。

今回はこのマシンで、試しました。以下はChatのやりとりです。

Prompt: 日本の首都はどこですか？
日本の首都は東京です。東京は日本の政治、経済、文化の中心であり、世界でも最も人口の多い都市の一つです。東京は1868年に明治天皇が東京に遷都して以来、日本の首都として機能しています。
=====================
Prompt: 次の文を文法的に正しい日本語に修正してください。「明日、学校行く。」
「明日、学校に行きます。」と修正してください。文法的に正しい日本語としては、「に」を付けて動詞の連用形「行きます」を使うのが適切です。また、敬語を使う場合は「行きます」を「参ります」に変えて「明日、学校に参ります。」と表現することもできます。
=====================
Prompt: 「全てのAはBである。CはAである。CはBであるか？」この命題の正しさを説明してください。
この命題は、シンプル・プレミセとメジャープレミセから構成される三段論法の例です。正しい三段論法の形は次のようになります：

1. 全てのAはBである（メジャープレミセ）
2. CはAである（シンプル・プレミセ）
3. したがって、CはBである（コノセンス）

この命題では、メジャープレミセは「全てのAはBである」と表現されています。これは、全てのAに関してBが当てはまるという一般的な主張を表しています。シンプル・プレミセは「CはAである」と表現されています。これは、CがAの一例であることを表しています。コノセンスは「CはBであるか？」と表現されていますが、これは三段論法の結論を問い合わせているように見えます。

この命題の正しさを判断するためには、メジャープレミセとシンプル・プレミセが正しいかどうかを確認する必要があります。もしメジャープレミセとシンプル・プレミセが正しい場合、コノセンスも正しいことになります。例えば、「全ての人々は死す（メジャープレミセ）」「ソクラテスは人々である（シンプル・プレミセ）」から「ソクラテスは死す（コノセンス）」という三段論法が成り立つように、この命題も同様に正しいことになります。

Intel oneAPI hpc-cluster HowTo config 新着情報

今年４月にリリースされたubuntu 24.04 LTSを使いHPC Clusterを構築する

Ken Hanabusa - July 24, 2024 1231

この記事は未完成です。完成まで少しお待ちください。

今年４月にリリースされたUbuntu 24.04 LTSを使いHPC Clusterを構築します。この記事を書くに至った理由は次のとおりです。

私のお客様でHPC Clusterをお使いの方は何人かいらっしゃいますが、その中にCentOS 6.3の時代にHPC Clusterを構築させていただいて、毎年ノードを追加しながら25ノードのクラスタまで成長した事例があります。今年度１ノードを追加する際にOSも最新のものにアップグレードすることになりました。現地でスクラッチからHPC Clusterを構築するのは、時間もかかりますし、予期しないトラブルへの対処も難しいことから、私の作業場で小規模なHPC Clusterを構築して動作検証を行い、そのOSクローンを行ったUSBを使い、現地でノード数を拡大するという手順を採用しました。この記事では私の作業場での小規模HPC Cluster構築の手順を実際の体験に基づいて記述していきます。この方法で構築した26台のHPC Clusterがお客様の大学で順調に稼働しており、日夜計算が流されています。HPC Clusterを構築したい読者の役に立つよう、最短手数でのクラスタ構築の解説を行います。

この記事では４台のPCを使ってHPC Clusterを構築します(HPC Cluster構成図参照)。

ページ 2 - 新着情報

第2回: シリコンにフェムト秒レーザーで穴を開ける——GPUシミュレーション“予習編”

なぜ“予習”が必要か：ケースの役割を物語で理解

① Bulk（バルク）＝「健康診断」

② Strain（ひずみ）＝「耐久テスト」

③ Liquid（液体化）＝「氷が解ける瞬間の再現」

④ Void（空孔）＝「割れ目のタネ」

A100×4 実測まとめ（WALL 時間）

総時間ランキング

1ステップあたり時間ランキング

【予告編】GPU で拓く未来のシミュレーション —— シリコン薄膜 × フェムト秒レーザー

1. 誰も見たことのない現象を映像化する

2. これまでの壁 —— なぜ不可能だったのか？

3. DeepMD が開いた突破口

4. 実用的価値とインパクト

5. GPU サーバーの役割

第1回・入門編：Quantum ESPRESSO で何を計算すれば「シリコン薄膜 × フェムト秒レーザー」を再現できるのか？

目次

1. バルク計算 —— シリコンの「教科書的」基準

2. 薄膜（スラブ）計算 —— 表面を作る

3. 欠陥・空孔計算 —— 穴のタネを仕込む

4. 液体相（高温シリコン）計算 —— 溶ける過程

5. 歪み（strain）計算 —— 引き延ばし・圧縮の効果

フェムト秒レーザーとは何か――シリコン薄膜に穴を開ける最先端技術

1. フェムト秒レーザーとは？

2. なぜシリコン薄膜に穴を開けるのにフェムト秒レーザーを使うのか

3. 実用的価値：どんな応用があるのか

4. シミュレーションでの挑戦とGPUの役割

CPU で材料計算を回しているなら——いまが GPU への乗り換え時。A100 実測を踏まえた H200 NVL 141GB（PCIe）導入ガイド

目次

1. なぜ今 GPU なのか（Gaussian ユーザーにも刺さる話）

2. テスト環境（読者マシン比較用スペック表）