次世代ナノ統合                           シミュレーションソフトウェアの研究開発
次世代ナノ統合                           シミュレーションソフトウェアの研究開発
トップページ

実時間実空間電子ダイナミクス法プログラムの大規模並列化の現状と展望


(分子研)○野田真史、(分子研、総研大)信定克幸


1.はじめに
 数10nm程度までのナノ構造体における光誘起電子ダイナミクスを第一原理計算の観点から調べた研究はまだ報告されていない。そこで、本研究でこの様なナノ構造体光学応答の大規模計算に適した実時間実空間電子ダイナミクス法プログラムを開発することを目的とした。


2.計算方法
 これまで我々が開発してきた時間依存密度汎関数理論に基づく電子ダイナミクス法 [1-3]を、MPI及びOpenMPによるハイブリッド大規模並列化計算に向けて大幅拡張した。 具体的には、軌道並列とメッシュ並列を組み合わせた並列化を行い、基底状態計算にMultigrid 法の採用及びRMM-DIIS 法の採用等を行った。 また、ハートリーポテンシャルを求める際に用いられる多極子展開において、多極子の数を減らすことにより計算時間の短縮を試みた。 ピラジン-ナトリウムクラスター及びC60フラーレンを対象として、レーザー光誘起電子ダイナミクスの計算を行い、並列化効率の向上やアルゴリズムの更なる改良を行った。


3.プログラム開発の現状図1 ストロングスケーリングによるC60フラーレンのベンチマークのデータ。□は旧版プログラムの実測値、△は最新版プログラムの実測値、点線は最新版プログラムの実測値を外挿したものである。
 現状のプログラムの並列化率は99.964%であり、プログラムが並列化されている部分はほぼ100%であると言える。 次にC60フラーレンでのベンチマークの結果を図1に示す。 旧版プログラムでは4096コアで30%程度のスピードアップ率が得られている。 その後、最新版プログラムでベンチマークを行ったところ、1024コアで70%程度のスピードアップ率を得た。 この結果を外挿することにより、4096コアでは50%のスピードアップ率が、64000コアでは20%のスピードアップ率が得られることが期待される。 しかし、Flops値については1コアの計算で理論性能比がおよそ3%である。これは命令実行数に対するメモリアクセスの命令数の割合が50%程度占めているためである。 このボトルネックを解消するためにはメモリアクセスを減らす工夫する必要がある。 具体的には、現状では通信によるボトルネックが大きいメッシュ並列を改良し、配列の大きさを小さくすることや、Taylor展開による時間発展の方法を別の方法に差し替えることが考えられる。


【参考文献】
[1] K. Nobusada and K. Yabana, Phys. Rev. A, 75, 032518 (2007).
[2] T. Iwasa and K. Nobusada, Phys. Rev. A, 80, 043409 (2009).
[3] T. Iwasa and K. Nobusada, Phys. Rev. A 82, 043411 (2010).



*出典:ナノ統合第5回公開シンポジウム要旨集より。
 掲載に際しては信定克幸准教授のご了承を得ています。



信定研究室ホームページへのリンク:http://raphael.ims.ac.jp/

前へ先頭へトップページ

分子研マーク 分子科学研究所
次世代スーパーコンピュータプロジェクト ナノ統合拠点事務局
*このページ内の著作権はすべて分子科学研究所に属します。無断転載等は一切お断りいたします。