2011 Fiscal Year Research-status Report
データマイニングを用いた材料設計シミュレーション基盤システム
Project/Area Number |
23500138
|
Research Institution | Kanazawa Institute of Technology |
Principal Investigator |
林 亮子 金沢工業大学, 情報学部, 講師 (30303332)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | シミュレーション / データマイニング / 材料設計 |
Research Abstract |
いわゆるデータマイニングには様々な手法があり,1つの問題に複数の手法が適用可能であるとともに,手法により様々な性質があるので,目的にあった手法を使用するにはある程度トライアンドエラーを行い,既知の結果が目的にあう形式で実際に抽出できるかどうかを確認する必要がある.すでに複数ジョブを投入する基礎システムはあるため,今年度は結果出力を扱うような,以下の内容を実施した.1.試験データを用いて連関規則の適用を試みた.連関規則では,基本的に「成功」「失敗」のような,所属するカテゴリーを表す質的変数しか扱えないので,原子間距離のような量的変数を扱う場合は何らかの手法で質的変数に変換する必要がある.そこで,数値範囲を設定してそこに入る場合は1,入らない場合は0で表現するダミー変数を使用した.そして,原子の初期配置が安定構造から離れる割合と,終了条件を満たすまでの計算繰り返し回数を,想定したシナリオに従って人為的に作成し,ダミー変数で表現したデータを用意した.そのデータを用いて連関規則による規則を抽出した結果,おおむねシナリオを再現することができた.すなわち,実際のシミュレーション結果を用いても連関規則を用いて規則を抽出できる見通しが立った.2.材料設計シミュレーションで現在広く使われる量子化学シミュレーションプログラムの一つであるGaussian03を使用し,いくつかの小規模ジョブを実行した結果の実データを使用してデータマイニングを試みた.一般に分子には,化学式は同じでも構造が異なる異性体が複数存在するが,本研究では異性体を自動的に分類する必要がある.そこで3種類の異性体が存在していて分子の規模が小さいC2H2F2のデータを用意し,決定木による分類を試みた.その結果,用意したデータに対しては分類が完全に行えた.すなわち,異性体を自動的に分類する手法が少なくとも1つ得られた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本課題は連携研究者を置き,定期的に研究内容の打ち合わせを行いながら実施している.その際に,「目的とする材料にあうよう,シミュレーション結果を適切に処理できることを確認しなければ,目的とする材料の変更が必要である」ことを指摘されており,その指摘は妥当であると考えた.そのため,研究計画段階では2年目に実施する予定であった内容を前倒しで実施している.2年目の内容は,シミュレーション結果得られた分子構造に関してデータマイニングを行うことであり,もともと困難が予想されていて,本年度の研究結果から,実際にある程度の解決の見通しが得られているので,おおむね順調に進展していると考えている.
|
Strategy for Future Research Activity |
引き続き,実際の材料設計シミュレーションプログラムを用いて出力データの処理方法を検討する予定である.出力データの処理方法に関しては,具体的には以下の課題に取り組む予定である.1.分子列において,物理長を計算するプログラムを開発する.これは必ずしも文字通りの物理長とは限らず,分子のバウンディングボックス(分子の外側につくる最小の直方体)を決定し,そのサイズを評価して物理長に代える可能性がある.その場合でも,分子列の向きへの依存性がなくなるのが望ましいので,バウンディングボックスの決定方法を検討する必要がある.2.分子列において導電性を評価する指標を,連携研究者とともに検討する.これはどちらかというと材料科学の範囲であるが,シミュレーション結果データから計算できる物理量である必要がある.データのうち,どの数値を用いてどのように計算するのかを連携研究者と相談して決定する.3.分子列中で個々の分子の並び方および各分子の種類の識別手法を検討する.初期状態で設定した分子およびその中に含まれる原子はわかっているので,既知の分子サイズを用いて分子を識別し,その中の原子の並びから異性体の種類を特定することが考えられる.
|
Expenditure Plans for the Next FY Research Funding |
当該年度に残額が発生した理由:当初支給額が交付予定額の70%であり,残額の支給予定が未定であったこと,さらに次年度以降の支給も保証がない状態であったため,慎重な支出を行いながら研究遂行した.そのため,残額が発生した.次年度は以下の計画がある.1.量子計算プログラムGaussian03は現在新しいバージョンが利用可能であるため,バージョンアップを行う.2.試験的に小規模の分散計算環境を構築するため,計算サーバを1台購入する.3.なるべく材料科学などの関連分野の研究者から意見を戴くため,学会発表を行う.
|
Research Products
(2 results)