マテリアルキュレーションのための物性間関係性データ作成・検索技術
Project/Area Number |
19K05287
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 29030:Applied condensed matter physics-related
|
Research Institution | National Institute for Materials Science |
Principal Investigator |
吉武 道子 国立研究開発法人物質・材料研究機構, 機能性材料研究拠点, 主席研究員 (70343837)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2022: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2021: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2020: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2019: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
|
Keywords | 物性間の関係性 / 定量的関係 / 数式 / MathML / 変数 / 自然言語処理 / 構文解析 / 深層学習 / 物性間関係性 / テキストデータ / 科学法則 / データベース |
Outline of Research at the Start |
材料情報を科学的原理の観点から分野俯瞰的に組み合わせて活用することで材料探索指針を得る手法=「マテリアルキュレーション」は、ある分野で常識とされてきたこと(必ずしも科学的根拠に基づくわけではない)に囚われず、広い視野にたって材料探索をすることを可能にする。本研究では、多くの研究開発者が利用して、狭い専門分野の常識や習慣に囚われずに材料探索を可能にする、ICT技術を活用した科学法則ナレッジグラフデータベース化のための基盤技術を研究開発する。
|
Outline of Annual Research Achievements |
教科書的な専門書のPDFファイルをテキストデータに変換して、そこから様々な物性間の関係性を抽出して、物性間の関係性のネットワーク型データベースを作成してきた。その際には、物性の名前の文字情報を抽出していた。 教科書に記載された物性間の関係性の中には、関係性を数式で定量的に表現できるものもあり、関係性ネットワークデータベースの関係性を表すエッジに数式を属性として入力できると、つながっている物性の片方が変化したときにもう一方の物性の値がどのように変化するかを定量的に予測することができる。このように、関係性に定量性を導入すべく、専門書のPDFファイルをXML形式に変換し、XMLからMathML部分を抜き出すことで、数式部分を自動抽出するプログラムを作成した。このMathMLは表現MathMLで、数式の数学的意味を表しておらず、これを数学的意味を表す意味MathMLへ変換するプログラムを作成した。また、意味MathMLを使って、左辺の変数(関係性データベースでつながっている片方の物性)が右辺に入っている変数(つながっている物性のもう片方)により表現されている数式を、右辺に入っている変数が左辺に入っている変数で表現する数式に変換するプログラムを作成した。また、数式を抽出したXMLファイルにおいて数式の近辺の変数名を記述している文章を抜き出して、数式で使われている変数(dとか)が、例えば「密度」を表す、というような変数名と物性名の対応付けを行うプログラムを作成した。これにより、物性間の関係性に定量的な数式を紐づける技術が開発された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
定量的な関係性を、言語処理的に、プログラムにより自動的に教科書中の数式から抽出する技術が開発できた。
|
Strategy for Future Research Activity |
開発したプログラム群を整理して、研究成果の公表・普及を推進することと、教科書から抽出した関係性のうち、物性値のデータベースがあるものを使って、関係性の存在を事例としていろいろ提示し、有用性を検証すること。
|
Report
(4 results)
Research Products
(11 results)