研究課題/領域番号 |
19K05287
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分29030:応用物理一般関連
|
研究機関 | 国立研究開発法人物質・材料研究機構 |
研究代表者 |
吉武 道子 国立研究開発法人物質・材料研究機構, 機能性材料研究拠点, 主席研究員 (70343837)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2019年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 物性間の関係性 / 定量的関係 / 数式 / MathML / 変数 / 自然言語処理 / 構文解析 / 深層学習 / 物性間関係性 / テキストデータ / 科学法則 / データベース |
研究開始時の研究の概要 |
材料情報を科学的原理の観点から分野俯瞰的に組み合わせて活用することで材料探索指針を得る手法=「マテリアルキュレーション」は、ある分野で常識とされてきたこと(必ずしも科学的根拠に基づくわけではない)に囚われず、広い視野にたって材料探索をすることを可能にする。本研究では、多くの研究開発者が利用して、狭い専門分野の常識や習慣に囚われずに材料探索を可能にする、ICT技術を活用した科学法則ナレッジグラフデータベース化のための基盤技術を研究開発する。
|
研究実績の概要 |
教科書的な専門書のPDFファイルをテキストデータに変換して、そこから様々な物性間の関係性を抽出して、物性間の関係性のネットワーク型データベースを作成してきた。その際には、物性の名前の文字情報を抽出していた。 教科書に記載された物性間の関係性の中には、関係性を数式で定量的に表現できるものもあり、関係性ネットワークデータベースの関係性を表すエッジに数式を属性として入力できると、つながっている物性の片方が変化したときにもう一方の物性の値がどのように変化するかを定量的に予測することができる。このように、関係性に定量性を導入すべく、専門書のPDFファイルをXML形式に変換し、XMLからMathML部分を抜き出すことで、数式部分を自動抽出するプログラムを作成した。このMathMLは表現MathMLで、数式の数学的意味を表しておらず、これを数学的意味を表す意味MathMLへ変換するプログラムを作成した。また、意味MathMLを使って、左辺の変数(関係性データベースでつながっている片方の物性)が右辺に入っている変数(つながっている物性のもう片方)により表現されている数式を、右辺に入っている変数が左辺に入っている変数で表現する数式に変換するプログラムを作成した。また、数式を抽出したXMLファイルにおいて数式の近辺の変数名を記述している文章を抜き出して、数式で使われている変数(dとか)が、例えば「密度」を表す、というような変数名と物性名の対応付けを行うプログラムを作成した。これにより、物性間の関係性に定量的な数式を紐づける技術が開発された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
定量的な関係性を、言語処理的に、プログラムにより自動的に教科書中の数式から抽出する技術が開発できた。
|
今後の研究の推進方策 |
開発したプログラム群を整理して、研究成果の公表・普及を推進することと、教科書から抽出した関係性のうち、物性値のデータベースがあるものを使って、関係性の存在を事例としていろいろ提示し、有用性を検証すること。
|