2022 Fiscal Year Research-status Report
マテリアルキュレーションのための物性間関係性データ作成・検索技術
Project/Area Number |
19K05287
|
Research Institution | National Institute for Materials Science |
Principal Investigator |
吉武 道子 国立研究開発法人物質・材料研究機構, 機能性材料研究拠点, 主席研究員 (70343837)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Keywords | 物性間の関係性 / 定量的関係 / 数式 / MathML |
Outline of Annual Research Achievements |
教科書的な専門書のPDFファイルをテキストデータに変換して、そこから様々な物性間の関係性を抽出して、物性間の関係性のネットワーク型データベースを作成してきた。その際には、物性の名前の文字情報を抽出していた。 教科書に記載された物性間の関係性の中には、関係性を数式で定量的に表現できるものもあり、関係性ネットワークデータベースの関係性を表すエッジに数式を属性として入力できると、つながっている物性の片方が変化したときにもう一方の物性の値がどのように変化するかを定量的に予測することができる。このように、関係性に定量性を導入すべく、専門書のPDFファイルをXML形式に変換し、XMLからMathML部分を抜き出すことで、数式部分を自動抽出するプログラムを作成した。このMathMLは表現MathMLで、数式の数学的意味を表しておらず、これを数学的意味を表す意味MathMLへ変換するプログラムを作成した。また、意味MathMLを使って、左辺の変数(関係性データベースでつながっている片方の物性)が右辺に入っている変数(つながっている物性のもう片方)により表現されている数式を、右辺に入っている変数が左辺に入っている変数で表現する数式に変換するプログラムを作成した。また、数式を抽出したXMLファイルにおいて数式の近辺の変数名を記述している文章を抜き出して、数式で使われている変数(dとか)が、例えば「密度」を表す、というような変数名と物性名の対応付けを行うプログラムを作成した。これにより、物性間の関係性に定量的な数式を紐づける技術が開発された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
定量的な関係性を、言語処理的に、プログラムにより自動的に教科書中の数式から抽出する技術が開発できた。
|
Strategy for Future Research Activity |
開発したプログラム群を整理して、研究成果の公表・普及を推進することと、教科書から抽出した関係性のうち、物性値のデータベースがあるものを使って、関係性の存在を事例としていろいろ提示し、有用性を検証すること。
|
Causes of Carryover |
研究成果をまとめて発表する機会が十分に得られなかったため、研究成果のまとめ・発表・普及に使用する予定。
|
Research Products
(3 results)