研究課題/領域番号 |
16K14379
|
研究機関 | 東京大学 |
研究代表者 |
岡本 ゆかり (桂ゆかり) 東京大学, 大学院新領域創成科学研究科, 助教 (00553760)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | データベース / データ科学 / 材料インフォマティクス / 物性科学 / 熱電変換 / 機械学習 / 第一原理計算 |
研究実績の概要 |
本研究では,物性科学分野における膨大な文献に掲載された物性データを、グラフごと数値データとして登録した、新しいスタイルの物性データベースの構築を目指した。完全自動収集では得られる情報量が不足するため、手動収集のプロセスの効率化を目指した。 前年度に作成した試作システムを運用して得た知見を活かし、実用性とデータ収集速度を大幅に向上した新規システムStarrydata2を設計・開発した。このシステムでは、数万本の論文のタイトルや著者、出版社へのリンクなどの書誌情報を管理できる。そして、各論文の中でグラフとして示されていた物性データを、各ユーザーが簡単な手順でデジタル化して抽出し、本文から読み取った化学組成や作製条件ともに登録できる。このシステムを、インターネット上に無料で公開した。 鉛テルル系、ビスマステルル系、クラスレート系熱電材料について、約2400試料のゼーベック係数・電気伝導率・熱伝導率の温度依存性を収集し、それらのデータを一括ダウンロードできる環境を整えた。物性科学におけるこの規模の実験値データベースの構築は世界初である。同じ母物質に属する数百試料のデータを同時に表示すると、物質依存性を大きく凌駕する試料依存性が確認できた。このデータを熱電特性の第一原理計算結果と合わせて自動解析したところ、各試料の電子緩和時間が熱電特性の支配因子であると強く示唆された。さらに、このデータを機械学習したところ、化学組成から熱電特性を高い精度で予測することに成功した。これらは、実験データの収集・データベース化が材料開発を加速する実例だと言える。 今後は、Starrydata2の視覚的データ表示機能や検索機能を充実させて、さらに便利なデータベースとすることを目指す。また、熱電材料以外にもさまざまな物性科学分野のデータベースの立ち上げを目指し、本システムを物性科学に広く役立てることを目指す。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
当初の予定通り、初年度に構築した簡易的データ収集システムStarrydataを運用して、データ収集プロセスの問題点の洗い出しを行い、新規データ収集システムのStarrydata2を設計・開発した。論文情報管理システムに似せたことと、抽出した数値データのみを保存できる操作画面の開発、登録データの即時グラフ表示、自動単位変換機能により、データ登録の手順を大幅に簡略化できた。次年度の大規模運用に向けて、システム開発の準備が整ったと言える。 このシステムを用いて、過去の論文から熱電特性の実験データを収集したところ、手作業にも関わらず、1時間で平均553データ点という高速データ収集に成功した。今年度だけで、鉛テルル系、ビスマステルル系、クラスレート系、遷移金属シリサイドを合わせて2400試料以上の熱電材料試料の実験データを収集できた。この規模と情報量を持つ実験値データベースは、物性科学分野で初めてである。 もう1つの課題であったデータ応用に関しては、当初の期待以上の結果が得られたと言える。鉛テルル系熱電材料434試料の熱電特性の実験データ群は、強い試料依存性を示しており、熱電特性を1つの代表試料で示すという従来の解析の限界を強く示すものである。この実験データ群を用いて、第一原理計算結果に含まれる未知変数を算出したところ、熱電材料の変換効率の指標である無次元性能指数ZTが、電子緩和時間に強く影響されていることを発見した。この実験データ群を、ニューラルネットワークを用いて機械学習したところ、試料の化学組成のみから、ゼーベック係数などの熱電特性を予測することに成功した。これらは実験データと第一原理計算の融合や、機械学習の導入が、物性科学の新発見につながることを示す結果である。
|
今後の研究の推進方策 |
最終年度に残された作業は、Starrydata2の機能の改善と、大規模データ収集活動の開始、他の物性科学分野への展開の3つである。 Starrydata2の機能においては、多様な試料情報の収集と管理、データ検索・ダウンロード機能の改善、データ視覚化システムの充実を予定している。試料情報としては現在化学組成しか登録できていないが、作製方法などの任意の情報をユーザーが登録できる機能を構築することで、データを高次元化する。データを検索する条件を、より詳細に設定できるようにする。そして、多数の試料の実験データを、自動フィッティングすることにより、データ間の相互演算を可能にする。それらのデータを、直観的でインタラクティブな散布図として表示させる機能を開発する。 今年度は、日本熱電学会を通して大規模なデータ収集活動を開始する。全国の熱電材料の研究室から学生を募集して、謝金を提供してのデータ収集に取り組んでもらう。これに参加した学生は、データ収集作業を通じて、自分の研究分野に関する情報に触れながら、アルバイト料を得ることができる。こうして集めたデータを、各学生の研究に応用し、データ応用の実例も増やしていく。こうして熱電特性データベースを大規模化するとともに、この過程で得られたノウハウを、全国規模のデータ収集活動の実践例としてまとめる。 最後に、熱電特性以外の物性科学分野のデータベースを立ち上げる。Starrydata2はすでに、熱電特性以外のデータベースを内包できる形で開発してある。そこで、論文からの実験値データベースの作成に興味を持った外部の研究者を募集する。そして、これまでのデータ収集ノウハウを共有し、大規模なデータ収集活動に取り組んでもらう予定である。
|
次年度使用額が生じた理由 |
当初は謝金を用いたデータ収集作業を予定していたが、今回データ収集活動を行ったメンバーは雇用上の理由により謝金を受け取れなかったため、謝金を使用しなかった。このために生じた次年度使用額は次年度のデータ収集活動の謝金として利用する予定である。
|