• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Research-status Report

文献データ収集支援システムの開発による大規模高次元物性データベースの構築

Research Project

Project/Area Number 16K14379
Research InstitutionThe University of Tokyo

Principal Investigator

岡本 ゆかり (桂ゆかり)  東京大学, 大学院新領域創成科学研究科, 助教 (00553760)

Project Period (FY) 2016-04-01 – 2019-03-31
Keywordsデータベース / データ科学 / 材料インフォマティクス / 物性科学 / 熱電変換 / 機械学習 / 第一原理計算
Outline of Annual Research Achievements

本研究では,物性科学分野における膨大な文献に掲載された物性データを、グラフごと数値データとして登録した、新しいスタイルの物性データベースの構築を目指した。完全自動収集では得られる情報量が不足するため、手動収集のプロセスの効率化を目指した。
前年度に作成した試作システムを運用して得た知見を活かし、実用性とデータ収集速度を大幅に向上した新規システムStarrydata2を設計・開発した。このシステムでは、数万本の論文のタイトルや著者、出版社へのリンクなどの書誌情報を管理できる。そして、各論文の中でグラフとして示されていた物性データを、各ユーザーが簡単な手順でデジタル化して抽出し、本文から読み取った化学組成や作製条件ともに登録できる。このシステムを、インターネット上に無料で公開した。
鉛テルル系、ビスマステルル系、クラスレート系熱電材料について、約2400試料のゼーベック係数・電気伝導率・熱伝導率の温度依存性を収集し、それらのデータを一括ダウンロードできる環境を整えた。物性科学におけるこの規模の実験値データベースの構築は世界初である。同じ母物質に属する数百試料のデータを同時に表示すると、物質依存性を大きく凌駕する試料依存性が確認できた。このデータを熱電特性の第一原理計算結果と合わせて自動解析したところ、各試料の電子緩和時間が熱電特性の支配因子であると強く示唆された。さらに、このデータを機械学習したところ、化学組成から熱電特性を高い精度で予測することに成功した。これらは、実験データの収集・データベース化が材料開発を加速する実例だと言える。
今後は、Starrydata2の視覚的データ表示機能や検索機能を充実させて、さらに便利なデータベースとすることを目指す。また、熱電材料以外にもさまざまな物性科学分野のデータベースの立ち上げを目指し、本システムを物性科学に広く役立てることを目指す。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

当初の予定通り、初年度に構築した簡易的データ収集システムStarrydataを運用して、データ収集プロセスの問題点の洗い出しを行い、新規データ収集システムのStarrydata2を設計・開発した。論文情報管理システムに似せたことと、抽出した数値データのみを保存できる操作画面の開発、登録データの即時グラフ表示、自動単位変換機能により、データ登録の手順を大幅に簡略化できた。次年度の大規模運用に向けて、システム開発の準備が整ったと言える。
このシステムを用いて、過去の論文から熱電特性の実験データを収集したところ、手作業にも関わらず、1時間で平均553データ点という高速データ収集に成功した。今年度だけで、鉛テルル系、ビスマステルル系、クラスレート系、遷移金属シリサイドを合わせて2400試料以上の熱電材料試料の実験データを収集できた。この規模と情報量を持つ実験値データベースは、物性科学分野で初めてである。
もう1つの課題であったデータ応用に関しては、当初の期待以上の結果が得られたと言える。鉛テルル系熱電材料434試料の熱電特性の実験データ群は、強い試料依存性を示しており、熱電特性を1つの代表試料で示すという従来の解析の限界を強く示すものである。この実験データ群を用いて、第一原理計算結果に含まれる未知変数を算出したところ、熱電材料の変換効率の指標である無次元性能指数ZTが、電子緩和時間に強く影響されていることを発見した。この実験データ群を、ニューラルネットワークを用いて機械学習したところ、試料の化学組成のみから、ゼーベック係数などの熱電特性を予測することに成功した。これらは実験データと第一原理計算の融合や、機械学習の導入が、物性科学の新発見につながることを示す結果である。

Strategy for Future Research Activity

最終年度に残された作業は、Starrydata2の機能の改善と、大規模データ収集活動の開始、他の物性科学分野への展開の3つである。
Starrydata2の機能においては、多様な試料情報の収集と管理、データ検索・ダウンロード機能の改善、データ視覚化システムの充実を予定している。試料情報としては現在化学組成しか登録できていないが、作製方法などの任意の情報をユーザーが登録できる機能を構築することで、データを高次元化する。データを検索する条件を、より詳細に設定できるようにする。そして、多数の試料の実験データを、自動フィッティングすることにより、データ間の相互演算を可能にする。それらのデータを、直観的でインタラクティブな散布図として表示させる機能を開発する。
今年度は、日本熱電学会を通して大規模なデータ収集活動を開始する。全国の熱電材料の研究室から学生を募集して、謝金を提供してのデータ収集に取り組んでもらう。これに参加した学生は、データ収集作業を通じて、自分の研究分野に関する情報に触れながら、アルバイト料を得ることができる。こうして集めたデータを、各学生の研究に応用し、データ応用の実例も増やしていく。こうして熱電特性データベースを大規模化するとともに、この過程で得られたノウハウを、全国規模のデータ収集活動の実践例としてまとめる。
最後に、熱電特性以外の物性科学分野のデータベースを立ち上げる。Starrydata2はすでに、熱電特性以外のデータベースを内包できる形で開発してある。そこで、論文からの実験値データベースの作成に興味を持った外部の研究者を募集する。そして、これまでのデータ収集ノウハウを共有し、大規模なデータ収集活動に取り組んでもらう予定である。

Causes of Carryover

当初は謝金を用いたデータ収集作業を予定していたが、今回データ収集活動を行ったメンバーは雇用上の理由により謝金を受け取れなかったため、謝金を使用しなかった。このために生じた次年度使用額は次年度のデータ収集活動の謝金として利用する予定である。

  • Research Products

    (12 results)

All 2018 2017 Other

All Journal Article (4 results) (of which Peer Reviewed: 1 results) Presentation (7 results) (of which Invited: 2 results) Remarks (1 results)

  • [Journal Article] Roles of Carrier Doping, Band Gap, and Electron Relaxation Time in the Boltzmann Transport Calculations of a Semiconductor’s Thermoelectric Properties2018

    • Author(s)
      Katsura Yukari、Takagi Hidenori、Kimura Kaoru
    • Journal Title

      MATERIALS TRANSACTIONS

      Volume: 59 Pages: 1013~1021

    • DOI

      10.2320/matertrans.E-M2018813

  • [Journal Article] 熱電特性データベースの構築と実験値マテリアルズ・インフォマティクスへの展開2017

    • Author(s)
      桂 ゆかり
    • Journal Title

      まてりあ

      Volume: 56 Pages: 560~563

    • DOI

      10.2320/materia.56.560

    • Peer Reviewed
  • [Journal Article] 実験的熱電特性のデータベース化に向けた論文データ収集WebシステムStarry dataの開発2017

    • Author(s)
      桂 ゆかり、熊谷 将也、郡司 咲子、今井 庸二、木村 薫
    • Journal Title

      粉体および粉末冶金

      Volume: 64 Pages: 467~470

    • DOI

      10.2497/jjspm.64.467

  • [Journal Article] High-pressure synthesis of tetragonal iron aluminide FeAl 22017

    • Author(s)
      Tobita Kazuki、Sato Naoki、Katsura Yukari、Kitahara Koichi、Nishio-Hamane Daisuke、Gotou Hirotada、Kimura Kaoru
    • Journal Title

      Scripta Materialia

      Volume: 141 Pages: 107~110

    • DOI

      10.1016/j.scriptamat.2017.08.002

  • [Presentation] ニューラルネットワークに基づくPbTe系熱電材料の特性予測2018

    • Author(s)
      佐藤陸, 小谷拓史, 桂ゆかり, 熊谷将也, 今井庸二, 郡司咲子, 木村薫
    • Organizer
      第65回応用物理学会春季学術講演会
  • [Presentation] 実験値データベースの応用による高性能SnTe熱電変換材料の開発2018

    • Author(s)
      小谷拓史, 桂ゆかり, 熊谷将也,今井庸二, 郡司咲子, 木村薫
    • Organizer
      第65回応用物理学会春季学術講演会
  • [Presentation] 熱電特性の実験値マテリアルズインフォマティクス2018

    • Author(s)
      桂ゆかり
    • Organizer
      第二回かけはし研究会「温度変化で発電するモバイル発電器」
  • [Presentation] 熱電特性グラフデータの収集による実験値マテリアルズインフォマティクス2017

    • Author(s)
      桂 ゆかり、小谷 拓史、熊谷 将也、郡司 咲子、今井 庸二、木村 薫
    • Organizer
      第78回応用物理学会秋季学術講演会
    • Invited
  • [Presentation] Data-driven evaluation of effective relaxation times for real thermoelectric materials2017

    • Author(s)
      Yukari Katsura, Takushi Kodani, Koichi Kitahara, Masaya Kumagai, Yoji Imai, Sakiko Gunji, Hideyasu Ouchi, Kazuki Tobita, Naoki Sato, Kaoru Kimura
    • Organizer
      The 36th International Conference of Thermoelectrics (ICT2017)
  • [Presentation] Theoretical considerations for enhancing thermoelectric properties2017

    • Author(s)
      Yukari Katsura
    • Organizer
      2nd Asian Association of Thermoelectrics (AAT) Summer School
    • Invited
  • [Presentation] 熱電材料の大規模文献データと第一原理計算に基づく電子緩和時間の推定2017

    • Author(s)
      桂 ゆかり, 小谷 拓史, 北原 功一, 熊谷 将也, 郡司 咲子, 今井 庸二, 大内 秀恭, 木村 薫
    • Organizer
      第14回日本熱電学会学術講演会
  • [Remarks] Starrydata2

    • URL

      http://starrydata2.org

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi