研究課題/領域番号 |
21K18849
|
研究機関 | 京都大学 |
研究代表者 |
加納 学 京都大学, 情報学研究科, 教授 (30263114)
|
研究期間 (年度) |
2021-07-09 – 2023-03-31
|
キーワード | 人工知能 / 第一原理モデル / デジタルツイン / 数式処理 / 自然言語処理 |
研究実績の概要 |
製造業における生産性向上の柱として,デジタルトランスフォーメーション(DX)に大きな期待が寄せられている.次世代生産技術の中核を担うデジタルツインの実現に向けて,データ取得が困難な状況でもプロセスの挙動を正確に予測するために,科学法則に基づく第一原理モデル(物理モデル)が必要になる.ただ,精密な第一原理モデルの構築は,専門家が試行錯誤を重ねながら取り組む必要があり,極めて難しく高コストである.そこで本研究では,対象プロセスに関連する文献を収集し,文献中の変数や数式の意味を理解し,モデル構築に必要な情報を抽出・編集し,第一原理モデルを自動的に構築する人工知能(AI)のプロトタイプを開発し,その実現可能性を世界に先駆けて示すことを目的としている. 2021年度には,研究目的達成のために必要な要素技術の開発を実施した.1)対象がプロセスモデルであることを活かして高精度に変数の意味を抽出する方法を開発した.2)関連する約13万報の論文を用いて言語モデルProcessBERTを構築し,文書中に現れる変数の同義性を判定する方法を開発した.3)文献から抽出された2つの数式群をMathML形式に変換し,ある記号について数式を解くことで,数式群の同義性を判定する方法を開発した.これらの要素技術開発により,膨大な文献から第一原理モデル構築に必要な変数と数式を抽出し,文献によって使用している記号が異なる場合でも,変数と数式が同じ内容であるかどうかを判定できるようになった.さらなる性能向上が必要であるが,第一原理モデル自動構築という壮大な目標に向けて大きく前進した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の目的は,第一原理モデルを自動的に構築する人工知能(AI)のプロトタイプを開発し,その実現可能性を世界に先駆けて示すことである.そのために,2021年度には,A)変数とその意味,および数式を抽出する,B)変数および数式の同義性を判定する,という2つの要素技術開発に取り組む計画を立てた.これらの要素技術開発は順調に進み,学会で成果を発表した.この他,研究開始当初には予定していなかったアノテーションツールの開発にも取り組み,文献からの情報抽出の効率化に貢献している.各項目について,さらなる性能改善を目指す必要はあるものの,研究は順調に進展している.
|
今後の研究の推進方策 |
昨年度に開発した要素技術の性能向上に取り組むと共に,要素技術を統合して,第一原理モデルを自動的に構築する人工知能(AI)のプロトタイプを開発し,本研究の目的を達成する.
|
次年度使用額が生じた理由 |
当初,2021年度中に国内外の学会に現地参加できるようになると見込んで旅費を計上していたが,まったくなかった.大規模データベース(コーパス)の構築等のために謝金を支払う予定であったが,人を集めるのを見送った.さらに,言語モデル構築のための計算量が想定よりも大幅に少なく,クラウド使用料が計画を下回った.これらの理由から,当該助成金が生じた.2022年度は,大規模データベース(コーパス)を構築し,様々な要素技術開発とプロトタイプ開発のために計算資源を大量に使用するために,高性能計算機購入費用,クラウド使用料,および謝金を計上する.さらに,加藤祥太助教を研究分担者に追加して,研究を加速させる.国内外の学会で積極的に研究成果を発表するために,旅費を計上する.
|