Project/Area Number |
23K13595
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 27020:Chemical reaction and process system engineering-related
|
Research Institution | Kyoto University |
Principal Investigator |
加藤 祥太 京都大学, 情報学研究科, 助教 (60883402)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2025: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2024: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Fiscal Year 2023: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
|
Keywords | 自然言語処理 / 人工知能 / 数式言語処理 / 言語モデル / 物理モデル / デジタルツイン / 化学工学 / プロセスシステム工学 |
Outline of Research at the Start |
プロセス産業では、生産性向上手法としてデジタルトランスフォーメーション(DX)が注目されており、デジタルツインの実現が期待されている。データの収集が困難な状況では対象プロセスを模擬できる物理モデルの構築が必要であるが、物理モデル構築には現象に対する深い知見と多大な手間を要する。本研究の最終目標は、対象プロセスに関する文献を収集し、文献から物理モデル構築に必要な情報を抽出・編集し、物理モデルを自動的に構築する人工知能の開発である。本研究では、必要な情報の抽出、抽出した情報の表記の統一、モデル候補の作成の3つの要素技術を開発した上で人工知能のプロトタイプを開発し、複数のプロセスに適用する。
|
Outline of Annual Research Achievements |
プロセス産業では生産性を高めるために、物理モデルに基づくデジタルツインの実現が求められている。しかし、物理モデルの構築には多大な労力を要する。この物理モデル構築工程を効率化するために、文献から物理モデルを自動で構築する人工知能(Automated physical model builder; AutoPMoB)の実現を目指している。本研究では、そのプロトタイプ開発に向けた要素技術開発に取り組んでいる。2023年度は、文献からの変数定義抽出と、抽出した変数定義の同義性判定の手法開発に取り組んだ。 変数定義抽出の研究では、化学プロセス関連文献に対する性能向上を目指し、自然言語処理分野において高い性能を達成している大規模言語モデルの適用と性能評価を行った。そして、得られた知見を基に、少量の学習データを拡張して、そのデータで言語モデルを微調整する手法を提案した。この提案手法は、5つの製造プロセスに関する47報の論文からの変数定義抽出において、既存手法を上回る正解率89.6%を達成した。 変数定義の同義性判定においても、大規模言語モデルの適用と性能評価を行った。その結果、専門分野に特化した言語モデルの必要性が示唆されたため、約120万報の論文を用いて化学工学分野に特化した言語モデルを構築した。構築した言語モデルは変数定義の同義性判定において既存の一般的なモデルを超える性能を示したが、適用対象の論文が異なると性能が大きく変化するという問題点も明らかになった。 未解決の問題への対処は必要であるが、AutoPMoBのプロトタイプ開発という目標に向けて着実に前進した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当該研究の目的は、デジタルツインを実現するために必要な物理モデルを自動で構築する人工知能(AutoPMoB)のプロトタイプ開発である。この目的を達成するため、2023年度には、1)モデルに関する情報の抽出手法開発と2)抽出した情報の同義性判定の手法開発に取り組んだ。これらの要素技術開発に関する研究は予定通り進展し、その成果を学会で発表した。 また、研究開始当初には計画していなかったが、大規模言語モデルを変数定義抽出と同義性判定に適用した。この取り組みにより、物理モデル自動構築における大規模言語モデルの可能性と限界を調査し、得られた知見を学会で発表し、専門分野内での認識を深めた。 これらの活動を通じて、各項目においてさらなる性能改善の余地はあるものの、全体として研究は順調に進展している。
|
Strategy for Future Research Activity |
引き続きAutoPMoBのプロトタイプ開発に向けた要素技術開発に取り組む。 2024年度は、研究開始当初の予定通り、A)変数定義の同義性判定手法の性能向上、B)物理モデルを表す数式群の同義性判定手法の開発、C)表記を統一した情報から構築したモデル候補の順位予測手法の開発に取り組む。
|