| Project/Area Number |
24K20836
|
| Research Category |
Grant-in-Aid for Early-Career Scientists
|
| Allocation Type | Multi-year Fund |
| Review Section |
Basic Section 61030:Intelligent informatics-related
|
| Research Institution | Nagoya University |
Principal Investigator |
松井 孝太 名古屋大学, 医学系研究科, 講師 (50737111)
|
| Project Period (FY) |
2024-04-01 – 2028-03-31
|
| Project Status |
Granted (Fiscal Year 2024)
|
| Budget Amount *help |
¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
Fiscal Year 2027: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2026: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2025: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2024: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
|
| Keywords | 転移学習 / 適応的実験計画 / 能動学習 |
| Outline of Research at the Start |
本研究では高コストなデータ収集フェイズがしばしばボトルネックとなる実験科学領域において,転移学習と能動学習によって効率的な実験を実現することを目指す.特に医学領域や材料科学領域の問題を対象として,新たなドメインで効率的に実験を行うために,過去データを効果的に利用して現在のドメインで高い性能が得られることが予想される条件に対して適応的にラベル付けを行うことを可能にする能動学習アルゴリズムを開発する.
|
| Outline of Annual Research Achievements |
本年度は,主に転移学習と適応的実験計画それぞれの手法開発とその評価,医学や材料科学領域への適用を行い,また得られた成果の対外発表,論文および書籍の執筆を行った.具体的には以下の4つの項目について取り組んだ. (1)転移学習の書籍執筆を行った.本書は転移学習の枠組みの説明からはじめ,転移学習の理論やさまざまな問題設定への拡張,適用方法を高いレベルで習得できる内容となっている. (2)トランスフォーマーモデルの文脈内学習が自動ドメイン適応機能を有していることを示唆する理論的な保証を与え,ICML WS(https://iclworkshop.github.io/)で発表を行った. (3)転移学習の材料科学領域への展開として,(a) マルチモーダルな情報から高分子の物性を予測するための特徴転移の方法開発,(b) 第一原理計算のシミュレーションデータと実際の実験データを統合して触媒活性予測を行うためのsim2realデータ変換手法の開発を行い,それぞれNeurIPS WS(https://sites.google.com/view/ai4mat/ai4mat-neurips-2024)で発表を行った.これらの結果は査読付き論文誌に投稿し,(b) については既に出版されている. (4)がん第一相臨床試験における最大耐用量推定問題に対して,能動的レベル集合推定に基づく新しい試験デザインを提案し,シミュレーションでの評価に加えて,理論的な収束の保証を与えた.この結果は査読付き論文誌に投稿中である.
|
| Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は,実験研究を効率化するための2つの軸として据えていた転移学習と適応的実験計画について,それぞれ方法論研究および応用研究で成果が得られた.また,書籍の執筆を通して転移学習という方法論のアウトリーチを広く行うことができたと認識している. トランスフォーマーの文脈内学習は,多数の研究によってさまざまなアルゴリズムを(パラメータを変更するという意味での)学習を行うことなく近似できる機能が示されている.本年度得られた成果では,文脈内学習がドメイン適応の主要なアルゴリズムの近似機能をも有していることが示され,これは文脈内学習の原理の解明に貢献するものであると考えられる. 材料科学領域への展開で得られた成果は,材料科学領域で実際に頻出する問題(高分子の物性予測,触媒活性予測)を効率化するものである.さらに,本研究で提案したフレームワークは,研究内で扱ったものとは異なる物質・材料へも比較的簡単に適用することができる拡張性の高さも有している.これは,材料科学領域全体に資する成果であると考えることができる. さらに,がん第一相試験に対する成果では,アルゴリズムの開発とシミュレーションでの評価だけでなく,理論的な収束解析も行っており,医学と機械学習という分野を橋渡しする成果になっていると考えられる. 以上のように,転移学習および適応的実験計画の方法開発と理論的研究について,また実問題を取り扱う応用研究および方法論のアウトリーチについて,おおむね順調に進んでいると判断することができる.
|
| Strategy for Future Research Activity |
本年度の活動では,転移学習と適応的実験計画の研究それぞれにおいて大きな進展が得られた.今後の展開として,(1)転移学習と適応的実験計画の方法論の拡張と応用,(2)両者を能動的転移学習の方法として統合することを考えている. (1)について,まず転移学習では,事前学習モデルが学習済み隠れ表現の上にタスク固有層をレイヤードする「軽量ファインチューニング」を軸に,マルチモーダルデータを扱うためのドメイン不変表現学習を深化させる.適応的実験計画では,物質固有の情報や,患者個人の状態を条件として取り込むことができる文脈付きベイズ最適化に注目し,臨床試験デザインなどへ拡張可能なアルゴリズム開発を目指す. (2)続いて,両者を結節する能動的転移学習の枠組みを実装し,ソース領域の獲得関数をターゲット領域の情報価値に応じて動的に重み付けするアルゴリズムの開発を目指す.材料科学領域では高分子物性予測や触媒活性予測,医学領域では第I/II相臨床試験の用量探索問題をケーススタディとし,シミュレーションと実データ解析の両面で手法の評価を行う.
|