小データな多ドメイン間での知識共有のための機械学習手法の開発とその応用
Project/Area Number |
20K19871
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Nagoya University |
Principal Investigator |
松井 孝太 名古屋大学, 医学系研究科, 講師 (50737111)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2023: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2022: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2021: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2020: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
Keywords | 機械学習 / 転移学習 / 能動学習 / スモールデータ / 能動的転移学習 |
Outline of Research at the Start |
従来の機械学習の方法では,目標となるタスクで利用可能なデータが小規模である場合,類似した大量のデータを用いて適切な初期モデルを事前学習しておくことが必須であると言える.一方,医学や材料科学などの実験科学分野では,事前モデルを学習可能な大量のデータを取得することが困難な場合が多い.本研究で開発を行う能動的転移学習アルゴリズムは,目標タスクの予測モデルの学習に有用なデータを各リソースから取得するプロセスを最適化することで,従来よりも少ないデータ数で良い性能を発揮するモデルの獲得を実現するためのものである.
|
Outline of Annual Research Achievements |
本年度は,能動学習および能動的転移学習の手法の開発とその評価,対外発表,および論文の執筆を行った。具体的には以下の2つの項目について取り組んだ。
(1)能動学習の手法である能動的レベル集合推定法を抗がん剤開発のための第I相臨床試験のデザインに応用するための新たな枠組みを構築した。第I相臨床試験では、抗がん剤の許容される最大の用量(最大耐用量)の正確な推定が重要な問題であり、提案法は理論的には正確な最大耐用量を達成でき、実験によって既存の手法と比較して様々なシナリオで高い推定精度を達成していることを確認した。本研究は2023年の日本計量生物学会年会で口頭発表を行い(申込時2022年度)、現在論文を執筆中である。 (2)能動的転移学習の新たな方法として,能動的レベル集合推定法にガウス過程(GP)モデルのための転移学習の方法であるDiff-GPモデルを組み合わせた、能動的転移レベル集合推定法を開発し、太陽電池用シリコンインゴットの低品質領域推定問題に応用した。開発した手法は、既に終了した実験で得られたデータを簡単な変換によって現在の実験データのように扱うことを可能とし、これを用いて現在の実験をより効率化することができる。さらに、過去のデータと現在のデータの違いが明示的にモデル化できる場合、このモデルを推定しながら同時にレベル集合推定を行う発展的な方法も開発した。これらの手法は、適用した低品質領域推定問題で既存法に比べて少ないデータ数で高い推定精度を示す結果が得られた。本研究はプレプリントが既に公開され(https://arxiv.org/abs/2304.01404)、現在論文誌に投稿中である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は主に能動学習と能動的転移学習の新たな方法開発に取り組んだ。能動学習の手法は抗がん剤第I相臨床試験の新たなデザインとしての提案であり、能動的転移学習の手法は材料科学における様々な低品質領域推定問題に汎用的に利用できる方法となっている。これらの応用領域は本質的にスモールデータであり、少ないデータで正確な推定や予測を行えるかどうかが非常に重要な問題となる。本年度は、手法を開発するだけでなく、どちらの問題に対しても、提案法がそれぞれの領域での既存法に比べてデータ効率を向上させることができる実験結果を得ることができた。特に、能動的転移レベル集合推定法は太陽電池用シリコンインゴットから測定された実際の物性値データを用いて評価実験を行なっており、有用性のエビデンスレベルは高いと考えている。 一方、本年度に行えなかった事項として、リアルタイムな実験計画への適用がある。能動学習手法は適応的実験計画とも呼ばれ、得られたデータを見てその場で次の測定計画を修正することができる方法である。この実評価には測定実験を行う共同研究者の協力が不可欠であるため、次年度での実施を計画している。 以上のように、能動的転移学習の方法開発および実際の問題への適用について、研究がおおむね順調に進んでいると判断することができる。
|
Strategy for Future Research Activity |
今後の展開として、(1)提案法の改良と拡張、(2)実環境での評価実験を行うことを考えている。 (1)について、例えば抗がん剤第I相臨床試験の問題設定として、2剤以上の薬剤を併用する場合や、薬剤の有効性と毒性を分離して評価する場合の用量推定問題への拡張が考えられる。特に後者については、近年殺細胞性の抗がん剤ではない分子標的薬や免疫チェックポイント阻害薬のように用量と有効性の間に単調増加な関係が期待できない薬剤が多く開発されていることから、そのようなケースにも適用できる能動学習手法を開発することは重要と考えられる。また、臨床試験にも過去のデータが蓄積されているケースは多くあり、ヒストリカルデータと呼ばれるそれらの過去データを現在の臨床試験に利用するための方法論研究が生物統計学の領域で行われている。これは能動的転移学習と非常に近い問題設定であり、本研究で開発した方法の直接的な適用や改良を構想している。 (2)については、特に材料科学分野の測定実験を念頭に計画をしている。測定装置に開発した能動的転移レベル集合推定のアルゴリズムを実装し、観測されたデータを直ちにモデルにフィードバックしつつ、次にどの条件で実験するかをモデルに指定させることで、実験を自動化・効率化することを構想している。
|
Report
(3 results)
Research Products
(18 results)
-
-
-
-
-
[Presentation] Exploration of fluorine solvent for Minor Actinide extraction2022
Author(s)
Masahiko Nakase, Kota Matsui, Miki Harigai, Shinta Watanabe, Chihiro Tabata, Tomoo Yamamura, Tohru Kobayashi, Takashi Kajitani, Koichi Kakinoki, Taisuke Tsukamoto, Takashi Shimada
Organizer
International Solvent Extraction Conference 2022 (ISEC2022)
Related Report
Int'l Joint Research
-
-
-
-
-
-
-
-
-
-
-
-
-