研究課題/領域番号 |
20K19930
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
研究機関 | 東京大学 |
研究代表者 |
河野 慎 東京大学, 大学院工学系研究科(工学部), 特任研究員 (40801288)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 深層学習 / ラベルなしテスト評価 / 世界モデル / 対称性 / 群対称性 / データ拡張 / メタ学習 / 群同変性 / スマートシティ / 能動学習 |
研究開始時の研究の概要 |
地方自治体による環境保守と点検は,労働力不足により満足に行えていない.機械学習技術応用により,点検業務の一部を他の業務と同時に担えるため,改善が期待される.一方,機械学習技術に必要なデータの用意やシステム運用は,個人情報や予算の観点から各自治体が行う必要があり,データの質や量などが課題となる. 本研究は,十分な質と量のデータが得られない環境において,効率的に学習が可能な機械学習技術の研究開発および自治体による実運用可能なシステム構築が目的である.1) 複数自治体における転移学習手法および2) データセット作成を含めた効率的な学習手法の研究開発,3) 実証実験を行い,本研究の有効性を明らかにする.
|
研究実績の概要 |
本年度は,主に昨年度から継続して取り組んでいるラベルが付与されていないテストセットにおけるモデルの性能評価に関する研究に取り組んだ.
ここ1年で大規模言語モデルや生成AIと称される基盤モデルが急速に普及してきている.その結果モデルの学習や運用コストが膨大に膨れており,そのモデルの利活用を検討する際の課題の一つとなってきている.そのため,コストを減らすことを目的としている本研究は非常に有益であると考える.昨年度は,主にデータ拡張の観点でラベルなし評価の研究を行っていたが,本年度はモデル自体に着目し,研究を行った.上述のように,大規模言語モデルや基盤モデルは運用コストが大きいため,その検証目的であってもコストがかかってしまう.そこで評価したいモデルと同じ挙動を示すような代理モデルを設ける手法について研究した.その結果については,今年度及び次年度の国内の研究会で報告済み及び予定である.
また本研究テーマのデータ効率の観点で,近年注目されている世界モデルも重要である.世界モデルは,実世界のデータ生成過程をモデル化する方法であり,世界モデルを構築することでデータの効率を上げた学習手法が考えられる.そこで本年度では,より実世界でその有用性から注目されているグラフ構造を持つデータに対して世界モデルを構築する研究を行った.本年度は,コンセプトの実証段階のため,データは実データではなく,迷路を想定した合成データでの検証を行った.その結果は,国内の研究会で報告済みである.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本年度は,基本的には順調である. 一方で遅れている理由としては,国際会議への投稿に至らなかったことが挙げられる. これは,実験結果が際立って良いわけではなかったためである.
|
今後の研究の推進方策 |
まずはラベルなし評価の実験結果を改善していくことが第一目標となる.次に今年度では合成データのみでの検証であったグラフ構造データにおける世界モデルの構築について取り組んでいく予定である.
|