| Project/Area Number |
24K15080
|
| Research Category |
Grant-in-Aid for Scientific Research (C)
|
| Allocation Type | Multi-year Fund |
| Section | 一般 |
| Review Section |
Basic Section 61030:Intelligent informatics-related
|
| Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
花田 博幸 国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (00793035)
|
| Project Period (FY) |
2024-04-01 – 2029-03-31
|
| Project Status |
Granted (Fiscal Year 2024)
|
| Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2028: ¥130,000 (Direct Cost: ¥100,000、Indirect Cost: ¥30,000)
Fiscal Year 2027: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2026: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2025: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2024: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
|
| Keywords | 機械学習 / 継続学習 / 分布ロバスト学習 / データ削減 |
| Outline of Research at the Start |
現在の人工知能分野においては、機械学習という、データから判断基準を学習させる手法が広く用いられている。しかし学習させるデータが時々刻々と入る環境においては、データの量が増大し続ける問題や、時間とともにデータの性質が変化する問題に対応しなければならない。 本研究ではこのような環境下で、「取り除いても影響が少ないデータ」を同定することを目的とする。まず既知の「データを取り除いても学習結果が一切変わらない」条件を「時間とともにデータの性質が変化する」場合でも利用可能にする。次いでより弱い条件「データを取り除いても学習結果が一定の範囲でしか変わらない」での最適なデータの取り除き方を新たに確立する。
|
| Outline of Annual Research Achievements |
本研究は機械学習において、将来得られるデータの分布が現在のそれと異なる(一定の範囲内で変動しうる)ことを仮定し、その条件のもとで学習結果に影響の少ない一部のデータを破棄しながら学習を継続的に行うことを目標としている。機械学習はデータから判断基準を学習する手法であることから、データの分布が変動した場合は、学習結果も対応して変化する必要がある。このことは、長期にわたって学習を継続的に行う際には大きな問題となる(例えば、書かれる文章は時期によって異なるなど)。 本年度においては、目標とした事項のうち、以下のことを達成した。 - (1) 「学習結果に影響の少ない」ではなく「学習結果に影響のない」という設定のもとで、削除可能なデータの条件を導出し、計算機実験を行った。(完了) - (2) 「学習結果に影響の少ない」データ削除を、機械学習のうち2クラス分類問題の設定において、方法を設計した。(数理的な基礎の開発は完了、応用に向けた実装の検討中) - (3) 以上のことを、凸最適化として書ける機械学習手法について方法を確立するとともに、深層学習のような凸最適化として書けない機械学習手法についても既存の近似手法を導入することで、各種の計算機実験を可能とした。(完了) このうち本年度の目標としては、(1)を実現するとともに(2)の目途を付けることであった((2)は次年度までに完成させる目標であった)。またそれに付随して、これらの問題の適用可能範囲として(3)を導いた。
|
| Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
【研究実績の概要】で示した通り、今年度の目標とした事項はおおむね達成できた。
|
| Strategy for Future Research Activity |
・目標とすることを実現できる計算手段こそ目途は付いたものの、現状のままでは計算コストが高く、10万事例を超えるような学習データへの適用が難しいことがわかった。この点を、計算設定自体の見直しや近似手法の導入により改善する必要がある。 ・現状の手法が適用できるのは、学習された機械学習モデルの出力値がスカラーである場合に限定されている。これでも回帰問題や二値分類問題には適用可能であるものの、三値以上の分類問題への拡張が自明ではなく、これを実現することを進めている。 ・本研究の目標として当初から掲げていたものではないが、学習結果への影響を少なくすることを「データ削減のみならず、新たなデータを加えることを認める」場合にも拡張が可能そうであることがわかり、方法を構築している。基本となる手法の方針は形作られたが、「将来得られるデータの分布が現在のそれと異なる」という設定を導入することについてはまだできておらず、今後進めたい。
|