研究課題/領域番号 |
21K12032
|
研究機関 | 九州大学 |
研究代表者 |
末廣 大貴 九州大学, システム情報科学研究院, 助教 (20786967)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | データサンプリング / オンライン予測 / 組み合わせ最適化 / ノイズラベル |
研究実績の概要 |
データサンプリング問題を,オンライン組み合わせ予測を用いて行う方法を開発した.具体的には,ニューラルネットワークのパラメータ更新ごとに逐次「望ましいデータ」をサンプリングする問題を,データ選択とニューラルネットワークによるフィードバックが繰り返されるオンライン予測問題と捉える.これは,フィードバックを適当に設定することでオンラインk-set問題に帰着することができ,効率的かつ効果的にデータ選択をすることが可能となる.応用として,ノイズデータ回避問題を考え,既存手法よりも計算量,精度両面において向上が確認できた.従来手法の多くは,2つのニューラルネットワークを同時に学習する必要があり,多くの計算量を要するが,提案法は通常の学習よりも少ない計算量,およびサンプル数に対して列線形時間でデータサンプリングを行うことができる.また,オンライン予測におけるリグレット最小化の理論をもとに,ノイズデータの回避率について,理論性能を導出した.結果は,国際ジャーナルに投稿予定である.また,学習器を所望の性能に制御する(性能を下げる)問題を考え,提案法を適用した.具体的には,学習データの適当な部分集合に対しラベルをフリップさせることで,学習器を所望の性能に低下させる.この「学習データの適当な部分集合」の選び方を,提案法により行った.結果は国内研究会で発表し,今後さらに実用性を強化して国際会議に投稿予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
データサンプリングの統合的枠組みを提案し,実応用の結果は従来研究の性能を上回っており,研究の進捗は順調と言える.理論性能保証に関しても,ノイズラベルデータに対する応用について示すことができており,一般的な解析に向けて順調に進展している.
|
今後の研究の推進方策 |
まず,現状の結果をまとめ,国際会議やジャーナルに投稿を行う.学習器の性能制御に関する応用については,実アプリケーションを検討し,実験を行う.今後はさらに応用先を検討,拡大し,実課題における問題点をもとに,統合的枠組みの改善に取り組む.
|
次年度使用額が生じた理由 |
COVID-19 により在宅勤務が増加し,自宅でのPCでの作業が増え,大学におけるPCのリプレイスの必要性が急務でなかった点(物品費).また,同じくCOVID-19により,学会出張がなかったため(旅費).
|