2020 Fiscal Year Research-status Report
汎化性能向上に資する大規模データセット構築のためのサンプル選択手法に関する研究
Project/Area Number |
19K12034
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
渡辺 顕司 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (50571064)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | パターン認識 / 多変量解析 |
Outline of Annual Research Achievements |
令和2年度では、昨年度に検討したサンプル選択手法の性能評価のため、多量サンプルからなるデータセットの検討・収集から開始した。このデータセットでは、確実に少数の例外値を含む実測データであることが好ましく、さらに今後、動画像なども含めた時系列データセットの拡充が進むと考え、過去より収録されている米国株式市場の株価データ、および外国為替市場の為替データの収集を行った。 これらのデータセットを用いて、分類・識別に学習に適したサンプル選択を行うためには、時系列情報を包含した特徴抽出が必須になる。また、特徴抽出の段階で例外値となるサンプル(例外サンプル)が検出できれば、別途、クラスタリング手法などを適用することなくサンプル選択が実現可能と期待できる。そこで、Long short term memory (LSTM), およびGated recurrent unit (GRU) などのニューラルネットワークベースの手法の検討を実施した。 以上の検討では、LSTM、およびGRUを用いて、十分に例外サンプルを検出(推定)できることが確認できた。しかし、上記の手法のネットワーク構造は、例えばrecurrent neural networks (RNN)に比べ、あまりにも複雑な構造となっており、計算コストの削減、および検出した例外サンプルの意味的解釈を実現するための特徴抽出に関する中間表現の解析などが非常に困難となる。この問題を解決するため、LSTMに着想を得た、新たな非線形サンプル選択手法の検討を開始した。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
令和2年度は、年度中の査読付き学術論文・国際会議の採録が達成できていないため、進捗に遅れが出ていると考える。これは、昨年度末から続く新型ウィルス性肺炎の流行に影響され、業務環境に大きな混乱が生じ、予算の適正執行、および業務遂行に支障が発生したことが大きい。しかし、1.評価用サンプルセットの収集が完了しつつある、かつ2.新たに検討を開始した手法の基礎実験は完了している、という2点から、次年度に遅れを取り戻すことは十分に可能であり、鋭意、計画に沿った研究を進めていきたい。
|
Strategy for Future Research Activity |
令和2年度までに得られた知見を活かし、線形・非線形サンプル選択手法の提案と、多量・多様なデータセットの解析、およびこれらの成果の学術論文誌などへの投稿・採録を目指す。この際、特にbackward pruningの観点による、簡素・明解なサンプル選択手法のほか、ニューラルネットワークを用いた非線形サンプル選択手法の有用性を示すことに重点を置き、本研究の着想が十分に有意であることを示す予定である。 上記の論文投稿と並行して、データセット再構築のための提案手法検討と、その有効性を示す実験を実施する。このデータセット再構築に関する研究では、提案手法を用いて必要十分なデータの要件を実験的に明らかにする予定である。
|
Causes of Carryover |
理由:本年度では、昨年度末より続く新型ウィルス性肺炎の蔓延に起因する全世界的な混乱に影響され、人材受け入れや必要な物品購入などを円滑に実施するのが極めて困難であった。さらに、国内外の移動も著しく制限され、国際会議等への参加が実施できず、旅費として確保した予算が想定以上に消費されなかった。 使用計画:次年度では、投稿予定の論文投稿料などが発生する予定である。また、世界的な新型ウィルス性肺炎の流行対策に伴う在宅勤務時間の増加に対応するための環境整備として、昨年度に調達できなかった計算機等の計算・通信能力増強などに使用する予定である。
|