• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実施状況報告書

汎化性能向上に資する大規模データセット構築のためのサンプル選択手法に関する研究

研究課題

研究課題/領域番号 19K12034
研究機関国立研究開発法人産業技術総合研究所

研究代表者

渡辺 顕司  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (50571064)

研究期間 (年度) 2019-04-01 – 2023-03-31
キーワードパターン認識 / 多変量解析
研究実績の概要

令和3年度は、昨年度に検討した時系列情報を包含する特徴抽出を行うためのRecurrent neural networks (RNN)関連の手法では、最も簡素なRNNでも十分な推定性能となり、他の既存・検討手法などで大きな性能向上が見込めないことを確認した。そこで、時系列データセットを対象とすることを一時保留とし、より一般的な、入力データの性質を問わないデータセット再構築のための手法に関する検討を再開した。
上記では、入力データと推定結果の誤差が大きくなるものが例外サンプルであるとの仮定から、既存の因子分解手法、たとえば、Factor analysis (FA)、Semi non-negative matrix factorization (Semi-NMF)、およびSemi-NMFに正則化項を導入した検討手法で推定した結果と入力データの誤差分布を比較し、それぞれの手法で誤差分布に違いが出ることを確認した。ここで、NMFではなくSemi-NMFを用いたのは、入力データが非負値でなければならないという、適用できるデータセットの制限を排するためである。これらの結果から例外サンプルを自動検出するための方式に関する検討を進めた。

現在までの達成度 (区分)
現在までの達成度 (区分)

4: 遅れている

理由

本年度は2021年8月に父、その後2022年1月に母が亡くなった。亡母は2020年4月頃より悪性リンパ腫を患い入退院を繰り返していた。本年度は、故人らに起因する介護のために時間を割く必要が増えた他、相続などの手続きが立て続けに発生し、業務遂行が極めて困難な状況であった。

今後の研究の推進方策

令和3年度までに得られた知見を活かし、線形・非線形サンプル選択手法の提案と、多量・多様なデータセットの解析、およびこれらの成果の学術論文誌などへの投稿・採録を目指す。このとき、データセット再構築のための提案手法を用いて必要十分なデータの要件を実験的に明らかにする予定である。

次年度使用額が生じた理由

本年度では、2020年より続く新型ウィルス性肺炎の蔓延に起因する全世界的な混乱が継続し、人材受け入れや必要な物品購入などを円滑に実施するのが困難であった。さらに、両親が立て続けに亡くなったことにより、これに起因する事象に対応する必要があり、通常通りの業務遂行・予算執行が極めて困難であったことが理由となる。
次年度では、投稿予定の論文投稿料などが発生する予定である。また、延長許可を頂いた最終年度ということで、これまでの研究データ保存のための物品購入に充てる予定である。

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi