2021 Fiscal Year Research-status Report
汎化性能向上に資する大規模データセット構築のためのサンプル選択手法に関する研究
Project/Area Number |
19K12034
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
渡辺 顕司 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (50571064)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | パターン認識 / 多変量解析 |
Outline of Annual Research Achievements |
令和3年度は、昨年度に検討した時系列情報を包含する特徴抽出を行うためのRecurrent neural networks (RNN)関連の手法では、最も簡素なRNNでも十分な推定性能となり、他の既存・検討手法などで大きな性能向上が見込めないことを確認した。そこで、時系列データセットを対象とすることを一時保留とし、より一般的な、入力データの性質を問わないデータセット再構築のための手法に関する検討を再開した。 上記では、入力データと推定結果の誤差が大きくなるものが例外サンプルであるとの仮定から、既存の因子分解手法、たとえば、Factor analysis (FA)、Semi non-negative matrix factorization (Semi-NMF)、およびSemi-NMFに正則化項を導入した検討手法で推定した結果と入力データの誤差分布を比較し、それぞれの手法で誤差分布に違いが出ることを確認した。ここで、NMFではなくSemi-NMFを用いたのは、入力データが非負値でなければならないという、適用できるデータセットの制限を排するためである。これらの結果から例外サンプルを自動検出するための方式に関する検討を進めた。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
本年度は2021年8月に父、その後2022年1月に母が亡くなった。亡母は2020年4月頃より悪性リンパ腫を患い入退院を繰り返していた。本年度は、故人らに起因する介護のために時間を割く必要が増えた他、相続などの手続きが立て続けに発生し、業務遂行が極めて困難な状況であった。
|
Strategy for Future Research Activity |
令和3年度までに得られた知見を活かし、線形・非線形サンプル選択手法の提案と、多量・多様なデータセットの解析、およびこれらの成果の学術論文誌などへの投稿・採録を目指す。このとき、データセット再構築のための提案手法を用いて必要十分なデータの要件を実験的に明らかにする予定である。
|
Causes of Carryover |
本年度では、2020年より続く新型ウィルス性肺炎の蔓延に起因する全世界的な混乱が継続し、人材受け入れや必要な物品購入などを円滑に実施するのが困難であった。さらに、両親が立て続けに亡くなったことにより、これに起因する事象に対応する必要があり、通常通りの業務遂行・予算執行が極めて困難であったことが理由となる。 次年度では、投稿予定の論文投稿料などが発生する予定である。また、延長許可を頂いた最終年度ということで、これまでの研究データ保存のための物品購入に充てる予定である。
|