2019 Fiscal Year Research-status Report
汎化性能向上に資する大規模データセット構築のためのサンプル選択手法に関する研究
Project/Area Number |
19K12034
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
渡辺 顕司 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (50571064)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | パターン認識 / 多変量解析 |
Outline of Annual Research Achievements |
令和元年度の研究開始当初、申請した研究計画に基づき、線形サンプル選択手法の検討を行った。研究当初の段階では、入力データセットの統計的・幾何的特性を十分に表現するクラスター代表ベクトル群、非負係数行列、および非正係数行列を推定する因子分解手法の検討を実施していた。しかし、特に非負・非正係数行列に関しては、制約条件の不足も影響し、意味解釈が容易な係数群の推定が困難であり、かつ、最適化問題を解く際の初期値依存性の克服も容易ではないことが判明した。この初期段階における検討として、既存の因子分解法を用いた例外サンプルの推定結果解析も実施していた際、最適化における初期値をクラスタリング結果とする必要はあるが、その係数推定結果は、通常サンプル群と例外サンプル群で、大きく異なることが明確になった。 以上の結果から、新たに、サンプル分布の幾何的解釈から、クラスタリング手法と同様な意味解釈が可能な半非負因子分解法を検討し、その性能評価実験を行った。この提案手法では、最適化において入力データのサンプル分布から得られる幾何的拘束条件が導入されており、初期値によらず、有意な因子(クラスター代表)ベクトル、および非負行列を推定することが可能であることが示唆された。この提案手法の初期検討版は、査読付き国際会議へと投稿したが、不採録となったため、査読者のコメントを汲んだうえで、提案手法のさらなる改良と、学術論文誌への投稿準備を開始した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
令和元年度は、年度中の査読付き国際会議の採録が達成できていないため、進捗にやや遅れが出ていると考える。しかし、1.提案手法として因子分解手法の検討が完了している、2.提案手法を線形サンプル選択に用いることの有意性に関する初期検討が完了している、という2点から、次年度に学術論文誌等へ投稿することは十分に可能であり、当初の研究計画を大きく逸脱するものではないと考える。
|
Strategy for Future Research Activity |
令和元年度に得られた知見を活かし、線形サンプル選択手法の提案と、多量・多様なデータセットの解析、およびこれらの成果の学術論文誌投稿を実施し、採録を目指す。この際、特にbackward pruningの観点による、簡素・明解なサンプル選択手法の有用性を示すことに重点を置き、本研究の着想が十分に有意であることを示す予定である。 上記の論文投稿と並行して、データセット再構築のための提案手法検討と、その有効性を示す実験を実施する。このデータセット再構築に関する研究では、提案手法を用いて必要十分なデータの要件を実験的に明らかにする予定である。 以上の研究成果は、通常であれば、まず査読付き国際会議への投稿と採録を目指すところである。しかし、令和元年度後半より新型ウィルス性肺炎が世界的に流行しており、成果発表のための国内外出張等が非常に困難な状況にある。そこで、本研究の成果は、査読付き学術論文誌の採録を主として目指すこととする。
|
Causes of Carryover |
理由:本年度では、国際会議への参加費、および論文投稿料などの経費支出が無かった他、科学計算用ワークステーションの購入費が、必要十分な要求仕様の慎重な検討などを行うことで、当初予定していた1,200,000円程度の額から、608,860円で購入できたことなどにより、次年度使用額が発生した。 使用計画:次年度では、本年度に投稿予定の論文投稿料などが発生する予定である。また、世界的な新型ウィルス性肺炎の流行対策に伴う在宅勤務時間の増加に対応するための環境整備として、設置計算機等の計算・通信能力増強などに使用する予定である。
|