2017 Fiscal Year Research-status Report
Big Data時代における超高次元特徴選択フレームワークに関する研究
Project/Area Number |
17K00227
|
Research Institution | Chiba University |
Principal Investigator |
森 康久仁 千葉大学, 大学院工学研究院, 助教 (40361414)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 特徴選択 / 特徴抽出 / データマイニング / ビッグデータ / 機械学習 |
Outline of Annual Research Achievements |
本研究は,大規模なデータに対する特徴選択法や特徴抽出法と,様々なデータ形式に伴った探索的データ解析方法の提案をするものであり,本年度は研究の初年度である. 特徴選択に関しては,これまでに申請者によって提案した,ブロック分割を用いた特徴選択法における,探索アルゴリズムと再ランキングの検討を行った.これにより従来の方法では探索していなかった特徴部分集合を評価することが可能になり,これまでとは異なる結果を得ることがでた.しかしながら,分類性能という観点だけから見ると,従来の手法より特筆すべき結果が得られたとは言えないものであり,選択された特徴自体を詳細に検査する必要があることが示された. 特徴抽出に関する研究として,変分自己符号化器とよばれるモデルを,単峰な分布ではなく多峰な分布に拡張することで,複雑かつ高次元に分布するような構造であったとしても,適切にデータの特徴を抽出する方法を提案した.提案した手法により抽出した特徴を用いることで,高次元かつデータ数が少ないデータであったとしても,識別性能を落とさずに学習できることを確認した.これらの結果は,電子情報通信学会ソサイエティ大会および総合大会にて研究成果の発表を行った. また,時系列データ,特に経済時系列および脳波時系列という特殊なデータ形式に特化したデータ解析の方法を検討した.これらの成果は,電子情報通信学会論文誌に掲載および電子情報通信学会ソサイエティ大会にて発表を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究がやや遅れている大きな理由はいかの2点である. ・申請者によって提案したブロック分割を用いた特徴選択法において,新たな探索アルゴリズムと再ランキングの検討を行った結果,それらの方法で選択された特徴と従来の手法を用いた場合とで分類性能に明確な改善が見られず,新たなアプローチを模索しているため. ・本年度から全く想定していなかった共同研究がスタートし,その準備や研究に時間を割かざるを得なくなった.
|
Strategy for Future Research Activity |
今年度の状況を踏まえ,ブロック分割を行う手法に対する改良にくわえ,深層学習などで自動的に特徴を選択する方法の検討も始める.また,超高次元である様々な形式のデータに対して,それらの手法の適用可能性とその性能を評価することを目標とする.さらには,今度の研究費にてBig Dataを想定した実験環境も整える予定である.
|
Causes of Carryover |
本年度生じた差額は,配分経費が想定よりやや少なかったため,国内出張及び実験環境整備費等を低く抑えたことによるものである.この差額を含め次年度も,申請時に想定していた配分額とやや異なるため,研究に必要な物品及び旅費に対し適切な選択をして使用する.
|
Research Products
(5 results)