研究課題/領域番号 |
17K00227
|
研究機関 | 千葉大学 |
研究代表者 |
森 康久仁 千葉大学, 大学院工学研究院, 助教 (40361414)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 特徴選択 / 特徴抽出 / データマイニング / ビッグデータ / 機械学習 |
研究実績の概要 |
本研究は,大規模なデータに対する特徴選択法や特徴抽出法と,様々なデータ形式に伴った探索的データ解析方法の提案をするものであり,本年度は研究の初年度である. 特徴選択に関しては,これまでに申請者によって提案した,ブロック分割を用いた特徴選択法における,探索アルゴリズムと再ランキングの検討を行った.これにより従来の方法では探索していなかった特徴部分集合を評価することが可能になり,これまでとは異なる結果を得ることがでた.しかしながら,分類性能という観点だけから見ると,従来の手法より特筆すべき結果が得られたとは言えないものであり,選択された特徴自体を詳細に検査する必要があることが示された. 特徴抽出に関する研究として,変分自己符号化器とよばれるモデルを,単峰な分布ではなく多峰な分布に拡張することで,複雑かつ高次元に分布するような構造であったとしても,適切にデータの特徴を抽出する方法を提案した.提案した手法により抽出した特徴を用いることで,高次元かつデータ数が少ないデータであったとしても,識別性能を落とさずに学習できることを確認した.これらの結果は,電子情報通信学会ソサイエティ大会および総合大会にて研究成果の発表を行った. また,時系列データ,特に経済時系列および脳波時系列という特殊なデータ形式に特化したデータ解析の方法を検討した.これらの成果は,電子情報通信学会論文誌に掲載および電子情報通信学会ソサイエティ大会にて発表を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究がやや遅れている大きな理由はいかの2点である. ・申請者によって提案したブロック分割を用いた特徴選択法において,新たな探索アルゴリズムと再ランキングの検討を行った結果,それらの方法で選択された特徴と従来の手法を用いた場合とで分類性能に明確な改善が見られず,新たなアプローチを模索しているため. ・本年度から全く想定していなかった共同研究がスタートし,その準備や研究に時間を割かざるを得なくなった.
|
今後の研究の推進方策 |
今年度の状況を踏まえ,ブロック分割を行う手法に対する改良にくわえ,深層学習などで自動的に特徴を選択する方法の検討も始める.また,超高次元である様々な形式のデータに対して,それらの手法の適用可能性とその性能を評価することを目標とする.さらには,今度の研究費にてBig Dataを想定した実験環境も整える予定である.
|
次年度使用額が生じた理由 |
本年度生じた差額は,配分経費が想定よりやや少なかったため,国内出張及び実験環境整備費等を低く抑えたことによるものである.この差額を含め次年度も,申請時に想定していた配分額とやや異なるため,研究に必要な物品及び旅費に対し適切な選択をして使用する.
|