2023 Fiscal Year Annual Research Report
A universal system for constructive data preprocessing
Project/Area Number |
21K11778
|
Research Institution | Yamagata University |
Principal Investigator |
安田 宗樹 山形大学, 大学院理工学研究科, 教授 (20532774)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 特徴抽出 / データ前処理 / 確率モデル / 統計的機械学習 |
Outline of Annual Research Achievements |
確率モデルを基礎とした積極的データ前処理器の確立を目指す。広く様々なデータに対して効果的で汎用的なデータ前処理器(つまり、特徴抽出器)の実現が本研究の最終的な目標点である。本年度の主な成果は以下に挙げるものとなる。 (1)制限ボルツマンマシン(RBM)と t-SNE を用いた特徴抽出器の提案:昨年度から引き続き取り組んできた課題である。本年度は、可視化(または、次元削減)手法の一つである t-SNE を組み合わせることにより実践的な特徴抽出器を実現した。RBM が汎用的な特徴抽出器として優れた性能をもつことが昨年度までの研究により明らかとなった。しかしながら、RBM が有効な特徴抽出器として機能するようになるためにデータ学習をどの程度行うか(つまり、学習パラメータの更新を何回行うか)、などの判定基準については曖昧であった。そのため、学習についてはまだ試行錯誤を必要とする部分が残されていた。そこで、RBM から抽出された特徴量の質を評価する指標を提案し、学習に対する基準を明確にした。RBM から得られた特徴量を t-SNE による次元削減法により単純化し、単純化された空間内でのクラスタ構造を評価する指標(シルエットスコア)である。この指標により、RBM 特徴抽出器の作成が学習を含めてトータルで自動化されることになる。尚、本成果の一部は既に国内学会にて発表済みである。 以上が本年度の本研究計画に対するもっとも重要な成果である。それ以外の関連する主な成果としては、(2)RBM の深層化拡張モデルである深層ボルツマンマシン(DBM)の学習の効率化に成功している。DBM は RBM を超える次の特徴抽出器候補として最有力の確率モデルである。(3)RBM 特徴抽出器のアルゴリズム高品質化に成功している。尚、(2)と(3)も既に国内学会・国際論文誌にて発表済みである。
|