研究課題/領域番号 |
21K11778
|
研究機関 | 山形大学 |
研究代表者 |
安田 宗樹 山形大学, 大学院理工学研究科, 教授 (20532774)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | データ前処理 / 確率モデル / 統計的機械学習 / スパースモデリング / データ要素重要度分析 |
研究実績の概要 |
本研究計画は、確率モデルを基礎として汎用的に利用できる積極的前処理器の確立を目指す。簡単で効果的なデータ前処理器の実現が本研究の最終的な目標点である。 本年度は、主に以下のような研究成果を得た。 (1)スパース性の自動学習機能をもつ制限ボルツマンマシン型モデルの提案:データ中のスパース性の抽出はスパースモデリングの文脈で発展してきている。しかしながら、通常のスパースモデリングにおいて、データのスパース度を決定するパラメータ(より具体的には正則化係数)は調節可能なものではないハイパパラメータである。本提案モデルは、スパース度を決定するパラメータの自動調節を可能とした。つまり、自動適応型スパースモデリングである。そして、提案モデルはパターン認識実験において成功している。本提案モデルのデータ前処理器への応用は今後の課題であるが、データ特徴抽出の場面において有効になると期待される。尚、本成果は国際学術論文誌にて発表済みである。 (2)制限ボルツマンマシンを基礎としたデータ前処理器の深化:制限ボルツマンマシンに基づくデータ前処理器についての研究は昨年度から継続的に実施している。昨年度は、提案モデルのノイズ頑健性について見出した。本年度は更に研究を進め、要素重要度を推定できる枠組みを相互情報量に基づき提案した。データ前処理において最も重要なのは、不要なデータ要素を刈り込み、重要な要素のみを残すことである。本提案法によりデータの各要素の重要度を情報理論に基づく枠組みを通して算出できるようになった。本提案の要素重要度分析によって、本研究は最終目標に大きく近づいたと言える。尚、本成果は昨年度の成果と併せて国際学会に投稿予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
上記【研究実績の概要】で述べた研究成果(2)の成功が主要な根拠である。データ要素の重要度分析は、本研究計画の掲げる最終目標に対しておそらくはもっとも重要なコンポーネントである。データ要素の重要度分析の理論的枠組みの提案とその手法の実験的成功は、本研究を大きく進めることになる。また、研究成果(1)も重要である。従来はハイパパラメータといて扱われていたパラメータをデータを使って自動的に最適化することが可能となった。このパラメータは、データのスパース度を決定する極めて重要なパラメータである。良質なデータ前処理は良質な特徴抽出から生まれると考えている。そして、良質な特徴抽出にはスパースモデリングの考え方(つまり、情報の取捨選択処理)が必要である。研究成果(1)の成功は、より柔軟でより効果的なデータ前処理の実現の可能性を向上させる。
|
今後の研究の推進方策 |
上記【研究実績の概要】で述べた研究成果(1)と(2)の融合が今後の研究推進の主たる方向である。研究成果(1)より得られた自動適応型スパースモデリングの理論を研究成果(2)に取り込み、より高品質なデータ前処理を可能にする枠組みの提案を目指す。本研究のこれまでの成果の妥当性の裏付けは主に実験的なものであり、理論的根拠による裏付けはまだ未発展である。実験的に提案法の正当性を主張することと同時に、理論的考察も進めていく必要がある。
|
次年度使用額が生じた理由 |
新型コロナウイルスの影響で参加予定であった学会・研究会等が中止、または、現地開催中止となり、その分として計上していた予算が次年度使用額となった。 次年度使用額は本年度中止になった分の参加学会・研究会を次年度に移し、次年度使用額をそれらの旅費として使用する予定である。
|