研究課題/領域番号 |
21K11778
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 山形大学 |
研究代表者 |
安田 宗樹 山形大学, 大学院理工学研究科, 教授 (20532774)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | データ前処理 / 特徴抽出 / 確率的ニューラルネットワーク / 統計的機械学習 / スパースモデリング / 統計的近似アルゴリズム / 確率モデル / データ要素重要度分析 / 統計的深層学習 / ベイズ統計 / 近似アルゴリズム / 特徴量抽出 / ボルツマンマシン |
研究開始時の研究の概要 |
適切なデータ前処理(または特徴量抽出)はその後のシステム(例えば深層学習システム)の性能に大きな影響を与えることが知られている。しかしながら、ノイズ除去や不要次元の剪定などを含むような「積極的前処理」は課題個別に設計されることが主であり、汎用的に利用できるものは残念ながら存在しない。 本研究は、確率的グラフィカルモデルと統計的機械学習理論を基礎として、汎用的に利用できる積極的データ前処理器の確立を目指す。
|
研究成果の概要 |
良質なデータの前処理は引き続く様々なデータサイエンス課題に対して重要であり、汎用的データ前処理アルゴリズムが求められる。本研究は、ノイズ除去や不要次元の剪定などを含むような「積極的前処理を前提とした汎用的アルゴリズム」の実現を主要な目的としている。研究期間内で得た主な成果は以下の通りである。(1)汎用型積極的前処理実現のための基礎モデルと基礎的アルゴリズムを確率的ニューラルネットワークをベースとして構築した。(2)統計的近似アルゴリズムの高品質化やスパースモデリングとの融合的モデル拡張を通して、確率的ニューラルネットワークを高度化し、真に汎用的な積極的前処理の実現への布石を作ることができた。
|
研究成果の学術的意義や社会的意義 |
データ前処理は種々のデータサイエンス課題の成功に対する鍵となるが、良質なデータ前処理の実現には、しばしば分野の専門知識や、それを超えた特別なアイディアが必要となってしまう。最適なデータ前処理アルゴリズムは個々のデータの性質に大きく依存するため、常に最適化な結果を与える万能なデータ前処理アルゴリズムは存在しない。しかしながら、ある程度汎用的に利用できるデータ前処理器ならおそらく実現可能である。特に、ノイズ除去や不要次元の剪定などを含むような積極的前処理はより重要である。積極的前処理を含むような汎用的データ前処理アルゴリズムの存在は、「誰でも成果を出すことができる」の実現を近づけることとなる。
|