2016 Fiscal Year Research-status Report
スパースモデリングの数理と多変量解析ツールの開発研究
Project/Area Number |
16K00057
|
Research Institution | Chuo University |
Principal Investigator |
小西 貞則 中央大学, 理工学部, 教授 (40090550)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | スパースモデリング / カーネル非線形モデリング / 多クラスパターン認識 / 非線形正準相関分析 / スパース部分空間法 / ベイズモデリング |
Outline of Annual Research Achievements |
複雑な現象分析を目的として獲得・蓄積されるデータは大規模化,高次元化し,これに伴い従来のデータ解析手法の適用限界が指摘されるようになり,新たな手法の開発研究が集中的に推進されつつある.本研究では,これまでの研究実績を踏まえ,大規模・高次元データに基づくスパースモデリング,カーネル法に基づく非線形モデリング,多クラスパターン認識などに関して理論的・実際的両側面から取り組み,平成28年度は以下のような研究成果を挙げた. 1. 多クラスパターン認識の解析手法の研究は,文字・画像認識,医用画像工学などの様々な分野で必要とされる重要な研究課題である.本研究では,次元圧縮法によって高次元空間をより低次の空間へと圧縮し,所属未知のデータと圧縮した空間との類似度を基準として分類する部分空間法について研究した.特に,カーネル法による非線形部分空間法とモデルの推定と変数選択を同時に実行するlasso タイプの正則化推定法について新たなスパース非線形部分空間法を提案した. 2.自然言語処理,システム工学,マーケッティングなど幅広い分野で用いられている分析手法の一つに正準相関分析がある.この手法は,2つの確率変数ベクトル間の関連性の程度を基準として分析する手法で,近年,極めて次元の高いデータや複雑な非線形構造を内包する多次元データが観測されるようになり,正準相関分析の新たな推定法や非線形化の研究が必要となってきた.本年度は,高次元化と非線形化の問題に対処するための研究に取り組み,モデルの安定化と汎化能力を向上させる変数の探索と同定を目的としたスパース正準相関分析,非線形構造を内包する多次元データの分析に有効に機能するカーネル法による非線形正準相関分析,モデルの非線形化とスパース性を融合した正準相関分析について理論的・数値的側面から研究し,実際上有用な解析手法の提案を目指して研究を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の目的とする大規模・高次元データに基づくスパースモデリング,カーネル法に基づく非線形モデリング,多クラスパターン認識などに関して理論的・実際的両側面から取り組んだ結果,当初の研究計画の中で次のような研究成果を挙げることができた. (1) カーネル法による非線形部分空間法とモデルの推定と変数選択を同時に実行するlasso タイプの正則化推定法について新たなスパース非線形部分空間法を提案した. (2) 正準相関分析の高次元化と非線形化の問題に対処するための研究に取り組み,モデルの安定化と汎化能力を向上させる変数の探索と同定を目的としたスパース正準相関分析,非線形構造を内包する多次元データの分析に有効に機能するカーネル法による非線形正準相関分析について理論的な側面から取り組み,一定の成果を挙げることができた. この研究成果を諸科学の直面する問題解決に応用するには,計算アルゴリズムの開発研究を併行して実施する必要がある.今後,スパースモデリングに関する理論研究を推進すると伴に,数値的側面からの研究に取り組み,モデリングに有効に機能する計算アルゴリズムの開発に取り組む予定である.
|
Strategy for Future Research Activity |
これまでに取り組んできた超高次元データに基づく様々なL1型正則化モデリングは,モデルの推定と変数選択を同時に実行できる有用な手法ではある.しかし,モデリングの過程で本質的な役割を果たす複数の正則化パラメータの決定法,データ数を超える多数のパラメータで特徴づけられたモデルを評価するためのモデル評価基準の提唱,大規模モデルの超高次元化に伴って生じる計算上の問題点など,理論的・数値的にいくつかの解決しなければならない問題が残っており,更なる研究が必要である.また,開発したスパースモデリングを生命科学,文字・画像認識へ応用した結果,有用性は立証できたが,より汎化能力の高い柔軟な手法開発を目指した研究を推進する必要性を認識した. このような観点から研究の一つの方向として,数値的アプローチに対して解析的なアプローチが難しいと思われた L1型スパースモデリングを,統計科学,機械学習の知識融合と数学的成果の有効利用によって,新たなスパースモデリングの展開を試みる.また,データからの情報に加えて,蓄積された知識を事前情報としてモデルに同化させた有効な推定法を確立する.このため,L1タイプの正則化項を課したモデルのパラメータに事前分布を設定して,確率分布に融合するベイズの理論・方法論について研究を推進し,より汎用性の高いベイズ型スパースモデリングの開発研究を行う. 開発したスパースモデリングは,多変量解析の各種分析手法への適用研究に取り組み,大規模・超高次元データから現象の構造を捉え,予測に有効に機能するモデルと高効率に情報抽出を行うための新しい分析手法の提案を目指す.平成30年度は,前年度の研究をさらに発展,継続させるとともに,諸科学への応用研究を積み重ねて,適用上の問題点を常に検証して研究にフィードバックさせる.
|
Causes of Carryover |
連携研究者による多変量解析,方向性データ解析におけるスパースモデリングの研究と環境科学への応用研究および資料収集を中国成都市西南財経大学(SWUFE)において実施した際の経費が,予定していた見積額を下回ったため.
|
Expenditure Plan for Carryover Budget |
平成29年度への繰越金は,少額であるので29年度利用計画とは別途に,書籍,計算機関連消耗品の購入に充てる予定である.
|
Research Products
(3 results)