研究課題/領域番号 |
16K16020
|
研究機関 | 滋賀大学 |
研究代表者 |
松井 秀俊 滋賀大学, データサイエンス学部, 准教授 (90633305)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 統計的モデリング / 関数データ解析 / 変数選択 / スパース推定 |
研究実績の概要 |
経時的に測定されたデータから、有効な情報を抽出するための統計的モデリング手法の開発を行った。本研究では、経時測定データに滑らかな関数を当てはめて関数データとして処理し、関数データを判別するためのロジスティック回帰モデルの推定方法について検討した。 多変量の関数データを3群以上の群へ判別する場合、判別に影響を与えている変数自身だけでなく、各変数に対しても、3群のうちどの群の判別に寄与しているかの選択、つまり決定境界の選択が必要な状況が生じる。本研究では、関数データに基づくロジスティック回帰モデルにおいて、スパース推定法の一つであるsparse group lassoを用いて推定することで、関数データの変数選択と決定境界の選択を同時に行う方法を提案した。推定アルゴリズムとして、座標降下法を提案手法に応用したものを導出した。また、モデル推定に伴う調整パラメータの値を、モデル評価基準を用いて決定した。提案手法を、人工データおよび実データ(遺伝子発現データ)の解析に適用することで、有効性を検証した。成果は論文として採択済である。 また、関数データに基づく線形回帰モデルにおいて、変数選択を効率的に行うためのアルゴリズムを新たに提案した。多変数の説明変数において、変数を複数のグループに分割し、各サブグループで変数選択を行う処理を繰り返すことで、全変数で変数選択を行う場合よりも計算コストを大幅に抑えることができる。本手法は、スパース推定に基づく変数選択などに比べて優れた変数選択の精度を与えた。この研究成果も論文として採択済である。 前年度から遂行していた、関数データに基づく二次回帰モデリングについては、推定法を最尤法の枠組みから正則化法へ拡張した。そして、数値実験を行うことで既存手法に比べて優れた予測結果を得た。研究成果は論文として執筆中である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
関数ロジスティック回帰に基づく変数・決定境界選択法については、モデルや推定方式の構築は比較的容易に行うことができたが、推定のためのアルゴリズムの構築とプログラムの実装に時間を要した。それでも、研究期間内に既存手法に比べて有効性を示すことができたため、本研究は予定通りに進捗していると判断した。 また、新たに共同研究として行うことになった、関数回帰モデルの効率的な変数選択法については共同研究者の協力もあり短時間で論文として採択させることができた。 関数二次回帰モデルの研究は、昨年度の内容を拡張し論文としてほぼ完成させることができた。こちらについても研究期間内に投稿出来る予定である。
|
今後の研究の推進方策 |
関数二次回帰モデルについては、現在多くの研究が行われている。私のこれまでの研究成果を活かして、スパース推定との融合などについて検討する。例えば、多変量データに対する交互作用モデルでは、交互作用項よりも主要項の変数を優先的に選択するためのスパース推定法が提案されている。これを関数データの枠組みへ拡張し、関数二次回帰モデルの変数選択へ応用することを試みる。 また、関数データに基づく回帰モデルだけではなく、クラスター分析についても研究を進める。これまでの研究で、経時測定データに対して混合効果モデルを用いて関数化し、得られた関数データ集合に基づくクラスタリング手法について検討したが、その際は多変数の関数データ間の関連を考慮に入れていなかった。今後の方針として、関数データ間の関連を考慮に入れたモデリングおよびクラスタリングを検討したい。
|
次年度使用額が生じた理由 |
年度末に予定していた学会への参加が、体調不良により不参加になったため年度内に使用することができなかった。繰越額は別の学会への参加や研究打合せのための出張費として使用する。
|