研究課題/領域番号 |
15K15947
|
研究機関 | 電気通信大学 |
研究代表者 |
川野 秀一 電気通信大学, 大学院情報理工学研究科, 准教授 (50611448)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 機械学習 / スパース学習 / 主成分分析 / 回帰分析 / 一般化線形モデル / オンライン学習 / 情報量規準 / 順序カテゴリカルデータ |
研究実績の概要 |
昨年度より引き続きスパース主成分回帰モデルの研究に取り組んだ.離散変数を取り扱うことが可能な損失関数を一般化線形モデルの枠組みまで拡張し,新たな損失関数を導出した.拡張された損失関数と主成分損失関数により最小化問題ベースでモデルを定式化し,スパース正則化を課すことによりモデル選択とモデルの一意性を保証したモデリング手法を提案した.モンテカルロ・シミュレーションや実データ解析を通して提案手法の有効性を検証した.本研究成果は,原著論文としてまとめられ現在投稿中である.また,様々な損失関数に対するスパースモデリングに関する研究,およびスパースモデルに含まれる正則化パラメータの選択方法に関する研究についても取り組んだ.順序付きカテゴリカルデータを目的変数とするスパース順序ロジットモデリング手法に対し,さらなる理論的・数値的検証を行った.オンライン学習手法adaptive regularization of weight vectors (AROW) にスパース学習を組み込んだスパースAROWについても,様々な観点から捉え直すことを試み,多くの数値的検証を行った.決定木のオンライン学習はこれまでミニバッチ学習の枠組みでしか研究されてこなかったが,カルバック-ライブラー情報量に基づいた損失関数を導出し,逐次的に得られるデータのみでモデルの更新が可能なオンライン決定木学習手法を提案した.スパース推定により得られる推定量の漸近分布を考えることにより,スパース推定された一般化線形モデルの評価基準を導出した.得られたモデル評価基準の有効性を,シミュレーションや実データへ適用することにより評価した.提案した評価基準を計算するソフトウェアを,統計分析ソフトR のパッケージsAICとして作成し,一般に公開した.得られた成果は研究論文として発表するとともに,学会・研究集会等で発表した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
スパース順序ロジットモデリングおよびスパースAROWに関する研究成果を学術雑誌に掲載することができ,スパース主成分回帰モデルに関する研究も原著論文としてまとめ上げ現在投稿中である.ただ,その他のデータ形式に対するスパース主成分回帰モデルの研究については取り組むことができなかったため,区分は「おおむね順調に進展している」とした.
|
今後の研究の推進方策 |
一般化線形モデルから導出される損失関数に基づくスパース主成分回帰モデルは,多くの計算時間を必要とする.このため,計算アルゴリズムの高速化について検討を行う.高速化の方法は多種考えられるが,座標降下法の共分散更新を中心に検討する.また,これまで主成分分析を行う損失関数は連続変数のみを扱うものであったが,カテゴリカルデータなどの離散変数も扱うことが可能な損失関数まで拡張する.現在関連研究を調査しており,研究に必要なエッセンスは掴みつつある.
|
次年度使用額が生じた理由 |
スーパーコンピューターの利用費を計上していたが,年度途中で他の研究費が採択され,利用費の支出をそちらの研究費に変更したため.
|
次年度使用額の使用計画 |
研究を遂行するために必要な統計科学関連,最適化関連,情報科学関連分野の図書を適宜購入する.得られた研究成果を,統計関連学会連合大会や情報論的学習理論ワークショップ,ロンドンで行われる「The 10th International Conference of the ERCIM WG on Computational and Methodological Statistics」において発表する予定であり,そのための旅費に充てる計画である.
|
備考 |
R パッケージ sAIC https://cran.r-project.org/package=sAIC
|