2014 Fiscal Year Research-status Report
スパース正則化による判別とグループ化に基づく意思決定システムの構築
Project/Area Number |
25330049
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
川崎 能典 統計数理研究所, 大学共同利用機関等の部局等, 准教授 (70249910)
|
Co-Investigator(Kenkyū-buntansha) |
植木 優夫 東北大学, 学内共同利用施設等, 助教 (10515860)
赤司 健太郎 学習院大学, 経済学部, 准教授 (50610747)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | スパース正則化法 / 分類・パターン認識 / 変数選択 / 変数グルーピング / 高次元分割表解析 / リスク解析 / 多重共線性 |
Outline of Annual Research Achievements |
カテゴリカルな応答変数に対して説明変数候補が膨大で、交互作用項が組合せ爆発的に多い状況を考える。このようなデータセットに対し、高次元分割表解析による情報抽出法を経由して、有効な予測変数の探索法を構築できることを明らかにすることと、スパース正則化法を利用したリスク因子剪定法が効率的かつ実用的な変数減少法を与えることを明らかにするのが、本研究の目的である。 平成26年度は、課題として掲げていた「スパース正則化を利用した自動変数グルーピング法の数値的側面の研究」に関して、実例ベースで研究を進めた。具体的には、電話による直接顧客マーケティングを利用した定期預金の販売に関するデータを分析した。預金契約に至りやすい顧客の特徴の把握と予測性が、変数選択法ないしグルーピング法によってどう異なるかを統計的に検証した。比較の対象として、LASSO、Elastic-Net、SCAD、MCPに加えて、我々の提案するSmooth-Threshold Estimating Equation法(STEE法)を取り上げた。推定用データと予測検証用データに分ける分割をランダムに10回実行して、受信者操作特性(ROC)曲線下の面積(AUC)で予測精度を比較すると、どの手法の精度もほぼ同等であった。この結果は国内学会の特別講演と、国際会議の招待講演で公表したほか、英文学術誌に投稿中で、現在改訂中である。 このほか、遺伝子間相互作用解析において分割表がスパースとなるケースに関し、一般的な固定自由度の代わりに適応的自由度を用いる検定手法を考案した。数値実験を行い、実際に検出力が向上することを確認し、得られた成果を論文にまとめて出版した。また、多変量金融時系列に基づく市場リスク管理への政策的な応用として、外国為替市場への介入額の意思決定システムを分析した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成26年度は、統計的パターン認識、機械学習における他手法との比較実証分析を、特に実際問題への応用の中で研究することを目標としていたが、これは銀行定期預金に関するテレマーケティングデータを利用した研究において、ほぼ達成することができた。研究内容は英文学術誌に投稿され、査読を経て現在改訂中である。また、遺伝子間相互作用解析においても着実に応用成果が上がっている。スパース正則化法に関連する学会発表では、研究代表者と研究分担者で合わせて5件の招待講演ないし特別講演(うち国際会議3件、国内学会2件)を行っており、学会での注目度は高まっている。 年度当初に挙げていた目標のうち、リスク最小化モデルとスパース正則化型変数選択法との統合は、研究分担者の一人の本務多忙で次年度に持ち越しとなったが、そもそも収損益データ(リスク事象のインパクト)が利用可能なデータで、結果を公表可能なケースは非常にすくなく、適切な公開データの取得に至らなかったという現実問題があった。これに関しては、シミュレーションデータでの検証を行うことを検討している。
|
Strategy for Future Research Activity |
平成27年度は課題の最終年度であるので、本プロジェクトの研究成果を論文等刊行物の形でなるべく結実させるよう努める。H26年度から持ち越しとなった、リスク最小化モデルとスパース正則化型変数選択法との統合については、収損益データが利用可能なデータセットの取得に至らない場合は早めに判断し、シミュレーションベースでの検証に切り替える。 統計的パターン認識、機械学習における他手法との比較実証分析という点では、パラメータ空間における八角形型(octagonal)縮小制約という興味深いスパース正則化法があるので、これも実証分析に加えることを計画している。
|
Causes of Carryover |
生じた次年度使用額の殆どは、初年度の平成25年度に研究分担者の一人が本務多忙であって、研究課題への取り組みは行ったが、学会発表等が本務都合でできなかったことに起因している。平成26年度単年度を取ってみれば、140万円の配分に対して147万円の執行であり、適正な執行状況にある。
|
Expenditure Plan for Carryover Budget |
初年度繰り越した分を考慮に入れて、研究発表や国際学会参加予定などに関して研究分担者と既に検討を行った上で配分額を調整しており、平成27年度の各機関への配分段階で、適切な配分となる予定である。
|
Research Products
(7 results)