2013 Fiscal Year Research-status Report
大規模計測データに対する正則化統計モデリング手法の開発
Project/Area Number |
25730017
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Kyushu University |
Principal Investigator |
松井 秀俊 九州大学, 数理(科)学研究科(研究院), 助教 (90633305)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 統計数学 / 関数データ解析 / スパース正則化 / モデル選択 |
Research Abstract |
観測された高次元データに対して、有用な情報を抽出するための統計的モデリング手法を構築した。本研究では、下記の二つの内容に関して二本の論文を執筆し、論文誌に投稿中である。 スパース正則化は、回帰モデルの係数パラメータにL1ノルムの制約を課した推定法で、制約の性質からモデル推定と変数選択を同時に行える手法として近年の統計科学の分野で最も多く利用されている手法の一つである。本研究では、ロジスティック回帰モデルに対して、すべての群の組み合わせに対する判別境界を選択できる制約を提案し、その制約に基づく推定のアルゴリズムと、推定モデルの評価法を導出した。提案手法をベンチマークデータに適用し、推定結果から各変数における判別能力の程度を示すことができた。 一つの個体が時点や位置などに応じて複数の観測値を得た形式のデータは「繰り返し測定データ」とよばれている。繰り返し測定データに対するアプローチの一つである関数データ解析は、離散時点観測されたデータを関数化処理し、得られた関数をデータとして扱う解析方法であり、繰り返し測定データ解析における問題点を解消できる。本研究では、目的変数と複数の説明変数が共に関数データとして与えられたとき、これらの関係を表現するための回帰モデルを構築した。特にここでは、両変数間の時間の因果関係を考慮したモデルについて考察した。そして、スパース正則化に基づく推定を通して、関数データとして与えられた説明変数の選択を行った。提案した手法を気象学のデータに適用し、台風の進路に影響を与えている気象情報の選択を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ロジスティック回帰モデルに対するスパース正則化に関しては、提案した推定法および評価法によって、研究目的に即した結果を得られることが数値実験を通して検証できた。この結果を論文としてまとめることができた点から、本研究は順調に進展していると考えられる。提案手法を実際のデータに適用することでも、その効果を明確に示すことができたが、そこからデータに対する新たな知見などを得ることについては難しかったという点では、さらに進展の余地があったと考えられる。 関数データに基づく回帰モデルの推定についても、モデルの推定、評価法を構築できた上、この結果を論文としてまとめることができた。一方で、このモデルの推定では時間の因果関係として、どの時点までをモデルに含めるかという点でのモデル選択の問題も残っている。この点については解決方法を得ることができなかった。
|
Strategy for Future Research Activity |
関数データに基づく回帰モデルにおいて、時間の因果関係を考慮に入れた新しいモデルの構築を試みる。当該年度に用いたモデルでは、推定に多くの数値計算を必要とする上、因果関係がどこまであるかという選択が難しかったため、これらの問題点を解消するための方法について検討する。 目的変数が複数種類ある、つまり多変量とき、これに対してスパース正則化を適用することで、モデルの推定と変数選択を同時に行う方法として、モデルの推定方法と、推定モデルを評価するための基準を導出する。目的変数が多変量の場合、モデルの推定量を導出するには高度な行列演算が必要になると考えられるため、行列演算についての知識を得ながら推定量を構築する。
|
Expenditure Plans for the Next FY Research Funding |
申請時には、購入予定の書籍としてプログラミング関係図書を挙げた。実際、当該年度の研究では、これまであまり利用したことがなかったMatlabを利用したが、解析する上でプログラム作成が難しい箇所については、公開されているソースコードを発見することができた。さらに、それ以外の箇所については比較的容易にプログラムを作成できた。以上の理由から、プログラミング関係図書の必要性が当初の想定よりも低下した。 当該年度は、研究により得られた成果を学会の場で報告する機会が多いとは言えなかった。従って、次年度使用額をより多くの学会、シンポジウムでの発表のための旅費に充て、研究内容に対して意義ある知見、フィードバックを得ることを計画している。
|
Research Products
(5 results)