2021 Fiscal Year Research-status Report
高次情報抽出のためのモデル融合型統計解析手法の開発研究
Project/Area Number |
19K11854
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
川野 秀一 電気通信大学, 大学院情報理工学研究科, 准教授 (50611448)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | スパースモデリング / 主成分回帰 / ベイズモデリング / マルチタスク学習 / テンソルデータ解析 / 変数併合 / 組成データ解析 / 馬蹄事前分布 |
Outline of Annual Research Achievements |
昨年度までと同様,本研究課題解決のための統計的モデリング手法に関する研究に取り組んだ.令和3年度では,以下の研究成果をあげることができた. 1. 関係性把握を行う統計手法の研究として,令和2年度にクロネッカー積に基づくテンソル共通成分分析を提案したが,この提案手法のさらなる理論的・数値的検証を行った.まとめていた原著論文にこれらの結果を加えることにより,提案手法をブラッシュアップさせることができた.本論文は,国際学術雑誌に掲載された. 2. 組成データを扱うことが可能なマルチタスク学習のための統計モデリング手法を提案した.タスクは標本毎に設定し,sample-specificモデルの枠組みの下で研究を進めた.Lin et al. (2014, Biometrika) の研究をたたき台にして,局所対称モデルで問題を定式化し,ネットワークlassoによる推定方法を確立した.推定アルゴリズムを交互方向乗数法の枠組みで導出し,シミュレーションによる性能評価後,腸内細菌叢データに適用した.本研究内容は,現在,原著論文として投稿中である. 3. ベイズ的併合型モデルに取り組んだ.併合型モデルとしては連結lasso,ベイズモデルの事前分布には馬蹄事前分布を用いた.ギブスサンプリングを構成し,モンテカルロ・シミュレーションを通して,提案手法の有効性を検証した.さらに,提案手法をhexagonal operator for regression with shrinkage and equality selection (HORSES) の枠組みに基づき拡張した.本研究内容は原著論文としてまとめられ,現在投稿中である. 4. 上記1から3以外にも次の研究に取り組んだ.統計的因果推論の枠組みの下,二重頑健推定量のモデル平均化法を考え,その平均化するモデルの候補集合の構成方法を提案した.また,lassoにおける偽発見率の推定において,ブートストラップを用いた推定方法を提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
令和2年度までに取り組んでいた,ベイズ的スパース凸クラスタリング,spike-and-slab事前分布に基づくベイズ的併合型モデル,テンソルデータに対する共通成分分析,多重関連ベクトルマシンの研究成果が学術雑誌に掲載された.組成データを扱うことが可能なマルチタスク学習,馬蹄事前分布に基づくベイズ的併合型モデルの研究成果をプレプリントとして発表することができた.
|
Strategy for Future Research Activity |
令和4年度は最終年度であるため,本研究課題の総括を行うとともに,以下の課題に取り組む. 1. これまでに取り組んできた主成分回帰,マルチタスク学習,低ランク回帰,共通成分分析などへの理解を深め,これらの統計モデルを用いて,予測と関係性把握を同時に行うための統計手法を新たに構築できないか検討する.計算アルゴリズムまでをも含めたモデリング手法を確立し,数値実験を通して有効性を検証する. 2. 予測を行う統計手法として,ベイズモデルの検討をさらに進める.これまで,線形回帰モデルを中心としたベイズモデルを考えてきたが,一般化線形モデルの枠組みまで拡張する.その際,マルコフ連鎖モンテカルロ法の構成が問題となるが,最新のサンプリング技術を用いることにより,高精度かつ高速な計算アルゴリズムを実現する. 3. 上記1と2で開発した手法のソフトウェアパッケージを作成する.
|
Causes of Carryover |
理由:昨年度に引き続き,新型コロナウイルス感染症の影響により,旅費の予算を計画的に使用することが困難だったため. 使用計画:統計科学関連,最適化関連,コンピュータサイエンス関連分野の書籍の購入,ソフトウェアパッケージの開発補助のための謝金,英文校正費,採択論文のオープンアクセス化に必要な費用等に充てる計画である.
|