研究課題/領域番号 |
17H06569
|
研究機関 | 東京大学 |
研究代表者 |
松田 孟留 東京大学, 大学院情報理工学系研究科, 特任助教 (50808475)
|
研究期間 (年度) |
2017-08-25 – 2019-03-31
|
キーワード | 低ランク / 多変量線形回帰 / 縮小ランク回帰 / 行列補完 / 特異値 / ベイズ統計 |
研究実績の概要 |
低ランク性を活かして行列型データの未観測成分を推定する経験ベイズ行列補完の手法を開発した。提案手法は、Efron and Morrisによる行列平均に対する特異値縮小型ミニマックス推定量の拡張になっている。すなわち、Efron and Morrisが用いた階層モデルにおいて一部の成分のみが観測できるという設定を考え、経験ベイズ推定量を導出したのが提案手法である。EMアルゴリズムの各ステップが線形代数の公式を用いて陽に書き下せるため、効率的なアルゴリズムとなっている。また、提案手法は既存手法と比べてパラメータチューニングが不要という利点をもつ。数値実験の結果、提案手法は多くの状況で既存手法と同等以上の補完精度を達成することが確認された。また、実データに対して提案手法が既存手法を上回る補完精度を達成することも確認された。
低ランク性を活かしたノンパラメトリック回帰の手法を開発し理論解析を行った。ノンパラメトリック回帰では関数を基底展開したときの係数列の減衰の速さで滑らかさを表現するのが一般的である。本研究では、複数のノンパラメトリック回帰を同時に行う設定において、各係数列の減衰の速さに加えて係数列の間の相関構造も考慮した関数クラスを定義した。この関数クラスは、アレイ信号データなど本質的に低次元であることが多いデータを表現するのに有効である。この関数クラスに対して、係数列をブロックに分割して各ブロックに特異値縮小を施す推定量が漸近的ミニマックスリスクを達成することを証明した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
経験ベイズ行列補完については、アルゴリズムの開発と実装に加えて、数値実験と実データへの適用まで完了することができた。
ノンパラメトリック回帰については、滑らかさと低ランク性の知識を必要とせずアダプティブに漸近的ミニマックスリスクを達成する推定量を構成することができた。
|
今後の研究の推進方策 |
経験ベイズ行列補完について、より多くのデータに有効な手法とするためにいくつかの拡張が考えられる。1つ目は、観測ノイズの分散が変数によって異なる場合への対処である。各変数に対する観測ノイズ分散を別々にデータから推定することができれば、より柔軟な行列補完を達成することができる。各変数に対する観測ノイズ分散を個別にパラメータとした場合でもEMアルゴリズムが閉じた形で書けるかを検証する。2つ目は、欠損メカニズムを考慮した拡張である。従来の行列補完のアルゴリズムでは、欠損がランダムに生じるというMissing Completely At Random (MCAR)の状況が暗に仮定されていた。しかし、実際には欠損がデータの値に依存して生じるMissing At Random (MAR)やMissing Not At Random (MNAR)の状況も多い。提案手法は統計モデルに基づいているため、このような欠損メカニズムを陽にモデルに取り込むことが可能である。
また、低ランク性を活かした情報量規準の改良にも取り組んでいく。Johnstoneは損失推定の問題を統計的決定理論を用いて定式化し、リスクの不偏推定量を優越するStein型の縮小推定量を与えた。この結果を特異値縮小へ拡張することで、縮小ランク回帰の状況で特に有効なモデル選択規準が得られると期待される。ここで、理論的な基礎づけとして、縮小ランク回帰型の推定量に対するリスクの不偏推定量の厳密な導出を与えることも重要である。従来の導出では推定量の不連続性が無視されており、数学的な妥当性に疑問が残る。
|