2010 Fiscal Year Annual Research Report
大規模ランダム行列を用いたモデル選択と機械学習理論
Project/Area Number |
20700258
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
小林 景 統計数理研究所, 数理・推論研究系, 助教 (90465922)
|
Keywords | 大規模ランダム行列 / カーネルマシン / カーネルグラム行列 / モデル選択 |
Research Abstract |
本年度は,代数統計学の共同研究のため,ロンドン・スクール・オフ・エコノミクスに長期海外出張し,全く新しいアプローチから統計モデルに代数的手法を導入した. まず,モデルと推定量が代数的に(多項式を用いて)定義される場合を考えた.この仮定は一見強く思われるが,ポアソン分布や多項分布などの分割表モデルや,ガウス分布で共分散行列に多項式制約がつく場合など適用範囲は広い.この場合において,まずフィッシャー情報計量やアファイン接続,埋め込み曲率などの情報幾何学的量を代数的に計算し,二次漸近有効性の十分条件をこれらを用いて表す.この十分条件を満たす代数的な推足量のクラスは,二次漸近有効な推定量全体の中で充分豊かであり,また局所的に推定値の一意的な存在を示すことができる. 次に,この二次漸近有効な推定量のクラスの推定方程式は代数的に単純な形をしていることから,その中に2次以下の連立多項式方程式で表されるようなものが存在することが示される.また尤度方程式からグレブナー基底による剰余を行うことにより,その連立多項式方程式を導出することができる.多項式の次数が下がると,ホモトピー連続化法などの数値計算手法を用いた推定値の計算の計算量を本質的に削減できるという利点がある.実際,数個実験によって計算量の本質的な削減を確認できた また,心内英単語辞書の相違の統計的解析についての結果をIMS Annual Conferenceで発表した.この研究では,心内辞書をランダム距離行列とみなして,その相違の新しい検定手法を提案した.
|