研究概要 |
大規模な高次元データからの情報抽出は一般に計算量的に困難を伴う.統計力学的な観点からこの問題の解決やこうした困難が生じる起源を分析するために以下の課題に取り組んだ. 1.適応TAP法にもとづく逆イジング問題推定法の開発:神経活動度や遺伝子発現のデータなどは,しばしば,オン/オフの2状態のみを取り得る離散データとして取り扱われる.逆イジング問題とはこれを統計力学のイジングモデルに対応させ,1体のバイアスと2体の相互作用まで含む確率モデルの中で最もデータに当てはまるモデルを求める問題である.従来,統計力学における平均場近似を基礎として,現実的な計算時間で実行できるさまざまな近似的推定法が提案されてきた.本研究では,近似によって生じる自己相互作用の影響をデータから適応的に求める適応TAP法のアイデアにもとづいて,逆イジング問題の近似的推定法を開発した.ベンチマーク問題に適用することで,提案法は従来法と比較して,ほとんど計算量を増やすことなく,1体バイアスを定めるパラメータを高い精度で推定できることを示した. 2.イジングパーセプトロンに関する解空間の構造分析:離散変数の推定問題は一般に計算量的に困難である.その典型例として,イジングパーセプトロン(2値変数の法線ベクトルで定まる超平面での2クラス分類)を取り上げ,ランダムなクラス分けに対する解空間の構造の変化を統計力学の方法を用いて分析した.その結果,ランダムなデータセットの大きさが増えるにつれて解空間の大きさは小さくなる一方で,空間が消失する臨界値の直前までランダムに選択した異なる2つの解の距離は非常に大きく揺らぐことが明らかになった.このことは,解探索が難しいイジングパーセプトロン問題の難しさの起源に対する手がかりとなるかもしれない.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
来日時期の都合上,実質的な研究のスタートが9月と遅かったため,初年度であるH24年度の目的は大規模確率モデルを平均場近似する際に生じる自己相互作用効果に関する基礎的理解と洞察力の向上としていた.外国人特別研究員と議論を重ねることにより,その内容を逆イジング問題に適用し,一部の性能について既存手法を上回る結果を見出したことは当初の予想以上の成果であった.
|
今後の研究の推進方策 |
逆イジング問題については,当初,非対称結合系への理論の適用を想定していたが,対称結合系について結果が出始めているため引き続きその分析を進める.また,平行して偽尤度法(pseudo likelihood method)として知られている別法との比較も進める.当初H26年に着手する予定であった高次元データの2クラス分類に関する計算困難を分析する課題もイジングパーセプトロンに関する分析が予定より進んでいるため前倒しして着手する.
|