研究概要 |
本研究は,画像,音声,自然言語,塩基配列などの大規模データに対して用いられている確率的生成モデルの,事後確率分布に潜む奇妙な構造を明らかにすることを目的とする.この目的のために平成23年度は以下の研究を実施した.なお,以下では解釈用のモデル(事前確率分布)をP(x),観測データのモデルをP(y|x)と記述する. 隠れマルコフモデルにおける事後確率分布構造の解析:事後確率分布P(x|y)にしたがう,多数(n個,10,000個程度)のサンプルx(200-500次元)を,動的計画法を用いた正確なアルゴリズムにより生成した.それぞれのサンプルに対し,多数(m個)の近傍の状態を生成し,サンプルの事後確率P(x|y)とm個すべての状態の事後確率の和を求めた(この和をBとする).こうして得られたn個のBを大きい順に並べかえたとき,その最大値Bmaxを構成するm個の状態に,事後確率を最大にするx(xmapと書く)が含まれていなければ,事後確率分布に不自然な構造が存在する(状態xmapが不自然)というのが本研究の考え方である,昨年度に引き続き,本年度は,いくつかの異なる近傍状態の生成方法を試して実験をおこなった.その結果,事後確率分布に奇妙な構造をもつ例をいくつか検出することができた.本年度は,格子型2次元マルコフ確率場およびツリー型マルコフ確率場においても,事後確率分布構造の解析を同様におこなった.その結果,格子型2次元マルコフ確率場についても,事後確率分布に奇妙な構造をもつ例を発見することができた.ただし,あらかじめ予想していた範囲を超える例は発見できていない.
|
今後の研究の推進方策 |
事後確率分布の構造を調べる研究を発展させる.とくに1)事後確率分布から生成したサンプルの近傍状態生成す手法を工夫する.2)確率的生成モデルのパラメータを観測データから最尤推定により推定する場合,その尤度関数は,一般的には多数の極大値をもつことが知られているが,観測データ数が増えるにしたがい,その多峰性は消失すると予想している.この予想を検証する.
|