研究課題/領域番号 |
24700139
|
研究種目 |
若手研究(B)
|
研究機関 | 東京工業大学 |
研究代表者 |
山崎 啓介 東京工業大学, 総合理工学研究科(研究院), 助教 (60376936)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | 数理統計学 / 階層型学習モデル / 漸近解析 |
研究概要 |
並列計算が可能な計算機を購入し、潜在変数推定の精度の計算を行った。予備研究で得られた理論値と計算機実験での値が概ね一致していることを確認した。実験に用いたモデルは混合正規分布である。コンポーネントの距離が近い場合にはクラス間の類似度が高いため、実験値は不安定になる。この場合は理論値に含まれるフィッシャー情報行列の逆数も発散に近い振る舞いをみせ、理論値と実験値双方で値が大きくぶれるため、対策が必要である。計訓練データ数を増加させることで理論値と実験値の比較が可能であるが、どの程度まで増やせばよいか、など新たな課題がみつかった。 また、データの一部の潜在変数が観測可能な場合(半教師あり学習)において、理論値を導出した。半教師あり学習は潜在変数の値が人手を用いて入手可能な場合に、それを利用する実用的な学習設定である。理論値は教師なし学習の場合と同様に、最尤法とベイズ法では主要項の係数が異なることがわかった。また、幾つかの仮定は必要であるが、多くの場合でベイズ法の推定誤差が最尤法のそれよりも小さいことが証明された。 ベイズ法を用いた潜在変数推定はマルコフ連鎖モンテカルロ法(MCMC法)を行う必要があり、実データ解析では計算量が多いことからあまり利用されていない。しかしながら理論的にその有用が証明されたので、実際にMCMC法を用いてクラスタリング結果の性質を実験的に検証した。変数に冗長性がない場合はサンプリング結果が安定していることが確認できた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
計算機による検証は計画通り進んでいる。 また当初の計画になかった半教師ありデータにおける理論値の導出に成功した。 それについて国内外の研究会で成果を報告できた。
|
今後の研究の推進方策 |
半教師あり学習の検証や、理論値と実験値の安定的な比較ができるための訓練データ数の考察など新たな課題が見つかったので、それを含めて研究を続ける。また当初の計画通り、「潜在変数の数に冗長性がある場合」についての計算機実験による精度計算や、理論値を応用した最適構造設計法を構築する。
|
次年度の研究費の使用計画 |
国際会議の開催場所が近く、また他の目的の使用も節約を行ったため次年度での研究費が発生した。未使用額は上記計画のための研究費に組み込む
|