研究実績の概要 |
Distributional Learning のアルゴリズムの考え方をもとに,階層化ノンパラメトリックベイズのモデルを用い, (k,l)-文脈依存確率を持ったCFGを定義した.また,リアル データに対する実験結果としても,Modified Kneser-Ney n-gramモデルと比較して,上回る結果を得た.Distributional な文脈から構文を学習する際に,ノンパラメトリックベイズの階層をよりフレキシブルにするため,右文脈と左文脈に分け,それぞれがどのように取り除かれていくかを考察しその有効なサンプリングの手法を提案している.実際には、最左導出の際は、右文脈を考慮すると、計算量が右文脈 の長さに対して指数的に増えるため,右文脈を考慮することは現実的ではない.そこで,構文木の導出の順序および階層のつけ方自体を考え直すことで,左右どちらの文脈も,現実的な計算量で考慮できるようなベイズ的な確率過程を構築した.実際の実装では,サンプリング法は高速に行うことが必要である.ノンパラメトリックベイズ推定で用いられるサンプリングは,ベクトル演算として効率よく実装することは難しいため,深層学習など他の機械学習の手法でよく用いられるようなpythonのベクトル演算用のライブラリを用いることは難しい.そこで,cython などによる中間的な言語を部分的に用いることにより,実装を軽量化する方法を考案している.最終的な成果として,教師なし構文解析の高精度化のためのアルゴリズムを提案することにより,一定の貢献を行うことができたと考えられる.
|