研究課題
平成25年度は,依存構造生成モデルと等価な階層的確率オートマトンの導出に取り組んだ.依存構造の主辞および項の属性を状態として,階層数を十分大きくすることで理論的に等価変換が可能であることを明らかにした.一方で,階層数が大きくなることによって,完全な等価性を維持すると計算量の観点から厳密推論が困難になる問題も明らかになった.しかし,階層数を制限することによって得られる近似モデルは,局所的な依存構造の推定を非常に効率よく高い精度で行うことができることが分かった.この性質を自然言語文章のチャンキング問題に応用し,等価変換により得られた階層的確率オートマトンの階層数を制限した「平坦近似依存構造モデル (Flat Approximated Dependency Grammar; FADG) 」による教師なしチャンキング手法を提案した.これまで,依存構造生成モデルは系列長に対する計算量が大きく,ごく短い文章しか現実的に扱うことができない問題があった.これに対して,FADGは浅い階層の依存構造解析を圧倒的に少ない計算時間で実現する.チャンキングは浅い構文解析を行う問題であり,FADGは教師なし手法として現時点での世界最高精度を達成した.また,提案モデルの拡張として,トピックモデルの特性を取り入れた系列セグメンテーションモデルを提案し,有用なフレーズ抽出が可能になることを示した.これらの結果は,本研究成果の応用性・拡張性の高さを示しており,系列解析手法における新たなフレームワーク研究基盤を拓いたといえる.
25年度が最終年度であるため、記入しない。
すべて 2014 2013
すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (1件)
情報処理学会論文誌:データベース(TOD)
巻: Vol. 7, No. 62 ページ: 印刷中
電子情報通信学会他共催 第6回 Webとデータベースに関するフォーラム論文集
巻: - ページ: II-3-2