2013 Fiscal Year Annual Research Report
構文解析モデルの階層的確率オートマトンへの等価変換
Project/Area Number |
24800004
|
Research Institution | University of Tsukuba |
Principal Investigator |
若林 啓 筑波大学, 図書館情報メディア系, 助教 (40631908)
|
Project Period (FY) |
2012-08-31 – 2014-03-31
|
Keywords | 教師なし構文解析 / 階層的確率オートマトン / 階層型隠れマルコフモデル / 依存構造解析 / チャンキング / フレーズ抽出 |
Research Abstract |
平成25年度は,依存構造生成モデルと等価な階層的確率オートマトンの導出に取り組んだ.依存構造の主辞および項の属性を状態として,階層数を十分大きくすることで理論的に等価変換が可能であることを明らかにした.一方で,階層数が大きくなることによって,完全な等価性を維持すると計算量の観点から厳密推論が困難になる問題も明らかになった. しかし,階層数を制限することによって得られる近似モデルは,局所的な依存構造の推定を非常に効率よく高い精度で行うことができることが分かった.この性質を自然言語文章のチャンキング問題に応用し,等価変換により得られた階層的確率オートマトンの階層数を制限した「平坦近似依存構造モデル (Flat Approximated Dependency Grammar; FADG) 」による教師なしチャンキング手法を提案した.これまで,依存構造生成モデルは系列長に対する計算量が大きく,ごく短い文章しか現実的に扱うことができない問題があった.これに対して,FADGは浅い階層の依存構造解析を圧倒的に少ない計算時間で実現する.チャンキングは浅い構文解析を行う問題であり,FADGは教師なし手法として現時点での世界最高精度を達成した. また,提案モデルの拡張として,トピックモデルの特性を取り入れた系列セグメンテーションモデルを提案し,有用なフレーズ抽出が可能になることを示した.これらの結果は,本研究成果の応用性・拡張性の高さを示しており,系列解析手法における新たなフレームワーク研究基盤を拓いたといえる.
|
Current Status of Research Progress |
Reason
25年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
25年度が最終年度であるため、記入しない。
|
Research Products
(3 results)