2005 Fiscal Year Annual Research Report
大規規構文木付きコーパスに基づく逐次的音声発話解析システムの開発とその評価
Project/Area Number |
17700145
|
Research Institution | Nagoya University |
Principal Investigator |
加藤 芳秀 名古屋大学, 大学院・国際開発研究科, 助手 (20362220)
|
Keywords | 漸進的構文解析 / 構文木付きコーパス / 音声対話インタフェース |
Research Abstract |
本研究の目的は,逐次的音声発話解析モジュールを開発し,自然で円滑な音声対話インタフェースを実現することにある.本研究では,研究の焦点を構文レベルの解析に絞り,音声発話の逐次的な構文解析手法の開発に取り組んだ.初年度は,構文情報に基づくコーパス検索ツールの開発,構文木付きコーパスに基づく構文木用例データベース構築,ならびに,構文木用例に基づく漸進的構文解析の開発を実施した. (1)構文情報に基づくコーパス検索ツールの開発 構文木付きコーパスの分析を円滑に行うために,コーパス検索ツールを開発した.キーワード系列から自動的に構文パターンを同定し,構文パターンを参考にしながらコーパス内を検索できる. (2)大規模構文木付きコーパスに基づく構文木用例データベースの構築 構文木付きコーパスから構文木用例を自動抽出するアルゴリズムを開発した.本アルゴリズムでは,コーパス中の構文木を部分構文木に分割する.部分構文木の形状を漸進的解析に適したものに限定すると同時に,言語学的に妥当な構文木用例を抽出するために,構文木の主辞情報に基づき分割する.本アルゴリズムに従って,数万文規模の構文木付きコーパスであるPenn Treebankから用例を抽出し,数千の構文木用例からなるデータベースを構築した. (3)構文木用例に基づく漸進的構文解析の開発 (2)により構築された構文木用例データベースに基づく漸進的構文解析を開発した.データベース中の構文木の出現頻度情報から,最大エントロピー法により確率言語モデルを構築した.確率言語モデルに基づき生起確率の大きい構文木を優先的に構築する漸進的構文解析アルゴリズムを開発した.
|