2003 Fiscal Year Annual Research Report
語彙化文法理論に基づく言語学的に妥当な文法の自動獲得
Project/Area Number |
15700120
|
Research Institution | The University of Tokyo |
Principal Investigator |
宮尾 祐介 東京大学, 大学院・情報理工学系研究科, 助手 (00343096)
|
Keywords | 文法獲得 / 語彙化文法 / HPSG / 構文解析 / predicate-argument structure / Corpus annotation |
Research Abstract |
大規模なコーパスから,言語学に基づく文法を半自動的に獲得する手法について研究を行った.具体的には,語彙化文法の枠組みとしてHead-driven Phrase Structure Grammar(HPSG)を仮定し,文法獲得の理論(Corpus-oriented Grammar Development)の構築および実装・実験を行った.本手法は,まず,発見的規則を利用して,コーパスに対しHPSGに基づく言語学的制約を注釈付けする.次に,HPSG理論で定義される文法規則(スキーマ)を構文木に対して逆適用することで,その構文木を説明するのに必要な語彙的制約を獲得する.HPSGに代表される語彙化文法理論では,一般的文法制約を少数のスキーマで表し,その他の単語依存の制約を大量の語彙項目で表すため,スキーマを手で記述し,語彙項目を自動獲得することで,言語学に基づきかつ頑健な文法を低コストで獲得することができる.本手法を実際にPenn Treebankに適用し,HPSG英語文法を獲得する実験を行った.その結果,未知のテキストに対し,98%以上の単語について厳密に正しい語彙項目を持ち,75%以上の文については完全に正しい構文木を出力できる文法が獲得された.この実験結果は,手作業により開発された既存の語彙化文法では考えられない性能を示しており,本手法の有効性が実験的に実証された.この結果により,本手法は文法開発の新しい方法として今後様々な文法の開発に応用されると考えられる.また,獲得された文法を用い,構文解析実験を行ったところ,predicate-argument relationの関係を90%近い精度で出力できることがわかった.これは,今後HPSGによる構文解析が実アプリケーションで利用できる可能性を示している.
|
Research Products
(3 results)
-
[Publications] Yusuke Miyao, Jun'ichi Tsujii: "A model of syntactic disambiguation based on lexicalized grammars"Proceedings of the 7^<th> Conference on Natural Language Learning. 1-8 (2003)
-
[Publications] Yusuke Miyao, Takashi Ninomiya, Jun'ichi Tsujii: "Probabilistic modeling of argument structures including non-local dependencies"Proceedings of the Conference on Recent Advances in Natural Language Processing. 285-291 (2003)
-
[Publications] Yusuke Miyao, Takashi Ninomiya, Jun'ichi Tsujii: "Corpus-oriented grammar development for acquiring a Head-driven Phrase Structure Grammar from the Penn Treebank"Proceedings of the International Joint Conference on Natural Language Processing. (To appear). (2004)