2011 Fiscal Year Annual Research Report
コーパスからの語彙項目抽出による大規模な日本語結合範疇文法の構築
Project/Area Number |
21500152
|
Research Institution | Osaka Gakuin University |
Principal Investigator |
大谷 朗 大阪学院大学, 情報学部, 准教授 (50283817)
|
Keywords | 語彙化文法 / 談話表示理論 / 言語情報記述 / 長文 / 構造的曖昧性 / 統語・意味・語用論的制約 / 人間の文理解 / 漸進低解析 |
Research Abstract |
本研究では、結合範疇文法(CCG)や主辞駆動句構造文法(HPSG)等の語彙化文法と、モンタギュー文法(MG)や談話表示理論(DRT)等の形式意味論に基づいて、新聞記事に現出する文のパターンを理論的に分析するとともに、そうしたパターンの制約に関連する人間の文理解メカニズムをモデル化し、言語情報記述の枠組みの精緻化を試みる。また、そうして得られた形式化を利用して、新聞記事データ集から工学的な応用が可能な文法を自動的に抽出することを試み、さらにモデルの働きをシミュレーションし、言語心理実験の結果と比較することで、提案する言語情報の形式化・モデルの妥当性を高めることを目的とする。 CCG、HPSG、DRTといった枠組みは、理論言語学と計算言語学の知見を柔軟に取り込みうる伝統的かつ最先端の言語理論であるが、日本語解析への適用はあまり試みられていない。そこで、本研究では、理論モデルの設計および複雑な言語晴報の形式化、大規模データの収集といった両分野が得意とする手法をこれらの枠組みの上で組み合わせ、言語学的に裏付けられた日本語文法・文理解メカニズム・コーパスといった言語情報の形式化、処理方法、資源の総合的かつ効率的な開発を目指した。 本研究の今年度の関心は~新聞記事の文のパターンの一つである長文に関し、人間にとっても、また計算機にとっても望ましい解析方法と考えられる漸進的解析に着目し、それを可能とする枠組みを具体的に記述することとした。従来の主要な研究対象であった構造的曖味性の解消の問題に焦点をあて、この処理に統語・意味・語用論的制約がどのように用いられるかということを考慮してDRTに基づいたモデルを構築し、文の持つ具体的な意味表示が完成される過程をシミュレートし、さらにそうした過程が人間の文解析の方法として妥当な振る舞いとなっているかどうかを言語心理学的にも検討した。
|
Research Products
(2 results)