研究課題/領域番号 |
15300090
|
研究種目 |
基盤研究(B)
|
研究機関 | 中京大学 |
研究代表者 |
白井 英俊 中京大学, 情報科学部認知科学科, 助教授 (10134462)
|
研究分担者 |
白井 賢一郎 中京大学, 教養部, 教授 (20162753)
|
キーワード | 日本語文法 / 談話構造 / 文脈依存の解釈 / 主辞駆動句構造文法 / 分節談話表示理論 / 解釈のモデル / 形式意味論 / 語彙意味論 |
研究概要 |
平成15年度から4年間にわたって行う本研究が対象とする日本語データおよび語彙の絞込みを行った。これには、すでに収集してある対話データ、新聞データ、および幼児とその親との対話データを分析し、語彙数にしてほぼ5000語の範囲のコーパスを作成した。 本年度はまた、日本語の名詞句の統語的、意味的構造にはどのような可能性が存在するか、また、その可能な候補のうち、文脈に基づいてどのようなものが解釈的に選考されるかについて、研究を行った。特に「名詞+の+名詞」のタイプの名詞句は頻繁に用いられる一方、「の」自体は特有の意味を持たないため、文脈に依存したいろいろな解釈が可能である。われわれは、長距離依存の可能性の有無から、統語的には二通りの構造が考えられると結論づけた。つまり、最初の名詞が二番目の名詞に対し補語として振舞うか、それとも修飾語として振舞うかの二通りである。しかし、意味的には、この名詞句に現れる名詞の性質と文脈とによって決まる関係をRとすると、ほぼ一通りにあらわされる。つまり、文脈によって最も妥当なRを求める、ということが、本質的にその名詞句を解釈することと考えられるのである。われわれは、Asher & Lascarides (2003)が提案する分節談話表示理論に基づき、この解釈モデルを構築するとともに、コーパスを用いて検証を行った。その結果は正解率80%以上であり、これは単純に周囲の単語の分布から名詞句の意味を決定する方法による正解率50%よりもよい結果となっている。この結果は、談話構造が解釈のもっともらしさの決定に重要な要因となっていることを示すものである。 計算機上で解釈モデルを実現するには、文法開発ツールを用いた文法構築、談話解釈モデル、語彙意味モデルなど、解決すべき問題が山積している。このうち、後者の二つについては、理論の枠組みを固めつつあり、データベース構築を進める予定である。
|