研究課題/領域番号 |
11680381
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 電気通信大学 |
研究代表者 |
古郡 廷治 (古郡 廷冶) 電気通信大学, 電気通信学部, 教授 (80114932)
|
研究分担者 |
呉 浩東 独協大学, 外国語学部, 助教授 (50293121)
|
研究期間 (年度) |
1999 – 2000
|
研究課題ステータス |
完了 (2000年度)
|
配分額 *注記 |
2,000千円 (直接経費: 2,000千円)
2000年度: 500千円 (直接経費: 500千円)
1999年度: 1,500千円 (直接経費: 1,500千円)
|
キーワード | 自然言語 / 共起性 / コーパス / 語義的曖昧性 / 類似性 / 構造的曖昧性 / Ambiguity / Natural Language / Disambiguation / Corpus |
研究概要 |
曖昧性は自然言語に本質的で、それは豊かな表現力を示すものでもある。しかし、それは言語処理上では難点である。たとえば、I saw a dog with a telescope.には、sawに「見る」と「のこぎり」の語義(意味)的曖昧性がある。with a telescopeが直前の名詞にかかるのか、動詞にかかるのかの構造的曖昧性もある。 質の高い自然言語処理システムを構築するためには意味的、構造的曖昧性の解消が必要である。これは辞書や文法があれば解決される問題ではない。曖昧性の解消には「知識」が必要である。一般に「遠鏡をもっている犬」は存在しない。われわれは、このような知識(常識)を使って文を理解する。しかし、同じ構造の文でも、I saw a house with a telescope.の理解では、状況の知識も必要である。「望遠鏡で家をみる」ことも、「望遠鏡を備えている家をみる」こともあり得るからである。 本研究では、知識源を大規模なコーパスに求め、それからの単語の共起性や類似性をもとに語義的曖昧性と構造的曖昧性を解消する手法を提案した。また、その手法の有利性を実験によって検証した。対象とした言語は、日本語、中国語、英語で、日本語では、助詞「の」を複数回使うことによってできる名詞句の構造的曖昧性を、中国語では、単語分割の際に遭遇する分割上の曖昧性の解消を、英語では、語義(word senses)的曖昧性の解消を試みた。
|