曖昧性は自然言語に本質的で、それは豊かな表現力を示すものでもある。しかし、それは言語処理上では難点である。たとえば、I saw a dog with a telescope.には、sawに「見る」と「のこぎり」の語義(意味)的曖昧性がある。with a telescopeが直前の名詞にかかるのか、動詞にかかるのかの構造的曖昧性もある。 質の高い自然言語処理システムを構築するためには意味的、構造的曖昧性の解消が必要である。これは辞書や文法があれば解決される問題ではない。曖昧性の解消には「知識」が必要である。一般に「遠鏡をもっている犬」は存在しない。われわれは、このような知識(常識)を使って文を理解する。しかし、同じ構造の文でも、I saw a house with a telescope.の理解では、状況の知識も必要である。「望遠鏡で家をみる」ことも、「望遠鏡を備えている家をみる」こともあり得るからである。 本研究では、知識源を大規模なコーパスに求め、それからの単語の共起性や類似性をもとに語義的曖昧性と構造的曖昧性を解消する手法を提案した。また、その手法の有利性を実験によって検証した。対象とした言語は、日本語、中国語、英語で、日本語では、助詞「の」を複数回使うことによってできる名詞句の構造的曖昧性を、中国語では、単語分割の際に遭遇する分割上の曖昧性の解消を、英語では、語義(word senses)的曖昧性の解消を試みた。
|