2000 Fiscal Year Annual Research Report
異貭な知識を用いた自然言語の曖昧性解消に関する研究
Project/Area Number |
11680381
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
古郡 廷治 電気通信大学, 電気通信学部, 教授 (80114932)
|
Co-Investigator(Kenkyū-buntansha) |
呉 浩東 独協大学, 外国語学部, 助教授 (50293121)
|
Keywords | 自然言語 / 共起性 / コーパス / 語義的曖昧性 / 類似性 / 構造的曖昧性 |
Research Abstract |
本研究では、自然言語のもつ語義的曖昧性と構造的曖昧性の解消手法を提案し、その有効性を実験によって検証した。対象とした言語は、日本語、中国語、英語である。日本語では助詞「の」を複数回使うことによってできる名詞句の構造的曖昧性、中国語では単語分割の際に遭遇する分割上の曖昧性、英語では語義(word senses)的曖昧性の解消実験を行った。 曖昧性解消の手法は、単語の共起性や類似性にもとづいている。たとえば、I go to the bank to get money.には、bank(「銀行」と「土手」)は、「銀行」の意味をもつが、この文での特定の意味は、この文と類似の文脈(bankがmoneyやdepositやinterest companyなど一緒に使われたとき)で、bankがもつ意味と同じになると考えられる。この考えは、構造上の曖昧性を解く場合にも通じる。たとえば、「川の上流の村落」は、(川の(上流の(村落)))ではなく、(川の((上流の(村落))である。「川」は「村落」より、「上流」と強い共起性がある。 人間は、共起性や類似性に関する知識(常識)をもっている。しかし、その知識をコンピュータに与え、処理するのはむずかしい。ここでは、知識源を大規模なコーパスに求め、その中にみる単語の共起性や文脈の類似性を統計量にてつかむことにより曖昧性の解消を試みた。当該単語(構造)の意味(構造)は、それが使われている文脈と同様の文脈で与えられている意味(構造)と同じである。 本研究の成果はいくつかの雑誌論文と研究会論文として発表されている。
|
-
[Publications] Wu,H. and Furugori,T.: "A Corpus-Based Approach for Word Sense Disambiguation Using Multiple Cues"Proc.of 5th Natural Language Processing Pacitic Rim Symposicm. 381-386 (1999)
-
[Publications] 韓東力,古郡廷治: "誤り駆動モデルに基づく中国語未登録語の認識"情報処理学会「自然言語処理」. 134-17. (1999)
-
[Publications] Furugor,T. & Alves,E.: "Disambiguation of Syntactic Structures Using the Strength of Association in Three Word Dependency Relations"J.of Quantitative Linguistics. 6(2). 101-107 (1999)
-
[Publications] 韓東力,呉浩東,古郡廷治: "A Method for Resolving Overlapping Ambiguities in Chinese Word Segmentation Process"電子情報通信学会「言語とコミュニケーション」. (2000)