研究課題
若手研究(A)
今年度は、HTMLタグを用いた単語クラスの自動学習の研究、および、単なる名詞連続からの概念具体物関係の自動学習、ならびにイベント間の時間的前後関係の自動学習の研究を行った。特に概念具体物関係の自動獲得は間接的に本研究で重要な役割を果たす単語意味クラスの自動学習を行っていることになる。まず、単語意味クラスの自動学習の研究に関してはHTML文書中で同一の箇条書きに現れる表現が意味的一貫性を持ちやすいという我々の観察に基づき、検索エンジンのヒットカウントと教師あり学習の一手法であるSVMを用いることで、高速に単語意味クラスを抽出する手法を研究した。ついで、ある種の言語的なパターンは、概念具体物関係を表しやすく、またそこから概念具体物関係を比較的容易に抽出できることは知られていたが、「オンラインショッピングサイト楽天」のように単なる名詞連続で概念具体物関係を表すものから関係を抽出することは行われていなかった。我々は、概念名を表しやすい単語が存在し、これらを他の言語的パターンから抽出し、さらに検索エンジンを利用したフィルタリングをおこなうことで、高精度に概念具体物関係を抽出できることを示した。また、イベント間の時間的前後関係に関しては、日本語のいわゆる並列動詞句ならびに、動詞と名詞の共起頻度をもとに、時間的な前後関係を持ち、同時に論理的な含意関係を持つ二つのイベント間の関係を大量のコーパスから自動的に学習する手法について研究した。
すべて 2006 2005 2004 その他
すべて 雑誌論文 (9件) 図書 (1件) 文献書誌 (5件)
Proceedings of Human Language Technology Conference/North American chapter the Association for Computational Linguistics (to appear)
自然言語処理 13(2)
ページ: 125-144
10018136873
Proceedings of the Recent Advances in Natural Langage Processing
ページ: 493-500
110006291052
Proceedings of Recent Advances in Natural Language Processing (RANLP 05)
ページ: 556-560
自然言語処理 12・1
ページ: 125-150
In Proceedings of The Nineteenth International Joint Conference on Artificial Intelligence (IJCAI-05) (To appear)
人工知能学会論文誌 19・6
ページ: 548-560
10014165007
In Proceedings of The 20^<th> International Conference on Computational Linguistics (COLING04)
ページ: 938-944
In Proceedings of International Workshop on Natural Language Processing and its Applications (NLPBA/BioNLP 2004)