2004 Fiscal Year Annual Research Report

Using Automatic Verb Classification to aid Event Extraction

Research Project

Project/Area Number	04F04765
Research Institution	National Institute of Informatics
Principal Investigator	COLLIER Nigel 国立情報学研究所, 情報学基礎研究系, 助教授
Co-Investigator(Kenkyū-buntansha)	KORHONEN Anna 国立情報学研究所, 情報学基礎研究系, 外国人特別研究員
Keywords	情報抽出 / テキストマイニング / 動詞の分類 / 自然言語処理
Research Abstract	イベント抽出はテキストマイニングの主要技術で、専門家が大規模な文書集合に含まれるイベント(すなわち事実)、例えば遺伝学の文献におけるタンパク質間の相互作用など、を探し出すことを可能にする。イベントとそれが文書中に現れる多様な表層形式をコンピュータに理解させるための情報資源を手作業で得るのは、人手によるアノテーションのコストのため、非常にコストがかかる。したがって、もっと良いアプローチとして、自動的な手法により領域固有の知識を狸得することが考えられる。コーパスデータからの述語の項構造の自動獲得は、まだ有望とはわかっていないが、語彙意味論的動詞クラス(Beth Levin,1993)の自動獲得は有望視されている。動詞のグループに共通した構文的なふるまいについての知識は、イベントタイプの同定と記述にきわめて有用である(Kingsbury, Palmer & Marcus,2002)。この研究で我々は、最新技術を拡張して、遺伝学のアブストラクトと雑誌論文という領域固有の文献集合から自動的に動詞クラスを帰納することを提案する。