研究概要 |
1.述語項構造の共起関係と格フレームを用いた事態間関係の自動獲得 「X{人}がY{財布}を拾う=>X{人}がY{財布}をZ{警察}に届ける」のようなよく共起する2つの事態(イベント)を大規模テキストから自動獲得した。まず、大規模テキストから係り受け関係にある述語項構造ペアを抽出し、Aprioriアルゴリズムにより述語項構造の共起度を効率よく計算した。次に、共起度が高い述語項構造に対して、格フレームを用いることにより、項の対応付けをとった。大規模テキストから約2万個の事態ペアを獲得することができた。 2.Wikipediaからの大規模語彙の自動獲得 Wikipediaの記事から語を獲得し、また、語の上位語、同義語などの情報も合わせて獲得した。獲得した語彙は形態素解析器JUMANと構文解析器KNPの辞書として利用し、実テキストを頑健に解析できるようにした。 B.述語項構造に基づくテキスト含意認識 テキストと仮説を述語項構造単位で扱い、テキストと仮説間のマッチングをとる含意関係認識システムを構築し、MTCIR-9のRITEタスクに参加した。テキスト・仮説の構文構造を解析し、述語項構造の集合として表現し、また、テキスト・仮説問のマッチングには国語辞典やWikipedia、Webコーパスから得られた語句の同義や上位下位関係を利用した。BC(二値分類)、MC(多値分類)、EXAM(大学入試タスク)、RITE4QA(質問応答タスク)に参加し、それぞ0.55,0.48,0.66,0.89の精度を達成した。
|