研究概要 |
本研究は,大規模な事態関係知識を文書集合から抽出し,深い言語理解の実現に利用する技術の確立を目的とするものである.計画立案当初は3年間で(a)事態間の因果関係に関する知識(以下,因果関係知識.Casuse(<地震が起こる>,<津波が起こる>),Effect(<X_<具体物>を干す>,<X_<具体物>が乾く>)など),および(b)事態の望ましさに関する単項関係知識(Positive(<健康である>),Negative(<津波が起こる>など)の2種類の知識を対象とする計画だったが,研究代表者が平成15年度2月より日本学術振興会在外研究のため渡英することになったので,(a)のタイプの因果関係知識の獲得に絞って研究を実施した. まず,因果関係に立つ2つの出来事がそれぞれ行為であるか事態であるかに基づき,cause,effect,precond(ition),meansの4つの因果関係を定義した.接続標識「ため」を含む複文からこれら4つの因果関係への自動分類実験を行い,cause,precond,meansの各関係について,80%の再現率で95%以上の分類精度を達成した.また,effect関係については,30%の再現率で90%の分類精度,を達成した.さらに,新聞記事1年分の文書集合に本手法を適用することにより,およそ27,000件を超える因果知識が獲得できる見積りを得た. 研究費は主として,上記の実験を行うための言語データ(因果関係タグ付きコーパス)や関連する辞書,言語資源の開発に利用した.得られた資源は,研究成果の一部として順次Web上で公開し,本研究領域の今後の発展に資するものとする予定である.
|