研究概要 |
1.論文間関係を提示する手法の分析,2.含意関係認識の関連研究調査と基盤技術の開発,3.論文検索システムの改良,の3点について研究を行った. 項目1について,手法とその効果を自動抽出し技術動向を俯瞰する手法など,情報抽出技術を応用することによって論文の内容を横断的に提示する研究が主に行われている.特に,獲得する情報をより複雑化することで,様々な観点から横断的分析を提供するという研究の方向性が見られ,これらの手法を応用することで論文間の関係・差異を提示することができると考えられる. 項目2については,RTEチャレンジ(テキストペアを入力とし,それらの間に含意関係があるかどうかを判定するタスク)を中心として既存研究の調査を行った.既存研究では,2つのテキストの間の単語・句レベルの対応関係を構造的機械学習で学習するものが主流である.現在のタスク設定・データではこのような手法である程度の精度が達成できるものと思われる.また,依存構造木を書き換え規則で対象テキストに近づけていく手法や,入力テキストを論理表現に変換して自動証明器を適用する手法が提案されている.これらの手法は既存のデータにおいては前述の手法と大きな差はないが,入力テキスト間の距離が大きい場合には有効な手法であると期待される.これらの分析に基づき,意味構造を表したグラフを書き換えることにより含意関係認識を行うシステムの開発を進めている.また,本システムの基盤技術である構文解析器の分野適応についても研究を行った. 項目3については,生命科学論文データベースMEDLINEのテキストについて論文検索システムを開発しているが,これまでのシステムでは結果のランキングを行っていなかった.ランキングを導入するため,日本語の同様の検索システムを応用し,MEDLINEのテキストを検索できるように移植作業を行った.
|