2012 Fiscal Year Annual Research Report
Project/Area Number |
23700157
|
Research Institution | Tohoku University |
Principal Investigator |
渡邉 陽太郎 東北大学, 情報科学研究科, 助教 (70583326)
|
Keywords | 文間関係認識 / 含意関係認識 / 自然論理 / 対数線形識別モデル / 隠れ変数 |
Research Abstract |
本年度では、前年度に構築した文間関係認識モデルの大幅な改善をおこない、複数のデータセットを用いた評価実験をおこなった。 まず、文間関係の認識に、一方の文から他方の文へと書き換える操作を考え、その書き換え操作に基いて文間関係を決定するという考え方を採用し、挿入・削除・置換という3種類の編集操作に基づく二文間のアライメントアルゴリズムを実装した。次に、Natural Logic (NL) において定義されている同値・含意・否定など、計7種類の意味関係を編集操作に対して与え、これを対数線形識別モデルを用いて扱うことによって、アライメントと多様な文間関係を同時に推定可能な文間関係認識手法を開発した。周辺尤度最大化に基づく学習手法により、アライメント情報を陽に与えることなく、文間関係のみからのモデルパラメータの推定を実現した。 開発した手法を2種類のデータセットを用いて評価した。一つは、我々が独自に開発した、文間関係に影響を与える様々な言語現象を含み、カテゴリごとに分類されたデータセットである。このデータセットを用いて評価した結果、教師あり学習によって構築されたアライメントのモデルを利用するのと比較して、提案手法により文間関係のみからモデルを学習することの有効性が明らかとなった。次に、情報アクセス技術のワークショップであるNTCIR-10のタスク、RITE-2のデータセットを用いて提案手法の評価をおこなった。このデータは、Wikipediaや大学入試問題から構築されたデータであり、多様な言語現象を含むより解くことが難しいデータとなっている。このデータを用いた評価実験の結果、文間関係認識分野において特に重要視されている矛盾関係に関して、RITE-2のデータセットを用いて評価したシステムの中では、提案手法が最も良い性能を得た。
|