2009 Fiscal Year Annual Research Report
Project/Area Number |
20700138
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
飯田 龍 Tokyo Institute of Technology, 大学院・情報理工学研究科, 助教 (40464276)
|
Keywords | 照応解析 / 根拠情報抽出 |
Research Abstract |
本研究課題では,文章中に記述された書き手の意見情報の抽出問題を,「よい」「すばらしい」などの評価表現や「~と思う」「~らしい」といった表現を伴って出現する意見の"帰結"部分と帰結部分を修飾する"根拠"が記述された談話単位を構造化する問題として扱う.我々はこれまでに談話中において同一実体を指す表現を同定する照応解析の技術構築に取り組んできており,そこで得た知見をこの根拠帰結関係同定に援用することで高品質の関係同定モデルを実現する.具体的には,与えられた照応詞に対して先行詞候補集合間で勝ち抜き戦を行い,最も先行詞らしい候補(最尤先行詞候補)を同定するトーナメントモデルや,最尤先行詞候補と照応詞の対を用いて最終的に照応関係にあるか否かを判定する探索先行分類型モデルを根拠帰結同定の問題に適用し,同定精度向上を実現する.評価実験の結果,単純な2値分類問題として根拠帰結関係を同定した場合と比較して提案手法を利用した場合に劇的に同定精度が向上することがわかった.また,その後の誤り分析より,「ので」「ため」のような接続表現を伴わない場合に関係同定が困難であることがわかった.この問題を解決するために,「体調を崩す->病気になる」といった事態間の関係を同定モデルの手がかりとすることで,接続表現が無い場合にも再現率約6割,精度約6割で関係が同定可能であることを示した.本研究で実現した技術は,言論間の類似関係や根拠をユーザに提供する言論マッププロジェクトにおける要素技術となっており,開発した技術は言論マップのアプリケーションで実際に利用されている.
|