研究概要 |
本研究課題では,1)自然言語処理の要素技術として研究開発が進んでいる意味役割付与,ゼロ照応解析技術を援用することで,[対象-属性-評価表現]の3つ組を高精度で抽出する技術を開発するとともに,ii)対象に関するいくつかの観点に評判情報を分類する技術,iii)類義の評判情報を集約する技術を開発することで,抽出された大量の評判情報を,体系的に整理した上でその特徴を明らかにした形で提示する評判分析システムを開発することを目的とする.そこで,以下の5つを柱に研究を行う.a.意味役割付与,省略解析技術を援用することで高精度な3つ組抽出技術を開発する.b.分析対象の種類ごとにどのような観点で評判が記述されやすいかという属性体系を自動的に構築する手法を開発し,その体系を元に,対象に対する大量の評判情報を分類する手法を開発する.c.表層的には異なる同じ種類の評判情報を対象とした言い換えの集約手法を開発する.d.分析結果から要約に含めるべき情報を選択する手法を開発する.e.選択された情報を元に,要約テキストを生成する手法を開発する.a.では,意味役割付与を援用した高精度な3つ組抽出技術を開発した.意味役割付与研究では,現在複数の出力ラベルに関する規則性を同時に学習する構造学習を用いて記述することで性能向上を目指す手法が有望視されている.3つ組抽出技術の開発においても同様にこれらの手法が有望と考えられるので,構造学習を導入した3つ組抽出技術を開発した.b.の属性体系の構築では,シソーラス,属性表現の内部文字列,属性表現の出現文脈(共起)の3種類の情報を用いて対象の属性群をクラスタリングする実験をおこない,各情報がクラスタリングの性能改善に相補的に役立つことを確認した.c.では,評判分析技術によって蓄積された「属性-評価表現」の組を対象に,同義・反義の関係にある評判情報を集約する手法を開発した.提案手法は,文書要約のために我々がすでに提案している施設配置問題を元にしたモデル化に基づいている.
|