研究概要 |
本期間,文脈情報を利用して意味表現に対する適切な文を得る意味生成システムの開発を行った.意味表現と自然言語文の同期モデルを学習するために,forest-to-string法を適用した.システムは,最も良い文を複数個生成し,文脈情報を用いてre-rankingアルゴリズムにより適切な文を選ぶ.意味解析には,曖昧性を扱うため新しい教師付き学習モデルを導入した.我々の方法の主な考え方は,大量のデータを利用すること,提案する意味学習器に用いる機械学習モデルのための素性空間を豊かにすることである.ラベルなしデータから得た語クラスター素性がstring kernel SVM法及びmaximum entropy法に有効であることを示した.標準的なコーパスで提案モデルを評価した結果,我々の方法は意味解析に合っていることが分かった. 目標の一つとして,現在の意味解析技術が法令領域にどの程度適用できるか調べることがある.しかしながら,法令文には長く複雑なものが多いために,この適用は簡単ではない.ある場合には,条項(paragraph)のすべての文を解析し,各文の意味を決定する必要がある.すなわち,条項の各文の論理的な部分を認識し,関連する論理的部分をそれらの論理的関係に従って論理式構造をまとめることを行わなければならない.この問題に対し,我々は,機械学習および線型計画法を用いて,法令条文の項(paragraph)の論理構造を2段階で学習する新しい枠組みし示した. 重要な課題の一つとして,テキスト・エンテイルメントの問題があり,我々は,法令領域に関して,この問題を調べている.今期は,日本語およびベトナム語を対象に,テキスト・エンテイルメントの認識について論文を出した.
|