Research Abstract |
今期は,意味解析の改良をねらい,文脈素性を用いる方法を実装することを主に研究した.また,意味解析モデルを実装するのにラベルなしデータがどのように有効かについても研究しました.これらの点に関して,注釈のない大規模コーパスを語クラスタモデルによりモデル化し,識別学習モデルのための素性を抽出しました.提案した半教師学習モデルは,品詞タグ付け,法令文書処理,テキスト要約,質問分類などの自然言語処理に適用しました,品詞タグ付けでは,ラベルなしデータを導入して双方向の推論学習手法を拡張しました.ベンチマークデータに対する実験結果は提案手法が有効であることを示しています.質問分類では,部分木に基づく質問分類モデルを構造化SVMにより半教師学習モデルに拡張しました.これらすべての結果は,提案した半教師学習モデルが有効であることを示しています.文を意味表現に変換する意味解析の問題について,提案する半教師学習モデルを適用しました.我々の従来の研究では,意味解析を同期文脈自由文法(SCFG)による構文解析の問題として定式化しました.SCFGは自然言語文およびその意味表現のコーパスに対し自動的に作られるものです.意味解析に関する問題は,文とその意味表現の対についての注釈付き訓練データが得難いことです.多くの実際の応用では,1つの文が複数の意味表現により曖昧に注釈される場合があります.この曖昧な訓練データに対処するため,最大エントロピーモデルを用いる意味解析を検討し,半教師学習モデルを適用した.実験結果は,提案法が曖昧なデータに効率的にうまく働くことを示しています.また,意味解析のためのツールを開発し,ベトナム語の意味コーパスを作成しました.
|