Budget Amount *help |
¥2,000,000 (Direct Cost: ¥2,000,000)
Fiscal Year 2010: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2009: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2008: ¥400,000 (Direct Cost: ¥400,000)
|
Research Abstract |
言語文の意味解析を行う際に,データ過疎の問題に対応するため,述語と項の共起性を判定するモデルを構築した.このモデルは,述語の項の組み合わせが与えられると,新しい項の妥当性を計算するモデルであり,新しい項として最もよく使われる表現を知ることや常識的知識の構築につながる.このような情報は,いくつかの文や文章を理解するタスク,例えば,照応解析,曖味性解消,ゼロ代名詞の参照先の判定に有用である.具体的な研究項目としては,最近傍法,PLSIに基づくモデル,およびWordNetの情報を用いたSVMなどのモデルを用いた実験を行った.また,手法の開発中に,英国のWebコーパスUKWaC(英国のWebから抽出された20億語よりなる英語のバランスコーパス)を入手した.このコーパスには,2000以上の動詞が含まれると推定され,項の情報も含んでいる.このような項の情報は,動詞だけを対象として単純な選択制約を拡張するのではなく,文全体としての未指定部分を推定するのに有用であると考えられる.項の対のグループを考慮しながら,PLSIに基づくモデルの組み合わせについて調査を行い,項を個別に考慮する方がよい結果を得ることを示した.また,我々のモデルに文章の一貫性の尺度を組み合わせることにより,文章内のパラグラフの結束性の評価や誤用の検出に利用する方法について考察した.
|