2009 Fiscal Year Annual Research Report
Project/Area Number |
08F08367
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
松本 裕治 Nara Institute of Science and Technology, 情報科学研究科, 教授
|
Co-Investigator(Kenkyū-buntansha) |
CALVO Francisco Hiram 奈良先端科学技術大学院大学, 情報科学研究科, 外国人特別研究員
|
Keywords | 述語項構造 / 選択制約 / 知識獲得 / 常識的知識 / 共起空間 / 意味解析 |
Research Abstract |
データ過疎の問題に対応するため,述語と項の共起性を判定するモデルを構築した.このモデルは,述語の項の組み合わせが与えられると,新しい項の妥当性を計算するモデルであり,新しい項として最もよく使われる表現を知ることや常識的知識の構築につながる.このような情報は,いくつかの文再構成タスク,例えば,照応解析,曖昧性解消,ゼロ代名詞の参照先の判定に有用である.昨年度は,最近傍法,PLSIに基づくモデル,およびWordNetの情報を用いたSVMなどのモデルを用いた実験を行った.また,手法の開発中に,英国のWebコーパスUKWaC(英国のWebから抽出された20億語よりなる英語のバランスコーパス)を入手した.このコーパスには,2000以上の動詞が含まれると推定され,項の情報も含んでいる.このような項の情報は,動詞だけを扱い単純な選択制約を拡張するのではなく,文全体としての未指定部分を推定するのに有用であると考えられる.項の対のグループを考慮しながら,PLSIに基づくモデルの組み合わせについて調査を行い,項を個別に考慮する方がよい結果を得ることを示した.また,我々のモデルに文章の一貫性の尺度を組み合わせることにより,文章内のパラグラフの結束性の評価や誤用の検出に利用する方法について考察した.
|