研究課題/領域番号 |
17700144
|
研究種目 |
若手研究(B)
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 北陸先端科学技術大学院大学 |
研究代表者 |
風間 淳一 北陸先端科学技術大学院大学, 情報科学研究科, 助教 (60377439)
|
研究期間 (年度) |
2005 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
3,200千円 (直接経費: 3,200千円)
2007年度: 800千円 (直接経費: 800千円)
2006年度: 1,100千円 (直接経費: 1,100千円)
2005年度: 1,300千円 (直接経費: 1,300千円)
|
キーワード | 言い換え / Web / 固有表現認識 / 大域的素性 / 固有表現辞書 / Wikipedia / クラスタリング / 自動獲得 / 属性 / 木構造カーネル |
研究概要 |
平成19年度の研究実績は以下の通りである。言い換えの獲得において、固有表現に注目することが有効であることが知られている。しかし、固有表現を高精度で認識すること自体難しい処理である。そこで、固有表現認識について、従来の手法では考慮することのできなかった「大域的素性」を利用する新しいパーセプトロン学習法を提案した。また、多種多様な固有表現の出現する文書に対応するため、近年その量と質から注目を浴びているWikipediaから固有表現辞書を抽出して利用する方法を提案し、これらの成果を国際学会「EMNLP-CoNLL2007」において発表した。また、名詞と動詞の係り受けのクラスタリングを利用して固有表現辞書を獲得し、利用する方法を開発し、効果を確認した。この成果は、「言語処理学会年次大会」(査読なし)において発表した。また、国際会議である「ACL08:HLT」にも受理され、発表予定である。このクラスタリングで得られる確率モデルは、名詞や動詞のクラスや言い換えを名詞と動詞の文脈を考慮した上で確率付きで生成することができ、その応用は多岐にわたる。その一つとして、単語群を画面上に配置する際の単語間の距離を求めることに利用する研究なども行った。
|