文脈に最適な言い換えをWebから自動獲得する手法に関する研究
Project/Area Number |
17700144
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
風間 淳一 Japan Advanced Institute of Science and Technology, 情報科学研究科, 助教 (60377439)
|
Project Period (FY) |
2005 – 2007
|
Project Status |
Completed (Fiscal Year 2007)
|
Budget Amount *help |
¥3,200,000 (Direct Cost: ¥3,200,000)
Fiscal Year 2007: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2006: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2005: ¥1,300,000 (Direct Cost: ¥1,300,000)
|
Keywords | 言い換え / Web / 固有表現認識 / 大域的素性 / 固有表現辞書 / Wikipedia / クラスタリング / 自動獲得 / 属性 / 木構造カーネル |
Research Abstract |
平成19年度の研究実績は以下の通りである。言い換えの獲得において、固有表現に注目することが有効であることが知られている。しかし、固有表現を高精度で認識すること自体難しい処理である。そこで、固有表現認識について、従来の手法では考慮することのできなかった「大域的素性」を利用する新しいパーセプトロン学習法を提案した。また、多種多様な固有表現の出現する文書に対応するため、近年その量と質から注目を浴びているWikipediaから固有表現辞書を抽出して利用する方法を提案し、これらの成果を国際学会「EMNLP-CoNLL2007」において発表した。また、名詞と動詞の係り受けのクラスタリングを利用して固有表現辞書を獲得し、利用する方法を開発し、効果を確認した。この成果は、「言語処理学会年次大会」(査読なし)において発表した。また、国際会議である「ACL08:HLT」にも受理され、発表予定である。このクラスタリングで得られる確率モデルは、名詞や動詞のクラスや言い換えを名詞と動詞の文脈を考慮した上で確率付きで生成することができ、その応用は多岐にわたる。その一つとして、単語群を画面上に配置する際の単語間の距離を求めることに利用する研究なども行った。
|
Report
(3 results)
Research Products
(11 results)