研究課題/領域番号 |
22300050
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 東京工業大学 |
研究代表者 |
藤井 敦 東京工業大学, 大学院・情報理工学研究科, 准教授 (30302433)
|
研究分担者 |
徳永 健伸 東京工業大学, 情報理工学(系)研究科, 教授 (20197875)
|
研究期間 (年度) |
2010 – 2012
|
研究課題ステータス |
完了 (2012年度)
|
配分額 *注記 |
17,940千円 (直接経費: 13,800千円、間接経費: 4,140千円)
2012年度: 5,330千円 (直接経費: 4,100千円、間接経費: 1,230千円)
2011年度: 8,450千円 (直接経費: 6,500千円、間接経費: 1,950千円)
2010年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
|
キーワード | 自然言語処理 / World Wide Web / ウィキペディア / 情報検索 / 用語説明 / 説明の観点 / 機械学習 / クラスタリング |
研究概要 |
本研究は,様々な用語に関する説明を効率よく活用することを目的として,ウェブページの集合からウィキペディア記事のような解説型テキストを自動的に生成する手法について研究した.動物名や病名といった用語の種類によって説明に必要な観点が異なるため,ウィキペディアの記事集合から観点に基づく用語説明のパターンを学習する.用語の種類に応じて検索結果から必要な文章が抽出され,解説型テキストとして統合される.
|