研究課題/領域番号 |
23500121
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
メディア情報学・データベース
|
研究機関 | 東京工業大学 (2013-2014) 奈良先端科学技術大学院大学 (2011-2012) |
研究代表者 |
宮崎 純 東京工業大学, 情報理工学(系)研究科, 教授 (40293394)
|
研究期間 (年度) |
2011-04-28 – 2015-03-31
|
研究課題ステータス |
完了 (2014年度)
|
配分額 *注記 |
5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円)
2013年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2012年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2011年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 情報検索 / 構造化文書 / XML / 文書統計量 / メニーコアプロセッサ / XML文書 / XML文書検索 / 更新処理 / 問合せ処理 / 高性能計算 / 部分文書検索 / 高精度検索 / マルチコアプロセッサ |
研究成果の概要 |
本研究では、構造化文書、特にWikipediaに代表されるXML文書に関して、それらが多くの一般ユーザにより自由に書き換えられるという特徴から、メニーコアプロセッサの利用を考慮した高速なXML文書の更新、それに伴う高い検索精度の維持、ならびに高速検索について研究を行なった。 文書の更新を効率化するために、新たな索引スキーマやノイズとなる語を排除するための二つのフィルタを提案した。さらに、文書統計量をGPGPUにより高速に計算する手法を提案した。これらにより、検索精度を保ちつつ文書更新コストを25%削減し、GPGPUにより文書統計量の計算をCPU実装よりも10倍以上高速化可能であることを示した。
|