2013 Fiscal Year Annual Research Report
Project/Area Number |
12J00780
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
欅 惇志 奈良先端科学技術大学院大学, 情報科学研究科, 特別研究員(DC2)
|
Keywords | XML / 情報検索 / 文書更新 / 差分更新 / 統計量 / Web文書 |
Research Abstract |
本研究で実用的なXML検索システムを作成するにあたって, 情報検索システムの要件である高精度・高速な検索を満たしつつ, Web検索システムにおいて極めて頻繁に発生する文書の更新に対しても現実的なコストで索引の差分更新を行うことで実現させる. XML検索システムでは従来の文書検索システムのように検索結果として文書全体を提示するのではなく, 文書のうちのユーザが求める部分のみ提示することを目指す. 従って, 実用的なXML検索システムを開発することができれば, 検索システムを用いるユーザは検索に必要な時間を短縮させ, 求める情報が文書中のどの部分に記述されているのかをユーザ自ら探す必要がなくなる. 更に, 近年モバイル端末やタブレット型PCからの情報検索の機会が増加しており, 必要十分な情報のみを提示するXML情報検索はディスプレイサイズの小さな環境においても有効な検索技術となるため, 今後非常に重要な技術になることが期待される. 前年度の研究成果によって, 従来の高精度・高速なXML情報検索システムと比較して遜色のない性能を維持しつつ, 高速に文書の更新を反映させることに成功した. 今年度は更に発展させて, 検索精度においても従来のシステムを上回ることを目指した, その際, 過去に提案した, 語の重要度のみに着目するのではなくて, 各部分, 及び, 関連する部分の持つ情報も考慮した上でより適切な検索結果を提示することを目指す手法と組み合わせることで, 従来のシステム以上の高精度を実現した. また, XML部分文書検索技術のWeb検索への拡張を目指し, 予めWeb文書の持つ物理構造を論理構造に沿うように再構造化を行い, また, 情報要求を満たさない重要でないコンテンツを除去するためのフィルタを適用することで, Web文書に対してもXML部分文書検索技術は有効であることを示した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の予定通り, 極めて短時間で更新に対応しつつ, 高精度かつ高速なXML検索を実現させた. その際, システムは大規模データに対してもスケールアウトを行うように開発を行った. また, XML検索技術の実用化の一つの手段であるWeb検索システムへの拡張を行うため, XML検索技術適用のためのWeb文書の再構造化手法を提案した.
|
Strategy for Future Research Activity |
開発したシステムが実際にスケールアウトするのかどうか, システム構築を行って評価する. その際, 効率的にCPUとGPUのタスクを切り分けることによって, より高性能な並列・分散処理が実現すると考えられる.
|
Research Products
(5 results)