2008 Fiscal Year Annual Research Report
Project/Area Number |
19024058
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
宮崎 純 Nara Institute of Science and Technology, 情報科学研究科, 准教授 (40293394)
|
Co-Investigator(Kenkyū-buntansha) |
植村 俊亮 奈良産業大学, 情報学部, 教授 (00203480)
波多野 賢治 同志社大学, 文化情報学部, 准教授 (80314532)
中島 伸介 京都産業大学, コンピュータ理工学部, 准教授 (90399535)
|
Keywords | 情報抽出 / Xquery / 構造化文書 / 情報検索 / ランキング |
Research Abstract |
本研究の目的である大規模構造化文書からの高度情報抽出を達成するために、その基礎技術を確立すべく、本年度は、(1)高精度XML文書情報検索、(2)高性能XQuery問合せ処理に関する二課題を中心に取り組んだ。 まず、高精度XML文書情報検索に関しては、XML文書の部分文書を高精度に検索するために、検索精度を上げるための研究を行った。基本的な考えは、Smallest Lowest Common Ancestor (SLCA)の考え方をもとに、検索キーワードの距離、含有率、寄与率の三つのスコアを提案し、評価を行った。その結果、キーワード含有率と従来の単語の重み付けとの組合せが最も検索精度を向上させることができ、昨年度までの研究成果よりも高い検索精度を実現した。 次に、構造化文書を高い能力で処理するXQuery Full-Textを実現するために、その基盤となる、XQuery分散処理方式の研究を行った。XQueryの分散処理に関して、基本的に値渡しによるリモートプロシジャコールに基づくものが既に提案されているが、参照渡しを利用した分散処理を採用することによりパイプライン処理を可能とした。また、この技術を利用し、P2Pネットワーク上で分散して構造化文書を管理しつつ、効率的な分散XQuery問合せ処理も可能な情報基盤アーキテクチャを提案した。XBenchベンチマークにより評価を行ったところ、従来よりも3〜5倍の高速処理が可能であることが判明した。
|
Research Products
(13 results)