2012 Fiscal Year Annual Research Report
Webデータに対する情報検索における情報単位に関する研究
Project/Area Number |
22700248
|
Research Institution | Doshisha University |
Principal Investigator |
波多野 賢治 同志社大学, 文化情報学部, 准教授 (80314532)
|
Project Period (FY) |
2010-04-01 – 2013-03-31
|
Keywords | 情報検索 / 情報単位 / 可視化 |
Research Abstract |
本研究では,多くの Web 検索エンジンが検索結果の表示形式として採用している「検索結果=Web 文書のリスト」という枠組みにとらわれず,Web データに対する情報検索における新しい検索結果の形式,すなわち情報単位を,Web 文書間のリンク構造,Web 文書内の文書構造,そして利用者が入力する情報要求から算出される索引語の重みにより決定する方法の提案を行った. 研究期間の一年目は手始めとして「検索結果=情報単位のリスト」という形式を追求するために,情報単位の重要度計算アルゴリズムの開発を,二年目はリスト形式による表示よって利用者が抱える問題の一つである検索結果の見通しの悪さを解決するための提示手法として,クエリとして入力された内容に合致する部分をハイライト表示する方法の提案を行い,それらの有用性を確認することができた. 最終年度である今年度は,実際にその手法を実際の Web 検索システムに実装し,実運用に耐えうるものかどうかの確認を行った.その結果,提案した情報単位表示方式は入力したクエリキーワードを基準に,Web テキスト上に着目すべき部分がハイライト表示されるため,どの文書のどの部分に利用者の情報要求を満たす部分が存在するのかを容易に判断できる有用なツールとなり得ることがわかったのと同時に,一般の Web 検索エンジン,つまり,格納されている Web 文書数が膨大なものに対しては,各索引語の重み計算,および新しい Web 文書の追加による索引語の重み再計算にコストがかかるという問題があることも判明した.しかしながら,このような提示形式を使用できるような場面,例えばある組織で公開されている Web 文書,すなわちその組織内 Web 文書の検索をするというドメイン内検索のような場面においては,非常に有効に機能することも判明し,本研究を行う意義は十分にあったと言える.
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|
Research Products
(7 results)