研究課題/領域番号 |
19024028
|
研究機関 | 東京工業大学 |
研究代表者 |
横田 治夫 東京工業大学, 学術国際情報センター, 教授 (10242570)
|
研究分担者 |
望月 祐洋 東京工業大学, 学術国際情報センター, 准教授 (60338209)
小林 隆志 名古屋大学, 大学院・情報科学研究所, 特任准教授 (50345386)
|
キーワード | 非構造データ / 関連度算出 / アクセス履歴 / ファイル検索 / キーワード検索 |
研究概要 |
本研究は、組織もしくは個人のシステムが保持する膨大な非構造データである多種大量のファイル等に対して、それらの間の概念構造等の関係を考慮した検索を行い、その結果を何らかの論理的なビューとして提供することで、利用者の要求にできるだけ合致した非構造データを提供することを目的とする。現在、ファイルに対する全文検索やメタデータを用いた検索等に関する研究は、これまでにも広く行われてはいるが、多様なメタデータを入力するのにコストがかかると同時に利用者の知識や熟練を前提とし・実際に欲しいファイルを探し出すことは容易ではない。特に、キーワードを含まない画像や数値データのファイルを検索するのは困難である。利用コンテクスト等を考慮して、ファイル間の関係を導き出し、これまで扱えなかった対象も検索可能とする手法の確立を目指す。平成19年度は、キーワードを含まないファイルを検索するため、ファイルサーバーのアクセスログを解析することで、同時に利用されているファイルに対する関連度を算出し、その関連度を使うことで図形や数値データのみのキーワードを含まない関連ファイルも検索できる手法を提案するとともに、実際に試作システムを作成し、被験者実験を行って効果を評価してきた。ファイルサーバーのアクセスログの精錬、ファイルのオープン・クローズ時間からの関連度算出式等の工夫により、全文検索やディレクトリ探索に比べて効率のよい検索が行えることを示すことができた。
|