2010 Fiscal Year Annual Research Report
大量非構造データ間の概念構造を考慮した論理的検索ビューに関する研究
Publicly Offered Research
Project Area | Cyber Infrastructure for the Information-explosion Era |
Project/Area Number |
21013017
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
横田 治夫 東京工業大学, 大学院・情報理工学研究科, 教授 (10242570)
|
Co-Investigator(Kenkyū-buntansha) |
望月 祐洋 東京工業大学, 学術国際情報センター, 准教授 (60338209)
小林 隆志 名古屋大学, 大学院・情報科学研究科, 准教授 (50345386)
渡辺 陽介 東京工業大学, 学術国際情報センター, 助教 (80532944)
|
Keywords | 非構造データ / 関連度算出 / アクセス履歴 / ファイル検索 / キーワード検索 |
Research Abstract |
情報技術の発展により、人類が創出する情報量が爆発的に増大している。データベース化されていない膨大な非構造データから、単なるキーワード検索だけで必要な情報を抽出してくることは容易ではない。本研究では、組織や個人のシステムが保持する膨大な量の非構造データに対するアクセス性を高めるため、非構造データ間の関係を考慮した論理的検索ビューを提供することを目的とする。 キーワード情報を含まないファイルに対する論理的検索ビューの提供に関して、アクセス履歴から使用時間の近いファイル同士を関連ファイルとして検出する手法をこれまで検討してきたが、本年度は通常のファイルの読み書き操作だけではなく、改名(Rename)、移動(Move)、複製(copy)の3つの操作(RMC操作)に新たに着目した。利用者がよく見せる行動として、新たな作業に取り掛かる際に、過去の作業で使用したファイルを複製・改名して再利用することがあるが、この場合、新規作業で作成されたファイル群とRMC操作が行われた過去の作業のファイル群の間には強い関連があるとみなすことができる。本研究ではRMC操作の有無を関連度に反映させる手法を提案し、評価を行った。さらに、本年度はファイル間の関連度だけでなく、ファイルとWebページ間の関連度を抽出する手法の検討を行った。ファイルアクセス履歴に加えてWebアクセスの履歴も用いることで、ファイルを操作した際に一緒に閲覧していたWebページも含めて関連するグループとして提示することができる。ファイルアクセスログとWebアクセスログから関係抽出を行う手法を2つ提案し、それぞれの比較評価を行った。
|
Research Products
(29 results)