2008 Fiscal Year Annual Research Report
大量非構造データ間の概念構造を考慮した論理的検索ビューに関する研究
Project/Area Number |
19024028
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
横田 治夫 Tokyo Institute of Technology, 学術国際情報センター, 教授 (10242570)
|
Co-Investigator(Kenkyū-buntansha) |
望月 祐洋 東京工業大学, 学術国際情報センター, 准教授 (60338209)
小林 隆志 名古屋大学, 大学院・情報科学研究科, 特任准教授 (50345386)
|
Keywords | 非構造データ / 関連度算出 / アクセス履歴 / ファイル検索 / キーワード検索 |
Research Abstract |
情報技術の発展により、人類が創出する情報量が爆発的に増大している。そのような膨大な情報の中から、データベース化されていない非構造データで、単なるキーワード検索では絞り込むことができない情報を抽出してくることは容易ではない。本研究では、組織や個人のシステムが保持する膨大な量の非構造データに対するアクセス性を高めるため、非構造データ間の関係を考慮した論理的検索ビューを提供することを目的とする。本年度は、電子的プレゼンテーションスライドを用いた講義ビデオ集合、テロップを含むテレビ映像集合、およびファイルシステム中のキーワード情報を含まないファイル集合、に対する論理的検索ビューの提供を主対象に研究を行った。電子的プレゼンテーションスライドを用いた講義・講演ビデオ集合に対しては、検索キーワードによって検索結果を提供するだけでなく、重要シーンを抽出してそれらから論理的検索ビューとしてダイジェストを作成する手法の研究を行い、どのような情報を組み合わせることによって、ダイジェストに適した重要シーンが摘出できるかを実験を通して確認した。より一般のビデオ検索やダイジェスト等の論理的検索ビュー提供のため、テレビの画面に表示されるテロップを用いることを想定し、テロップの字認識率を向上させるためにWebの情報を利用する方法を提案し、実際のニュース番組とニュースサイトを用いてその効果を確認した。さらに、扱う対象をより一般化し、ファイルシステム中のキーワード情報を含まないファイルに対しては、アクセス履歴からファイル間の関連度を算出し、算出した関連度に基づいてキーワードに対する全文検索の結果とそれらに関連するファイルを検索結果として提供する手法を提案し、評価を行った。そらに、この研究成果を発展させ、キーワード検索だけでなく、論理的検索ビューとして関連するファイルを仮想フォルダとして提供する手法に関しても研究も行った。
|
Research Products
(24 results)