研究課題/領域番号 |
16016273
|
研究種目 |
特定領域研究
|
配分区分 | 補助金 |
審査区分 |
理工系
|
研究機関 | 首都大学東京 |
研究代表者 |
石川 博 首都大学東京, システムデザイン学部, 教授 (60326014)
|
研究分担者 |
太田 学 岡山大学, 大学院自然科学研究科, 助教授 (10326019)
片山 薫 首都大学東京, システムデザイン学部, 研究員 (00336520)
|
研究期間 (年度) |
2004 – 2005
|
研究課題ステータス |
完了 (2005年度)
|
配分額 *注記 |
11,600千円 (直接経費: 11,600千円)
2005年度: 5,800千円 (直接経費: 5,800千円)
2004年度: 5,800千円 (直接経費: 5,800千円)
|
キーワード | WWW(World Wide Web) / コンテンツ融合 / 差異 / XML / データベース / クラスタリング |
研究概要 |
本研究は、(1)インタネット上の様々な情報資源を柔軟にモデル化・記述して新しいサービスの枠組みを提案することと(2)様々なコンテンツの高度な利用方法(具体的にはコンテンツに対する知的な検索、集約、マイニング技術)を提案することを主たる目標としている。 前者について、Webコンテンツ(XML)の時間変化による差分情報をXMLの構造に適した形式で抽出し、効率的な格納、アクセス、配信する技術の開発を行ってきた。特に、関係DBを利用したブランチを持つXMLデータの版管理の応用技術としてアクセス権管理について研究した。複数の人がXMLデータを共有する場合には、その人の持つアクセス権限に応じて異なって見える版を提供することが重要である。我々は、ブランチを持つXMLデータの版管理を行うために考案した,木構造のラベリング手法を基本とする版識別子を拡張して,XMLリポジトリにおける柔軟で安全なアクセス管理方式を提案し、それを効率よく実装できることを示した。 後者については、Webコンテンツを対象にその差異に注目した新しいコンテンツ融合に関する研究を行った。集約による高付加価値な情報の自動生成を目指して、サーチエンジンの検索結果をWebページのもつリンク情報を基にクラスタリングする手法を提案した。リンク情報の解析には、より緻密に結びついたリンク構造にあるページ集合を見つけるのに有効な最大流アルゴリズムを用いた。検索質問とその適合ページ集合が与えられているNTCIRのデータを用いて実験を行い、提案手法が検索質問と部分的に適合するページの集約に特に有効であることを確認した。
|