2006 Fiscal Year Annual Research Report
情報爆発時代におけるサイバー空間情報定量評価基盤の構築
Project Area | Cyber Infrastructure for the Information-explosion Era |
Project/Area Number |
18049013
|
Research Institution | The University of Tokyo |
Principal Investigator |
喜連川 優 東京大学, 生産技術研究所, 教授 (40161509)
|
Co-Investigator(Kenkyū-buntansha) |
小口 正人 お茶の水女子大学, 理学部, 教授 (60328036)
中野 美由紀 東京大学, 生産技術研究所, 助手 (30227863)
相良 毅 東京大学, 生産技術研究所, 助手 (80302777)
|
Keywords | 情報システム / コンテンツ・アーカイブ / 計算機システム / データストレージ / 情報工学 / ウェブ情報 / リンク解析 / 評価 |
Research Abstract |
近年人類の創生する情報は爆発的に増加しており、本研究では、膨大な情報源から真に必要とする情報を如何に抽出するかという課題に挑戦しようとするものである。情報源の中でも最も増加率の高いウェブ情報源に対して、検索手法等各種手法の有効性を定量的かつ再現性を持たせた形で評価する定量的評価基盤を構築することを目的とする。 今年度はサイバー空間情報定量評価基盤の基本設計を確立することを目指し、定量評価基盤の基本アーキテクチャの設計と行うと同時に、再現性のある定量的評価手法を実現するために、現在のサイバー区間の解析および定量評価基盤への組込み手法について検討を行った。 1)本研究で構築を試みる定量評価基盤システムは年々爆発的に増加する情報を蓄積するために巨大なストレージの運用が必要となる。最新のストレージ仮想化手法を用いた拡張可能なシステムアーキテクチャ並びに格納構造の設計を行うと共に、インターネット上に広がる分散された情報を収集するための高速通信機構について検討、実験を行った。 2)再現性のある定量的検索評価基盤実現のための多様な評価機構組込み方式設計に関し、種々の情報獲得手法を定量的に評価するためには基本となる柔軟な評価機構組込み方式の調査を行った。 3)定量評価結果の解釈支援を目的としたサイバー空間構造解析を進める上で、とりわけリンク情報を用いた情報獲得手法では検索結果を解釈することが極めて困難である。全日本ウェブページのスナップショットを時系列に解析し、新たに作られたウェブページの発展、消滅、変遷の過程を追跡するための手法を開発し、具体的なデータ解析を行った。まが、ウェブページ上のテキスト情報解析についても検討を始め、評判情報の抽出を試みた。
|
Research Products
(6 results)