研究分担者 |
相澤 彰子 国立情報学研究所, 情報学資源研究センター, 教授 (90222447)
高須 淳宏 国立情報学研究所, 実証研究センター, 教授 (90216648)
相原 健郎 国立情報学研究所, ソフトウェア研究系, 教授 (90300706)
片山 紀生 国立情報学研究所, 情報メディア研究系, 助教授 (60280559)
井上 雅史 国立情報学研究所, 実証研究センター, 助手 (50390597)
|
研究概要 |
本研究では,インタネット上の情報資源は,生産・流通・利用・蓄積・他との関連・形態などあらゆる側面において従来のコンテンツとは根本的に異なる「不均質」なコンテンツであることに着目し,Webの構造に着目した解析と,不均質性に着目した新たな処理をモジュールとした研究体制をとってきた. 前者では,Webに代表される情報資源の構造上の特性を形式的にとらえ,それに適した新たな処理技術とモデルを提案することを目的としている.より具体的には,(1)リンク距離に基づくハイパーリンクによって構成されるWeb空間の潜在的構造の解析,(2)大規模,不均質,動的な特性に適したWebコンテンツのクラスタに基づくインデキシング,(3)時間情報に基づく重要語トラッキング,を中心に研究を進めた. 後者の不均質性に着目した処理では,(1)言語の不均質性,(2)ジャンル(コンテンツのタイプ)の不均質性に着目し,さらに,(3)画像,映像などを含むメディア横断の検索手法や学習環境への活用について研究を行った.言語の不均質性については,単に言語の差異を超えてあらゆる言語で書かれたコンテンツにアクセスするだけではなく,言語的不均質性に密接に相関することが多い,言語の背後にある文化や社会的状況の差異に由来する「視点」の差をも対象としている.コンテンツのジャンル(種類)の不均質性については,不均質性の分析を行うとともに,利用者の検索意図と求める情報のタイプに応じた複数文書の要約の自動作成について研究を行った.コンテンツの特性だけではなく,利用者の不均一性や状況(コンテクスト)を考慮した情報活用についても研究を進めた. また,これらの処理手法を統合する情報活用システムの実現にはその有効性の評価が必要不可欠であり,評価実験用の大規模なテストベッドを構築し,評価手法についても研究を進めた.このモジュールでは,3回の国際ワークショップを開催した.
|