研究課題/領域番号 |
10480067
|
研究機関 | 東京大学 |
研究代表者 |
石塚 満 東京大学, 大学院・工学系研究科, 教授 (50114369)
|
研究分担者 |
土肥 浩 東京大学, 大学院・工学系研究科, 助手 (90260504)
伊庭 斉志 東京大学, 大学院・工学系研究科, 助教授 (40302773)
|
キーワード | インターネット / WWW / 情報組織化 / ハイパーリンク / 文書整理支援 |
研究概要 |
非均質だが巨大な分散的情報空間を形成し、今や社会の重要なインフラストラクチャになりつつあるWWW(World Wide Web)情報空間を、Webページの理解に基づき利用しやすい空間にするための、知的機能を開発する以下の研究を進めた。 第一は、非均質なWWW空間の弱い組織化の研究であり、弱い組織化に際して我々はハイパーリンクの構造に着目した。まず、このリンクが持つ意味を、a)詳細化、b)語彙説明、c)関連情報の指示、d)リンク集の項目、e)画像、音声、映像の提示、f)ページ内への移動、について高精度で自動認識する手法を考案、開発した。次いで、wwwのある特定分野(例えば「人工知能」など)の多数(数100〜数1000)のWebページから少数(数-50位まで)の有用な中心的なWebパージ(コアページ)を抽出し、他のWebページをこのコアページに関連付けて弱い組織化を行う方法を考案、開発した。これをArea View機能と称し、視覚的表示のプロトタイプシステムも開発した。端的には他からリンクにより参照されている数(即ち被リンク数)が多いWebページは有用であるとみなすものだが、上記のリンクの意味認識やリンク両端のWebページの単語ベクトルの比較等も考慮することで精度を向上させている。 第二は、Web上から得られる多数の文書データを、ユーザの視点に基づき整理することを支援するFish Viewシステムを開発した。ユーザの視点を入れて文書の類似性を判定するために、電子化辞書の概念階層を利用し、注目している部分は細かい単語レベルまでとり、その他の部分は粗くとらえるFish Eyeマッチング法(名称は魚眼レンズに由来)を考案、開発した。このFish Viewシステムは、大量の文書を順序立てて読む場合に役立つシステムとして、プロトタイプが稼働している。
|