1998 Fiscal Year Annual Research Report
WWW非均質情報空間のページ意味理解に基づく組織化の研究
Project/Area Number |
10480067
|
Research Institution | The University of Tokyo |
Principal Investigator |
石塚 満 東京大学, 大学院・工学系研究科, 教授 (50114369)
|
Co-Investigator(Kenkyū-buntansha) |
土肥 浩 東京大学, 大学院・工学系研究科, 助手 (90260504)
伊庭 斉志 東京大学, 大学院・工学系研究科, 助教授 (40302773)
|
Keywords | インターネット / WWW / 情報組織化 / ハイパーリンク / 文書整理支援 |
Research Abstract |
非均質だが巨大な分散的情報空間を形成し、今や社会の重要なインフラストラクチャになりつつあるWWW(World Wide Web)情報空間を、Webページの理解に基づき利用しやすい空間にするための、知的機能を開発する以下の研究を進めた。 第一は、非均質なWWW空間の弱い組織化の研究であり、弱い組織化に際して我々はハイパーリンクの構造に着目した。まず、このリンクが持つ意味を、a)詳細化、b)語彙説明、c)関連情報の指示、d)リンク集の項目、e)画像、音声、映像の提示、f)ページ内への移動、について高精度で自動認識する手法を考案、開発した。次いで、wwwのある特定分野(例えば「人工知能」など)の多数(数100〜数1000)のWebページから少数(数-50位まで)の有用な中心的なWebパージ(コアページ)を抽出し、他のWebページをこのコアページに関連付けて弱い組織化を行う方法を考案、開発した。これをArea View機能と称し、視覚的表示のプロトタイプシステムも開発した。端的には他からリンクにより参照されている数(即ち被リンク数)が多いWebページは有用であるとみなすものだが、上記のリンクの意味認識やリンク両端のWebページの単語ベクトルの比較等も考慮することで精度を向上させている。 第二は、Web上から得られる多数の文書データを、ユーザの視点に基づき整理することを支援するFish Viewシステムを開発した。ユーザの視点を入れて文書の類似性を判定するために、電子化辞書の概念階層を利用し、注目している部分は細かい単語レベルまでとり、その他の部分は粗くとらえるFish Eyeマッチング法(名称は魚眼レンズに由来)を考案、開発した。このFish Viewシステムは、大量の文書を順序立てて読む場合に役立つシステムとして、プロトタイプが稼働している。
|
-
[Publications] S.Saeyor, M.Ishizuka: "WebBeholder:A Revolution in Tracking and Viewing Changes on the Web by Agent Community" Proc.(CD-ROM)3rd World Conf.on WWW and Intranet(WebNet98). (1998)
-
[Publications] 高間、石塚: "Fish Eyeマッチング:概念体系を利用した視点抽出に基づく文書整理支援機能" 人工知識学会誌. 14, 1. 93-101 (1999)
-
[Publications] S.Saeyor、石塚: "WebBeholder:エージェントコミュニティによるWeb情報変化の監視と指示" 情報処理学会、情報学シンポジウム資料. 41-47 (1999)
-
[Publications] 福島、伊庭、石塚: "WWW情報空間のリンク構造を用いた弱い構造化" 電子情報通信学会、人工知能と知識処理研報告. (1999)
-
[Publications] 福島、石塚: "WWW情報空間におけるコアページの抽出と弱い構造化" 情報処理学会第57回全国大会予稿集. No.5F-8 (1999)