1998 Fiscal Year Annual Research Report
高度ネットワーク情報フィルタリングのための情報処理技術に関する研究
Project/Area Number |
09650447
|
Research Institution | National Center for Science Information Systems |
Principal Investigator |
相澤 彰子 学術情報センター, 研究開発部, 助教授 (90222447)
|
Keywords | HTTPアクセスログ / プロキシサーバ / ネットワーク情報システム / LSI / データ要約 / 共通フィルタサーバ / ネットワーク統計情報 / 双対尺度法 |
Research Abstract |
ネットワークの相互接続点において,両者の違いを吸収して円滑に通信を行うために,高度な情報の中継/変換技術が必要になっている.本研究では,このような機能を「高度ネットワーク情報フィルタリング」と呼び,平成9年度から本年度にかけての2年間を用いて,その高度化に必要な要素技術を検討した. 本年度では特に,HTTPのプロキシーサーバに焦点をあてて,そのアクセス統計を利用して中継サーバの最適配置や類似クライアントの自動抽出を行うための分析手法を検討した.ここで,大規模サイトにおいては短期間であってもログファイルの量は膨大なものになることから,あらかじめ定めた数学的な情報基準にしたがってログデータを要約することを試み,さらに,要約したデータに対して文献検索の分野で近年注目されている自動索引づけ手法LSI(Latent Semantic Indexing)を適用することで,クライアント間の類似度を求める手法を提案した.また,提案手法を用いて,実際に大規模プロキシーサイトで観察されたログデータを分析し,単純な頻度に基づく方法よりも,クライアント間の類似関係を有効に抽出できることを示した. 本研究で提案した手法は,大量のデータから有用な情報を抽出するデータ発掘の前処理として用いることもできる.そこで,大量の単語を含む全文テキスト(論文)の類似度計算問題に対しても同様のデータ集約を適用して,有効性を調べた.
|
-
[Publications] Akiko AIZAWA: "Reducing the Dimensions of Attributes by Selection and Aggregation" Lecture Notes in Artificial Intelligence #1532. First International Conference DS'98 (Springer). 417-418 (1998)
-
[Publications] 相澤 彰子: "特徴素の選択と集約によるDSAのためのデータ要約" 情報処理学会情報学基礎研究会. 52-4. 25-32 (1998)
-
[Publications] 相澤 彰子: "HTTPログファイルからの情報抽出によるインターネットドメインの分析" 電子情報通信学会論文誌. Vol.J81-DI,No.11. 1201-1210 (1998)
-
[Publications] 相澤 彰子: "LSIの適用による大規模HTTPアクセスログからの情報抽出" 情報処理学会情報学基礎研究会. 49-5. 33-40 (1998)
-
[Publications] Akiko Aizawa: "Genetic Algorithm as a Combination of Probabilistic Solution-Space Decomposition and Randam Search" Systems and Computers in Japan. Vol.29,No.5. 1-10 (1998)