2003 Fiscal Year Annual Research Report
Webの意味構造発見に基づく新しいWeb検索サービス方式に関する研究
Project/Area Number |
15017249
|
Research Institution | Kyoto University |
Principal Investigator |
田中 克己 京都大学, 情報学研究科, 教授 (00127375)
|
Co-Investigator(Kenkyū-buntansha) |
田中 浩也 京都大学, 情報学研究科, COE研究員
角谷 和俊 京都大学, 情報学研究科, 助教授 (60314499)
|
Keywords | World Wide Web / 情報検索 / 半構造データ / 文脈 / Webマイニング / 適合フィードバック / 話題構造 / ローカル度 |
Research Abstract |
本研究では、WebデータやWeb利用者のデータ検索行動に内在する意味構造を発見し、これに基づき、高度なWeb情報検索サービスを実現するために、次のような方式の開発を行った。(1)クラスタリングされた検索画像群に対する利用者の選択画像・非選択画像の間の差異情報を増幅させた新しい適合フィードバック方式について評価実験を行い、従来方式と本方式の適切なハイブリッド化に関する知見を得た。(2)サンプル集合中の選択データの相対的な位置関係と最も類似するデータをターゲットとして与えられたデータ集合から自動的に選択する相対的質問の概念とその近似処理方式を開発した。(3)主題語-内容語からなる話題構造を、テレビ映像に付帯する字幕情報、および、Webページから自動的に抽出し、リアルタイムに,類似の話題構造や互いに内容を補完するような話題構造を有するWebページを検索してテレビ映像と連動呈示するシステムや、複数のWebデータの差異を同時に見ることができる新しいブラウザなどの開発を行った。(4)Webページがどの程度地域的に限定されているかを測る尺度として、内容ローカル度と内容の日常度を定義し、前者は、地理的用語の出現頻度と詳細度、地理用語がカバーする地域範囲と地理用語の密度から計算し、後者は、内容の日常性(どの地域にでもその内容が出現している度合い)を固有名詞・地理用語を抜いた場合の他のページとの類似度から計算する方式を開発し、ニュース記事約2000件を対象として評価実験を行った。(5)閲覧中のWebページの「周辺」情報を発見・表示してブラウジングする方式を研究した。さらに、Web上の画像やテキストの意味は、その画像やテキスト自身の有する意味情報に加えて、これらの画像やテキストの周辺にどのような情報が配置かされているかによって推定することが可能と考え、画像やテキストの文脈を、このような周辺情報から推定するために、画像やテキストの周辺の情報、画像・テキストを含む領域の上位領域(Webページの論理構造)、Webページへのリンク元ページの情報をクラスタリングすることで、画像やWebページの様々なアスペクトを発見する方式を開発した。
|
Research Products
(6 results)
-
[Publications] 中島伸介, 木下真一, 田中克己: "差異増幅型適合フィードバックに基づく画像データベース検索"電子情報通信学会論文誌. jJ87-D-I・2. 164-174 (2004)
-
[Publications] 中島伸介, 田中克己: "相対的マッピング処理に基づく相対的情報検索手法"情報処理学会論文誌:データベース. 45・SIG04. 63-75 (2004)
-
[Publications] Akiyo Nadamoto, Katsumi Tanaka: "A Comparative Web Browser (CWB) for Browsing and Comparing Web Pages"Proceeding of the 12th International World Wide Web Conference (WWW2003), Budapest, Hungary, ACM Press. 727-735 (2003)
-
[Publications] Qiang Ma, Chiyako Matsumoto, Katsumi Tanaka: "A Localness-Filter for Searched Web Pages"Proceedings of the 5th Asia Pacific Web Conference (APWeb2003), Xi'an, China, LNCS 2642, Springer-Verlag. 2642. 525-536 (2003)
-
[Publications] 是津耕司, 田中克己: "画像の文脈情報のWebからの抽出と提示"日本データベース学会Letters. 2・1. 99-102 (2003)
-
[Publications] Koji Zettsu, Yutaka Kidawara, Katsumi Tanaka: "Image Retrieval by Web Contexts : Filtering the Gap between Image Keywords and its Usage Keywords"Proceedings of the 14th International Conference on Database and Expert Systems Applications (DEXA2003), LNCS2736, Springer-Verlag. 2736. 579-588 (2003)