2006 Fiscal Year Annual Research Report
Project/Area Number |
18700086
|
Research Institution | Kyoto University |
Principal Investigator |
手塚 太郎 京都大学, 情報学研究科, 産学官連携助手 (40423016)
|
Keywords | ウェブ / 情報検索 / 信頼性 / テキストマイニング |
Research Abstract |
本研究の本年度の成果として、ウェブコンテンツに対する信頼性判断を支援するシステムの開発に向けて、基礎研究ならびにプロトタイプシステムの実装に取り組んだ。具体的には、ユーザが信頼性を判断したいと考えた自然言語文の入力に対し、クエリ自体ならびに類似するフレーズをウェブ文書中から収集し、その相対頻度や文書中での表現の不確実性を数値化して提示することで、ユーザによる信頼性判断を支援するシステムの開発を行った。また、システムの公開を通してログを収集し、求められる改善点等を明らかにした。 さらに、ウェブページの信頼性を評価する新しい尺度として、リンク元ページの空間的分布を利用する手法の研究開発に取り組んだ。具体的には、ユーザが指定したウェブページにリンクしているサイトのIPアドレスを地理空間上にマッピングすることで、その広がりや分散の度合いを計算し、信頼性判断の基準として提示する手法を提案した。多数のウェブページに対して実験を行い、ページの空間的支持の度合いに応じて異なる数値が得られることを確認した。加えて、提案手法によって得られた情報に基づき、リンク元ページの空間的分布を視覚的に提示するユーザインタフェースの実装も行った。 また、今後ウェブマイニングの基礎的ツールとなっていくことが予想される検索エンジン提供の数値データの信頼性を高めるため、統計的アプローチに基づいて信頼性を高めるための基礎研究に着手した。具体的には、ウェブ検索によって得られるヒット件数の集約を行い、より信頼性の高い数値を得る手法の開発ならびに評価を行った。
|