• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

検索システムにおける個別WEB応用への対応化技術の研究

研究課題

研究課題/領域番号 20500086
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 メディア情報学・データベース
研究機関電気通信大学

研究代表者

尾内 理紀夫  電気通信大学, 大学院・情報理工学研究科, 教授 (70323871)

研究分担者 林貴 宏 (林 貴宏)  新潟大学, 自然科学系, 准教授 (60342490)
研究期間 (年度) 2008 – 2010
研究課題ステータス 完了 (2010年度)
配分額 *注記
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2010年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2009年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2008年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード情報検索 / WEB応用 / 情報検
研究概要

研究の結果、システム全体は、文書収集・登録部(新規収集クローラと更新クローラ、文書登録モジュール)と検索部(検索バックエンド、インデクサ、スコア作成モジュール)から構成されることとなった。2種類のクローラで採用するオープンソースソフトウェアについて検討し、新規収集クローラはHeritrixを使用することし、更新クローラ、文書登録モジュールを実装した。さらに規模の拡大における負荷軽減、スケーラビリティ、耐障害性について検討し、Hadoopを導入し、HDFSで管理するようにした。MapReduceによるインデキシングの高速化を図り、従来に比較し、インデックスサイズはほぼ同等で約15倍の速度向上を実現した。以上、成果として本方式の有効性を検証した。

報告書

(4件)
  • 2010 実績報告書   研究成果報告書 ( PDF )
  • 2009 実績報告書
  • 2008 実績報告書
  • 研究成果

    (2件)

すべて 2009

すべて 雑誌論文 (2件) (うち査読あり 2件)

  • [雑誌論文] 規模の拡張に対応した検索エンジンの開発2009

    • 著者名/発表者名
      早坂良太, 林貴宏, 尾内理紀夫
    • 雑誌名

      日本ソフトウェア科学会、コンピュータソフトウェア Vol.26, No.4

      ページ: 138-156

    • NAID

      130004549151

    • 関連する報告書
      2010 研究成果報告書
    • 査読あり
  • [雑誌論文] 規模の拡張に対応した検索エンジンの開発2009

    • 著者名/発表者名
      早坂良太, 林貴宏, 尾内理紀夫
    • 雑誌名

      日本ソフトウェア科学会「コンピュータソフトウェア」 Vol.26, No.4

      ページ: 138-156

    • NAID

      130004549151

    • 関連する報告書
      2009 実績報告書
    • 査読あり

URL: 

公開日: 2008-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi