• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

パトリシアトライを用いた効果的な全文検索法に関する研究

研究課題

研究課題/領域番号 09780387
研究種目

奨励研究(A)

配分区分補助金
研究分野 情報システム学(含情報図書館学)
研究機関徳島大学

研究代表者

獅々堀 正幹  徳島大学, 工学部, 講師 (50274262)

研究期間 (年度) 1997 – 1998
研究課題ステータス 完了 (1998年度)
配分額 *注記
2,100千円 (直接経費: 2,100千円)
1998年度: 1,000千円 (直接経費: 1,000千円)
1997年度: 1,100千円 (直接経費: 1,100千円)
キーワード全文検索 / パトリシアトライ / Pa-CB-tree / 2進木構造 / 情報検索 / CB-tree
研究概要

効率的な全文検索エンジンを構成するためには,よりコンパクトで,かつ,高速な検索が可能な索引部分を用いることが鍵となる.そこで,本研究ではパトリシアトライ構造により索引部を構成し,パトリシアトライの高速な検索機能は保持しつつ,そのデータ構造を圧縮する手法の考案を目的としていた.
そこで,本研究では上記の目的を実現するため,本研究の実施計画として,まず1年目にはパトリシアトライの基本圧縮アルゴリズムの考案,2年目には圧縮型のパトリシア構造から形成される索引部を有する全文検索エンジンを構築し,大規模文書データベースに対する実験評価を予定していた.
まず,1年目の研究実績として,パトリシアトライをPaCB-treeと呼ばれるコンパクトなビット列に圧縮する手法を考案した.通常の2進木トライの圧縮方法であるCB-treeと比較すると,PaCB-treeの方が従来のCB-treeよりも40〜60%圧縮率を向上できた.また,パトリシアトライの代表的な圧縮型データ構造であるPAT arrayと比較すると,コンパクト性ではPAT arrayの方が有利であるが,検索効率の面でディスクアクセス数が多くなるというPAT arrayの欠点を解消し,パトリシアトライが本来持つ検索効率を保持したまま圧縮が行えた.
次に,2年目の研究実績としては,1年目で考案したPaCB-treeから形成される索引部を有する全文検索エンジンを構築した.従来のパトリシアトライ型の検索エンジンと比較した結果,同じサイズの索引部を用いた場合でも,本手法の検索エンジンの方が数多くの検索対象文書を索引部に格納することができ,実用的に優れていることを明らかにした.以上,本研究により,パトリシアトライの圧縮率を向上することができ,より実用性に富んだパトリシアトライ型の全文検索エンジンを実現できた.
今後,本研究成果を曖昧検索や類似検索が行える全文検索に応用する計画である.

報告書

(2件)
  • 1998 実績報告書
  • 1997 実績報告書
  • 研究成果

    (11件)

すべて その他

すべて 文献書誌 (11件)

  • [文献書誌] Masami Shishibori: "Design of a Compact Data Structure for the Patricia Trie" IEICE Transactions on Information and Systems. Vol.E81-D No.4. 364-371 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Masami Shishibori: "Two Improved Access Methods on Compact Binary(CB) trees" International Journal of Information Processing & Management. (発売予定).

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Masami Shishibori: "Robust Human-Computer Interface Systems Using the Generalized LR Raring" Proc.of the 2nd IEEE International Conference on Intelligent Processing Systems. Sydney,Australia. 62-66 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Masami Shishibori: "Automatic Error Recovery in the Natural Language Interface" Proc.of 1998 IEEE International Conference on Systems, Man. and Cyhernetics. San Diego,U.S.A.1353-1358 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Masami Shishibori: "A Dynamic Construction Method for the PaCB-tree" Proc.of the 18the International Conference on Computer Processing of Orimctal Languages. Tokushima,Japan(発売予定).

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Masami Shishibori: "An Algorithm to Allocate Diagrams Automatically on Document Formatting Systems." IEICE Transactions on Information and Systems. Vol.E80-D No.2. 259-273 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] Masami Shishibori: "An Order Searching Algorithm of Extensible Hashing" International Journal of Computer Mathematics. Vol.63 Nos.3+4. 179-201 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] Masami Shishibori: "The Design of a Compact Data Structure for Binary tries" Proceedings of the 17th International Conference on Computer Processing of Oriental Languages. Kowloon Hong Kong. 606-611 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] Masami Shishibori: "A Construction Method for the Index Represented by a Pointerless Patricia Trie" Proceedings of the 2nd International Workshop on Information Retrieval with Asian Languages. Tsukuba Japan. 24-30 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] Masami Shishibori: "An Efficient Compression Method for the Patricia Trie" Proceedings of 1997 IEEE International Conference on Systems,Man and Cybernetics. Florida U.S.A.415-420 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] Masami Shishibori: "Design of a Compact Data Structure for the Patricia Trie" IEICE Transactions on Information and Systems. (発表予定).

    • 関連する報告書
      1997 実績報告書

URL: 

公開日: 1997-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi