• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

パトリシアトライを用いた効果的な全文検索法に関する研究

Research Project

Project/Area Number 09780387
Research Category

Grant-in-Aid for Encouragement of Young Scientists (A)

Allocation TypeSingle-year Grants
Research Field 情報システム学(含情報図書館学)
Research InstitutionThe University of Tokushima

Principal Investigator

獅々堀 正幹  徳島大学, 工学部, 講師 (50274262)

Project Period (FY) 1997 – 1998
Project Status Completed (Fiscal Year 1998)
Budget Amount *help
¥2,100,000 (Direct Cost: ¥2,100,000)
Fiscal Year 1998: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 1997: ¥1,100,000 (Direct Cost: ¥1,100,000)
Keywords全文検索 / パトリシアトライ / Pa-CB-tree / 2進木構造 / 情報検索 / CB-tree
Research Abstract

効率的な全文検索エンジンを構成するためには,よりコンパクトで,かつ,高速な検索が可能な索引部分を用いることが鍵となる.そこで,本研究ではパトリシアトライ構造により索引部を構成し,パトリシアトライの高速な検索機能は保持しつつ,そのデータ構造を圧縮する手法の考案を目的としていた.
そこで,本研究では上記の目的を実現するため,本研究の実施計画として,まず1年目にはパトリシアトライの基本圧縮アルゴリズムの考案,2年目には圧縮型のパトリシア構造から形成される索引部を有する全文検索エンジンを構築し,大規模文書データベースに対する実験評価を予定していた.
まず,1年目の研究実績として,パトリシアトライをPaCB-treeと呼ばれるコンパクトなビット列に圧縮する手法を考案した.通常の2進木トライの圧縮方法であるCB-treeと比較すると,PaCB-treeの方が従来のCB-treeよりも40〜60%圧縮率を向上できた.また,パトリシアトライの代表的な圧縮型データ構造であるPAT arrayと比較すると,コンパクト性ではPAT arrayの方が有利であるが,検索効率の面でディスクアクセス数が多くなるというPAT arrayの欠点を解消し,パトリシアトライが本来持つ検索効率を保持したまま圧縮が行えた.
次に,2年目の研究実績としては,1年目で考案したPaCB-treeから形成される索引部を有する全文検索エンジンを構築した.従来のパトリシアトライ型の検索エンジンと比較した結果,同じサイズの索引部を用いた場合でも,本手法の検索エンジンの方が数多くの検索対象文書を索引部に格納することができ,実用的に優れていることを明らかにした.以上,本研究により,パトリシアトライの圧縮率を向上することができ,より実用性に富んだパトリシアトライ型の全文検索エンジンを実現できた.
今後,本研究成果を曖昧検索や類似検索が行える全文検索に応用する計画である.

Report

(2 results)
  • 1998 Annual Research Report
  • 1997 Annual Research Report
  • Research Products

    (11 results)

All Other

All Publications (11 results)

  • [Publications] Masami Shishibori: "Design of a Compact Data Structure for the Patricia Trie" IEICE Transactions on Information and Systems. Vol.E81-D No.4. 364-371 (1998)

    • Related Report
      1998 Annual Research Report
  • [Publications] Masami Shishibori: "Two Improved Access Methods on Compact Binary(CB) trees" International Journal of Information Processing & Management. (発売予定).

    • Related Report
      1998 Annual Research Report
  • [Publications] Masami Shishibori: "Robust Human-Computer Interface Systems Using the Generalized LR Raring" Proc.of the 2nd IEEE International Conference on Intelligent Processing Systems. Sydney,Australia. 62-66 (1998)

    • Related Report
      1998 Annual Research Report
  • [Publications] Masami Shishibori: "Automatic Error Recovery in the Natural Language Interface" Proc.of 1998 IEEE International Conference on Systems, Man. and Cyhernetics. San Diego,U.S.A.1353-1358 (1998)

    • Related Report
      1998 Annual Research Report
  • [Publications] Masami Shishibori: "A Dynamic Construction Method for the PaCB-tree" Proc.of the 18the International Conference on Computer Processing of Orimctal Languages. Tokushima,Japan(発売予定).

    • Related Report
      1998 Annual Research Report
  • [Publications] Masami Shishibori: "An Algorithm to Allocate Diagrams Automatically on Document Formatting Systems." IEICE Transactions on Information and Systems. Vol.E80-D No.2. 259-273 (1997)

    • Related Report
      1997 Annual Research Report
  • [Publications] Masami Shishibori: "An Order Searching Algorithm of Extensible Hashing" International Journal of Computer Mathematics. Vol.63 Nos.3+4. 179-201 (1997)

    • Related Report
      1997 Annual Research Report
  • [Publications] Masami Shishibori: "The Design of a Compact Data Structure for Binary tries" Proceedings of the 17th International Conference on Computer Processing of Oriental Languages. Kowloon Hong Kong. 606-611 (1997)

    • Related Report
      1997 Annual Research Report
  • [Publications] Masami Shishibori: "A Construction Method for the Index Represented by a Pointerless Patricia Trie" Proceedings of the 2nd International Workshop on Information Retrieval with Asian Languages. Tsukuba Japan. 24-30 (1997)

    • Related Report
      1997 Annual Research Report
  • [Publications] Masami Shishibori: "An Efficient Compression Method for the Patricia Trie" Proceedings of 1997 IEEE International Conference on Systems,Man and Cybernetics. Florida U.S.A.415-420 (1997)

    • Related Report
      1997 Annual Research Report
  • [Publications] Masami Shishibori: "Design of a Compact Data Structure for the Patricia Trie" IEICE Transactions on Information and Systems. (発表予定).

    • Related Report
      1997 Annual Research Report

URL: 

Published: 1997-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi