• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

情報爆発時代の構造化文書の超高精度検索とその実現

公募研究

研究領域情報爆発時代に向けた新しいIT基盤技術の研究
研究課題/領域番号 21013035
研究種目

特定領域研究

配分区分補助金
審査区分 理工系
研究機関奈良先端科学技術大学院大学

研究代表者

宮崎 純  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (40293394)

研究分担者 植村 俊亮  奈良産業大学, 情報学部, 教授 (00203480)
波多野 賢治  同志社大学, 文化情報学部, 准教授 (80314532)
研究期間 (年度) 2009 – 2010
研究課題ステータス 完了 (2010年度)
配分額 *注記
5,000千円 (直接経費: 5,000千円)
2010年度: 2,500千円 (直接経費: 2,500千円)
2009年度: 2,500千円 (直接経費: 2,500千円)
キーワード情報抽出 / 情報システム / ディレクトリ・情報検索 / 構造化文書 / XML
研究概要

Web文書に代表される電子文書は近年急激に増加しており、その中から有用な情報を取得することが重要となってきている。特に文書のサイズが大きくなると、ユーザの情報要求に適合する箇所を文書中から発見することも困難となっている。本研究では、特に電子文書の中でもXML文書に焦点を絞り、ユーザの情報要求に対して文書中で最も適合する一部分、すなわち部分文書の検索手法の高精度化について研究を行ってきた。
既存の手法では、各部分文書ごとのスコア値に基づいて、高いスコア値の部分文書のみをランキングしてユーザに提示していたが、高いスコア値を持つ部分文書の周辺の適合部分文書を取りこぼしてしまい、その結果検索精度を落とす原因となっていた。そこで、高いスコア値を持つ部分文書の周辺を探索し、ある程度適合すると判断される周辺の部分文書を統合するとともに、統合した結果、サイズが変更された部分文書のスコア値を調整する手法を提案した。この提案手法を用いて、国際ワークショップINEX2010のコンペティションに参加したところ、世界二位の検索精度を達成し、提案手法の高い有効性を実証することができた。
引き続いてXML部分文書検索に関して、検索精度を落とさず検索処理効率を上げるために、XML文書の経路式に基づく索引語の大域重み付けの既存手法であるIPFを改良し、類似した経路式をある規則によりまとめることにより、識別すべき部分文書のクラス数を減らす手法を提案した。その中で、ISFと呼ぶ提案手法はクラス数を75%削減したにも関わらず検索精度はIPFとほぼ同じであることが判明した。これにより、ISFが効率の良い高精度検索処理に有効であることを明らかにした。

報告書

(2件)
  • 2010 実績報告書
  • 2009 実績報告書
  • 研究成果

    (17件)

すべて 2011 2010 2009

すべて 雑誌論文 (4件) (うち査読あり 4件) 学会発表 (13件)

  • [雑誌論文] 有益な検索結果提示のための部分文書再構成手法の提案2011

    • 著者名/発表者名
      欅惇志, 波多野賢治, 宮崎純
    • 雑誌名

      情報処理学会論文誌データベース

      巻: Vol.4, No.1 ページ: 1-13

    • NAID

      40019601041

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] A Query-oriented XML Fragment Search Approach on A Relational Database System2010

    • 著者名/発表者名
      Atsushi Keyaki, Kenji Hatano, Jun Miyazaki
    • 雑誌名

      Journal of Digital Information Management

      巻: Vol.8, Issue 3 ページ: 175-180

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] ロックフリーGCLOCKページ置換アルゴリズム2009

    • 著者名/発表者名
      油井誠, 宮崎純, 植村俊亮, 加藤博一, 山名早人
    • 雑誌名

      情報処理学会論文誌データベース Vol.2, No.4

      ページ: 32-48

    • NAID

      110007113871

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Utilizing Web Directories For Translation Disambiguation In Cross-Language Information Retrieval2009

    • 著者名/発表者名
      Fuminori Kimura, Akira Maeda, Kenji Hatano, Jun Miyazaki, Shunsuke Uemura
    • 雑誌名

      Trends in Communication Technologies and Engineering Science Series (LNEE) Vol.33

      ページ: 95-107

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [学会発表] 複数の検索要素を統合する3Dオブジェクト検索システム2011

    • 著者名/発表者名
      三宅香菜子, 宮崎純, 天野敏之, 藤澤誠, 加藤博一
    • 学会等名
      第3回データ工学と情報マネジメントに関するフォーラム(DE-M2011)
    • 発表場所
      修善寺
    • 年月日
      2011-02-28
    • 関連する報告書
      2010 実績報告書
  • [学会発表] XML部分文書検索における緩和大域的重み付け手法の提案2011

    • 著者名/発表者名
      欅惇志, 波多野賢治, 宮崎純
    • 学会等名
      第3回データ工学と情報マネジメントに関するフォーラム(DEIM2011)
    • 発表場所
      修善寺
    • 年月日
      2011-02-28
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Expansion of Result Reconstruction for Effective XML Fragment Search at INEX 20102010

    • 著者名/発表者名
      Atsushi Keyaki, Kenji Hatano, Jun Miyazaki
    • 学会等名
      INEX 2010 Workshop
    • 発表場所
      オランダ、ヴグフト
    • 年月日
      2010-12-13
    • 関連する報告書
      2010 実績報告書
  • [学会発表] A Result Reconstruction Method for Effective XML Search2010

    • 著者名/発表者名
      Atsushi Keyaki, Kenji Hatano, Jun Miyazaki
    • 学会等名
      12th International Conference on Information Integration and Web-based Applications & Services
    • 発表場所
      フランス、パリ
    • 年月日
      2010-11-09
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 付加情報を利用した3Dオブジェクト検索システム2010

    • 著者名/発表者名
      三宅香菜子, 宮崎純, 藤澤誠, 加藤博一
    • 学会等名
      平成22年度情報処理学会関西支部大会
    • 発表場所
      大阪市
    • 年月日
      2010-09-22
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 再構成されたXML部分文書に対再構成されたXML部分文書に対するランキング手法の提案2010

    • 著者名/発表者名
      欅惇志, 波多野賢治, 宮崎純
    • 学会等名
      電子情報通信学会WI2研究会
    • 発表場所
      佐渡
    • 年月日
      2010-09-16
    • 関連する報告書
      2010 実績報告書
  • [学会発表] XML検索技術を利用した検索結果の構成手法2010

    • 著者名/発表者名
      棒惇志, 波多野賢治, 宮崎純
    • 学会等名
      情報処理学会第72回全国大会
    • 発表場所
      東京
    • 年月日
      2010-03-11
    • 関連する報告書
      2009 実績報告書
  • [学会発表] Nb-GCLOCK : A Non-blocking Buffer Management based on the Generalized CLOCK2010

    • 著者名/発表者名
      Makoto Yui, Jun Miyazaki, Shunsuke Uemura, Hayato Yamana
    • 学会等名
      IEEE International Conference on Data Engineering (ICDE 2010)
    • 発表場所
      アメリカ・ロングビーチ
    • 年月日
      2010-03-04
    • 関連する報告書
      2009 実績報告書
  • [学会発表] XML部分文書の再構成に基づく検索結果の提示手法2010

    • 著者名/発表者名
      棒惇志, 波多野賢治, 宮崎純
    • 学会等名
      第2回データ工学と情報マネジメントに関するフォーラム(DEIM2010)
    • 発表場所
      淡路島
    • 年月日
      2010-03-01
    • 関連する報告書
      2009 実績報告書
  • [学会発表] A Method of Generating Answer )ML Fragment from Ranked Results2009

    • 著者名/発表者名
      Atsushi Keyaki, Jun Miyazaki, Kenji Hatano
    • 学会等名
      INEX 2009 Workshop
    • 発表場所
      オーストラリア・ブリズベン
    • 年月日
      2009-12-07
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 多用なコンテンツを活用するための高性能XMLデータ処理2009

    • 著者名/発表者名
      宮崎純
    • 学会等名
      第2回ユニバーサルコミュニケーション研究会
    • 発表場所
      奈良
    • 年月日
      2009-11-13
    • 関連する報告書
      2009 実績報告書
  • [学会発表] A Scoring Method of XML Fragments Considering Query-Oriented Statistics2009

    • 著者名/発表者名
      Atsushi Keyaki, Kenji Hatano, Jun Miyazaki
    • 学会等名
      International Conference on the Applications of Digital Information and Web Technologies
    • 発表場所
      イギリス・ロンドン
    • 年月日
      2009-08-05
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 索引語の統計量を用いたXML部分文書検索法の組合せ利用とその効果2009

    • 著者名/発表者名
      棒惇志, 波多野賢治, 宮崎純
    • 学会等名
      情報処理学会データベースシステム研究会
    • 発表場所
      神戸
    • 年月日
      2009-07-28
    • 関連する報告書
      2009 実績報告書

URL: 

公開日: 2009-04-01   更新日: 2018-03-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi