• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2003 年度 研究成果報告書概要

メタファー的検索の定式化とそのHTML文書検索への応用

研究課題

研究課題/領域番号 13480086
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関北海道大学

研究代表者

原口 誠  北海道大学, 大学院・工学研究科, 教授 (40128450)

研究分担者 佐土原 健  産業技術総合研究所, 研究員 (90344168)
大久保 好章  北海道大学, 大学院・工学研究科, 助手 (40271639)
研究期間 (年度) 2001 – 2003
キーワードメタファー的検索 / 概念グラフの汎化 / HTML文書 / テキストコンテンツの類似性
研究概要

テキストコンテンツに対する構造汎化手法を、HTML文書のメタファー的検索(GのようなAを探す問題)のために必要な技法に拡張し、アルゴリズムの高速化を行った。具体的には、
(1)タグとテキストコンテンツからなるHTML文書に対する構造汎化を定めるために、テキスト部分の概念グラフをノードに、HTMLタグをロールとみなしたHTML概念グラフを新たに導入し、昨年度与えた極大類比構成アルゴリズムをHTML概念グラフの極大類比を求めるものに拡張した。
(2)次に、メタファー的なHTML文書検索方式として、一つの比較的に抽象的なHTML文書を検索の目的文書Aとし、比喩的例示を与えるGとしては、複数の例示文書群を与えるとする。その前提のもとに、例示文書群の汎化でAの具体化になっているものを求めることにより、Aであって、かつ、例示文書の共通性質を持つ、最も極大なもの(極大類比)を算出する方式を策定した。極大類比に包摂されるものを検索質問「GのようなA」にヒットさせる。さらに、Aとテキスト中の語彙の包摂関係が電子化辞書の品質に大きく依存する問題点を解消するために、実際にはAと概念的に近いA'で所与の例示文書群の汎化を抑制するアルゴリズムに改良した。
(3)構造汎化の計算量の問題を克服するために、評価関数のもとに、最大評価値を持つ極大類比のみを高速に算出するアルゴリズムを実装し、その有効性を検証した。
(3)の手法を(2)に組み込んだものは、タグ数およびテキストコンテンツが50文程度のものに対しては、3秒程度で計算が終了し、比較的に小規模のHTML文書群の処理方式としては十分に有効であることを確かめた。

  • 研究成果

    (10件)

すべて その他

すべて 文献書誌 (10件)

  • [文献書誌] 原口誠: "概念階層構築における人と機械の違い"人工知能学会誌. 18(5). 537-541 (2003)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] M.HARAGUCHI, M.YOTSUTANI, M.YOSHIOKA: "Towards an Organization and Access Method of Story Databases"Proc.7th World Multiconference on Systematics, Cybernetics and Informatics. 213-216 (2003)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] Y.Kudo, M.Haraguchi, Y.Okubo: "Data Abstractions for Decision Tree Induction"Theoretical Computer Science. 292(2). 387-416 (2003)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] Y.Okubo, Y.Kudoh, M.Haraguchi: "Constructing Appropriate Data Abstractions for Mining Classification Knowledge"Springer LNAI 2543 (Web-Knowledge Management and Decision Support). 276-289 (2003)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 大久保 好章, 森田 展博, 原口 誠: "類似性の観察に基づく知識ベースの内包的エラー修正法"人工知能学会誌. 18. 1-14 (2003)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] M.Haraguchi: "Can a Machine Produce Appropriate New Concepts?"Journal of the Japanese Society for Artificial Intelligence. 18(5). 537-541 (2003)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] M.Haraguchi, S.Nakano.M.Yoshioka: "Discovery of Maximal Analogies between Stories"Proc.of the 5th Int'1 Conf.on Discovery Science (Springer LNCS). 2534. 324-331 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Y.Kudo, M.Haraguchi, Y.Okubo: "Data Abstractions for Decision Tree Induction"Theoretical Computer Science (Elsevier Science). 292(2). 387-416 (2003)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Y.Okubo, Y.Kudoh, M.Haraguchi: "Constructing Appropriate Data Abstractions for Mining Classification Knowledge"Web-Knowledge Management and Decision Support -14th Int'l Conf.on Applications of Prolog, Revised Papers (Springer LNA). 2543. 276-289 (2003)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Y.Okubo, N.Morita, M.Haraguchi: "Similarity-Driven Knowledge Revision for Intentional Errors"Trans.of the Japanese Society for Artificial Intelligence. 18. 1-14 (2003)

    • 説明
      「研究成果報告書概要(欧文)」より

URL: 

公開日: 2005-04-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi