• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 研究成果報告書概要

極大類比による文書データの汎化とその利用

研究課題

研究課題/領域番号 16300039
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関北海道大学

研究代表者

原口 誠  北海道大学, 大学院・情報科学研究科, 教授 (40128450)

研究分担者 田中 譲  北海道大学, 大学院・情報科学研究科, 教授 (60002309)
角田 篤泰  名古屋大学, 大学院・院情報科学研究科, 助教授 (80292001)
吉岡 真治  北海道大学, 大学院・情報科学研究科, 助教授 (40290879)
大久保 好章  北海道大学, 大学院・情報科学研究科, 助手 (40271639)
研究期間 (年度) 2004 – 2005
キーワード極大類比 / 文書要約 / 類似性 / テキストセグメンテーション / イベント列
研究概要

本研究の最終目標は、文化的背景ないし目的を共有する人々が、類似していると考える文書群に共通なストーリー構造を抽出し、抽出された構造をスクリプト的に用いることにより、より直感的で人々の共感を得やすい文書を生成するための基盤技法を確立することにある。主な具体的な成果は以下の通りである。
イベント列としての物語を、主題を中心にして分割するために、テキストセグメンテーションにより、連続したイベントからなる複数のイベントブロックに分割する。ブロック毎に話題を表す語彙(中心語彙群)を共起性に基づくグラフにおけるクリークとして抽出し、話題は共起に関して密に結合された語彙集合として定める。次に、話題を結びつける機能を持つ語彙もしくはイベントを特定する。昨年度実装した方式は手がかかり語によってアドホックに決める方式であったが、本年度は、キーグラフ同様に、異なる中心語彙群との相関により話題に基づく支持度を求め、複数の話題に共通に支持される度合いを語彙が持っ話題結合度として定めた。話題結合度の高い語彙は、文脈的な語彙として捉えることが可能であり、そうした結合度の高い語彙をより多く含むイベントを複数のブロックを繋ぐイベントとして抽出する。
上記の手法で同定された物語構造(イベントブロック-中心語彙群-ブロック結合構造)を保存する構造写像を高速に算出するためのアルゴリズムを、イベントブロックの分割統治と過度の抽象化を抑制する制御規則を持つものとして策定した。高速化のポイントは、分割統治の効果と過度の抽象化の制御規則が固有に持つ枝刈規則に加え、中心語彙群と結合構造の保存性スコアーを新たに導入し、そのスコアー下限値(事前に与える)に基づく枝刈規則を新たに与える点にある。これら3種類の探索枝刈の実装により、一般には指数オーダの処理が必要になる構造類比の算出手法の高速化に対する新たな道を切り開いた。

  • 研究成果

    (14件)

すべて 2006 2005

すべて 雑誌論文 (13件) 図書 (1件)

  • [雑誌論文] An Extended Branch-and-Bound Search Algorithm for Finding Top-$N$ Formal Concepts of Documents2006

    • 著者名/発表者名
      M.Haraguchi
    • 雑誌名

      Proceedings of the 4th Workshop on Learning with Logics and Logics for Learning-LLLL'06 (印刷中)

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] A Method for Pinpoint Clustering of Web Pages with Pseudo-Clique Search2006

    • 著者名/発表者名
      M.Haraguchi
    • 雑誌名

      Springer LNAI, Federation over the Web, International Workshop 3847

      ページ: 59-78

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] A Method for Pinpoint Clustering of Web Pages with Pseudo-Clique Search.2006

    • 著者名/発表者名
      Makoto Haraguchi, Yoshiaki Okubo
    • 雑誌名

      Federation over the Web, Int'l Workshop, Dagstuhl Castle, Germany, May 1 - 6, 2005, Revised Selected Papers, Lecture Notes in Artificial Intelligence(Springer) 3847

      ページ: 59-78

    • 説明
      「研究成果報告書概要(欧文)」より
  • [雑誌論文] An Extended Branch-and-Bound Search Algorithm for Finding Top-$N$ Formal Concepts of Documents.2006

    • 著者名/発表者名
      Makoto Haraguchi, Yoshiaki Okubo
    • 雑誌名

      Proceedings of the 4th Workshop on Learning with Logics and Logics for Learning - LLLL'06 (to appear)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [雑誌論文] An Algorithm for Mining Implicit Itemset Pairs Based on Differences of Correlations,2005

    • 著者名/発表者名
      T.Taniguchi
    • 雑誌名

      Proceedings of the 8th International Conference on Discovery Science - DS'05, Springer-LNAI 3735

      ページ: 227-240

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Towards Constructing Story Databases Using Maximal Analogies Between Stories2005

    • 著者名/発表者名
      M.Yoshioka
    • 雑誌名

      Springer LNAI, In Intuitive Human Interfaces for Organizing and Accessing Intellectual Assets 3359

      ページ: 243-255

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] On a Combination of Probabilistic and Boolean IR Models for WWW Document Retrieval2005

    • 著者名/発表者名
      M.Yoshioka
    • 雑誌名

      ACM Transactions on Asian Language Information Processing 4

      ページ: 340-356

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Finding Significant Web Pages with Lower Ranks by Pseudo-Clique Search2005

    • 著者名/発表者名
      Y.Okubo
    • 雑誌名

      Proceedings of the 8th International Conference on Discovery Science - DS'05, Springer-LNAI 3735

      ページ: 346-353

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Discovery of Hidden Correlations in a Local Transaction Database Based on Differences of Correlations2005

    • 著者名/発表者名
      Tsuyoshi Taniguchi, Makoto Haraguchi, Yoshiaki Okubo
    • 雑誌名

      Proceedings of the 4th International Conference on Machine Learning and Data Mining in Pattern Recognition - MLDM'05(Springer-LNAI) 3587

      ページ: 537-548

    • 説明
      「研究成果報告書概要(欧文)」より
  • [雑誌論文] An Algorithm for Mining Implicit Itemset Pairs Based on Differences of Correlations2005

    • 著者名/発表者名
      Tsuyoshi Taniguchi, Makoto Haraguchi
    • 雑誌名

      Proceedings of the 8th International Conference on Discovery Science -DS'05(Springer-LNAI) 3735

      ページ: 227-240

    • 説明
      「研究成果報告書概要(欧文)」より
  • [雑誌論文] Towards Constructing Story Databases Using Maximal Analogies Between Stories.2005

    • 著者名/発表者名
      Masaharu Yoshioka, Makoto Haraguchi, Akihito Mizoe
    • 雑誌名

      Intuitive Human Interfaces for Organizing and Accessing Intellectual Assets : International Workshop, Dagstuhl Castle, Germany, March 1-5, 2004, Revised Selected Papers, Gunter Grieser(Yuzuru Tanaka (eds))(Springer-Verlag GmbH, LNAI) 3359

      ページ: 243-255

    • 説明
      「研究成果報告書概要(欧文)」より
  • [雑誌論文] On a Combination of Probabilistic and Boolean IR Models for WWW Document Retrieval.2005

    • 著者名/発表者名
      Masaharu Yoshioka, Makoto Haraguchi
    • 雑誌名

      ACM Transactions on Asian Language Information Processing(TALIP) Vol.4

      ページ: 340-356

    • 説明
      「研究成果報告書概要(欧文)」より
  • [雑誌論文] Finding Significant Web Pages with Lower Ranks by Pseudo-Clique Search2005

    • 著者名/発表者名
      Yoshiaki Okubo, Makoto Haraguchi
    • 雑誌名

      Proceedings of the 8th International Conference on Discovery Science - DS'05(Springer-LNAI) 3735

      ページ: 346-353

    • 説明
      「研究成果報告書概要(欧文)」より
  • [図書] 人工知能学辞典(「類推による学習」の項を執筆)2005

    • 著者名/発表者名
      原口 誠(分担執筆)
    • 総ページ数
      976
    • 出版者
      共立出版
    • 説明
      「研究成果報告書概要(和文)」より

URL: 

公開日: 2007-12-13  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi