• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

極大類比による文書データの汎化とその利用

研究課題

研究課題/領域番号 16300039
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関北海道大学

研究代表者

原口 誠  北海道大学, 大学院・情報科学研究科, 教授 (40128450)

研究分担者 田中 譲  北海道大学, 大学院・情報科学研究科, 教授 (60002309)
角田 篤泰  名古屋大学, 大学院・院情報科学研究科, 助教授 (80292001)
吉岡 真治  北海道大学, 大学院・情報科学研究科, 助教授 (40290879)
大久保 好章  北海道大学, 大学院・情報科学研究科, 助手 (40271639)
研究期間 (年度) 2004 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
8,600千円 (直接経費: 8,600千円)
2005年度: 5,800千円 (直接経費: 5,800千円)
2004年度: 2,800千円 (直接経費: 2,800千円)
キーワード極大類比 / 文書要約 / 類似性 / テキストセグメンテーション / イベント列 / 文書構造 / 物語の構造解析 / コーパス / 特異値分解 / トピック・文脈解析 / ストーリー
研究概要

本研究の最終目標は、文化的背景ないし目的を共有する人々が、類似していると考える文書群に共通なストーリー構造を抽出し、抽出された構造をスクリプト的に用いることにより、より直感的で人々の共感を得やすい文書を生成するための基盤技法を確立することにある。主な具体的な成果は以下の通りである。
イベント列としての物語を、主題を中心にして分割するために、テキストセグメンテーションにより、連続したイベントからなる複数のイベントブロックに分割する。ブロック毎に話題を表す語彙(中心語彙群)を共起性に基づくグラフにおけるクリークとして抽出し、話題は共起に関して密に結合された語彙集合として定める。次に、話題を結びつける機能を持つ語彙もしくはイベントを特定する。昨年度実装した方式は手がかかり語によってアドホックに決める方式であったが、本年度は、キーグラフ同様に、異なる中心語彙群との相関により話題に基づく支持度を求め、複数の話題に共通に支持される度合いを語彙が持っ話題結合度として定めた。話題結合度の高い語彙は、文脈的な語彙として捉えることが可能であり、そうした結合度の高い語彙をより多く含むイベントを複数のブロックを繋ぐイベントとして抽出する。
上記の手法で同定された物語構造(イベントブロック-中心語彙群-ブロック結合構造)を保存する構造写像を高速に算出するためのアルゴリズムを、イベントブロックの分割統治と過度の抽象化を抑制する制御規則を持つものとして策定した。高速化のポイントは、分割統治の効果と過度の抽象化の制御規則が固有に持つ枝刈規則に加え、中心語彙群と結合構造の保存性スコアーを新たに導入し、そのスコアー下限値(事前に与える)に基づく枝刈規則を新たに与える点にある。これら3種類の探索枝刈の実装により、一般には指数オーダの処理が必要になる構造類比の算出手法の高速化に対する新たな道を切り開いた。

報告書

(3件)
  • 2005 実績報告書   研究成果報告書概要
  • 2004 実績報告書
  • 研究成果

    (27件)

すべて 2006 2005 2004

すべて 雑誌論文 (25件) 図書 (2件)

  • [雑誌論文] An Extended Branch-and-Bound Search Algorithm for Finding Top-$N$ Formal Concepts of Documents2006

    • 著者名/発表者名
      M.Haraguchi
    • 雑誌名

      Proceedings of the 4th Workshop on Learning with Logics and Logics for Learning-LLLL'06 (印刷中)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] A Method for Pinpoint Clustering of Web Pages with Pseudo-Clique Search2006

    • 著者名/発表者名
      M.Haraguchi
    • 雑誌名

      Springer LNAI, Federation over the Web, International Workshop 3847

      ページ: 59-78

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] A Method for Pinpoint Clustering of Web Pages with Pseudo-Clique Search.2006

    • 著者名/発表者名
      Makoto Haraguchi, Yoshiaki Okubo
    • 雑誌名

      Federation over the Web, Int'l Workshop, Dagstuhl Castle, Germany, May 1 - 6, 2005, Revised Selected Papers, Lecture Notes in Artificial Intelligence(Springer) 3847

      ページ: 59-78

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] An Extended Branch-and-Bound Search Algorithm for Finding Top-$N$ Formal Concepts of Documents.2006

    • 著者名/発表者名
      Makoto Haraguchi, Yoshiaki Okubo
    • 雑誌名

      Proceedings of the 4th Workshop on Learning with Logics and Logics for Learning - LLLL'06 (to appear)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] A Method for Pinpoint Clustering of Web Pages with Pseudo-Clique Search2006

    • 著者名/発表者名
      M.Haraguchi, Y.Okubo
    • 雑誌名

      Federation over the Web, International Workshop(Springer-LNAI) 3847

      ページ: 59-78

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] An Algorithm for Mining Implicit Itemset Pairs Based on Differences of Correlations,2005

    • 著者名/発表者名
      T.Taniguchi
    • 雑誌名

      Proceedings of the 8th International Conference on Discovery Science - DS'05, Springer-LNAI 3735

      ページ: 227-240

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Towards Constructing Story Databases Using Maximal Analogies Between Stories2005

    • 著者名/発表者名
      M.Yoshioka
    • 雑誌名

      Springer LNAI, In Intuitive Human Interfaces for Organizing and Accessing Intellectual Assets 3359

      ページ: 243-255

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] On a Combination of Probabilistic and Boolean IR Models for WWW Document Retrieval2005

    • 著者名/発表者名
      M.Yoshioka
    • 雑誌名

      ACM Transactions on Asian Language Information Processing 4

      ページ: 340-356

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Finding Significant Web Pages with Lower Ranks by Pseudo-Clique Search2005

    • 著者名/発表者名
      Y.Okubo
    • 雑誌名

      Proceedings of the 8th International Conference on Discovery Science - DS'05, Springer-LNAI 3735

      ページ: 346-353

    • NAID

      120000954272

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Discovery of Hidden Correlations in a Local Transaction Database Based on Differences of Correlations2005

    • 著者名/発表者名
      Tsuyoshi Taniguchi, Makoto Haraguchi, Yoshiaki Okubo
    • 雑誌名

      Proceedings of the 4th International Conference on Machine Learning and Data Mining in Pattern Recognition - MLDM'05(Springer-LNAI) 3587

      ページ: 537-548

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] An Algorithm for Mining Implicit Itemset Pairs Based on Differences of Correlations2005

    • 著者名/発表者名
      Tsuyoshi Taniguchi, Makoto Haraguchi
    • 雑誌名

      Proceedings of the 8th International Conference on Discovery Science -DS'05(Springer-LNAI) 3735

      ページ: 227-240

    • NAID

      120000956717

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Towards Constructing Story Databases Using Maximal Analogies Between Stories.2005

    • 著者名/発表者名
      Masaharu Yoshioka, Makoto Haraguchi, Akihito Mizoe
    • 雑誌名

      Intuitive Human Interfaces for Organizing and Accessing Intellectual Assets : International Workshop, Dagstuhl Castle, Germany, March 1-5, 2004, Revised Selected Papers, Gunter Grieser(Yuzuru Tanaka (eds))(Springer-Verlag GmbH, LNAI) 3359

      ページ: 243-255

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] On a Combination of Probabilistic and Boolean IR Models for WWW Document Retrieval.2005

    • 著者名/発表者名
      Masaharu Yoshioka, Makoto Haraguchi
    • 雑誌名

      ACM Transactions on Asian Language Information Processing(TALIP) Vol.4

      ページ: 340-356

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Finding Significant Web Pages with Lower Ranks by Pseudo-Clique Search2005

    • 著者名/発表者名
      Yoshiaki Okubo, Makoto Haraguchi
    • 雑誌名

      Proceedings of the 8th International Conference on Discovery Science - DS'05(Springer-LNAI) 3735

      ページ: 346-353

    • NAID

      120000954272

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Finding Significant Web Pages with Lower Ranks by Pseudo-Clique Search2005

    • 著者名/発表者名
      Y.Okubo, M.Haraguchi
    • 雑誌名

      Proceedings of the 8th International Conference on Discovery Science(Springer-LNAI) 3735

      ページ: 346-353

    • NAID

      120000954272

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] An Algorithm for Mining Implicit Itemset Pairs Based on Differences of Correlations2005

    • 著者名/発表者名
      T.Taniguchi, M.Haraguchi
    • 雑誌名

      Proceedings of the 8th International Conference on Discovery Science(Springer-LNAI) 3735

      ページ: 227-240

    • NAID

      120000956717

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Discovery of Hidden Correlations in a Local Transaction Database Based on Differences of Correlations2005

    • 著者名/発表者名
      T.Taniguchi, M.Haraguchi, Y.Okubo
    • 雑誌名

      4th International Conference on Machin Learning and Data Mining in Pattern Recognition(Springer-LNAI) 3587

      ページ: 537-548

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Towards Constructing Story Databases Using Maximal Analogies Between Stories2005

    • 著者名/発表者名
      M.Yoshioka, M.Haraguchi, A.Mizoe
    • 雑誌名

      In Intuitive Human Interfaces for Organizing and Accessing Intellectual Assets(Springer-LNAI) 3359

      ページ: 243-255

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 検索語の網羅性に注目した汎化概念により検索語選択支援を行う情報検索システムの研究2005

    • 著者名/発表者名
      吉岡真治, 原口誠
    • 雑誌名

      人工知能学会論文誌 20・4

      ページ: 270-280

    • NAID

      10022005347

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Towards Constructing Story Databases Using Maximal Analogies Between Stories2005

    • 著者名/発表者名
      M.Yoshioka, M.Haraguchi, A.Mizoe
    • 雑誌名

      Intuitive Human Interfaces for Organizing and Accessing Intellectual Assets (Springer-LNCS) LNCS3359

      ページ: 243-255

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 検索後の網羅性に注目した汎化概念により検索語選択支援を行う情報検索システムの研究2005

    • 著者名/発表者名
      吉岡 真治, 原口 誠
    • 雑誌名

      人工知能学会誌 Vol.20No.4(印刷中)

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Appropriate Boolean Query Reformulation Interface for Information Retrieval based on Adaptive Generalization2005

    • 著者名/発表者名
      M.Yoshioka, M.Haraguchi
    • 雑誌名

      Proc.of the International Workshop on Challenges in Web Information Retrieval and Integration (発表予定)

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Multiple News Articles Summarization based on Event Reference Information2004

    • 著者名/発表者名
      M.Yoshioka, M.Haraguchi
    • 雑誌名

      In Working Notes of the Fourth NTCIR Workshop Meeting

      ページ: 467-473

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Study on the Combination of Probabilistic and Boolean IR Models for WWW Documents Retrieval2004

    • 著者名/発表者名
      M.Yoshioka, M.Haraguchi
    • 雑誌名

      In Working Notes of the Fourth NTCIR Workshop Meeting Supplement Vol.

      ページ: 9-16

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 様々な特徴のキャラクタに対する同化動作生成手法2004

    • 著者名/発表者名
      本林 正裕, 原口 誠
    • 雑誌名

      電子情報通信学会論文誌 Vol.J87-D-II, No.7

      ページ: 1473-1486

    • NAID

      110003171136

    • 関連する報告書
      2004 実績報告書
  • [図書] 人工知能学辞典(「類推による学習」の項を執筆)2005

    • 著者名/発表者名
      原口 誠(分担執筆)
    • 総ページ数
      976
    • 出版者
      共立出版
    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [図書] 人工知能学辞典(「類推による学習」の項を執筆)(分担2頁)2005

    • 著者名/発表者名
      原口 誠(分担執筆)
    • 総ページ数
      972
    • 出版者
      共立出版
    • 関連する報告書
      2005 実績報告書

URL: 

公開日: 2004-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi