• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

極大類比による文書データの汎化とその利用

研究課題

研究課題/領域番号 16300039
研究機関北海道大学

研究代表者

原口 誠  北海道大学, 大学院・情報科学研究科, 教授 (40128450)

研究分担者 田中 譲  北海道大学, 大学院・情報科学研究科, 教授 (60002309)
吉岡 真治  北海道大学, 大学院・情報科学研究科, 助教授 (40290879)
角田 篤泰  名古屋大学, 大学院・法学研究科, 助教授 (80292001)
大久保 好章  北海道大学, 大学院・情報科学研究科, 助手 (40271639)
キーワード極大類比 / 文書構造 / 類似性 / 物語の構造解析 / コーパス / 特異値分解 / トピック・文脈解析
研究概要

本研究の最終目標は、文化的背景ないし目的を共有する人々が、類似していると考える文書群に共通なストーリー構造を抽出し、抽出された構造をスクリプト的に用いることにより、より直感的で人々の共感を得やすい文書を生成するための基盤技法を確立することにある。この目的のために、本年度は昨年度与えた物語の構造解析手法の改良を行い、解析結果に基づいて極大類比(イベント列間の構造類比)を求めるアルゴリズムの洗練化を行った。具体的には下記のとおりである。
イベント列としての物語を、主題を中心にして分割するために、テキストセグメンテーションにより、連続したイベントからなる複数のイベントブロックに分割する。ブロック毎に話題を表す語彙(中心語彙群)を共起性に基づくグラフにおけるクリークとして抽出し、話題は共起に関して密に結合された語彙集合として定める。次に、話題を結びつける機能を持つ語彙もしくはイベントを特定する。昨年度実装した方式は手がかかり語によってアドホックに決める方式であったが、本年度は、キーグラフ同様に、異なる中心語彙群との相関により話題に基づく支持度を求め、複数の話題に共通に支持される度合いを語彙が持つ話題結合度として定めた。話題結合度の高い語彙は、文脈的な語彙として捉えることが可能であり、そうした結合度の高い語彙をより多く含むイベントを複数のブロックを繋ぐイベントとして抽出する。
上記の手法で同定された物語構造(イベントブロック-中心語彙群-ブロック結合構造)を保存する構造写像を高速に算出するためのアルゴリズムを、イベントブロックの分割統治と過度の抽象化を抑制する制御規則を持つものとして策定した。高速化のポイントは、分割統治の効果と過度の抽象化の制御規則が固有に持つ枝刈規則に加え、中心語彙群と結合構造の保存性スコアーを新たに導入し、そのスコアー下限値(事前に与える)に基づく枝刈規則を新たに与える点にある。これら3種類の探索枝刈の実装により、一般には指数オーダの処理が必要になる構造類比の算出手法の高速化に対する新たな道を切り開いた。

  • 研究成果

    (7件)

すべて 2006 2005

すべて 雑誌論文 (6件) 図書 (1件)

  • [雑誌論文] A Method for Pinpoint Clustering of Web Pages with Pseudo-Clique Search2006

    • 著者名/発表者名
      M.Haraguchi, Y.Okubo
    • 雑誌名

      Federation over the Web, International Workshop(Springer-LNAI) 3847

      ページ: 59-78

  • [雑誌論文] Finding Significant Web Pages with Lower Ranks by Pseudo-Clique Search2005

    • 著者名/発表者名
      Y.Okubo, M.Haraguchi
    • 雑誌名

      Proceedings of the 8th International Conference on Discovery Science(Springer-LNAI) 3735

      ページ: 346-353

  • [雑誌論文] An Algorithm for Mining Implicit Itemset Pairs Based on Differences of Correlations2005

    • 著者名/発表者名
      T.Taniguchi, M.Haraguchi
    • 雑誌名

      Proceedings of the 8th International Conference on Discovery Science(Springer-LNAI) 3735

      ページ: 227-240

  • [雑誌論文] Discovery of Hidden Correlations in a Local Transaction Database Based on Differences of Correlations2005

    • 著者名/発表者名
      T.Taniguchi, M.Haraguchi, Y.Okubo
    • 雑誌名

      4th International Conference on Machin Learning and Data Mining in Pattern Recognition(Springer-LNAI) 3587

      ページ: 537-548

  • [雑誌論文] Towards Constructing Story Databases Using Maximal Analogies Between Stories2005

    • 著者名/発表者名
      M.Yoshioka, M.Haraguchi, A.Mizoe
    • 雑誌名

      In Intuitive Human Interfaces for Organizing and Accessing Intellectual Assets(Springer-LNAI) 3359

      ページ: 243-255

  • [雑誌論文] 検索語の網羅性に注目した汎化概念により検索語選択支援を行う情報検索システムの研究2005

    • 著者名/発表者名
      吉岡真治, 原口誠
    • 雑誌名

      人工知能学会論文誌 20・4

      ページ: 270-280

  • [図書] 人工知能学辞典(「類推による学習」の項を執筆)(分担2頁)2005

    • 著者名/発表者名
      原口 誠(分担執筆)
    • 総ページ数
      972
    • 出版者
      共立出版

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi