• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

罫線文書を対象にした機械学習手法の開発とデータマイニングへの応用

研究課題

研究課題/領域番号 17700159
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関広島市立大学

研究代表者

鈴木 祐介  広島市立大学, 情報科学部, 助教 (10398464)

研究期間 (年度) 2005 – 2007
研究課題ステータス 完了 (2007年度)
配分額 *注記
2,900千円 (直接経費: 2,900千円)
2007年度: 1,000千円 (直接経費: 1,000千円)
2006年度: 1,000千円 (直接経費: 1,000千円)
2005年度: 900千円 (直接経費: 900千円)
キーワード機械学習 / データマイニング / グラフ構造パターン / 罫線文書
研究概要

平成19年度は次の課題に重点を置いて研究を行い,以下のような知見等を得た.
1.TTSPグラフに対する共通パターン発見アルゴリズムの実装および計算機実験:昨年度までにTTSPグラフを用いて罫線文書を表現する方法を考案した.またパターン発見アルゴリズムを提案した.本年度はTTSPグラフに共通するパターン発見アルゴリズムを計算機上に実装し,その評価実験を行った.
2.木構造パターンの学習可能性の考察:パターン発見アルゴリズムの応用として,いくつかの種類の木構造パターンの機械学習可能性を新たに考察した.特に木構造パターンが複数存在する場合の機械学習可能性について帰納推論の枠組みと質問学習の枠組みを用いて考察した.
3.また,その他のグラフ構造パターンに対して,グラフ構造パターンが複数存在する場合の機械学習可能性について質問学習の枠組みを用いて考察した.
本年度の研究によってTTSPグラフに対するパターン発見アルゴリズムを実装することが出来た.これにより罫線文書に対してTTSPグラフを用いたデータマイニングが可能になると考えられる.また,いくづかのパターンに対してパターンが複数存在する場合の機械学習可能性を示すことが出来た.これにより,単一のパターンでは表現できないようなデータ間の特徴を抽出するパターン発見アルゴリズムへの応用が可能であると考えられる.
本年度の研究成果を用いて,今後は罫線文書実データに対するデータマイニング実験などを行っていく予定である.また,罫線文書を表現するより良いパターンの提案とその学習可能性を考察していく予定である.

報告書

(3件)
  • 2007 実績報告書
  • 2006 実績報告書
  • 2005 実績報告書
  • 研究成果

    (7件)

すべて 2008 2007 2006 2005

すべて 雑誌論文 (6件) (うち査読あり 1件) 学会発表 (1件)

  • [雑誌論文] Learning of Finite Unions of Tree Patterns with Internal Structured Variables firom Queries2008

    • 著者名/発表者名
      Satoshi Matsumoto
    • 雑誌名

      IEICE TRANSACTIONS on Information and Systems, Special Issue on Foundations of Computer Science 91-D(2)

      ページ: 222-230

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] Polynomial Time Inductive Inference of Unions of Two Term Tree Languages2006

    • 著者名/発表者名
      Hidenori Hirashima
    • 雑誌名

      Proceedings of the 16th International Conference on Inductive Logic Programming (Short Papers)

      ページ: 92-94

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Ordered Term Tree Languages Which are Polynomial Time Inductively Inferable from Positive Data2006

    • 著者名/発表者名
      Yusuke Suzuki
    • 雑誌名

      Theoretical Computer Science 350/1

      ページ: 63-90

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Discovery of Maximally Frequent Tag Tree Patterns with Height-Constrained Variables from Semistructured Web Documents2005

    • 著者名/発表者名
      Yusuke Suzuki
    • 雑誌名

      2005 International Workshop on Challenges in Web Information Retrieval and Integration (WIRI 2005)

      ページ: 104-112

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Polynomial Time Inductive Inference of TTSP Graph Languages from Positive Data2005

    • 著者名/発表者名
      Ryoji Takami
    • 雑誌名

      Proceedings 15th International Conference ILP 2005 Lecture Notes in Computer Science Springer 3625

      ページ: 366-388

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] A Polynomial Time Matching Algorithm of Ordered Tree Patterns Having Height-Constrained Variables2005

    • 著者名/発表者名
      Kazuhide Aikou
    • 雑誌名

      Proceedings 16th Annual Symposium, CPM 2005 Lecture Notes in Computer Science Springer 3537

      ページ: 346-357

    • 関連する報告書
      2005 実績報告書
  • [学会発表] Exact Leaning of Finite Unions of Graph Patterns from Queries2007

    • 著者名/発表者名
      Satoshi Matsumoto
    • 学会等名
      The 18th International Conference on Algorithmic Learning Theory
    • 発表場所
      日本 仙台
    • 年月日
      2007-10-02
    • 関連する報告書
      2007 実績報告書

URL: 

公開日: 2005-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi