• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実績報告書

離散値・数値混用データからの閉集合を利用した知識発見方式

研究課題

研究課題/領域番号 22240010
研究機関京都大学

研究代表者

山本 章博  京都大学, 情報学研究科, 教授 (30230535)

研究分担者 平田 耕一  九州工業大学, その他の研究科, 教授 (20274558)
徳永 浩雄  首都大学東京, 理工学研究科, 教授 (30211395)
吉仲 亮  京都大学, 情報学研究科, 助教 (80466424)
研究期間 (年度) 2010-04-01 – 2014-03-31
キーワード知識発見 / 機械学習 / 形式概念解析 / 閉集合 / 実数計算
研究概要

本研究の目的は, 離散値データと数値データが混用されたデータからの新たな知識発見に対して,数値の離散化と閉集合に着目し,2種類のデータに一貫性を持つ理論と手法を開発することにある.本年度の主な成果は以下の通りである.
1.昨年度に新たに設計した,木構造データの特徴として部分木を用いながら閉集合を利用して知識発見するアルゴリズムについて,そのアルゴリズムを洗練し,実データに対する計算機実験を行った上で学術雑誌に発表した.
2.数値データからの知識発見手法として,実数の2進符号化を利用したクラスタリングを一昨年度に提案した.その応用として,書籍などのを文書を写した文書画像における文字列検索への応用を試みた.文書画像が白黒の2色からなると仮定したとき,クラスタである閉集合が文字や文字の一部となる連結成分を表すことになる,という観察に基づき,さらにクラスタから数列を導出した上で,その数列のマッチングだけを行うことで文字認識をせずに文字列検索を行う方式を考案し,実装と実データによる評価を行った.
3.離散値データの一種である文字列データを非可換半群の要素とみなしたとき,文字と変数の列である単項式を知識発見に用いる方法を2種類考案した.1つは,単項式間に定まる自然な半順序を利用して正データの背後にあるべき生成過程を表現した上で,HMMやPCFGと同様にパラメータ推定を行う手法である.もう1つは,正データを生成する単項式と負データを生成する単項式を独立に生成する方式である.後者は大学入試センターの数学試験問題について,問題文のクラスタリングに応用した.
4.日本語文において,名詞・動詞と機能語の組合せを属性とした上で,閉集合を利用した知識発見を利用することにより,シソーラス拡張を行うという新たな方式を考案し,実装と実データによる評価を行った.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

当研究課題の基本的な目標であるである「位相的閉集合と代数的閉集合を用いて,離散値・数値混在データからの知識発見」については,一つの方式が完成し,アルゴリズムの設計と生命科学データへの適用実験まで進めることができ,昨年度までに国際会議発表,学術雑誌論文掲載を行ってきた.閉集合を用いた知識発見に付随するいくつかの問題についても研究が進展している.本年度は,代数的閉集合や位相的閉集合を利用した知識発見手法のバリエーションとアプリケーションを増やしながら,実問題を解ける手法を考案する,という段階に入っている.実際,昨年度までの研究成果をまとめた論文が本年度に国際雑誌に掲載されたのをはじめ,本年度の成果は国際会議や研究会で発表済み,もしくは近く発表予定である.

今後の研究の推進方策

代数的閉集合や位相的閉集合を利用した知識発見手法のバリエーションとアプリケーションを増やすという研究を続け,この手法の有効性を実例をもって示してゆく.また,基本的な成果については,論文だけではなく成書にまとめるように進める.

  • 研究成果

    (16件)

すべて 2013 2012

すべて 雑誌論文 (11件) (うち査読あり 8件) 学会発表 (5件)

  • [雑誌論文] Segmental Mapping and Distance between Rooted Labeled Ordered Trees2013

    • 著者名/発表者名
      Tomohiro Kan, Shoichi Higuchi, Kouichi Hirata
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 7676 ページ: 485-494

  • [雑誌論文] Learning figures with the Hausdorff metric by fractals;towards computable binary classification2013

    • 著者名/発表者名
      Mahito Sugiyama, Hirowatari, E., Tsuiki, H., Yamamoto, A.
    • 雑誌名

      Journal of Machine Learning

      巻: 90 ページ: 91-126

    • DOI

      10.1007/s10994-012-5301-z

    • 査読あり
  • [雑誌論文] Integration of the Dual Approaches in the Distributional Learning of Context-Free Grammars2012

    • 著者名/発表者名
      Ryo Yoshinaka
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 7183 ページ: 538-550

  • [雑誌論文] Learning Families of Closed Sets in Matroids2012

    • 著者名/発表者名
      Ziyuan Gao, Frank Stephan, Guohua Wu, Akihiro Yamamoto
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 7160 ページ: 120-139

  • [雑誌論文] Semi-Supervised Ligand Finding Using Formal Concept Analysis2012

    • 著者名/発表者名
      Sugiyama, M.,Yamamoto, A.
    • 雑誌名

      IPSJ Transactions on Mathematical Modeling and Its Applications (TOM)

      巻: 5 ページ: 114-123

    • 査読あり
  • [雑誌論文] Learning from graph data by putting graphs on the lattice2012

    • 著者名/発表者名
      Nguyen Viet Anh, Yamamoto, A.
    • 雑誌名

      Expert Systems with Applications

      巻: 39 ページ: 11172-11182

    • DOI

      10.1016/j.eswa.2012.03.035

    • 査読あり
  • [雑誌論文] Mining of closed frequent subtrees from frequently updated databases2012

    • 著者名/発表者名
      Nguyen Viet Anh, Yamamoto, A.
    • 雑誌名

      Intelligent Data Analysis

      巻: 16 ページ: 953-967

    • DOI

      10.3233/IDA-2012-00561

    • 査読あり
  • [雑誌論文] Efficient Mining of Closed Tree Patterns From Large Tree Databases With Subtree Constraint2012

    • 著者名/発表者名
      Nguyen Viet Anh, Koichiro Doi, Yamamoto, A.
    • 雑誌名

      International Journal on Artificial Intelligence Tools

      巻: 21 ページ: 1250026

    • DOI

      10.1142/S0218213012500261

    • 査読あり
  • [雑誌論文] Privacy Preserving Using Dummy Data for Set Operations in Itemset Mining Implemented with ZDDs2012

    • 著者名/発表者名
      Keisuke Otaki, Mahito Sugiyama, Akihiro Yamamoto
    • 雑誌名

      IEICE transactions on information and systems

      巻: E95-D ページ: 3017--3025

    • 査読あり
  • [雑誌論文] Estimation of Generating Processes of Strings Represented with Patterns and Refinements2012

    • 著者名/発表者名
      Keisuke Otaki, Yamamoto, A.
    • 雑誌名

      Journal of Machine Learning Research - Proceedings Track

      巻: 21 ページ: 177-182

    • 査読あり
  • [雑誌論文] A Trim Distance between Positions in Nucleotide Sequences2012

    • 著者名/発表者名
      Shunsuke Makino, Takaharu Shimada, Kouichi Hirata, Kouki Yonezawa, Kimihito Ito
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 7569 ページ: 81-91

    • 査読あり
  • [学会発表] Classification by Selecting Plausible Formal Concepts in a Concept Lattice2013

    • 著者名/発表者名
      Ikeda, M., Yamamoto, A.
    • 学会等名
      FCAIR 2013 : Formal Concept Analysis meets Information Retrieval
    • 発表場所
      モスクワ
    • 年月日
      20130324-20130324
  • [学会発表] 劣制限マッピングの新たな特徴付けとアライメント距離に関するマッピングの階層2013

    • 著者名/発表者名
      平田耕一
    • 学会等名
      人工知能学会 第88回 人工知能基本問題研究会
    • 発表場所
      沖縄
    • 年月日
      20130124-20130125
  • [学会発表] Binary Classification Using Fast Gaussian Filtering Algorithm2012

    • 著者名/発表者名
      Kentaro Imajo, Keisuke Otaki, Akihiro Yamamoto
    • 学会等名
      Third Workshop on Algorithms for Large-Scale Information Processing (ALSIP 2012)
    • 発表場所
      宮崎
    • 年月日
      20121130-20121201
  • [学会発表] ラベル付き根付き順序木の断片マッピングと断片距離2012

    • 著者名/発表者名
      菅智宏, 樋口鐘一, 平田耕一
    • 学会等名
      人工知能学会 第86回 人工知能基本問題研究会
    • 発表場所
      北見
    • 年月日
      20120809-20120809
  • [学会発表] A Distance Between Text Documents based on Topic Models and Ground Metric Learning2012

    • 著者名/発表者名
      金 涛, Cuturi Marco, 山本 章博
    • 学会等名
      2012年度人工知能学会全国大会 (第26回)
    • 発表場所
      山口
    • 年月日
      20120612-20120615

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi