• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

離散値・数値混用データからの閉集合を利用した知識発見方式

Research Project

Project/Area Number 22240010
Research InstitutionKyoto University

Principal Investigator

山本 章博  京都大学, 情報学研究科, 教授 (30230535)

Co-Investigator(Kenkyū-buntansha) 平田 耕一  九州工業大学, その他の研究科, 教授 (20274558)
徳永 浩雄  首都大学東京, 理工学研究科, 教授 (30211395)
吉仲 亮  京都大学, 情報学研究科, 助教 (80466424)
Project Period (FY) 2010-04-01 – 2014-03-31
Keywords知識発見 / 機械学習 / 形式概念解析 / 閉集合 / 実数計算
Research Abstract

本研究の目的は, 離散値データと数値データが混用されたデータからの新たな知識発見に対して,数値の離散化と閉集合に着目し,2種類のデータに一貫性を持つ理論と手法を開発することにある.本年度の主な成果は以下の通りである.
1.昨年度に新たに設計した,木構造データの特徴として部分木を用いながら閉集合を利用して知識発見するアルゴリズムについて,そのアルゴリズムを洗練し,実データに対する計算機実験を行った上で学術雑誌に発表した.
2.数値データからの知識発見手法として,実数の2進符号化を利用したクラスタリングを一昨年度に提案した.その応用として,書籍などのを文書を写した文書画像における文字列検索への応用を試みた.文書画像が白黒の2色からなると仮定したとき,クラスタである閉集合が文字や文字の一部となる連結成分を表すことになる,という観察に基づき,さらにクラスタから数列を導出した上で,その数列のマッチングだけを行うことで文字認識をせずに文字列検索を行う方式を考案し,実装と実データによる評価を行った.
3.離散値データの一種である文字列データを非可換半群の要素とみなしたとき,文字と変数の列である単項式を知識発見に用いる方法を2種類考案した.1つは,単項式間に定まる自然な半順序を利用して正データの背後にあるべき生成過程を表現した上で,HMMやPCFGと同様にパラメータ推定を行う手法である.もう1つは,正データを生成する単項式と負データを生成する単項式を独立に生成する方式である.後者は大学入試センターの数学試験問題について,問題文のクラスタリングに応用した.
4.日本語文において,名詞・動詞と機能語の組合せを属性とした上で,閉集合を利用した知識発見を利用することにより,シソーラス拡張を行うという新たな方式を考案し,実装と実データによる評価を行った.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

当研究課題の基本的な目標であるである「位相的閉集合と代数的閉集合を用いて,離散値・数値混在データからの知識発見」については,一つの方式が完成し,アルゴリズムの設計と生命科学データへの適用実験まで進めることができ,昨年度までに国際会議発表,学術雑誌論文掲載を行ってきた.閉集合を用いた知識発見に付随するいくつかの問題についても研究が進展している.本年度は,代数的閉集合や位相的閉集合を利用した知識発見手法のバリエーションとアプリケーションを増やしながら,実問題を解ける手法を考案する,という段階に入っている.実際,昨年度までの研究成果をまとめた論文が本年度に国際雑誌に掲載されたのをはじめ,本年度の成果は国際会議や研究会で発表済み,もしくは近く発表予定である.

Strategy for Future Research Activity

代数的閉集合や位相的閉集合を利用した知識発見手法のバリエーションとアプリケーションを増やすという研究を続け,この手法の有効性を実例をもって示してゆく.また,基本的な成果については,論文だけではなく成書にまとめるように進める.

  • Research Products

    (16 results)

All 2013 2012

All Journal Article (11 results) (of which Peer Reviewed: 8 results) Presentation (5 results)

  • [Journal Article] Segmental Mapping and Distance between Rooted Labeled Ordered Trees2013

    • Author(s)
      Tomohiro Kan, Shoichi Higuchi, Kouichi Hirata
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 7676 Pages: 485-494

  • [Journal Article] Learning figures with the Hausdorff metric by fractals;towards computable binary classification2013

    • Author(s)
      Mahito Sugiyama, Hirowatari, E., Tsuiki, H., Yamamoto, A.
    • Journal Title

      Journal of Machine Learning

      Volume: 90 Pages: 91-126

    • DOI

      10.1007/s10994-012-5301-z

    • Peer Reviewed
  • [Journal Article] Integration of the Dual Approaches in the Distributional Learning of Context-Free Grammars2012

    • Author(s)
      Ryo Yoshinaka
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 7183 Pages: 538-550

  • [Journal Article] Learning Families of Closed Sets in Matroids2012

    • Author(s)
      Ziyuan Gao, Frank Stephan, Guohua Wu, Akihiro Yamamoto
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 7160 Pages: 120-139

  • [Journal Article] Semi-Supervised Ligand Finding Using Formal Concept Analysis2012

    • Author(s)
      Sugiyama, M.,Yamamoto, A.
    • Journal Title

      IPSJ Transactions on Mathematical Modeling and Its Applications (TOM)

      Volume: 5 Pages: 114-123

    • Peer Reviewed
  • [Journal Article] Learning from graph data by putting graphs on the lattice2012

    • Author(s)
      Nguyen Viet Anh, Yamamoto, A.
    • Journal Title

      Expert Systems with Applications

      Volume: 39 Pages: 11172-11182

    • DOI

      10.1016/j.eswa.2012.03.035

    • Peer Reviewed
  • [Journal Article] Mining of closed frequent subtrees from frequently updated databases2012

    • Author(s)
      Nguyen Viet Anh, Yamamoto, A.
    • Journal Title

      Intelligent Data Analysis

      Volume: 16 Pages: 953-967

    • DOI

      10.3233/IDA-2012-00561

    • Peer Reviewed
  • [Journal Article] Efficient Mining of Closed Tree Patterns From Large Tree Databases With Subtree Constraint2012

    • Author(s)
      Nguyen Viet Anh, Koichiro Doi, Yamamoto, A.
    • Journal Title

      International Journal on Artificial Intelligence Tools

      Volume: 21 Pages: 1250026

    • DOI

      10.1142/S0218213012500261

    • Peer Reviewed
  • [Journal Article] Privacy Preserving Using Dummy Data for Set Operations in Itemset Mining Implemented with ZDDs2012

    • Author(s)
      Keisuke Otaki, Mahito Sugiyama, Akihiro Yamamoto
    • Journal Title

      IEICE transactions on information and systems

      Volume: E95-D Pages: 3017--3025

    • Peer Reviewed
  • [Journal Article] Estimation of Generating Processes of Strings Represented with Patterns and Refinements2012

    • Author(s)
      Keisuke Otaki, Yamamoto, A.
    • Journal Title

      Journal of Machine Learning Research - Proceedings Track

      Volume: 21 Pages: 177-182

    • Peer Reviewed
  • [Journal Article] A Trim Distance between Positions in Nucleotide Sequences2012

    • Author(s)
      Shunsuke Makino, Takaharu Shimada, Kouichi Hirata, Kouki Yonezawa, Kimihito Ito
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 7569 Pages: 81-91

    • Peer Reviewed
  • [Presentation] Classification by Selecting Plausible Formal Concepts in a Concept Lattice2013

    • Author(s)
      Ikeda, M., Yamamoto, A.
    • Organizer
      FCAIR 2013 : Formal Concept Analysis meets Information Retrieval
    • Place of Presentation
      モスクワ
    • Year and Date
      20130324-20130324
  • [Presentation] 劣制限マッピングの新たな特徴付けとアライメント距離に関するマッピングの階層2013

    • Author(s)
      平田耕一
    • Organizer
      人工知能学会 第88回 人工知能基本問題研究会
    • Place of Presentation
      沖縄
    • Year and Date
      20130124-20130125
  • [Presentation] Binary Classification Using Fast Gaussian Filtering Algorithm2012

    • Author(s)
      Kentaro Imajo, Keisuke Otaki, Akihiro Yamamoto
    • Organizer
      Third Workshop on Algorithms for Large-Scale Information Processing (ALSIP 2012)
    • Place of Presentation
      宮崎
    • Year and Date
      20121130-20121201
  • [Presentation] ラベル付き根付き順序木の断片マッピングと断片距離2012

    • Author(s)
      菅智宏, 樋口鐘一, 平田耕一
    • Organizer
      人工知能学会 第86回 人工知能基本問題研究会
    • Place of Presentation
      北見
    • Year and Date
      20120809-20120809
  • [Presentation] A Distance Between Text Documents based on Topic Models and Ground Metric Learning2012

    • Author(s)
      金 涛, Cuturi Marco, 山本 章博
    • Organizer
      2012年度人工知能学会全国大会 (第26回)
    • Place of Presentation
      山口
    • Year and Date
      20120612-20120615

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi