• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

木の編集距離による近似パタン発見と半構造データからの情報抽出

研究課題

研究課題/領域番号 17700138
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関東京大学

研究代表者

久保山 哲二  東京大学, 国際・産学共同研究センター, 助教 (80302660)

研究期間 (年度) 2005 – 2007
研究課題ステータス 完了 (2007年度)
配分額 *注記
3,500千円 (直接経費: 3,500千円)
2007年度: 1,000千円 (直接経費: 1,000千円)
2006年度: 1,300千円 (直接経費: 1,300千円)
2005年度: 1,200千円 (直接経費: 1,200千円)
キーワード木の編集距離 / カーネル関数 / 畳み込みカーネル / 多項式カーネル / 木の近似照合 / q-gram / 木のアラインメント / 糖鎖構造 / 半構造データ
研究概要

前年度までに、木の編集距離の様々な既存アルゴリズムを対象に、その近似の度合いを代数的に定式化した。これにより、既存の木の編集距離のアルゴリズムを、統一的に記述し俯瞰することができるようになり、その近似の度合いや計算量に応じた自然なクラス階層が存在することもわかった。この成果は、カーネル法に基づく機械学習においても、2つの木構造間の写像の数え上げをベースにした類似度関数を設計することにより、木の編集距離の様々なアルゴリズムをカーネル関数として利用できることがわかった。
本年度は、当初の計画では、木の構造照合に関する理論的な枠組みが出来次第、Webのページの木構造を対象にした情報抽出という応用へ研究を進める予定であったが、理論的により興味深く、かつ一般的な成果が得られたため、理論面の研究を進めた。
具体的には、前年度までの研究成果を踏まえて、木構造のみでなく、文字列をはじめとする他の離散構造を対象とした既存の畳み込みカーネルの性質を調べた。その結果、畳み込みカーネルの厳密な定義ではなく「共通部分構造の重みつき数え上げ」という概念的な理解により設計されたカーネルで、畳み込みカーネルの定義を逸脱したものが散見されることが判明した。そのようなカーネル関数では、半正定値性が保証されず、その妥当性を確認する必要が発生する。このようなカーネル関数に対しても、本研究で、2つの木構造間のカーネル関数の設計として構築したマッピングの数え上げに基づくカーネル関数の設計手法が有効であることを示した。また、多項式カーネルを一般化したPolynomial Summaryカーネルを提案し、既存の様々なフレームワークを包括する手法であることを示した。すなわち、多項式カーネルは、限定された形式の多項式で定義されているが、これを、より一般の多項式について定義し、カーネル関数となる条件を与えた。

報告書

(3件)
  • 2007 実績報告書
  • 2006 実績報告書
  • 2005 実績報告書
  • 研究成果

    (11件)

すべて 2007 2006 2005

すべて 雑誌論文 (10件) (うち査読あり 2件) 学会発表 (1件)

  • [雑誌論文] Polynomial summaries of positive semidefinite kernels2007

    • 著者名/発表者名
      K. Shin and T. Kuboyama
    • 雑誌名

      Proc. of 18th International Conference on Algorithmic Learning Theory(ALT), LNAI 4754

      ページ: 313-327

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] A Genetic Programming Approach to Extraction of Glycan Motifs using Tree Structured Patterns2007

    • 著者名/発表者名
      M. Nagamine, T. Miyahara, T. Kuboyama, H. Ueda, and K. Takahashi
    • 雑誌名

      Proc. of 20th Australian Joint Conference on Artificial Intelligence(AI), LNAI 4830

      ページ: 150-159

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] A Spectrum Tree Kernel2007

    • 著者名/発表者名
      T.Kuboyama, K.Hirata, H.Kashima, K.F.Aoki-Kinoshita, H.Yasuda
    • 雑誌名

      人工知能学会論文誌 22

      ページ: 140-147

    • NAID

      130000058330

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] A q-Grams Based Distance for Ordered Labeled Trees2006

    • 著者名/発表者名
      T.Kuboyama, K.Hirata, N.Ohkura, M.Harao
    • 雑誌名

      Proc.of 4th Workshop on Learning with Logics and Logics for Learning

      ページ: 77-83

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] The Gram Distribution for Rooted Ordered Trees2006

    • 著者名/発表者名
      N.Ohkura, T.Kuboyama, K.Hirata, M.Harao
    • 雑誌名

      Proc.of 4th Workshop on Learning with Logics and Logics for Learning

      ページ: 69-76

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Flexible tree kernels based on counting the number of tree mappings2006

    • 著者名/発表者名
      T.Kuboyama, K.Shin, H.Kashima
    • 雑誌名

      Proc.of 4th International Workshop on Mining and Learning with Graphs

      ページ: 61-72

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] A Gram Distribution Kernel Applied to Glycan Classification and Motif Extraction2006

    • 著者名/発表者名
      T.Kuboyama, K.Hirata, K.F.Aoki-Kinoshita, H.Kashima, H.Yasuda
    • 雑誌名

      Genome Informatics 2

      ページ: 25-34

    • NAID

      130003997438

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] A Theoretical Analysis of Tree Edit Distance Measures2005

    • 著者名/発表者名
      T.kuboyama, K.Shin, T.Iiyahara
    • 雑誌名

      情報処理学会論文誌:数理モデル化と応用(TOM13) 46・17

      ページ: 31-45

    • NAID

      130000058410

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] A Theoretical Analysis of Alignment and Edit Problems for Trees2005

    • 著者名/発表者名
      T.Kuboyama, K.Shin, T.Miyahara, H.Yasuda
    • 雑誌名

      Proc. Theoretical Computer Science, 9th Italian Conference, Lecture Notes in Computer Science 3701

      ページ: 323-337

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] The q-Gram Distance for Ordered Unlabeled Trees2005

    • 著者名/発表者名
      N.Ohkura, K.Hirata, T.Kuboyama, M.Harao
    • 雑誌名

      Proc. 8th International Conference on Discovery Science (DS2005). Lecture Notes in Artificial Intelligence 3735

      ページ: 189-202

    • NAID

      110003225065

    • 関連する報告書
      2005 実績報告書
  • [学会発表] 畳み込みカーネルと多項式カーネルの一般化2007

    • 著者名/発表者名
      久保山哲二, 申吉浩
    • 学会等名
      人工知能学会人工知能基礎問題研究会(第66回)
    • 発表場所
      大分県大分郡湯布院町
    • 年月日
      2007-07-13
    • 関連する報告書
      2007 実績報告書

URL: 

公開日: 2005-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi