• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

計算学習理論に基づく知識発見に関する研究

研究課題

研究課題/領域番号 10143101
研究種目

特定領域研究(A)

配分区分補助金
研究機関東北大学

研究代表者

丸岡 章  東北大学, 大学院・情報科学研究科, 教授 (50005427)

研究分担者 篠原 歩  九州大学, 大学院・システム情報科学研究科, 助教授 (00226151)
今井 浩  東京大学, 大学院・理学系研究科, 助教授 (80183010)
安倍 直樹  IBM, トーマスワトソン研究センター, 研究員
渡辺 治  東京工業大学, 大学院・情報理工学研究科, 教授 (80158617)
高須 淳宏  国立情報学研究所, ソフトウェア研究系・データ工学研究部門, 助教授 (90216648)
研究期間 (年度) 1998 – 2000
研究課題ステータス 完了 (2001年度)
配分額 *注記
79,700千円 (直接経費: 79,700千円)
2000年度: 21,800千円 (直接経費: 21,800千円)
1999年度: 21,600千円 (直接経費: 21,600千円)
1998年度: 36,300千円 (直接経費: 36,300千円)
キーワード学習 / サンプリング / ブースティング / 線形分離 / 部分系列探索 / テキスト分類 / 最小記述長基準に基づいた圧縮 / 半定形データ / 特徴空間の幾何学構造 / 学習可能性 / エキスパートオンラインモデル / 決定リスト / 適応型サンプリング / 質問学習 / 能動学習 / クラスタリング / 枝刈り / 方向選択性 / 強化学習
研究概要

膨大なデータベースから有効な情報を効率良く取り出すための,種々の計算のメカニズムを与えるとともに,特にテキストを対象とした情報抽出のための手法を開発した.代表的な成果は以下のとおりである.
知識発見とブースティング:ブースティングは,複数の性能の劣る予測アルゴリズムを統合して,高い予測性能をもつ予測アルゴリズムを構成する学習法で,実用性も高い手法である.この手法に関連して,状況に応じてサンプル量を適宜自動調整する適応型サンプリング技法を用いた新しいブースティングMadaBoostを開発した.また,学習アルゴリズムが自ら環境に働きかけ,能動的に情報を収集するという視点にたった能動学習アルゴリズムを考案し,従来法を上回る予測精度が得られることを計算機シミュレーションにより示した.さらに,ブースティングのひとつの方式である決定木ブースティングのための見通しの良い理論を構築するとともに,決定木の視点に線形分離関数を割り当てた決定木ブースティングを開発した.
テキスト解析における知識発見:遺伝子情報からの機械発見システムBONSAIの核となるアルゴリズムとして,最良の部分列パターンを見つけるアルゴリズムを開発した.また,話者適応するテキスト解析のために,Baum-Welchアルゴリズムからオンライン型アルゴリズムを構成した.
情報圧縮に基づく知識発見:テキストを対応とした文脈木重み付け法により圧縮に基づいた学習アルゴリズムを開発した.また,形態素間の文法的関係を最小記述長のグラフとして表すことにより,辞書知識ベースの作成する方法を提案し,実際の辞書テキストの知識構造化を行い,この方法の妥当性を検証した.
不確実環境における知識発見:現実のテキストデータから情報を効率良く抽出する方法として,誤りを含む文字列データの近似マッチング法を与えた.また,適応型サンプリング手法に基づいて,不確実性をもつ環境における学習アルゴリズムの現実的な評価法を与えた.

報告書

(4件)
  • 2001 研究成果報告書概要
  • 2000 実績報告書
  • 1999 実績報告書
  • 1998 実績報告書
  • 研究成果

    (31件)

すべて その他

すべて 文献書誌 (31件)

  • [文献書誌] A.Maruoka: "Predicting nearly as well as the best pruning of a decision tree through dynamic programming scheme"Theoretical Computer Science. 261(1). 179-209 (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] N.Abe: "Efficient mining from large databases by query learning"The 17^<th> International Conference on Machine Learning. 17. 575-582 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] H.Imai: "Variance-Based k-Clustering Algorithms by Voronoi Diagrams and Randomization"IEICE Trans.Information and Systems. E83-D. 1199-1206 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] A.Shinohara: "A Practical Algorithm to Find the Best Subsequence Patterns"Proc.3rd International Conference on Discovery Science(DS2000). LNAI 1967. 141-154 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] 高須 淳宏: "学術文献画像の書誌情報の近似マッチング法"情報処理学会論文誌:データベース. 42,SIG-1. 148-158 (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] O.Watanabe: "Adaptive Sampling Methods for Scaling Up Knowledge Discovery Algorithms"Data Mining Knowledge and Discovery. 6(2)(to appear). (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] A.Maruoka, E.Takimoto: "Encyclopedia of Computer Science and Technology Vol.45"Marcel Dekker,Inc.. 448 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] A. Maruoka: "Predicting nearly as well as the best pruning of a decision tree through dynamic programming scheme"Theoretical Computer Science. 261(1). 179-209 (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] N. Abe: "Efficient mining from large databases by query learning"The 17th International Conference on Machine Learning. 17. 575-582 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] H. Imai: "Variance-Based k-Clustering Algorithm by Voronoi Diagrams and Randomization"IEICE Trans. Information and Systems. E83-D. 1199-1206 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] A. Shinohara: "A Practical Algorithm to Find the Best Subsequence Patterns"Proc. 3rd International Conference on Discovery Science (DS2000), LNAI 1967. 141-154 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] A. Takasu: "An Approximate Matching Method for Bibliographic Data in Academic Article Images"IPSJ Transactions on Databases. Vol.42, No.SIG01. 148-158 (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] O. Watanabe: "Adaptive Sampling Methods for Scaling Up Knowledge Discovery Algorithms"Data Mining Knowledge and Discovery. (to appear), Vol.6, No.2. (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] Maruoka Akira: "On-line Estimation of Hidden Markov Model Parameters"Lecture Notes in Artificial Intelligence. 1967. 155-169 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Abe Naoki: "Efficient mining from large databases by query learning"The 17th International Conference on Machine Learning. Vol.17. 575-582 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Imai Hiroshi: "Variance-Based k-Clustering Algorithms by Voronoi Diagrams and Randomization"IEICE Trans. Information and Systems. Vol.E83-D. 1199-1206 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Shinohara Ayumi: "A practical algorithm to find the best subsequence patterns"Proc. 3rd International Conference on Discovery Science. LNAI1967. 141-154 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Takasu Atsuhiro: "学術文献画像の書誌情報の近似マッチング法"情報処理学会論文誌:データベース. Vol.42. 148-158 (2001)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Watanabe Osamu: "MadaBoost : A modification of Ada Boost"Proc. of the 13th Conference on Computational Learning Theory. Vol.13. 180-189 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Maruoka Akira: "Proper Learning Algorithm for Functions of k Terms under Smooth Distributions"Information and Computation. 152. 188-204 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] Abe Naoki: "Associative Reinforcement Learning with Linear Probabilistic Concepts"Proceedings of the 16th International Conference on Machine Learning. 3-11 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] Imai Hiroshi: "Finding Meaningful Regions Containing Given Keywords from Large Text Collections"Lecture Notes in Artificial Intelligence. 1721. 353-354 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] Shinohara Ayumi: "Shift-And approach to pattern matching in LZW compressed text"Lecture Notes in Computer Scienc. 1645. 1-13 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] Takasu Atsuhiro: "Music Structure Analysis and Its Application to Theme Phrase Extraction"Proceedings on the Third European Conference on Research and Advanced Technology for Digital Libraries. 92-105 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] Watanabe Osamu: "From computational learning theory to discovery science"Lecture Notes in Computer Scienc. 1644. 134-148 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] Maruola Akira: "Structured Weight-Based Prediction Algorithms" Lecture Notes in Artificial Intelligence. 1501. 127-142 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Abe Naoki: "Empirical Comparison of Competing Query Learning Strategies" Lecture Notes in Artificial Intelligence. 1532. 387-388 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Imai Hiroshi: "Geometric Clustering Models in Feature Space" Lecture Notes in Artificial Intelligence. 1532. 421-422 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Shinohara Ayumi: "Uniform Characterizations of Polynomial-query Learnabilities" Lecture Notes in Artificial Intelligence. 1532. 84-92 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Takasu Atsuhiro: "On the number of clusters in cluster analysis" Lecture Notes in Artificial Intelligence. 1532. 419-420 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Watanabe Osamu: "A Role of Constraint in Self-Organization" Proceedings of the 2nd International Workshop. 307-318 (1998)

    • 関連する報告書
      1998 実績報告書

URL: 

公開日: 1998-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi