研究概要 |
本研究の目標は,構造化データからの頻度に基づく知識発見の基礎理論の構築を行うことである.構造化データから抽出する知識の表現手法として「式」を採用し,「式」のなす束構造における下方集合の性質を中心に解明し,機械学習手法の一般的性質を明らかにする.これらの成果に基いて,高速な機械学習・知識発見アルゴリズムを構成する. [連携研究者]首都大学東京・理工学研究科・教授徳永浩雄 本年度の成果として,昨年度に引き続き,様々なデータに対する式のなす束構造を利用した機械学習・知識発見のための基礎的性質を分析した.「式」としては,時系列事象間の関係を表す有向グラフ(エピソード),一般の有向グラフ,木,イデアルを表す多項式,楽譜を表すMusicXMLである.また,これらの「式」については具体的な機械学習・知識発見アルゴリズムを構成した.特徴的な成果としては以下の通りである. 1.多項式イデアルの機械学習の研究を展開させ,イデアルの一般形である閉集合の有界和を正データから新しい学習するアルゴリズムを考案した. 2.木構造データの機械学習の基礎となる木構造データ間の距離に関する網羅的な体系の確立を目標に分析を進めた. 3.構造データの機械学習手法のために昨年度考案したカーネル関数を一般化し,演繹的な導出を用いたカーネル関数の形に定式化した. 4.統計的推論に対して機械学習の研究で一般的なVC次元の分析を行った. 5.木構造データをあらかじめ圧縮しておくことで機械学習を高速化するための一般性をもった手法を考案し,実装した.
|