研究概要 |
本研究では,構造化データからの頻度に基づく知識発見の基礎理論の構築を行うことを目的とする.構造化データから抽出する知識の表現手法として「式」を採用し,「式」のなす束構造における下方集合の性質を中心に解明する.一方で,機械学習手法の一般的性質を明らかにする.これらの成果に基いてことで,高速な機械学習・知識発見アルゴリズムを構成する.本年度の成果として,まず知識表現手法となる「式」として.一階述語論理の項,時系列事象間の関係を表す有向グラフ(エピソード),一般の有向グラフ,木などを対象に,束構造を利用した機械学習・知識発見のための基礎的性質を分析し,一部の「式」については具体的な機械学習・知識発見アルゴリズムを構成した.分析には実データに対するアルゴリズム評価を含んでいる.また,機械学習手法としてサポートベクトルマシンを選び,その一般的性質の分析を行った.さらに,サポートベクトルマシンについて,生成文法における導出を「式」とみなすことで,新たなカーネル関数を設計を行い,実問題としてRNA配列データの分類問題に適用することでその有効性を示すことに成功した.さらに,多項式イデアルをデータ,その基底を「式」とする機械学習の枠組みにおいて,形式言語の学習研究において従来から考察されてきた集合和の学習を考察し,全く新しい学習アルゴリズムを考案し,それが多項式イデアル以外の概念に対しても応用の可能性があることを示した.
|