研究課題/領域番号 |
23300061
|
研究機関 | 兵庫県立大学 |
研究代表者 |
申 吉浩 兵庫県立大学, 応用情報科学研究科, 教授 (60523587)
|
研究分担者 |
有村 博紀 北海道大学, 情報科学研究科, 教授 (20222763)
坂本 比呂志 九州工業大学, 大学院・情報工学研究科, 准教授 (50315123)
久保山 哲二 学習院大学, 計算機センター, 准教授 (80302660)
岡本 洋 独立行政法人理化学研究所, 脳回路機能理論研究チーム, 研究員 (00374067)
CUTURI Marco 京都大学, 情報学研究科, 准教授 (80597344)
|
キーワード | 機械学習 / データマイニング / アルゴリズム / カーネル法 / 離散構造データ解析 |
研究概要 |
カーネル設計理論の構築当初計画では、主な未解決問題として、分割自由カーネルの適用対象の拡張、隠れ度2以上の分割自由カーネルの標準形の列挙、多項式サマリーの標準形の列挙、非推移的マッピングカーネルの半正定値性を挙げ、分割自由カーネルに関する二つの問題の解決を23年度の実施目標としたが、実施においては優先順位を変更し、隠れ度2の分割自由カーネルの標準形の列挙、マッピングカーネルの正定値性判定定理の解析関数への拡張、その応用としての非推移的マッピングカーネルへの正定値性判定定理の拡張の問題を肯定的に解決するとともに、カーネルのGram行列計算のための高速なアルゴリズムの研究を行い、従来の単純な動的計画法の適用に比較して、50倍程度の速度性能を有するアルゴリズムを考案、国際会議において発表した。 特定領域での応用では、糖鎖構造から疾病を予測する事例において、有効性を有するカーネルの特定を行い、辺のラベルを考慮したワームカーネルが良好な予測精度を有することを見いだした。ワームカーネルは、糖鎖構造中の極めて単純な部分構造に着目するカーネルであることから、定性的な解釈が行いやすいという点で、実用的に興味深い結果である。 ユーティリティの開発当初の計画通り、木カーネル計算のためのユーティリティの開発を、高速化の研究と並行して行った。高速化アルゴリズムに関しては、木データからなるデータセットにわたって、カーネル計算に必要な部分構造を一括して抽出し、部分構造同士のカーネル値をボトムアップに計算する動的計画法のアルゴリズムを考案した。このアルゴリズムに基づき、80種類近い木カーネルを計算するプロトタイプを実装した。プロトタイプによる実験では、単純な動的計画法に基づく従来の方法に比較して、50倍程度の速度向上を示した。更に、同プロトタイプに基づき、公開するためのユーティリティ版の開発を外注した。網羅的な例外処理、保守性に優れたコーディング、新たなカーネルの追加を容易にするモジュール化、並列処理による高速性が主要な要求項目であり、23年度は基本的な設計とプロトタイプの一部の移植を完了し、24年度の完成を目指す。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
カーネル理論構築における未解決問題の解決では、当初計画とは異なる問題を解決したが、理論的な観点から見れば、マッピングカーネルの正定値性判定定理をMercerの定理流に解析関数に拡張した点から、より本質的な問題を解決したといえる。ユーティリティの開発については、計画通りに進捗した。
|
今後の研究の推進方策 |
カーネル理論構築では、23年度において未解決問題の優先順位に変更があったものの、進捗としては同等であった。ユーティリティの開発は計画通りであった。従って、24年度以降の計画については、未解決問題の優先順位以外に現時点で変更の必要はなく、計画通りに実施する予定である。
|