研究課題/領域番号 |
23300061
|
研究機関 | 兵庫県立大学 |
研究代表者 |
申 吉浩 兵庫県立大学, 応用情報科学研究科, 教授 (60523587)
|
研究分担者 |
岡本 洋 独立行政法人理化学研究所, その他部局等, 研究員 (00374067)
有村 博紀 北海道大学, 情報科学研究科, 教授 (20222763)
坂本 比呂志 九州工業大学, その他の研究科, 准教授 (50315123)
久保山 哲二 学習院大学, 付置研究所, 准教授 (80302660)
CUTURI Marco 京都大学, 情報学研究科, 准教授 (80597344)
|
研究期間 (年度) |
2011-04-01 – 2014-03-31
|
キーワード | 機械学習 / カーネル法 / 木構造データ / 動的計画法 |
研究概要 |
カーネル設計理論においては、カーネルの計算可能性を探求するために新たに導入した理論的枠組みである「分割可能カーネル」において重要な進展を得た。隠れ次数が1の場合については既にその標準形を得ていたが、今年度は隠れ次数2の場合の標準形を完全に求めた。隠れ次数2の分割可能カーネルは、一次の基本対称式を含み、例えば部分構造の要素の位数の和として定義されるカーネルを、その重要な例にもつ。今回の研究成果では、隠れ次数2の分割可能カーネルがなす空間は3つの部分空間に分割され、それぞれが2乃至3のパラメータで表現されることを示した。即ち、少数のパラメータにより隠れ次数2の分割可能カーネルを完全に記述することが可能であり、実用においては、交叉検定などにより最適パラメータを探索することにより、従来の勘にたよったカーネル選択ではなく、システマティクに最適なカーネルを探索することが可能となる。この結果は機械学習のトップカンファレンスであるICMLにおいて平成25年6月に発表する。 カーネル計算のためのユーティリティ開発では、本年度の課題であった並列計算による高速化を実現した。これにより、従来に比較して数倍から十数倍の高速化に成功した。 高速化されたユーティリティを利用して、70種類以上にのぼる木カーネルのアルゴリズムの性能比較実験を行い、興味深い結果を得た。すなわち、予想に反して、ごく単純な形の部分構造の重み付き数え上げを行うカーネルが、より複雑な部分構造を数え上げるカーネルや、木の編集距離から導出されるカーネルに比べて、統計的に有意によい性能を示すことが分かった。この結果は、木データを扱う実研究においてカーネルを選択する際に重要な指針を与える。 その他の研究成果として、木の編集距離と密接に関連する最適化問題の発見、文字列アライメントのグラフへの一般化を得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度の重要な研究目標であった、カーネルの計算可能性の理論的枠組みの整理、並列化によるユーティリティプログラムの高速化の二点において重要な成果を得、本研究課題の最終年度である25年度までに、所期の研究目標を達成する見込みを得た。特に、パラメータ探索による最適なカーネルの探索のための手法の見通しを得たことは、有効なカーネル設計法を提供するという本研究課題の大目標の達成にとって、大きな一歩であった。
|
今後の研究の推進方策 |
25年度は本研究課題の最終年度である。カーネル設計理論においては、24年度の成果をベースにして計算可能性の枠組みを完成させるとともに、当初想定した未解決問題を解決することを目標とする。中でも、隠れ次数が3以上の場合の分割可能カーネルの標準形を求めること、マッピングカーネルの再生核ヒルベルト空間の特徴付け、グラフカーネルへの拡張の三項目は最優先で取り組むべきであると考えている。 カーネル計算のためのユーティリティプログラムは、サービスの公開にむけた処理の自動化が完了し、サーバ環境の整備、ホームページの作成、規約の整備などを行えば、本研究課題の重要な目標であるユーティリティの公開が可能となる。25年度における目標実現の見通しは得られているものと考えられる。 更に、本ユーティリティプログラムを利用して、多様な実データを用いた実証実験を網羅的かつ体系的に実施する計画である。そのために、まず、ユーティリティプログラムをネットワークを介して分担研究者に公開する。 本研究課題の終了後ではあるが、26年度以降に重点的に研究するべき課題の整理も並行して行う。カーネル法は、非常に重要な機械学習の手法であるが、実用的な観点から考えると、まだまだ明らかにしなければならないことは多い。例えば、本年度の成果のひとつとして、マッピングカーネルが必ずしもinfinitely divisibleとはならないことを示したが、どのような条件下でinfinitely divisibleとなるかを知ることは実用上有用である。また、非常に多くの構成法が知られているカーネルに対して、どの構成法が最も有効であるかは、実証実験を通してしか得られない知見であろうと思われる。本研究課題で構築するカーネル設計理論や、実証実験のためのユーティリティの開発は、このような問題の解決に資するものと考える。
|