研究課題
平成26年度は,(i) 高速なデータマイニング技術を開発するための基盤技術である列挙アルゴリズムに関する研究と,(ii) 列挙アルゴリズムを用いた機械学習のための特徴量抽出アルゴリズムの開発を行った.次にこれらの概要を述べる:(i) 本項では,木構造の一種である,誘導木に注目し,入力グラフからすべての誘導木を漏れなく重複無く列挙するアルゴリズムを開発した.提案のアルゴリズムは,入力グラフの縮退数と呼ばれるパラメタが定数であるときに,最適な列挙アルゴリズムである.縮退数は,グラフの平均次数と密接な関係がある.このアルゴリズムは,平均次数の小さい現実世界のデータに対して,適応可能なアルゴリズムだと考えられる.本結果は,韓国で行われた第25回アルゴリズムと計算に関する国際会議 (ISAAC 2014) に採択された.(ii) 今日,データベースに含まれる特徴量は膨大であり,それらを組み合わせると,その数は天文学的数字になる.本項では,列挙アルゴリズムと枝刈り法を用いて,機械学習で用いる有用な組み合わせ特徴量の発見するアルゴリズムの開発を目的とした.結果として,既存研究で与えられた特徴量列挙アルゴリズムよりも,省スペースで高速なアルゴリズムを開発できたが,機械学習の性能向上にはつながらなかった.本結果は,第17回情報論的学習理論ワークショップで発表した.性能向上を測るために,今後は,より有用な特徴量のみを列挙するアルゴリズムに関する考察を行いたい.
3: やや遅れている
列挙アルゴリズムの開発に関しては順調に推移している.しかし,列挙アルゴリズムの並列実行可能性の考察は十分に行えなかった.この点に関しては現在取り組んでいる遷移問題と呼ばれる問題も同時に考えることで,何らかの知見が得られると考えている.また,データマイニングアルゴリズムの開発に関しては,十分な結果が得られていない.これは研究計画上の課題である.これらを踏まえて,達成度はやや遅れていると評価する.
列挙アルゴリズムの開発に関しては,順調に成果が出ているため,このまま遂行していく.一方で,データマイニングアルゴリズムの開発に関してはやや遅れている.対応策としては,外部の研究者と積極的に交流を行うことで,現在のアルゴリズムの問題点を明確化し,当初の研究計画を達成したい.
すべて 2015 2014 その他
すべて 雑誌論文 (1件) (うち査読あり 1件、 謝辞記載あり 1件) 学会発表 (7件) 備考 (1件)
Proc. The 25th International Symposium on Algorithms and Computation (ISAAC 2014)
巻: LNCS 8889 ページ: 94 -- 201
10.1007/978-3-319-13075-0_8
http://www-ikn.ist.hokudai.ac.jp/~wasa/enumeration_complexity.html