2014 Fiscal Year Annual Research Report
超高速列挙アルゴリズムを用いた構造データマイニングアルゴリズムの開発
Project/Area Number |
13J01149
|
Research Institution | Hokkaido University |
Principal Investigator |
和佐 州洋 北海道大学, 情報科学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 列挙アルゴリズム / データマイニング / グラフ / 半構造データ / 機械学習 |
Outline of Annual Research Achievements |
平成26年度は,(i) 高速なデータマイニング技術を開発するための基盤技術である列挙アルゴリズムに関する研究と,(ii) 列挙アルゴリズムを用いた機械学習のための特徴量抽出アルゴリズムの開発を行った.次にこれらの概要を述べる: (i) 本項では,木構造の一種である,誘導木に注目し,入力グラフからすべての誘導木を漏れなく重複無く列挙するアルゴリズムを開発した.提案のアルゴリズムは,入力グラフの縮退数と呼ばれるパラメタが定数であるときに,最適な列挙アルゴリズムである.縮退数は,グラフの平均次数と密接な関係がある.このアルゴリズムは,平均次数の小さい現実世界のデータに対して,適応可能なアルゴリズムだと考えられる.本結果は,韓国で行われた第25回アルゴリズムと計算に関する国際会議 (ISAAC 2014) に採択された. (ii) 今日,データベースに含まれる特徴量は膨大であり,それらを組み合わせると,その数は天文学的数字になる.本項では,列挙アルゴリズムと枝刈り法を用いて,機械学習で用いる有用な組み合わせ特徴量の発見するアルゴリズムの開発を目的とした.結果として,既存研究で与えられた特徴量列挙アルゴリズムよりも,省スペースで高速なアルゴリズムを開発できたが,機械学習の性能向上にはつながらなかった.本結果は,第17回情報論的学習理論ワークショップで発表した.性能向上を測るために,今後は,より有用な特徴量のみを列挙するアルゴリズムに関する考察を行いたい.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
列挙アルゴリズムの開発に関しては順調に推移している.しかし,列挙アルゴリズムの並列実行可能性の考察は十分に行えなかった.この点に関しては現在取り組んでいる遷移問題と呼ばれる問題も同時に考えることで,何らかの知見が得られると考えている.また,データマイニングアルゴリズムの開発に関しては,十分な結果が得られていない.これは研究計画上の課題である.これらを踏まえて,達成度はやや遅れていると評価する.
|
Strategy for Future Research Activity |
列挙アルゴリズムの開発に関しては,順調に成果が出ているため,このまま遂行していく.一方で,データマイニングアルゴリズムの開発に関してはやや遅れている.対応策としては,外部の研究者と積極的に交流を行うことで,現在のアルゴリズムの問題点を明確化し,当初の研究計画を達成したい.
|
Research Products
(9 results)