研究領域 | スパースモデリングの深化と高次元データ駆動科学の創成 |
研究課題/領域番号 |
26120503
|
研究種目 |
新学術領域研究(研究領域提案型)
|
配分区分 | 補助金 |
審査区分 |
複合領域
|
研究機関 | 北海道大学 |
研究代表者 |
瀧川 一学 北海道大学, 情報科学研究科, 准教授 (10374597)
|
研究期間 (年度) |
2014-04-01 – 2016-03-31
|
研究課題ステータス |
完了 (2015年度)
|
配分額 *注記 |
3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2015年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2014年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 機械学習 / グラフ / 構造データ / 疎性モデリング / 変数選択 |
研究実績の概要 |
グラフデータを対象とする教師付き機械学習において、最も重要な問題の一つが「どのような構造特徴を用いるか」という学習対象の変数表現の問題である。この問題に対し、本課題では、すべての可能な部分グラフ特徴の空間を考え、そこから少数の有効特徴を選ぶ疎性モデリングの問題として捉え、より良い変数表現の研究を行った。すべての可能な部分グラフ特徴は組合せ爆発により陽に全列挙できないため、探索しながら学習を行う必要がある。このとき、この部分グラフ特徴の有無を表す変数(部分グラフ指示子)には、グラフの包含関係に由来する高い相関と冗長性があり、学習問題を難しくしている。この点を多角的に分析することで機械学習の挙動の理解と改善に関する知見が期待できると考える。
本年度の研究によって次の3点の成果を得た。(1) 相関構造と冗長性は共にある部分構造aと別の部分構造bの「共起」に由来する。そこでまずこの「共起」構造を分析する技術について検討を行った。部分グラフ探索時に各々の部分グラフxが生起する事例集合が分かる。この情報を保持し活用する手法を考案し、分析と改良を引き続き行っている。(2) 本研究では厳密探索に基づくアルゴリズム開発を対象としてきたが、疎性学習制約によってはかなり深い探索が必要となり、現実的な実行時間を得ることが難しい事例が存在する。そこでwildcardを含む緩和表現を探索・列挙し、出力要約を行う手法を開発した。現在、機械学習への応用について検討を行っている。(3) 相関構造と冗長性の存在より線形学習では十分でないことが示唆されている。非線形モデルの学習の試みとして、すべての部分グラフ特徴から効率的に決定木学習を行う手法を開発した。厳密に線形の疎学習を行うよりかなり効率的に計算が可能であるため、現在、この決定木を基底学習機とするブースティングによる高精度の実現の検討を行っている。
|
現在までの達成度 (段落) |
27年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
27年度が最終年度であるため、記入しない。
|