2015 Fiscal Year Annual Research Report
疎性モデリングに基づく部分グラフ指示子の冗長性及び相関構造の分析
Publicly Offered Research
Project Area | Initiative for High-Dimensional Data-Driven Science through Deepening of Sparse Modeling |
Project/Area Number |
26120503
|
Research Institution | Hokkaido University |
Principal Investigator |
瀧川 一学 北海道大学, 情報科学研究科, 准教授 (10374597)
|
Project Period (FY) |
2014-04-01 – 2016-03-31
|
Keywords | 機械学習 / グラフ / 構造データ / 疎性モデリング / 変数選択 |
Outline of Annual Research Achievements |
グラフデータを対象とする教師付き機械学習において、最も重要な問題の一つが「どのような構造特徴を用いるか」という学習対象の変数表現の問題である。この問題に対し、本課題では、すべての可能な部分グラフ特徴の空間を考え、そこから少数の有効特徴を選ぶ疎性モデリングの問題として捉え、より良い変数表現の研究を行った。すべての可能な部分グラフ特徴は組合せ爆発により陽に全列挙できないため、探索しながら学習を行う必要がある。このとき、この部分グラフ特徴の有無を表す変数(部分グラフ指示子)には、グラフの包含関係に由来する高い相関と冗長性があり、学習問題を難しくしている。この点を多角的に分析することで機械学習の挙動の理解と改善に関する知見が期待できると考える。
本年度の研究によって次の3点の成果を得た。(1) 相関構造と冗長性は共にある部分構造aと別の部分構造bの「共起」に由来する。そこでまずこの「共起」構造を分析する技術について検討を行った。部分グラフ探索時に各々の部分グラフxが生起する事例集合が分かる。この情報を保持し活用する手法を考案し、分析と改良を引き続き行っている。(2) 本研究では厳密探索に基づくアルゴリズム開発を対象としてきたが、疎性学習制約によってはかなり深い探索が必要となり、現実的な実行時間を得ることが難しい事例が存在する。そこでwildcardを含む緩和表現を探索・列挙し、出力要約を行う手法を開発した。現在、機械学習への応用について検討を行っている。(3) 相関構造と冗長性の存在より線形学習では十分でないことが示唆されている。非線形モデルの学習の試みとして、すべての部分グラフ特徴から効率的に決定木学習を行う手法を開発した。厳密に線形の疎学習を行うよりかなり効率的に計算が可能であるため、現在、この決定木を基底学習機とするブースティングによる高精度の実現の検討を行っている。
|
Research Progress Status |
27年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
27年度が最終年度であるため、記入しない。
|
Research Products
(11 results)