Publicly Offered Research
Grant-in-Aid for Scientific Research on Innovative Areas (Research in a proposed research area)
グラフデータを対象とする教師付き機械学習において、最も重要な問題の一つが「どのような構造特徴を用いるか」という学習対象の変数表現の問題である。この問題に対し、本課題では、すべての可能な部分グラフ特徴の空間を考え、そこから少数の有効特徴を選ぶ疎性モデリングの問題として捉え、より良い変数表現の研究を行った。すべての可能な部分グラフ特徴は組合せ爆発により陽に全列挙できないため、探索しながら学習を行う必要がある。このとき、この部分グラフ特徴の有無を表す変数(部分グラフ指示子)には、グラフの包含関係に由来する高い相関と冗長性があり、学習問題を難しくしている。この点を多角的に分析することで機械学習の挙動の理解と改善に関する知見が期待できると考える。本年度の研究によって次の3点の成果を得た。(1) 相関構造と冗長性は共にある部分構造aと別の部分構造bの「共起」に由来する。そこでまずこの「共起」構造を分析する技術について検討を行った。部分グラフ探索時に各々の部分グラフxが生起する事例集合が分かる。この情報を保持し活用する手法を考案し、分析と改良を引き続き行っている。(2) 本研究では厳密探索に基づくアルゴリズム開発を対象としてきたが、疎性学習制約によってはかなり深い探索が必要となり、現実的な実行時間を得ることが難しい事例が存在する。そこでwildcardを含む緩和表現を探索・列挙し、出力要約を行う手法を開発した。現在、機械学習への応用について検討を行っている。(3) 相関構造と冗長性の存在より線形学習では十分でないことが示唆されている。非線形モデルの学習の試みとして、すべての部分グラフ特徴から効率的に決定木学習を行う手法を開発した。厳密に線形の疎学習を行うよりかなり効率的に計算が可能であるため、現在、この決定木を基底学習機とするブースティングによる高精度の実現の検討を行っている。
27年度が最終年度であるため、記入しない。
All 2016 2015 2014 Other
All Journal Article (6 results) (of which Acknowledgement Compliant: 5 results, Peer Reviewed: 2 results) Presentation (9 results) (of which Invited: 3 results) Remarks (1 results)
システム・制御・情報
Volume: 60(3) Pages: 107-112
Discrete Applied Mathematics
Volume: 200 Pages: 123-152
10.1016/j.dam.2015.07.002
Social Networks
Volume: 44 Pages: 143-152
10.1016/j.socnet.2015.06.003
人工知能学会研究会資料
Volume: B502 Pages: 75-80
130008061570
SAR NEWS
Volume: 29 Pages: 9-17
電子情報通信学会技術研究報告
Volume: 115(323) Pages: 25-32
http://www.ist.hokudai.ac.jp/netjournal/net_48_1.html