研究課題/領域番号 |
18K11472
|
研究機関 | 九州工業大学 |
研究代表者 |
古川 徹生 九州工業大学, 大学院生命体工学研究科, 教授 (50219101)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | データ可視化 / テンソル解析 / 関係データ / 潜在空間法 / 次元削減法 / 知識発見 / ビッグデータ解析 / マルチタスク学習 |
研究実績の概要 |
本研究の目的は,複雑なデータ構造を持つ大規模な複合データを包括的に解析・可視化する手法の開発である.キーアイデアは,本研究者が開発した非線形テンソル解析法 "Tensor SOM" をネットワーク化することである.すなわち複数のTensor SOMを結合したTensor SOM Networkが本研究の中心である.複合データの構造はグラフ構造で表現が可能であり,しばしばEntity Relation (ER) 図として表現される.本研究ではTensor SOMをデータ構造と同一のグラフ構造で結合したネットワークで結合する.これは非線形テンソル分解を構成要素とするベイジアンネットワークとみなすことができ,ベイジアンネットの情報伝播などの手法を利用することが可能である.
3年間の研究期間内では以下の4点に取り組む計画である.(1) Tensor SOMを結合したTensor SOM Networkの開発.具体的には (1-a) 対等なデータ同士の水平的な結合法の開発,および (1-b) 階層的なデータ間の垂直的結合法の開発に分けられる.(2) Tensor SOM Network内の情報伝播による複合データの横断的可視化法の開発.上述したベイジアンネットの手法を応用して,Tensor SOM Network全体を串刺しにした可視化法を開発する.(3) 実際の大規模複合データへ応用し,現実課題で有用性を検証.(4)Tensor SOMは自己組織化マップ (SOM) をベースとしているが,現代的な統計的機械学習で学習アルゴリズムの再構築を行い,より多様な解析対象を扱える連続潜在変数型のTensor SOM Networkを開発する.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
(1-a) 対等な関係データ同士を水平的に結合する手法の開発に取り組んだ.これはマルチビューテンソルデータの非線形解析として位置づけられる.すなわち各々の関係データに関して相互情報量が最大となる低次元表現を得ることが目的となる.1年目においては,マルチビューデータの非線形次元削減法において,co-trainingアプローチによるメトリック推定法を開発した.さらに提案法をTensor SOM Networkにおける水平結合に適用した.これにより,単純なカップリングより有効な結合法が実現できた.なお,本手法とドロップアウト法を組み合わせることで,教師なし学習におけるより一般的なメトリック推定が可能になるという着想を得ており,並行して試行している.
(1-b) 一方,階層的な複合データを解析する垂直的結合についても並行して取り組んだ.本研究では和型の階層結合と,積型の階層結合の2種の結合法を開発した.これらはそれぞれ,情報幾何学的にはm型とe型に相当する.両者は異なる階層モデルを生成するため,用途に応じて使い分けるものである.また垂直的結合は次元削減法のマルチタスク学習とみなすことができる.これは教師なし学習のマルチタスク学習であり,困難な課題として知られている.本研究ではマルチタスク学習の観点でも研究に取り組み,少数サンプルからでも学習可能なマルチタスク次元削減法を実現した.
(2) についても開発は順調に進んでおり,プロトタイプができている.(3) については,オンラインショップのデータを企業からデータを提供してもらい,実用レベルでの開発に着手したところである.また (4) についても並行して進めている.(4) は発展的なテーマであるものの,現在のところ順調に進んでいる.
|
今後の研究の推進方策 |
今年度以降は以下のように研究を推進する計画である. (1) (2) Tensor SOM Networkの学習アルゴリズムの完成.1年目に水平結合・垂直結合がそれぞれ実現できたため,それらを論文として完成させるとともに,それらを統合し,Tensor SOM Networkとして実現する.またマルチタスク次元削減法という観点でも,その理論と学習法について研究を深める. (2) (3) 大規模な実データへの応用として,企業から提供を受けたデータを用いて現実課題での実装を行う.なお複数企業から共同研究やデータ解析での利用の申し出を受けており,実応用面でも順調に進行している. (4) カーネル平滑化を用いた統計的次元削減法を開発し,それを用いた非線形テンソル解析法を実現する.これは発展的テーマであるため,2年間かけて取り組む.
上記に加え,以下の派生テーマに関して研究を検討し,可能であれば実施する.(5) 複合関係データが与えられたとき,対応するTensor SOM Networkを自動的に生成する方法,(6) 解析を容易にするユーザーインタフェースの開発.
|
次年度使用額が生じた理由 |
実データの処理について謝金を支払う予定であったが,主にアルゴリズム開発,理論開発の研究が中心であったため,支出が生じなかった.また国際会議発表等にかかる旅費も当初より少なかった.今年度は当初の実データ処理にかかる人件費が発生するため,次年度にまわして使用する.また国際会議等も初年度の成果発表を予定しているため,第二年度に使用する計画である.
|