研究実績の概要 |
画像やテキストといった,種類の異なるデータをまとめて異種データと呼ぶ.既存研究では(1)異種データ間に1対1の対応を仮定した生成モデルが正準相関分析(Canonical Correlation Analysis, CCA)の理論研究で利用されており,また,(2)一種類のデータ間に多対多対応を仮定した生成モデルがグラフ解析の分野で発展してきた.一方で,異種データに多対多対応を仮定した生成モデルは提案されていなかった. そこで初年度は既存のモデルを拡張し,異種データに多対多対応を仮定した生成モデルを新たに提案した.提案した生成モデルに基づき,最尤法により異種データの特徴量ベクトルの低次元変換を推定する手法Probabilistic Multi-view Graph Embedding (PMvGE)を提案した.PMvGEは様々な多変量解析手法を特殊例として含むCross-Domain Matching Correlation Analysis (CDMCA)を近似的に一般化した非線形な確率的枠組みになっていることも示した. 提案法の統計的性質を調べるために,線形モデルとニューラルネットワーク (Neural Network, NN)を用いたPMvGEで推定量の一致性を示した.さらに,NNを利用したとき,特徴量の次元が十分に高ければ内積だけで非常に広いクラスの類似度を表現できることを証明した.NN自体の表現定理はよく知られているが,NNにより特徴量ベクトルを変換し,その内積が高い表現力を持つことはこれまで理論的に示されておらず,この結果は,近年急速に発展している,NNを基にしたグラフ埋め込み一般の研究にも応用できる.
|