2018 年度実績報告書

データベクトル間の関連を考慮した多ドメインデータの多変量解析

研究課題

研究課題/領域番号	16H02789
研究機関	京都大学
研究代表者	下平英寿京都大学, 情報学研究科, 教授 (00290867)
研究分担者	清水昌平滋賀大学, データサイエンス学部, 教授 (10509871)
研究期間 (年度)	2016-04-01 – 2020-03-31
キーワード	多変量解析 / パターン認識 / グラフ埋め込み / 漸近理論 / 自然言語処理 / 画像検索 / 分散表現 / ニューラルネットワーク
研究実績の概要	ソーシャルメディアでは画像，タグ，地理情報等の様々な種類（ドメインと呼ぶ）のデータが得られ，画像やタグは数百次元のベクトルで表される．このような多ドメインデータから情報統合する柔軟な多変量解析の方法論（Cross-Domain Matching Correlation Analysis; CDMCA）を発展させることが本研究の目的である．正準相関分析を多ドメインへ拡張する既存手法では各ドメインのサンプルサイズが同一でベクトルの対応が１対１対応のものしか扱えない．本研究の方法では各ドメインのサンプルサイズが異なり，ベクトル間の関連の強さを任意に設定できる．画像認識や自然言語処理の大規模データに取り組んで，多変量解析の方法論の発展を目指している．本年度は次の成果が得られた．（１）CDMCAの線形変換を非線形変換（ニューラルネット）におきかえる理論研究に重要な進展があった．十分に大きなニューラルネットワークを学習させることによって，内積を用いた特徴ベクトルの類似度は任意の正定値関数を学習できることがわかった．（２）さらにバイアス項もニューラルネットワークで学習することにより，任意の条件付き正定値関数を学習できることがわかった．これは双曲空間への埋め込みなど広いクラスを実現できる．（３）さらに内積の差を用いることによって，より広いクラスの類似度を学習できることがわかった．負の値を許す重み付き内積のSGDによる最適化計算によって効率よく学習できる．（４）これらの手法は自然言語処理の単語埋め込みにおいて有効であることがわかった．（５）画像検索のベンチマークデータ作成について予備的検討をおこなった．（６）ロバスト化のための理論的な結果を得た．（７）ネットワーク解析，情報量規準，リサンプリングに関しても進展があった．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由理論研究で大きな進展があった．自然言語処理と画像検索への応用ではおおむね想定通り．
今後の研究の推進方策	今後も自然言語処理，画像検索などの応用をすすめて得られる知見を理論研究に生かしつつ，理論的な興味に基づいた研究も発展させる

研究成果
(22件)

すべて 2019 2018

すべて雑誌論文 (9件) (うち査読あり 9件、オープンアクセス 6件) 学会発表 (13件) (うち国際学会 3件)

[雑誌論文] An Information Criterion for Auxiliary Variable Selection in Incomplete Data Analysis2019
- 著者名/発表者名
  Shinpei Imori, Hidetoshi Shimodaira
- 雑誌名
  
  Entropy
  
  巻: 21 ページ: 281
- DOI
  https://doi.org/10.3390/e21030281
- 査読あり / オープンアクセス
[雑誌論文] Graph Embedding with Shifted Inner Product Similarity and Its Improved Approximation Capability2019
- 著者名/発表者名
  Akifumi Okuno, Geewook Kim, Hidetoshi Shimodaira
- 雑誌名
  
  Proceedings of Machine Learning Research, PMLR
  
  巻: 89 ページ: 644-653
- 査読あり / オープンアクセス
[雑誌論文] Robust Graph Embedding with Noisy Link Weights2019
- 著者名/発表者名
  Akifumi Okuno, Hidetoshi Shimodaira
- 雑誌名
  
  Akifumi Okuno, Hidetoshi Shimodaira ; Proceedings of Machine Learning Research, PMLR
  
  巻: 89 ページ: 664-673
- 査読あり / オープンアクセス
[雑誌論文] An information criterion for model selection with missing data via complete-data divergence2018
- 著者名/発表者名
  Hidetoshi Shimodaira, Haruyoshi Maeda
- 雑誌名
  
  Annals of the Institute of Statistical Mathematics
  
  巻: 70 ページ: 421-438
- DOI
  https://doi.org/10.1007/s10463-016-0592-7
- 査読あり
[雑誌論文] A probabilistic framework for multi-view feature learning with many-to-many associations via neural networks2018
- 著者名/発表者名
  Akifumi Okuno, Tetsuya Hada, Hidetoshi Shimodaira
- 雑誌名
  
  Proceedings of the 35th International Conference on Machine Learning, PMLR
  
  巻: 80 ページ: 3888-3897
- 査読あり / オープンアクセス
[雑誌論文] Transitivity vs Preferential Attachment: Determining the Driving Force Behind the Evolution of Scientific Co-Authorship Networks2018
- 著者名/発表者名
  Masaaki Inoue, Thong Pham, Hidetoshi Shimodaira
- 雑誌名
  
  International Conference on Complex Systems, ICCS 2018: Unifying Themes in Complex Systems
  
  巻: IX ページ: 262-271
- DOI
  https://doi.org/10.1007/978-3-319-96661-8_28
- 査読あり
[雑誌論文] Word-like character n-gram embedding2018
- 著者名/発表者名
  Geewook Kim, Kazuki Fukui and Hidetoshi Shimodaira
- 雑誌名
  
  Proceedings of the 2018 EMNLP Workshop W-NUT: The 4th Workshop on Noisy User-generated Text
  
  巻: 4 ページ: 148-152
- 査読あり / オープンアクセス
[雑誌論文] A novel principle for causal inference in data with small error variance2018
- 著者名/発表者名
  Patrick Bloebaum, Dominik Janzing, Takashi Washio, Shohei Shimizu, Bernhard Schoelkopf
- 雑誌名
  
  Proceedings of the Twenty-First International Conference on Artificial Intelligence and Statistics, PMLR
  
  巻: 84 ページ: 900-909
- 査読あり / オープンアクセス
[雑誌論文] Non-Gaussian Methods for Causal Structure Learning2018
- 著者名/発表者名
  Shimizu Shohei
- 雑誌名
  
  Prevention Science
  
  巻: 20 ページ: 431～441
- DOI
  https://doi.org/10.1007/s11121-018-0901-x
- 査読あり
[学会発表] 擬ユークリッド空間への単語埋め込み2019
- 著者名/発表者名
  Geewook Kim, 奥野彰文, 下平英寿
- 学会等名
  言語処理学会第25回年次大会
[学会発表] On representation power of neural network-based graph embedding and beyond2018
- 著者名/発表者名
  Akifumi Okuno and Hidetoshi Shimodaira
- 学会等名
  ICML2018 workshop Theoretical Foundations and Applications of Deep Generative Models
- 国際学会
[学会発表] ニューラルネットワークを用いた異種データのグラフ埋め込み2018
- 著者名/発表者名
  奥野彰文, 下平英寿
- 学会等名
  2018年度統計関連学会連合大会
[学会発表] マルチスケール・ブートストラップによるモデル選択後のselective inference2018
- 著者名/発表者名
  寺田吉壱, 下平英寿
- 学会等名
  2018年度統計関連学会連合大会
[学会発表] 回帰モデルにおける補助変数を活用した推定精度の向上2018
- 著者名/発表者名
  前田篤刀, 伊森晋平, 下平英寿
- 学会等名
  2018年度統計関連学会連合大会
[学会発表] 複雑ネットワーク成長メカニズムにおける優先的選択性と推移性のノンパラメトリック同時推定2018
- 著者名/発表者名
  井上雅章, Pham THONG, 下平英寿
- 学会等名
  2018年度統計関連学会連合大会
[学会発表] 単語ベクトルを利用した文書の教師なし行列表現2018
- 著者名/発表者名
  福井一輝, 下平英寿
- 学会等名
  情報論的学習理論と機械学習ワークショップ
[学会発表] ロバストなグラフ埋め込み2018
- 著者名/発表者名
  奥野彰文, 下平英寿
- 学会等名
  情報論的学習理論と機械学習ワークショップ
[学会発表] ニューラルネットワークを用いたグラフ埋め込みの表現定理とその拡張2018
- 著者名/発表者名
  奥野彰文, Geewook Kim, 下平英寿
- 学会等名
  情報論的学習理論と機械学習ワークショップ
[学会発表] グラフ埋め込みの次数補正とその応用2018
- 著者名/発表者名
  田中卓磨, 奥野彰文, 下平英寿
- 学会等名
  情報論的学習理論と機械学習ワークショップ
[学会発表] 因果探索、予測、そして制御2018
- 著者名/発表者名
  清水昌平
- 学会等名
  応用統計学会
[学会発表] Causal discovery, prediction mechanisms, and control2018
- 著者名/発表者名
  S. Shimizu
- 学会等名
  The 5th meeting of the Institute of Mathematical Statistics (IMS) meeting series, the IMS Asia Pacific Rim Meeting (IMS-APRM)
- 国際学会
[学会発表] Causal discovery, prediction, and control2018
- 著者名/発表者名
  S. Shimizu
- 学会等名
  Causal Modeling and Machine Learning (CaMaL) Workshop
- 国際学会

2018 年度 実績報告書

データベクトル間の関連を考慮した多ドメインデータの多変量解析

研究代表者

下平 英寿 京都大学, 情報学研究科, 教授 (00290867)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] An Information Criterion for Auxiliary Variable Selection in Incomplete Data Analysis2019

著者名/発表者名

雑誌名

DOI

[雑誌論文] Graph Embedding with Shifted Inner Product Similarity and Its Improved Approximation Capability2019

著者名/発表者名

雑誌名

[雑誌論文] Robust Graph Embedding with Noisy Link Weights2019

著者名/発表者名

雑誌名

[雑誌論文] An information criterion for model selection with missing data via complete-data divergence2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] A probabilistic framework for multi-view feature learning with many-to-many associations via neural networks2018

著者名/発表者名

雑誌名

[雑誌論文] Transitivity vs Preferential Attachment: Determining the Driving Force Behind the Evolution of Scientific Co-Authorship Networks2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] Word-like character n-gram embedding2018

著者名/発表者名

雑誌名

[雑誌論文] A novel principle for causal inference in data with small error variance2018

著者名/発表者名

雑誌名

[雑誌論文] Non-Gaussian Methods for Causal Structure Learning2018

著者名/発表者名

雑誌名

DOI

[学会発表] 擬ユークリッド空間への単語埋め込み2019

著者名/発表者名

学会等名

[学会発表] On representation power of neural network-based graph embedding and beyond2018

著者名/発表者名

学会等名

[学会発表] ニューラルネットワークを用いた異種データのグラフ埋め込み2018

著者名/発表者名

学会等名

[学会発表] マルチスケール・ブートストラップによるモデル選択後のselective inference2018

著者名/発表者名

学会等名

[学会発表] 回帰モデルにおける補助変数を活用した推定精度の向上2018

著者名/発表者名

学会等名

[学会発表] 複雑ネットワーク成長メカニズムにおける優先的選択性と推移性のノンパラメトリック同時推定2018

著者名/発表者名

学会等名

[学会発表] 単語ベクトルを利用した文書の教師なし行列表現2018

著者名/発表者名

学会等名

[学会発表] ロバストなグラフ埋め込み2018

著者名/発表者名

学会等名

[学会発表] ニューラルネットワークを用いたグラフ埋め込みの表現定理とその拡張2018

著者名/発表者名

学会等名

[学会発表] グラフ埋め込みの次数補正とその応用2018

著者名/発表者名

学会等名

[学会発表] 因果探索、予測、そして制御2018

著者名/発表者名

学会等名

[学会発表] Causal discovery, prediction mechanisms, and control2018

著者名/発表者名

学会等名

[学会発表] Causal discovery, prediction, and control2018

著者名/発表者名

学会等名

2018 年度実績報告書

下平英寿京都大学, 情報学研究科, 教授 (00290867)