• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実績報告書

データベクトル間の関連を考慮した多ドメインデータの多変量解析

研究課題

研究課題/領域番号 16H02789
研究機関京都大学

研究代表者

下平 英寿  京都大学, 情報学研究科, 教授 (00290867)

研究分担者 清水 昌平  滋賀大学, データサイエンス学部, 准教授 (10509871)
研究期間 (年度) 2016-04-01 – 2020-03-31
キーワード多変量解析 / パターン認識 / グラフ埋め込み / 漸近理論 / 自然言語処理 / 画像検索 / 分散表現 / ニューラルネットワーク
研究実績の概要

ソーシャルメディアでは画像,タグ,地理情報等の様々な種類(ドメインと呼ぶ)のデータが得られ,画像やタグは数百次元のベクトルで表される.このような多ドメインデータから情報統合する柔軟な多変量解析の方法論(Cross-Domain Matching Correlation Analysis; CDMCA)を発展させることが本研究の目的である.正準相関分析を多ドメインへ拡張する既存手法では各ドメインのサンプルサイズが同一でベクトルの対応が1対1対応のものしか扱えない.本研究の方法では各ドメインのサンプルサイズが異なり,ベクトル間の関連の強さを任意に設定できる.画像認識や自然言語処理の大規模データに取り組んで,多変量解析の方法論の発展を目指している.
本年度は次の成果が得られた.(1)自然言語処理や画像検索,および言語と画像を融合したマルチモーダル検索へCDMCAを応用して有効性を確認した.言語はwikipediaコーパス,画像とタグはソーシャルメディア(Flickr)を利用した.画像の特徴量はCNNを事前深層学習したものを用いた.(2)CDMCAの線形変換を非線形変換(ニューラルネット)におきかえる理論研究に重要な進展があった.特徴ベクトルの類似度に内積を用いていても,十分に大きなニューラルネットワークを学習させることによって非常に広いクラスの類似度が表現できることがわかった.(3)最終層を線形変換にする場合は固有値を重みにする類似度を検討した.(4)自然言語処理への応用で単語に対応する特徴ベクトル(ワードベクトルとも呼ばれる)を計算するときに,日本語など分かち書きされない言語への対応で実用的な工夫を検討した.(5)情報量規準やリサンプリングに関しても進展があった.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

理論研究で大きな進展があった.自然言語処理と画像検索への応用ではおおむね想定通り.

今後の研究の推進方策

今後も自然言語処理,画像検索などの応用をすすめて得られる知見を理論研究に生かしつつ,理論的な興味に基づいた研究も発展させる.

  • 研究成果

    (15件)

すべて 2018 2017

すべて 学会発表 (15件) (うち国際学会 7件)

  • [学会発表] 単語らしい文字n-gramの埋め込みによる単語の分散表現2018

    • 著者名/発表者名
      Kim Geewook, 福井一輝 , 羽田哲也 , 下平英寿
    • 学会等名
      言語処理学会第24回年次大会(NLP2018)
  • [学会発表] Leveraging local data structure for multi-view analysis with many-to-many associations2017

    • 著者名/発表者名
      Akifumi Okuno and Hidetoshi Shimodaira
    • 学会等名
      Conference of the International Federation of Classification Societies (IFCS-2017)
    • 国際学会
  • [学会発表] Statistical consistency of multi-view correlation analysis with many-to-many associations2017

    • 著者名/発表者名
      Akifumi Okuno and Hidetoshi Shimodaira
    • 学会等名
      Joint Statistical Meeting 2017
    • 国際学会
  • [学会発表] Robust Multi-view Graph Embedding2017

    • 著者名/発表者名
      Akifumi Okuno and Hidetoshi Shimodaira
    • 学会等名
      International Conference on Robust Statistics 2017
    • 国際学会
  • [学会発表] Segmentation-Free Word Embedding for Unsegmented Languages2017

    • 著者名/発表者名
      Takamasa Oshikiri
    • 学会等名
      Conference on Empirical Methods in Natural Language Processing (EMNLP 2017)
    • 国際学会
  • [学会発表] Spectral Graph-Based Method of Multimodal Word Embedding2017

    • 著者名/発表者名
      Kazuki Fukui, Takamasa Oshikiri, Hidetoshi Shimodaira
    • 学会等名
      Workshop on Graph-based Methods for Natural Language Processing (TextGraphs-11)
    • 国際学会
  • [学会発表] Deep Multi-view Representation Learning Based on Adaptive Weighted Similarity2017

    • 著者名/発表者名
      Tetsuya Hada, Akifumi Okuno, Hidetoshi Shimodaira
    • 学会等名
      First International Workshop on Symbolic-Neural Learning (SNL-2017)
    • 国際学会
  • [学会発表] An Information Criterion For Prediction With Auxiliary Variables Under Covariate Shift2017

    • 著者名/発表者名
      Takahiro Ido, Shinpei Imori, Hidetoshi Shimodaira
    • 学会等名
      IASC-ARS/NZSA 2017
    • 国際学会
  • [学会発表] Cross-view link prediction with attribute vectors and its information criterion2017

    • 著者名/発表者名
      Akifumi Okuno, Hidetoshi Shimodaira
    • 学会等名
      2017年度統計関連学会連合大会
  • [学会発表] クロスドメインマッチング相関分析による画像情報を反映した単語埋め込み2017

    • 著者名/発表者名
      福井 一輝, 押切 孝将, 下平 英寿
    • 学会等名
      2017年度統計関連学会連合大会
  • [学会発表] マルチスケールブートストラップによる近似的に不偏なselective inference2017

    • 著者名/発表者名
      寺田 吉壱, 下平 英寿
    • 学会等名
      2017年度統計関連学会連合大会
  • [学会発表] 共変量シフトにおける補助変数を用いた予測と情報量規準2017

    • 著者名/発表者名
      井戸 貴大, 伊森 晋平, 下平 英寿
    • 学会等名
      2017年度統計関連学会連合大会
  • [学会発表] 属性ベクトルとニューラルネットワークを用いた異種データ間のリンク構造の最尤推定2017

    • 著者名/発表者名
      奥野彰文, 羽田哲也, 下平英寿
    • 学会等名
      第20回情報論的学習理論ワークショップ
  • [学会発表] クロスドメインマッチング相関分析を用いた画像とキャプションの同時埋め込み2017

    • 著者名/発表者名
      福井一輝,下平英寿
    • 学会等名
      第20回情報論的学習理論ワークショップ
  • [学会発表] 単語辞書を併用した単語分割しない単語埋め込み2017

    • 著者名/発表者名
      Geewook Kim,福井 一輝,羽田 哲也,下平 英寿
    • 学会等名
      第20回情報論的学習理論ワークショップ

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi