• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

データベクトル間の関連を考慮した多ドメインデータの多変量解析

研究課題

研究課題/領域番号 16H02789
研究機関大阪大学

研究代表者

下平 英寿  大阪大学, 基礎工学研究科, 教授 (00290867)

研究分担者 清水 昌平  滋賀大学, データサイエンス教育研究センター, 准教授 (10509871)
研究期間 (年度) 2016-04-01 – 2020-03-31
キーワード多変量解析 / パターン認識 / 次元削減 / グラフ埋め込み / 漸近理論 / 自然言語処理 / 画像検索 / 分散表現
研究実績の概要

ソーシャルメディアでは画像,タグ,地理情報等の様々な種類(ドメインと呼ぶ)のデータが得られ,画像やタグは数百次元のベクトルで表される.このような多ドメインデータから情報統合する柔軟な多変量解析の方法論(Cross-Domain Matching Correlation Analysis; CDMCA)を発展させることが本研究の目的である.正準相関分析を多ドメインへ拡張する既存手法では各ドメインのサンプルサイズが同一でベクトルの対応が1対1対応のものしか扱えない.本研究の方法では各ドメインのサンプルサイズが異なり,ベクトル間の関連の強さを任意に設定できる.画像認識や自然言語処理の大規模データに取り組んで,多変量解析の方法論の発展を目指している.
本年度は次の成果が得られた.
(1)自然言語処理へCDMCAを応用して,その有効性を確認した.従来研究では正準相関分析(CCA)を用いて1言語の単語ベクトルを計算していたが,本研究では中規模の多言語コーパスにおいて複数言語で翻訳された文書から各言語の各単語ベクトルを計算したところ,単語翻訳タスクで高い性能を示した.
(2)画像投稿サイトFlickrの画像データとそのタグへCDMCAを応用して,画像とタグの相互検索でその有効性を確認した.画像とタグは共通空間のベクトルとして表現されるので,クエリ画像に近いタグを探すだけでなく,逆にタグに近い画像を探すことによって相互検索を行う.従来法に比べて一定の改善を確認した.
(3)CDMCAの方法論を発展させる研究について,予備的な結果が得られた.とくに,L1正則化,ロバスト化,深層学習による非線形化などの拡張をおこなった.推定量の一致性や2乗ロスを尤度に置き換えるアプローチの考察,モデル選択や因果推測との関係について検討をおこなった.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

初年度はおおむね当初計画どおり成果がでている.とくに自然言語処理と画像検索への応用では当初の期待を超える成果が得られている.理論研究,方法論を発展させる研究は,検討を行い,予備的結果が得られている.

今後の研究の推進方策

今後は自然言語処理,画像検索などの応用をさらに進める.このような応用分野における知見が,統計的方法論のさらなる発展につながるように,検討をおこなう.一方で理論研究については,応用からの刺激をうけて検討を行う他に,それ自体の興味に基づいた研究も行う.

  • 研究成果

    (15件)

すべて 2018 2017 2016 その他

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (12件) (うち国際学会 4件) 備考 (1件)

  • [雑誌論文] An information criterion for model selection with missing data via complete-data divergence2018

    • 著者名/発表者名
      Hidetoshi Shimodaira, Haruyoshi Maeda
    • 雑誌名

      Annals of the Institute of Statistical Mathematics

      巻: 70 ページ: 421-438

    • DOI

      https://doi.org/10.1007/s10463-016-0592-7

    • 査読あり
  • [雑誌論文] マッチング相関分析を用いた画像-マルチタグ間の相互検索2016

    • 著者名/発表者名
      福井一輝, 奥野彰文, 下平英寿
    • 雑誌名

      電子情報通信学会論文誌

      巻: D99 ページ: 774-777

    • DOI

      10.14923/transinfj.2015IUL0005

    • 査読あり
  • [学会発表] 単語分割を経由しない単語埋め込み2017

    • 著者名/発表者名
      押切孝将, 下平英寿
    • 学会等名
      言語処理学会第23回年次大会
    • 発表場所
      筑波大学(茨城県・つくば市)
    • 年月日
      2017-03-14
  • [学会発表] 多対多対応を扱う相関分析の一致性について2017

    • 著者名/発表者名
      奥野彰文, 下平英寿
    • 学会等名
      第11回日本統計学会春季集会
    • 発表場所
      政策研究大学院大学(東京都・港区)
    • 年月日
      2017-03-05
  • [学会発表] 深層クロスドメインマッチング相関分析の提案とその応用2016

    • 著者名/発表者名
      羽田哲也, 福井一輝, 下平英寿
    • 学会等名
      第19回情報論的学習理論ワークショップ
    • 発表場所
      京都大学(京都府・京都市)
    • 年月日
      2016-11-16
  • [学会発表] Image and tag retrieval by leveraging image-group links with multi-domain graph embedding2016

    • 著者名/発表者名
      Fukui, Kazuki and Okuno, Akifumi and Shimodaira, Hidetoshi
    • 学会等名
      2016 IEEE International Conference on Image Processing
    • 発表場所
      Phoenix(アメリカ)
    • 年月日
      2016-09-26
    • 国際学会
  • [学会発表] データベクトルのマッチングに関する情報統合の多変量解析とその最尤推定2016

    • 著者名/発表者名
      下平英寿
    • 学会等名
      統計関連学会連合大会
    • 発表場所
      金沢大学(石川県・金沢市)
    • 年月日
      2016-09-07
  • [学会発表] マッチング相関分析を用いた多言語単語埋め込み2016

    • 著者名/発表者名
      押切孝将, 福井一輝, 下平英寿
    • 学会等名
      統計関連学会連合大会
    • 発表場所
      金沢大学(石川県・金沢市)
    • 年月日
      2016-09-07
  • [学会発表] 多ドメインマッチング相関分析の深層ニューラルネットによる非線形化2016

    • 著者名/発表者名
      羽田哲也, 下平英寿
    • 学会等名
      統計関連学会連合大会
    • 発表場所
      金沢大学(石川県・金沢市)
    • 年月日
      2016-09-07
  • [学会発表] 多対多対応を利用したマッチング相関分析の一致性について2016

    • 著者名/発表者名
      奥野彰文, 下平英寿
    • 学会等名
      統計関連学会連合大会
    • 発表場所
      金沢大学(石川県・金沢市)
    • 年月日
      2016-09-07
  • [学会発表] Cross-Lingual Word Representations via Spectral Graph Embeddings2016

    • 著者名/発表者名
      Oshikiri, Takamasa and Fukui, Kazuki and Shimodaira, Hidetoshi
    • 学会等名
      54th Annual Meeting of the Association for Computational Linguistics
    • 発表場所
      Berlin(ドイツ)
    • 年月日
      2016-08-10
    • 国際学会
  • [学会発表] A non-Gaussian approach for causal structure learning in the presence of hidden common causes2016

    • 著者名/発表者名
      Shimizu, Shohei
    • 学会等名
      CRM Workshop: Statistical Causal Inference and its Applications to Genetics
    • 発表場所
      Montreal (Canada)
    • 年月日
      2016-07-25
    • 国際学会
  • [学会発表] 多ドメインマッチング相関分析のL1正則化法2016

    • 著者名/発表者名
      小嶋啓右, 廣瀬慧,下平英寿
    • 学会等名
      情報論的学習理論と機械学習(IBISML)研究会
    • 発表場所
      沖縄科学技術大学院大学メインキャンパス(沖縄県・国頭郡恩納村)
    • 年月日
      2016-07-06
  • [学会発表] A non-Gaussian model for causal discovery in the presence of hidden common causes2016

    • 著者名/発表者名
      Shimizu, Shohei
    • 学会等名
      Munich Workshop on Causal Inference and Information Theory
    • 発表場所
      Munich (Germany)
    • 年月日
      2016-05-23
    • 国際学会
  • [備考] Shimodaira Lab

    • URL

      http://www.sigmath.es.osaka-u.ac.jp/shimo-lab/

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi