• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Research-status Report

Knowledge Routing Method for Modality Networks

Research Project

Project/Area Number 19K22861
Research InstitutionThe University of Tokyo

Principal Investigator

中山 英樹  東京大学, 大学院情報理工学系研究科, 准教授 (00643305)

Project Period (FY) 2019-06-28 – 2021-03-31
Keywordsマルチモーダル / 教師なし学習 / 知識発見 / 画像認識 / 自然言語処理
Outline of Annual Research Achievements

現在成功している機械学習技術の多くは、入出力の事例(パラレルデータ)が十分に与えられる教師付き学習の枠組みに則っている。しかしながら、現実的には大量のパラレルデータを用意することは必ずしも容易であるとは言い難い。本研究では、申請者が実績を有するピボット学習の考え方を拡張し、さまざまな種類のデータ(モダリティ)が為すグラフ(ネットワーク)上で任意の二点間の関連性を教師なしで学習するための数理的基盤技術を開発する。具体的には、多数のモダリティ群が疎に結合した一般的なグラフにおいて、所望の二点間を結ぶ最適な経路を発見するとともに、モデルパラメータを最適化することを考える。
本研究では、適切な経路の選択と、その経路における関連性の最大化を同時に行うことが鍵となる。その実現に必要な数理的基盤として、EMアルゴリズムに基づく交互最適化による汎用的な学習アルゴリズムの開発を行った。本年度は理論面に注目するため、テキストデータの談話構造解析という単一ドメインのタスクを題材としたが、同じ枠組みで正準相関分析などのクロスモーダルな分析手法を用いることで、本研究で目標とする経路発見へ応用可能であると期待できる。本成果は、自然言語処理のトップジャーナルであるTransactions of the Association for Computational Linguistics (TACL)へ採択されている。
また、近年は教師なしのクロスモーダル学習が大きく進展しつつあり、本研究においても同様のアプローチを組み込むことで、モダリティネットワーク上で明示的にエッジがない部分も経路として利用し、手法の柔軟性を飛躍的に向上できる可能性がある。これを念頭に、画像認識における物体関連性識別などを題材として、教師なしクロスモーダル学習手法の開発を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究の計画を実現するにあたり、技術的に最も挑戦性の高い部分は、グラフ上の適切な経路の選択とその経路における関連性の最大化を同時に行う点にあるが、これを可能とするための数理的基盤技術が確立できた。今後はこの枠組みにおいて、一般的なクロスモーダル解析手法を導入していくことで本研究の最終的な目標を実現できると期待でき、具体的な道筋が得られたことから十分な進展であると考える。

Strategy for Future Research Activity

本年度開発した交互最適化による学習アルゴリズムにおいて、(1)現在のモデルパラメータによる最適な経路の探索、(2)その経路における関連性を最大化するようにモデルパラメータを更新、という二つの処理を繰り返す。これにより、最終的にモダリティネットワーク上の最適な経路を得て、二点間の関連性の推定や予測精度を最大化することを実現する。具体的な評価タスクとして、複数監視カメラネットワークにおける人物同定タスクの公開データセット[Liang et al., 2015]や、写真・スケッチ・言語などさまざまなモダリティでシーンの記述を行ったCross-Modal Placesデータセット[Castrejon et al., 2016]を利用した実験により、提案手法の有効性を実証する。

Causes of Carryover

本年度の計画策定後に、別の自由度の高い予算により十分な計算資源が購入でき物品費が浮いたこと、また適切な研究員が採用できず人件費が浮いたことなどにより、全体として当初予定よりも使用額が少なくなったことによる。
2020年度は本研究の最終年度となるため、複数のRA等の人件費や、クラウド計算機の使用料金、研究発表にかかる費用(論文掲載料、学会参加費、英文校閲料金等)などを中心に予算を執行し、研究を推進する。

  • Research Products

    (13 results)

All 2020 2019 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 1 results) Presentation (9 results) (of which Int'l Joint Research: 2 results,  Invited: 3 results) Remarks (1 results)

  • [Journal Article] Unsupervised Discourse Constituency Parsing Using Viterbi EM2020

    • Author(s)
      Noriki Nishida, Hideki Nakayama
    • Journal Title

      Transactions of the Association for Computational Linguistics

      Volume: 8 Pages: 215-230

    • DOI

      10.1162/tacl a 00312

    • Peer Reviewed / Open Access
  • [Journal Article] Erasing Scene Text with Weak Supervision2020

    • Author(s)
      Jan Zdenek, Hideki Nakayama
    • Journal Title

      Proceedings of the IEEE Winter Conference on Applications of Computer Vision (WACV)

      Volume: - Pages: 2238-2246

    • Peer Reviewed
  • [Journal Article] Efficient Base Class Selection Algorithms for Few-Shot Classification2020

    • Author(s)
      Takumi Ohkuma, Hideki Nakayama
    • Journal Title

      Proceedings of the ACM International Conference on Multimedia Retrieval (ICMR)

      Volume: - Pages: -

    • Peer Reviewed
  • [Presentation] 談話の削除不可能性に基づく教師なし談話核性分類2020

    • Author(s)
      西田典起, 中山英樹
    • Organizer
      言語処理学会 第26回年次大会
  • [Presentation] 名詞句の並び替えによる教師なし言い換え生成の検討2020

    • Author(s)
      杉浦昇太, 西田典起, 中山英樹
    • Organizer
      言語処理学会 第26回年次大会
  • [Presentation] MADAO: データ拡張最適化のためのメタ的アプローチ2020

    • Author(s)
      幡谷龍一郎, 中山英樹
    • Organizer
      第23回 画像の認識・理解シンポジウム (MIRU 2020)
  • [Presentation] Few-shot classificationにおけるベースクラスデータ多様化の有効性2020

    • Author(s)
      大熊拓海, 中山英樹
    • Organizer
      第23回 画像の認識・理解シンポジウム (MIRU 2020)
  • [Presentation] Erasing Scene Text with Weak Supervision2020

    • Author(s)
      Jan Zdenek, Hideki Nakayama
    • Organizer
      The IEEE Winter Conference on Applications of Computer Vision (WACV 2020)
    • Int'l Joint Research
  • [Presentation] Efficient Base Class Selection Algorithms for Few-Shot Classification2020

    • Author(s)
      Takumi Ohkuma, Hideki Nakayama
    • Organizer
      The ACM International Conference on Multimedia Retrieval (ICMR 2020)
    • Int'l Joint Research
  • [Presentation] 深層学習の発展と応用2019

    • Author(s)
      中山英樹
    • Organizer
      応用物理学会 第152回微小光学研究会
    • Invited
  • [Presentation] 機械学習とマルチメディア認識理解2019

    • Author(s)
      中山英樹
    • Organizer
      第4回 統計・機械学習若手シンポジウム
    • Invited
  • [Presentation] マルチモーダル情報と機械翻訳2019

    • Author(s)
      中山英樹
    • Organizer
      アジア太平洋機械翻訳協会年次セミナー AAMT 2019, Tokyo ~機械翻訳最前線~
    • Invited
  • [Remarks] 少ないデータからの機械学習に関する研究内容と成果

    • URL

      http://www.nlab.ci.i.u-tokyo.ac.jp/projects.html

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi