研究課題/領域番号 |
19K22861
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分61:人間情報学およびその関連分野
|
研究機関 | 東京大学 |
研究代表者 |
中山 英樹 東京大学, 大学院情報理工学系研究科, 准教授 (00643305)
|
研究期間 (年度) |
2019-06-28 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2020年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2019年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | 教師なし学習 / 少ラベル学習 / 連合学習 / マルチモーダル / 画像認識 / 自然言語処理 / 少量データ学習 / ゼロショット学習 / ドメイン一般化 / 知識発見 / 転移学習 / ピボット学習 / モダリティネットワーク |
研究開始時の研究の概要 |
現在産業的に成功している機械学習技術の多くは、入出力の事例(パラレルデータ)が十分に与えられる教師付き学習の枠組みに則っている。しかしながら、我が国ではデータの構築・活用は各企業や個人レベルでローカルに行われることが多く、大量のパラレルデータを用意することは現実的には困難である場合が多い。 本研究では、社会において局所的に偏在する多数のマルチモーダルデータが全体として構成する疎なグラフを考え、グラフ上の任意のモダリティ間の関連性を発見・最大化するための基盤技術を開発する。これにより、直接の教師データなしに任意のデータ間での予測や推論を可能とすることを狙うものである。
|
研究成果の概要 |
本研究では、個別に存在する多様なデータリソースを、それぞれのデータは秘匿したまま総合的に活用するための基盤技術の提案と開発を行った。具体的には、教師なし学習や少ラベル学習によって各ローカルデータが持つ情報を十分に引き出すと共に、オープンセットを考慮した連合学習によってこれらを間接的に連携させることを試みた。本研究の成果は、TACLやECCV等のトップ国際論文誌・国際会議に多数採択されている。
|
研究成果の学術的意義や社会的意義 |
現在成功している機械学習技術の多くは、入出力の事例(ラベル付きデータ)が十分に与えられる教師あり学習の枠組みに則っているが、実際の応用場面では大量のラベル付きデータを各人が用意することは必ずしも容易ではない。一つの解決策として、社会において個別に存在するデータを協調的に活用することが考えられるが、単純にデータを共有することはプライバシー等の観点から難しいことが多い。本研究で得られた技術により、さまざまなデータを各所有者が秘匿したまま統合的に活用することを可能とし、社会における新しいデータ活用の一助になると期待できる。
|