研究課題/領域番号 |
19K22863
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分61:人間情報学およびその関連分野
|
研究機関 | 東京大学 |
研究代表者 |
山崎 俊彦 東京大学, 大学院情報理工学系研究科, 准教授 (70376599)
|
研究期間 (年度) |
2019-06-28 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円)
2020年度: 3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2019年度: 3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
|
キーワード | 少量学習データ / ドメイン適応 / 弱教師付き学習 / 半教師付き学習 / Few -Shot学習 / Zero-Shot学習 / 機械学習 / 転移学習 / 弱/半教師付き学習 / Few/Zero-Shot学習 |
研究開始時の研究の概要 |
少量学習データに対応可能な学習アルゴリズムの実証と最適化・一般化を行っていく。具体的には、研究代表者が専門分野としている画像・映像を対象に下記の研究などを行っていく。(1) 転移学習と弱教師あり学習の組み合わせによるドメイン適応、(2) 学習曲線に注目した弱教師あり学習、(3) Few-Shot学習におけるData Augmentation、(4) マルチモーダルを活用したZero-Shot学習、(5) 上記課題の一般化およびオープンソース化。
|
研究成果の概要 |
深層学習は圧倒的な性能を発揮することが知られているが、それは大規模な正解データが入手可能である場合に限られる。裏を返せばそのデータを取得・作成するための時間的・金銭的コストが大きな問題である。物体認識などすでに昔から研究がなされている分野では豊富なデータセットが入手可能である一方、産業界のデータや個人情報が絡む医療データなどは大規模な正解データセットを期待できない場合も多い。本研究ではこの問題を解決するために、ドメイン適応、弱/半教師付き学習、Few/Zero-Shot学習、自己教師あり学習、アンバランス学習など少量かつ偏りのあるデータでも学習可能な種々の要素技術を実現した。
|
研究成果の学術的意義や社会的意義 |
前述の通り、深層学習アルゴリズムがその性能を十分に発揮するためには、大規模かつ性格なラベリングがなされた学習データが必要であった。産業応用を考えた場合、新たに大量のデータを収集し、かつそのデータに正解ラベルを付与するコストはあまりにも高い。本研究成果はこの制約を緩和し、少量であったり極端にデータの分布に偏りがあったりしても正しく学習がなされる種々の要素技術を実現したことにある。我々の技術はすでにいくつかは実サービスに応用されており、社会的にも貢献している。
|