研究課題/領域番号 |
19K22863
|
研究機関 | 東京大学 |
研究代表者 |
山崎 俊彦 東京大学, 大学院情報理工学系研究科, 准教授 (70376599)
|
研究期間 (年度) |
2019-06-28 – 2021-03-31
|
キーワード | 少量学習データ / ドメイン適応 / 弱教師付き学習 / 半教師付き学習 / Few -Shot学習 / Zero-Shot学習 |
研究実績の概要 |
深層学習では、大規模データが特に重要であるが裏を返せばそのデータを取得・作成するための時間的・金銭的コストが大きな問題となる。本研究の目的は、この問題を解決するために、ドメイン適応、弱/半教師付き学習、Few/Zero-Shot学習など少量のデータでも学習可能なアルゴリズムを実現することである。 弱教師付き物体検出、すなわち画像中に何が写っているかはわかるものの位置を示すバウンディングボックスがないといった問題設定下において、バウンディングボックスの位置を逐次アップデートする手法を確立た。弱教師付き物体検出分野で世界最高性能を実現するとともに、難関国際会議ICCVにて口頭発表した。さらに、ソースコードをオープンソースとして一般公開した。 Few/Zero-Shot学習について、Zero-shot semantic segmentation (意味に基づく画像領域分割)とZero-shot conditional inpainting (画像修復)の2つの課題について取り組んだ。いずれも当該クラスの画像を1度も見たことのない状態で言語など他のドメインから知識を得て処理をおこなうものであり、世界に先駆けた研究の1つである。 画像のStyle Transferにおいて、ソースとターゲットで全くペアが存在せずそれぞれ独立にデータが収集された状況でも学習が行えるフレームワークを実現し、大規模主観評価にてその有効性を確認した。難関国際会議AAAIにて発表した。 また、医療画像を対象に、様々な環境下で撮影された画像を単一のモデルで扱かったときの性能限界とその理由について検討を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
2年間の短期プロジェクトであるが、非常に多くの項目について成果が出ている。そのハイライトをいくつか列挙する。 弱教師付き物体検出について。深層学習は学習データにノイズを多く含むほど学習の収束速度が遅くなれることが報告されている。その特徴を逆手にとって、「良いバウンディングボックスはその領域を隠したときに深層学習がうまく学習できなくなるようなものである」という仮説を立てた。この条件をより強く満たすようなバウンディングボックスを探索することで精度の高いボックスの設定ができるようになった。また、従来の手法では暗に物体は画像中に1つだけ存在することを仮定しており、2つ以上存在するときそれらが逆に精度を低下させる原因になっていた。画像中にいくつ存在するかは事前に知ることは出来ないため、2つ以上存在した場合それらの存在を考慮に入れないで学習をすすめる手法を提案した。これら2つの手法を組み合わせることにより、世界最高性能かつ当時としては最新技術より大幅な向上率を実現した高精度な物体検出アルゴリズムを実現した。 Unpaired Image Style Transferに関する検討を行った。従来のImage Style Transferではソースとターゲットでペアとなったデータが求められる、操作結果に対して説明や少修正が与えられないなどの問題があった。そこで、強化学習を利用して微分不可能な外部画像編集ツールを操作させる学習を行い、Descriminatorを利用してターゲットの学習データと遜色ないかを判別するという手法を実現した。主観評価において圧倒的な高評価を得たとともに、間に外部画像編集ツールを用いることで深層学習にありがちな画像のノイズや論理的破綻を防ぐことに成功した。
|
今後の研究の推進方策 |
企業との共同研究をすすめる中で、実データはデータの正例と反例の数が極めてアンバランスな状況が多いことを痛感している。例が少ない方のデータを増やすことは研究では可能であるが、実応用上は現実的でない。そこで、学習データのアンバランスがあっても効果的に学習を進められるアルゴリズムについて検討を進めていく。 また、現在の深層学習は大量のデータを用いた力技で様々なタスクを解こうとするものが多い。画像の意味を考慮して画像間で適切な意味の対応付を行うことで安定かつ高速に学習が進む可能性を予備検討により得ている。今後、より詳細な検討や大規模実験によってこの仮説を実証していく。 さらには、少ない学習データであるほど機械学習機の判断や予測が過学習や当てずっぽうでないことを示すための「説明可能性」が求められると感じている。そこで、特に医療画像など少数のデータしか得られないような状況下において説明可能なAIの検討を行っていく。
|
備考 |
一部の研究成果についてはソースコードをオープンソースとしてGithubで公開中。
|