2018 Fiscal Year Research-status Report
Development of deep neural network architecture for multitask learning
Project/Area Number |
18K11348
|
Research Institution | The University of Tokyo |
Principal Investigator |
川上 玲 東京大学, 大学院情報理工学系研究科, 特任講師 (90591305)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | マルチタスク学習 / ニューラルネットワーク / 物体検出 / 汎化性能 |
Outline of Annual Research Achievements |
平成30年度は,マルチタスク学習(MTL)を行うためのタスクの調査と選定を行う予定であった.対象をコンピュータビジョン分野に限れば,多クラス認識,領域分割と物体検出,物体追跡と検出,法線推定とエッジ分類,属性推定とクラス認識,人物の姿勢推定と行動認識,顔検出と姿勢・年齢・ランドマーク推定,画像分類と審美的品質推定,などでマルチタスク学習が有効であることが分かっていた.さらに,深度推定と意味領域分割,エッジ検出と深度,及び法線推定,顔認証と顔の属性推定などでも有効であることが分かった.
また,当該年度では,同じデータに異なるラベルがついたデータセットではなく,異なるデータに異種のラベルがついたタスクの組み合わせも考慮し,補足しあうかを調査する予定であったが,計画を変更し,平成31年度に行う予定であった,本プロジェクトで提案する交差接続(Cross-Unit)が,領域分割と物体検出のタスクの組合せにおいて有効であるかの検証を行った.物体検出には,Caltech Pedestrianという人検出のデータセットを使用し,領域分割にはCityscapesという50都市(主にドイツ,一部スイスの都市)を車載カメラで路上から撮影した画像に画素レベルでラベル付けがされたものを用いた.結果として,物体(人)検出は領域分割からの知識を流用し,性能が向上することを確認した.また,検出は汎化性能が向上することを確認した.この結果は現在国際会議に投稿中である.また,物体検出から派生した研究成果が英文論文誌,及び国内の学術会議などに採択された.派生研究でも英文雑誌に投稿中のものが一件ある.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成30年度の進捗は概ね順調であり,タスクの調査や選定は予定通り進んだ.また,異なるデータで異種のラベルがついたタスクの組み合わせまで調査が進まなかったものの,手法の開発は当初の予定よりも早く進んだ.特に,交差接続を領域分割と物体検出の組み合わせに適用できたことは大きい.物体検出は性能が向上することを確認し,また,汎化性能も向上する可能性があることを示せた.具体的には,シングルタスクで学習した検出器のモデルの性能が,画像一枚あたりの平均見落とし率で21.5%(低いほど良い)あり,他のベースラインの手法(たとえば,従来の下層を共有する手法)などでは,これに対する向上が全く見られなかったのに対し,提案する交差接続では,画像一枚あたりの平均見落とし率が19.4%と,性能の向上が確認できた.さらに,これらの学習モデルを全く別のデータセット(KITTIベンチマーク,カールスルーエの車載カメラ映像)に適用したところ,シングルタスクで55.3%の平均見落とし率であったのに対し,マルチタスク学習の手法は,51~52%とすべてシングルタスクを上回ったものの,提案する交差接続ではさらに48.61%の平均見落とし率を達成できた.すなわち,同じ学習データセットで,より有用な学習が行えていることが示せた.この成果は現在国際会議に投稿中であり,またいくつかの検出の派生研究の成果がそれぞれ英文論文誌や国内会議に採択され,次年度への基礎を築くことができた.
|
Strategy for Future Research Activity |
今後は,交差接続を別のデータで検証し,性能向上を確認し,実証を継続することを計画している.データは,申請者が若手研究で作成していた,鳥検出のデータで,検出や領域分割を行う予定である.このデータは,近畿地方,及び北海道でそれぞれ作成されているため,どちらかのデータで学習させ,もう一方で汎化性能を評価することができる.ベースラインの手法も実装し,性能を比較する.また,今回,物体検出は性能向上を確認できたものの,領域分割の結果は性能向上が見られなかった.この原因を考察するとともに,可能であれば,データの多様性や複雑性,情報量を数値化することに取り組みたい.また,必要であれば,検証用のデータも作成する.
また,当初の計画通り,交差接続の畳込み層を畳込みLSTMで代替した,交差接続型時系列データ処理のネットワークの設計にも取り組む.次年度,および翌年度で,ネットワークの開発や最適化を行うとともに,動画のデータを整備し,評価に用いる.計画が進めば,不完全なデータからの学習にまで適用し,性能を評価する.
|
Causes of Carryover |
実験では,公開されているベンチマークのデータを上手く利用できたため,データ作成のコストが想定よりも少なく済んだ.一方で多くの成果が実を結びつつあり,来年度は論文の出版件数が計画時の想定よりも増加する見込みであるため,未使用額は,これらの出版費用に充てる.
|
Research Products
(9 results)