2022年度は主に物体検出におけるドメイン汎化という問題に取り組んだ。漫画における物体検出は、キャラクターや内容に基づく推薦や自動翻訳などの様々な応用を持つ重要なタスクである。しかしながら漫画では作品や作者が変わるごとに作風(画風やテキストのフォントや配置)が大きくことなり(これはドメインの違いと呼ばれる)、ある特定の作品群で学習した検出器を別の作品でテストした場合に大きく性能が低下することが知られている。そこで本研究ではドメイン(作風)に依存しない物体検出器の学習に取り組んだ。具体的には、ある一つのラベルありドメインと複数のラベル無し(もしくは弱ラベル付き)ドメインのデータを学習に使用することでドメインに依存しない検出器を学習する"半教師無し(もしくは弱教師あり)物体検出"という新たなタスクを提案し、これを統一的に解く学習方法も示した。これによりラベル付けのアノテーションの手間をほとんど増やすことなくドメインに依存しない物体検出器の学習が可能になる。本研究の成果は国内で最大規模の査読有りコンピュータビジョンの会議であるMIRU2023に投稿した。 2021年度は漫画におけるシーン理解に向けた取り組みとして、シーン理解という包括的な問題をコンピュータビジョン分野における個々の基礎的なタスクに分割して取り組んだ。これらの内容は国内学会では画像の認識・理解シンポジウム(MIRU)のポスター発表と映像表現・芸術科学フォーラムの口頭発表を行い、映像表現・芸術科学フォーラムでは3件の優秀発表賞を受賞した。また、半自動着色の内容は画像処理分野における査読付き旗艦国際会議ICIPとコンピュータグラフィックス分野における国際会議SIGGRAPH ASIAのポスターに採択され発表を行った。 以上から研究機関全体を通じて国内・国際会議で発表を行い賞を受賞するなど、当初の計画以上に進展したと言える。
|