研究課題/領域番号 |
23K16896
|
研究機関 | 東京大学 |
研究代表者 |
古田 諒佑 東京大学, 生産技術研究所, 助教 (20843535)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
キーワード | 半教師有り学習 / 弱教師有り学習 / ドメイン汎化 / 物体検出 |
研究実績の概要 |
2023年度は主に物体検出のドメイン汎化の問題に取り組んだ。物体検出では学習時とテスト時にドメイン(データ分布)が異なると性能が大きく低下してしまうという問題がある。そこで、複数のドメインでのデータを集めて未知のドメインにも汎化する物体検出器を学習させるのが従来のドメイン汎化と呼ばれるタスクであるが、これは正解アノテーション付きの学習データを収集するコストが高い。そこで、私は物体検出における半教師有りおよび弱教師有りドメイン汎化と呼ばれる新たな問題に取り組んだ。半教師有りドメイン汎化では、単一のドメインでのみ正解アノテーション付きデータを用い、他のドメインでは正解アノテーション無しのデータを学習に用いる。弱教師有りドメイン汎化では、同じく単一のドメインでのみ正解アノテーション付きデータを用い、他のドメインでは弱ラベル付きのデータを学習に用いる。そのため、アノテーションコストを抑えて物体検出器を学習させることができる。私はこの2つのタスクにおいて、Mean Teacherと呼ばれる学習フレームワークがうまく動作することを実験的に示し、さらになぜ上手く動作するのかについて理論的な観点から新しい解釈を与えた。また、その解釈に基づいてさらに検出精度を向上させる正則化手法を提案した。本研究の内容は、国内で最大規模の査読有りコンピュータビジョンの会議であるMIRU2023にて口頭発表に選出された。また、コンピュータビジョン分野の最難関国際会議にも投稿中である。 また、漫画の物体検出における年代による絵柄の違いによる性能低下の問題にも取り組んだ。この問題もドメインの違いによる性能低下の一種ととらえることができる。Mean Teacherを用いたドメイン適応手法を用いることで性能低下を抑えることが可能であることを検証し、国内のPRMU研究会にて発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2023年度の本研究の内容は、国内で最大規模の査読有りコンピュータビジョンの会議であるMIRU2023にて口頭発表に選出された。そしてコンピュータビジョン分野における最難関国際会議にも投稿中である。また関連する漫画の物体検出におけるドメイン適応の研究成果も国内の研究会にて発表しており、順調に進展していると言える。
|
今後の研究の推進方策 |
2023年度は主に未知のドメインに対応できるように物体検出のドメイン汎化の問題に取り組んだ。上述したように、その内容では順調に研究成果が得られたため、2024年度は未知のクラスに対応できるようにzero-shot物体検出と呼ばれるタスクに取り組む方針である。具体的には大規模言語モデルなどを用いて未知のクラスに対する外部知識を獲得しそれを利用することで未知のクラスに対処する方法を検討中である。
|
次年度使用額が生じた理由 |
2023年度の研究成果はコンピュータビジョン分野における難関国際会議に投稿したが、査読にてリジェクトされ採録されなかった。そのため、計上していた国際会議旅費・参加費を使用することがなく次年度使用額が生じた。該当研究成果は査読コメントに応じた修正を行い別の難関国際会議に投稿中であり、次年度使用額はそのための旅費・参加費に使用する予定である。
|