研究課題/領域番号 |
21K11971
|
研究機関 | 名城大学 |
研究代表者 |
堀田 一弘 名城大学, 理工学部, 教授 (40345426)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 深層学習 / Feedback / 情報リーク / セグメンテーション / Transformer |
研究実績の概要 |
情報リークという観点から様々な研究を行っている。例えば、Deep Neural Networkの出力を入力側にFeedbackして再度推論しながらセマンティックセグメンテーションを行う方法を提案した。また、一般に、動画像認識では3D CNNが利用されるが、その内部で情報をFeedbackさせる方法も提案した。これにより、時系列情報を有効に活用することができると考えられる。 時系列画像のセマンティックセグメンテーションを行う際、教師付き画像と時系列的に近い画像は高い精度でセグメンテーションができる。この性質を利用し、教師付き画像の所から時系列順に疑似ラベルを付与し、それらを教師データとして再利用しながら学習を行っていく方法も提案した。これは時系列的に情報をリークしていく枠組みと考えられる。また、セグメンテーションではクラス数が増えると精度が悪くなる傾向がある。そこで、あるクラスとその他の2クラス識別を行うDeep Neural Networkを学習し、そこから知識蒸留をしながら多クラスセグメンテーションの精度を改善する自己蒸留法も提案した。これは2クラス識別器からの情報リークと言える。 また、最近ではTransformerの有効性が多数報告されているので、今後のベースとなるTransformerの改良も行っている。画像には自然言語のように明確に単語という概念がないため、Vision Transformerでは入力画像を局所領域に切り出したものを単語のように扱っている。これを改善するために、学習画像の局所領域をクラスタリングしたものを単語と考え、Vision Transformerの中に組み込んだ。これはVisual Wordから入力画像への情報リークと考えることができる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
様々な画像認識問題に対し、情報リークという観点から様々な方法を提案し、有効性を確認できている。この点からおおむね順調に進展していると言える。
|
今後の研究の推進方策 |
今後も情報リークという観点から、画像分類、セマンティックセグメンテーション、動画像認識などの様々な画像認識問題に対してアプローチしていく。最近はTransformerを用いた方法の有効性の報告が多いため、Transformerに対して情報リークの観点からさらなる改善をしていく。
|
次年度使用額が生じた理由 |
国際会議に採択されたが、コロナが収束していない状況だったため、オンライン発表にした。そのため、旅費を利用せずに残額が生じた。今年は対面式の国際会議がメインになっているので、旅費に利用する。
|