研究課題/領域番号 |
21K11971
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 名城大学 |
研究代表者 |
堀田 一弘 名城大学, 理工学部, 教授 (40345426)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 深層学習 / Feedback / 情報リーク / セグメンテーション / Transformer / GAN / マルチタスク / フィードバック / 画像認識 |
研究開始時の研究の概要 |
本申請研究では、現在の深層学習では利用されていないが、脳内で有効活用されている情報のフィードバックに着目し、フィードバックを他の深層学習器間に一般化した「情報リーク」を用いて学習の効率化や識別精度の向上を図る。具体的には、異なる入力、構造、役割の深層学習器からの情報リークや相互に情報リークを行う方法を研究し、情報リークを用いた新しい認識法を確立する。
|
研究実績の概要 |
情報リークという観点から様々な研究を行っている。例えば、Deep Neural Networkの出力を入力側にFeedbackして再度推論しながらセマンティックセグメンテーションを行う方法を提案した。また、一般に、動画像認識では3D CNNが利用されるが、その内部で情報をFeedbackさせる方法も提案した。これにより、時系列情報を有効に活用することができると考えられる。 時系列画像のセマンティックセグメンテーションを行う際、教師付き画像と時系列的に近い画像は高い精度でセグメンテーションができる。この性質を利用し、教師付き画像の所から時系列順に疑似ラベルを付与し、それらを教師データとして再利用しながら学習を行っていく方法も提案した。これは時系列的に情報をリークしていく枠組みと考えられる。また、セグメンテーションではクラス数が増えると精度が悪くなる傾向がある。そこで、あるクラスとその他の2クラス識別を行うDeep Neural Networkを学習し、そこから知識蒸留をしながら多クラスセグメンテーションの精度を改善する自己蒸留法も提案した。これは2クラス識別器からの情報リークと言える。 また、最近ではTransformerの有効性が多数報告されているので、今後のベースとなるTransformerの改良も行っている。画像には自然言語のように明確に単語という概念がないため、Vision Transformerでは入力画像を局所領域に切り出したものを単語のように扱っている。これを改善するために、学習画像の局所領域をクラスタリングしたものを単語と考え、Vision Transformerの中に組み込んだ。これはVisual Wordから入力画像への情報リークと考えることができる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
様々な画像認識問題に対し、情報リークという観点から様々な方法を提案し、有効性を確認できている。この点からおおむね順調に進展していると言える。
|
今後の研究の推進方策 |
今後も情報リークという観点から、画像分類、セマンティックセグメンテーション、動画像認識などの様々な画像認識問題に対してアプローチしていく。最近はTransformerを用いた方法の有効性の報告が多いため、Transformerに対して情報リークの観点からさらなる改善をしていく。
|