研究課題/領域番号 |
20H04217
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
櫻田 健 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (70773670)
|
研究分担者 |
高村 大也 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究チーム長 (80361773)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 変化検出 / 説明文生成 / シーン認識 / 3Dモデリング |
研究実績の概要 |
本年度はシーン認識、シーンの変化検出・変化説明文生成、3Dモデリングの研究に取り組んだ。シーン認識としては、不均一グリッドを用いたgraph convolutionとgraph poolingを提案し、シーンに応じて適応的にノード配置を設定できるsemantic segmentation手法を構築した。本手法により従来よりも少ない計算量でシーンの認識を行うことが可能となった。本研究はコンピュータビジョンのトップカンファレンスの一つであるCVPR2021に 採択され発表を行なった。 昨年度に引き続き取り組んだシーンの変化検出・変化説明文生成の研究では、ネットワーク構造の改良やデータセットの見直し、評価実験などを行った。これらにより、シーンの変化を物体単位で認識し、さらにそれら物体単位の変化の説明文を自動で生成することが可能となった。変化の検出および説明文の生成、いずれにおいても車載画像のようなシーンの前景と背景の分離が難しい状況でも高精度に推定できる点が従来手法と大きく異なり、実用的なシーンに対するロバスト性を獲得した。 また、3Dモデリングとして、バイナリ超平面を利用した高速な類似画像検出手法に取り組んだ。本手法は、画像の局所特徴を画像全体の特徴量へ変換する計算コストを削減し、3Dモデリングを大規模データに適用する際の計算量を削減することを目的としている。一部の行列演算以外は二値化することが可能となった。今後も検討を継続し高効率かつ高精度な手法の開発を目指す。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
シーンに応じて適応的にノード配置を設定できるsemantic segmentation手法を開発しその成果 がコンピュータビジョンのトップカンファレンスの一つであるCVPR2021に採択され外部から高い評価を得た。また、シーンの変化検出・変化説明文生成についてもネットワーク構造の改良等で高い精度を実現できた。
|
今後の研究の推進方策 |
今後は、3Dモデリング手法と変化検出・変化説明文生成手法の更なる精度向上と高速化に取り組む。さらに、作成したCGデータセットを拡張し、異なるデータの形式にも適用できる手法の検討を行う。
|